Análisis profundo de la comprensión lingüística en LLMs multilingües, revelando disparidades y factores influyentes. ¿Es el inglés la lengua dominante? Lo investigamos.
Análisis profundo de cómo la relevancia del contexto recuperado influye en las representaciones internas de los LLM en sistemas RAG y su impacto en la generación.
Análisis teórico del impacto de la inicialización en la reutilización y refinamiento de características durante el ajuste fino. Se revelan distintos regímenes y sus efectos.
Análisis de DG-PG, un framework MARL que mitiga el ruido entre agentes mediante modelos analíticos diferenciables, permitiendo el aprendizaje cooperativo escalable.
Análisis de SkillInject, un benchmark para evaluar la vulnerabilidad de agentes LLM a ataques de inyección mediante archivos de habilidades. Revela fallas de seguridad críticas.