Un sistema que distingue entre suelo firme y lectura abierta. Este documento presenta el problema que resuelve, cómo funciona su arquitectura, la evidencia de que funciona, y por qué la solución correcta para humanidades no es la misma que para ciencias.
Actualizado 10.03.2026 · Estado del arte y hallazgos bibliográficos contrastados con Scite Smart Citations
PaperAsk (arXiv, oct 2025) evaluó GPT-4o, GPT-5 y Gemini-2.5-Flash en tareas académicas de uso real. No solo en benchmark controlado, sino en condiciones reales de trabajo.
Un instrumento editorial de investigación asistido por IA que distingue entre suelo firme y lectura abierta. No es un chatbot. No es un wrapper. Es una arquitectura diseñada para que cada afirmación tenga un nivel de confianza explícito.
| Nivel | Modo | Naturaleza | Función |
|---|---|---|---|
| Suelo firme | CITA | Determinístico, sin LLM | Citabilidad literal verificable. Búsqueda documental pura con caché. El lector puede ir al texto y juzgar por sí mismo. |
| Hallazgo documental | FUENTE | Determinístico + rescue semántico | Localización de pasajes. FTS headline + fallback trigramas + rescue semántico con match de páginas. |
| Lectura anudada | MAPA | Probabilístico enmarcado | Interpretación abierta pero verificable. Guardrails + detección de hiatos + auditoría. No delira — relee. |
En Lacan no buscamos una máquina de certezas, sino un sistema que distinga entre cita verificable y lectura asistida anclada. Ateneo no repite — relee. Y lo hace anclado en el texto.
Un LLM es un generador probabilístico: produce texto fluido, pero no garantiza que ese texto sea fiel al corpus. Ateneo interpone seis capas de verificación entre el modelo y el usuario.
El LLM nunca ve datos de fuera del corpus curado. Suspensión de todo juicio externo: «solo puedes hablar de lo que está en estos libros».
Revisa la salida del modelo y tacha toda cita fuera de la lista permitida. «Meditaciones, libro XV» → no existe (solo hay 12). Eliminado.
Prompt con instrucción formal: «Si no encuentras la cita, di que no la encuentras. NO inventes.» Establece el marco; si falla, las capas 4–6 lo atrapan.
Detecta saltos temporales o conceptuales injustificados. Cita del Seminario 2 (1955) junto a referencia al Seminario 20 (1972) sin explicación → alarma.
Cada fragmento recuperado se clasifica por proximidad. Solo ANCLA (cita exacta) y NÚCLEO (contexto inmediato) llegan al LLM. VECINDAD y RUIDO se descartan.
Cruza fuentes entre sí. En Marco Aurelio: 4 idiomas (griego, inglés, español, francés). Si «confirmada» en inglés pero sin correlato en griego → inconsistencia.
Cada método de búsqueda tiene un punto ciego distinto. Combinados, se compensan entre sí.
Divide texto en trozos de 3 caracteres y compara. Tolerante a erratas y OCR imperfecto.
Cada texto → vector de 1,536 números. «The impediment to action...» y «τὸ ἐμποδίζον τῇ πράξει...» → vectores casi idénticos.
Índice analítico con flexibilidad morfológica. «verificar» encuentra «verificación» y «verificado».
Ateneo lleva en producción desde febrero 2026 operando sobre corpus humanísticos reales. Estas son las métricas verificadas.
Corpus curado de los 23 Seminarios de Lacan. OCR corregido, paginación alineada con ediciones Paidós. El caso difícil: ediciones múltiples, traducciones con varianza, seminarios orales transcritos.
Aparato crítico con texto griego original (Leopold 1908, Long 1862), inglés, español y francés. Verificación cruzada entre las cuatro lenguas. Ediciones de dominio público con tradición textual estable.
cita_fast es 100% determinístico, sin LLM.
Papers de los últimos 6 meses sobre verificación de citas en LLMs, cruzados contra la arquitectura de Ateneo.
stripDisallowedCitations: si la cita [SEM XI, p.N] no
salió de la BD, se elimina automáticamente.
En 280 millones de fuentes indexadas, no encontré papers sobre verificación de citas de LLMs en corpus humanísticos especializados. El campo sigue mirando sobre todo hacia ciencias. Ese es precisamente el territorio donde está Ateneo.
La mayor parte de la investigación en verificación de citas se concentra en STEM. Ateneo opera donde esa investigación aún no ha llegado: corpus humanísticos especializados.
DOIs estables. APIs estructuradas (PubMed, Semantic Scholar). Corpus en un solo idioma (inglés). Citas factuales: «X causa Y». Verificación atómica posible y adecuada.
Variantes de edición. Traducciones con varianza editorial. Atribución disputada. Circulación oral. Y lo fundamental: en humanidades, citar ya es interpretar.
La narrativa defensiva: «hemos mitigado alucinaciones». Te pone en la misma carrera que todos: quién suprime mejor lo que el LLM hace naturalmente. Carrera al fondo.
Lo que otros intentan suprimir, Ateneo lo enmarca con evidencia real. El suelo es duro. La lectura es abierta pero anclada. En humanidades, eso no es un compromiso — es lo correcto.
Formaliza en literatura revisada por pares la tesis central: en humanidades la interpretación no se puede ni se debe cerrar. DOI: 10.33391/jgjh.171
«La tarea de la hermenéutica filosófica es 'dejar lo indecidible sin decidir', porque 'nadie sabe, y nadie tiene el poder de decidir', ni siquiera Gadamer.»
Ateneo opera hoy sobre dos corpus en producción. Estos son los perfiles que ya lo usan o que encajan directamente con su arquitectura.
Un investigador que necesita comprobar si una cita de Lacan (Seminario, página, edición) es literal, aproximada o inexistente. Ateneo lo resuelve en segundos con trazabilidad completa.
Un editor que revisa un manuscrito con decenas de citas de Meditaciones de Marco Aurelio y necesita verificarlas contra múltiples ediciones e idiomas. Ateneo cruza 4 lenguas automáticamente.
Un centro que quiere integrar IA en sus procesos pero necesita garantizar que las referencias generadas son auditables. La arquitectura de Ateneo es portable a nuevos corpus.
Un interlocutor institucional o de transferencia que quiera evaluar Ateneo sobre su propio corpus: jurídico, filosófico, filológico o de patrimonio textual.
Videollamada o presencial. Sin compromiso. El objetivo es que el interlocutor vea el sistema operando y juzgue por sí mismo.
Si hay un corpus humanístico o de patrimonio textual que requiera verificación, podemos evaluar juntos la viabilidad técnica de una adaptación acotada.