Dossier técnico y estratégico · Marzo 2026

Ateneo: un instrumento
de investigación
editorial

Un sistema que distingue entre suelo firme y lectura abierta. Este documento presenta el problema que resuelve, cómo funciona su arquitectura, la evidencia de que funciona, y por qué la solución correcta para humanidades no es la misma que para ciencias.

Actualizado 10.03.2026 · Estado del arte y hallazgos bibliográficos contrastados con Scite Smart Citations

Dicendum est, sed ita ut nihil affirmem, quaeram omnia, dubitans plerumque et mihi diffidens
«Debo hablar, pero sin afirmar nada; lo indagaré todo, dudando las más de las veces y desconfiando de mí mismo.»1
1Marco Tulio Cicerón, De divinatione, II, 3, 8, citado en Michel de Montaigne, Los ensayos (ed. 1595), trad. J. Bayod Brau (Barcelona: Acantilado, 2007), 587.

Los LLM punteros siguen
fallando en verificación de citas

PaperAsk (arXiv, oct 2025) evaluó GPT-4o, GPT-5 y Gemini-2.5-Flash en tareas académicas de uso real. No solo en benchmark controlado, sino en condiciones reales de trabajo.

48–98%
Tasa de fallo en citation retrieval con consultas multi-referencia
PaperAsk · citation retrieval task
72–91%
Fallo en extracción de contenido específico por sección
PaperAsk · content extraction task
<0.32
F1 en paper discovery — se pierden más del 60% de los papers relevantes
PaperAsk · paper discovery task
Citation retrieval (peor caso)
98% fallo
Citation retrieval (mejor caso)
48% fallo
Content extraction
72–91% fallo
AstaBench — precisión media (57 agentes)
38.78%
La fiabilidad no se presupone, se diseña. Estos datos no son anécdota — son benchmarks publicados y reproducibles sobre los mejores modelos disponibles en condiciones reales. El problema es estructural.

Qué es Ateneo

Un instrumento editorial de investigación asistido por IA que distingue entre suelo firme y lectura abierta. No es un chatbot. No es un wrapper. Es una arquitectura diseñada para que cada afirmación tenga un nivel de confianza explícito.

Nivel Modo Naturaleza Función
Suelo firme CITA Determinístico, sin LLM Citabilidad literal verificable. Búsqueda documental pura con caché. El lector puede ir al texto y juzgar por sí mismo.
Hallazgo documental FUENTE Determinístico + rescue semántico Localización de pasajes. FTS headline + fallback trigramas + rescue semántico con match de páginas.
Lectura anudada MAPA Probabilístico enmarcado Interpretación abierta pero verificable. Guardrails + detección de hiatos + auditoría. No delira — relee.

En Lacan no buscamos una máquina de certezas, sino un sistema que distinga entre cita verificable y lectura asistida anclada. Ateneo no repite — relee. Y lo hace anclado en el texto.

Contexto Maestro · Ateneo · 2026

Cómo funciona:
verificación por capas

Un LLM es un generador probabilístico: produce texto fluido, pero no garantiza que ese texto sea fiel al corpus. Ateneo interpone seis capas de verificación entre el modelo y el usuario.

🚪
Pre-LLM
1. Whitelist — Solo pruebas admitidas

El LLM nunca ve datos de fuera del corpus curado. Suspensión de todo juicio externo: «solo puedes hablar de lo que está en estos libros».

✂️
Post-LLM
2. stripDisallowedCitations — Saneamiento

Revisa la salida del modelo y tacha toda cita fuera de la lista permitida. «Meditaciones, libro XV» → no existe (solo hay 12). Eliminado.

⚖️
Regla
3. Quote Contract — Contrato explícito

Prompt con instrucción formal: «Si no encuentras la cita, di que no la encuentras. NO inventes.» Establece el marco; si falla, las capas 4–6 lo atrapan.

🔍
Lógica
4. Detección de hiato — Saltos sospechosos

Detecta saltos temporales o conceptuales injustificados. Cita del Seminario 2 (1955) junto a referencia al Seminario 20 (1972) sin explicación → alarma.

📁
Clasificación
5. ANCLA / NÚCLEO / VECINDAD / RUIDO

Cada fragmento recuperado se clasifica por proximidad. Solo ANCLA (cita exacta) y NÚCLEO (contexto inmediato) llegan al LLM. VECINDAD y RUIDO se descartan.

👥
Cruce
6. Cross-validation — Consenso entre fuentes

Cruza fuentes entre sí. En Marco Aurelio: 4 idiomas (griego, inglés, español, francés). Si «confirmada» en inglés pero sin correlato en griego → inconsistencia.

Tres métodos, cobertura complementaria

Cada método de búsqueda tiene un punto ciego distinto. Combinados, se compensan entre sí.

🔍
Trigram (pg_trgm)
Buscador por forma

Divide texto en trozos de 3 caracteres y compara. Tolerante a erratas y OCR imperfecto.

✓ Detecta erratas, variantes
✗ No entiende significado
🧠
Vector / HNSW
Buscador por significado

Cada texto → vector de 1,536 números. «The impediment to action...» y «τὸ ἐμποδίζον τῇ πράξει...» → vectores casi idénticos.

✓ Cruza idiomas, sinónimos
✗ Puede confundir conceptos ambiguos
📖
FTS (Full-Text Search)
Buscador por palabras

Índice analítico con flexibilidad morfológica. «verificar» encuentra «verificación» y «verificado».

✓ Raíces morfológicas, exactitud
✗ No cruza idiomas
4 contratos formales. 80 casos. 80/80 live. Auditoría runtime end-to-end. La diferencia no es el volumen del sistema, sino su disciplina: contratos verificables, checkers, CI y persistencia de trazabilidad cuando el modelo responde.

Producción, no prototipo

Ateneo lleva en producción desde febrero 2026 operando sobre corpus humanísticos reales. Estas son las métricas verificadas.

80/80
Validación estática y live — 20 casos por modo, 4 modos, 0 fallos en la batería actual
CI · GitHub Actions · producción
4
Contratos formales — CITA, FUENTE, MAPA y Stoic Verify
Contratos · checkers Python · CI
Runtime
Auditoría persistida — claims, evidence y policy snapshots confirmados end-to-end
Producción · trazabilidad por respuesta
Verificación de cita estoica en Ateneo — resultado CONFIRMADA 95/100 con contraste multilingüe
Ateneo Stoic Edition · Verificación en producción · Cita contrastada contra texto griego original (Leopold 1908) en 4 idiomas
Seminarios 1–23 en español y francés

Corpus curado de los 23 Seminarios de Lacan. OCR corregido, paginación alineada con ediciones Paidós. El caso difícil: ediciones múltiples, traducciones con varianza, seminarios orales transcritos.

Marco Aurelio + Séneca + Epicteto en 4 idiomas

Aparato crítico con texto griego original (Leopold 1908, Long 1862), inglés, español y francés. Verificación cruzada entre las cuatro lenguas. Ediciones de dominio público con tradición textual estable.

¿Cómo sé que no se inventa citas? Tres niveles: (1) las citas [Libro, p.N] se validan contra la base de datos determinista — si no salió de ahí, se elimina; (2) los literales entrecomillados se verifican carácter a carácter contra los snippets originales; (3) auditoría runtime cruza idiomas para detectar inconsistencias. El contrato cita_fast es 100% determinístico, sin LLM.

Qué propone el campo
y qué tiene Ateneo

Papers de los últimos 6 meses sobre verificación de citas en LLMs, cruzados contra la arquitectura de Ateneo.

FACTUM
Johns Hopkins / DARPA · ene 2026
Teoría mecanicista: la alucinación es un fallo de Atención vs Feed-Forward en el LLM.
Da marco teórico a por qué las guardas de Ateneo funcionan. No es competencia — es justificación.
Diagnóstico
SemanticCite
U. Sydney · nov 2025
Verificar si la cita realmente sustenta lo que se dice, no solo si existe.
Ateneo verifica existencia. Gap pendiente compartido: verificar la prosa interpretativa.
Parcial
CiteGuard
U. Waterloo + U. Illinois · oct 2025
Attribution alignment con retrieval-augmented validation. 65,4% de precisión en CiteME — casi a nivel humano (69,7%).
Ateneo sigue este mismo esquema: retrieval → LLM → verificación. En humanidades especializadas, la precisión tiende a bajar por la complejidad del corpus.
✅ Sí
CheckIfExist
— · ene 2026
Verificar que las referencias bibliográficas existen realmente antes de incluirlas.
stripDisallowedCitations: si la cita [SEM XI, p.N] no salió de la BD, se elimina automáticamente.
✅ Sí
HalluCitation Matters
NAIST, Japón · 2025
Documenta referencias fabricadas en papers aceptados en ACL, NAACL y EMNLP — conferencias top.
El problema es tan grave que contamina publicaciones académicas revisadas por pares.
Diagnóstico
Citation Failure / CITENTION
TU Darmstadt · sep 2025
Distingue citation failure (cita incompleta) de response failure (respuesta incorrecta).
cita_fast: sin response failure posible (determinístico). FUENTE separa el hallazgo documental del despliegue interpretativo.
✅ Arq.
PaperAsk
arXiv · oct 2025
Benchmark cuantitativo: citation retrieval falla 48–98% en GPT-4o, GPT-5 y Gemini.
No anécdota sino número reproducible sobre los mejores modelos en condiciones reales.
Benchmark
OpenScholar
Allen Institute · 2024
Sistema real: síntesis de literatura científica con RAG y citas ancladas. Paper en Nature, demo pública.
Opera en STEM, no en humanidades. Modelo único (LLaMA 3.1 8B).
Producto
VeriCite
arXiv · oct 2025
Pipeline: generación → selección de evidencia → refinamiento con citas verificadas.
Prototipo sin despliegue productivo visible. No verifica prosa interpretativa entre citas.
Prototipo
4 de 9 papers describen mecanismos comparables a componentes ya implementados en Ateneo. El gap pendiente converge en un punto: que la prosa interpretativa tenga suelo visible en el texto. Ese es precisamente el territorio donde Ateneo está trabajando.

Un territorio todavía por explorar

A — Vacío documental
0
Papers sobre verificación de citas LLM en corpus humanísticos especializados — en 280 millones de fuentes indexadas
Scite · 2 búsquedas · 10 marzo 2026
B — SciRAG perfilado
100%
STEM
SciRAG (nov 2025): opera en literatura científica indexada en inglés con DOIs. Dominio distinto al de Ateneo.
DOI: 10.48550/arxiv.2511.14362
C — CiteGuard sin refutación
0
Contrasting citations en Scite para CiteGuard. El 65,4% en CiteME es el mejor resultado STEM disponible.
Scite tally · 10 marzo 2026

En 280 millones de fuentes indexadas, no encontré papers sobre verificación de citas de LLMs en corpus humanísticos especializados. El campo sigue mirando sobre todo hacia ciencias. Ese es precisamente el territorio donde está Ateneo.

Búsqueda Scite Smart Citations · 10 marzo 2026

Por qué humanidades
es el caso difícil

La mayor parte de la investigación en verificación de citas se concentra en STEM. Ateneo opera donde esa investigación aún no ha llegado: corpus humanísticos especializados.

STEM — El caso fácil
Muletas digitales disponibles

DOIs estables. APIs estructuradas (PubMed, Semantic Scholar). Corpus en un solo idioma (inglés). Citas factuales: «X causa Y». Verificación atómica posible y adecuada.

Humanidades — El caso difícil
Sin muletas, con complejidad constitutiva

Variantes de edición. Traducciones con varianza editorial. Atribución disputada. Circulación oral. Y lo fundamental: en humanidades, citar ya es interpretar.

Lo que otros hacen
Suprimir lo probabilístico

La narrativa defensiva: «hemos mitigado alucinaciones». Te pone en la misma carrera que todos: quién suprime mejor lo que el LLM hace naturalmente. Carrera al fondo.

Lo que hace Ateneo
Enmarcar lo probabilístico

Lo que otros intentan suprimir, Ateneo lo enmarca con evidencia real. El suelo es duro. La lectura es abierta pero anclada. En humanidades, eso no es un compromiso — es lo correcto.

La interpretación como tarea, no como defecto

Gadamer & Derrida · Utrecht U. · 2024 · Open Access
«Doing Justice to Poetry»

Formaliza en literatura revisada por pares la tesis central: en humanidades la interpretación no se puede ni se debe cerrar. DOI: 10.33391/jgjh.171

La apertura como tarea
Extractos citados en Scite

«La tarea de la hermenéutica filosófica es 'dejar lo indecidible sin decidir', porque 'nadie sabe, y nadie tiene el poder de decidir', ni siquiera Gadamer.»

La fórmula: Ateneo no es «un LLM al que le hemos puesto parches para que no alucine». Es un dispositivo de lectura donde lo determinístico (CITA, FUENTE) da el suelo firme y lo probabilístico (MAPA) abre la lectura. Los guardrails no eliminan la probabilidad — la enmarcan. La tesis valiosa no es «hemos convertido el bug en el feature», sino algo más preciso: hemos diseñado una arquitectura adecuada al dominio.

Casos de uso actuales

Ateneo opera hoy sobre dos corpus en producción. Estos son los perfiles que ya lo usan o que encajan directamente con su arquitectura.

Investigadores y docentes
Verificación de citas en corpus curados

Un investigador que necesita comprobar si una cita de Lacan (Seminario, página, edición) es literal, aproximada o inexistente. Ateneo lo resuelve en segundos con trazabilidad completa.

Editoriales y proyectos de edición crítica
Control de calidad sobre manuscritos

Un editor que revisa un manuscrito con decenas de citas de Meditaciones de Marco Aurelio y necesita verificarlas contra múltiples ediciones e idiomas. Ateneo cruza 4 lenguas automáticamente.

Centros de investigación y universidades
Infraestructura de validación para IA aplicada

Un centro que quiere integrar IA en sus procesos pero necesita garantizar que las referencias generadas son auditables. La arquitectura de Ateneo es portable a nuevos corpus.

Transferencia tecnológica
Piloto sobre un corpus concreto

Un interlocutor institucional o de transferencia que quiera evaluar Ateneo sobre su propio corpus: jurídico, filosófico, filológico o de patrimonio textual.

Una conversación concreta

Lo que proponemos: una sesión privada de 30 minutos donde mostramos Ateneo funcionando en vivo sobre el corpus de Lacan o de los estoicos. Sin presentación de diapositivas — directamente sobre la herramienta. Si hay un corpus propio sobre el que evaluar la portabilidad, podemos explorar un piloto acotado.

Web: ateneo.pablomartinezsamper.com
Contacto: pablo@pablomartinezsamper.com
Formato
Demo privada + conversación abierta

Videollamada o presencial. Sin compromiso. El objetivo es que el interlocutor vea el sistema operando y juzgue por sí mismo.

Exploración
Piloto sobre corpus propio

Si hay un corpus humanístico o de patrimonio textual que requiera verificación, podemos evaluar juntos la viabilidad técnica de una adaptación acotada.