Dossier técnico y estratégico · Marzo 2026

Ateneo: un instrumento
de investigación
editorial

Un sistema que distingue entre suelo firme y lectura abierta. Este documento presenta el problema que resuelve, cómo funciona su arquitectura, la evidencia de que funciona, y por qué la solución correcta para humanidades no es la misma que para ciencias.

Actualizado 10.03.2026 · Estado del arte y hallazgos bibliográficos contrastados con Scite Smart Citations

Dicendum est, sed ita ut nihil affirmem, quaeram omnia, dubitans plerumque et mihi diffidens

«Debo hablar, pero sin afirmar nada; lo indagaré todo, dudando las más de las veces y desconfiando de mí mismo.»¹

¹Marco Tulio Cicerón, De divinatione, II, 3, 8, citado en Michel de Montaigne, Los ensayos (ed. 1595), trad. J. Bayod Brau (Barcelona: Acantilado, 2007), 587.

§ 01 — El problema documentado

Los LLM punteros siguen
fallando en verificación de citas

PaperAsk (arXiv, oct 2025) evaluó GPT-4o, GPT-5 y Gemini-2.5-Flash en tareas académicas de uso real. No solo en benchmark controlado, sino en condiciones reales de trabajo.

48–98%

Tasa de fallo en citation retrieval con consultas multi-referencia

PaperAsk · citation retrieval task

72–91%

Fallo en extracción de contenido específico por sección

PaperAsk · content extraction task

<0.32

F1 en paper discovery — se pierden más del 60% de los papers relevantes

PaperAsk · paper discovery task

Citation retrieval (peor caso)

98% fallo

Citation retrieval (mejor caso)

48% fallo

Content extraction

72–91% fallo

AstaBench — precisión media (57 agentes)

38.78%

La fiabilidad no se presupone, se diseña. Estos datos no son anécdota — son benchmarks publicados y reproducibles sobre los mejores modelos disponibles en condiciones reales. El problema es estructural.

§ 02 — Definición

Qué es Ateneo

Un instrumento editorial de investigación asistido por IA que distingue entre suelo firme y lectura abierta. No es un chatbot. No es un wrapper. Es una arquitectura diseñada para que cada afirmación tenga un nivel de confianza explícito.

Nivel	Modo	Naturaleza	Función
Suelo firme	CITA	Determinístico, sin LLM	Citabilidad literal verificable. Búsqueda documental pura con caché. El lector puede ir al texto y juzgar por sí mismo.
Hallazgo documental	FUENTE	Determinístico + rescue semántico	Localización de pasajes. FTS headline + fallback trigramas + rescue semántico con match de páginas.
Lectura anudada	MAPA	Probabilístico enmarcado	Interpretación abierta pero verificable. Guardrails + detección de hiatos + auditoría. No delira — relee.

En Lacan no buscamos una máquina de certezas, sino un sistema que distinga entre cita verificable y lectura asistida anclada. Ateneo no repite — relee. Y lo hace anclado en el texto.

Contexto Maestro · Ateneo · 2026

§ 03 — Arquitectura

Cómo funciona:
verificación por capas

Un LLM es un generador probabilístico: produce texto fluido, pero no garantiza que ese texto sea fiel al corpus. Ateneo interpone seis capas de verificación entre el modelo y el usuario.

🚪

Pre-LLM

1. Whitelist — Solo pruebas admitidas

El LLM nunca ve datos de fuera del corpus curado. Suspensión de todo juicio externo: «solo puedes hablar de lo que está en estos libros».

✂️

Post-LLM

2. stripDisallowedCitations — Saneamiento

Revisa la salida del modelo y tacha toda cita fuera de la lista permitida. «Meditaciones, libro XV» → no existe (solo hay 12). Eliminado.

⚖️

Regla

3. Quote Contract — Contrato explícito

Prompt con instrucción formal: «Si no encuentras la cita, di que no la encuentras. NO inventes.» Establece el marco; si falla, las capas 4–6 lo atrapan.

🔍

Lógica

4. Detección de hiato — Saltos sospechosos

Detecta saltos temporales o conceptuales injustificados. Cita del Seminario 2 (1955) junto a referencia al Seminario 20 (1972) sin explicación → alarma.

📁

Clasificación

5. ANCLA / NÚCLEO / VECINDAD / RUIDO

Cada fragmento recuperado se clasifica por proximidad. Solo ANCLA (cita exacta) y NÚCLEO (contexto inmediato) llegan al LLM. VECINDAD y RUIDO se descartan.

👥

Cruce

6. Cross-validation — Consenso entre fuentes

Cruza fuentes entre sí. En Marco Aurelio: 4 idiomas (griego, inglés, español, francés). Si «confirmada» en inglés pero sin correlato en griego → inconsistencia.

§ 03b — Búsqueda híbrida

Tres métodos, cobertura complementaria

Cada método de búsqueda tiene un punto ciego distinto. Combinados, se compensan entre sí.

🔍

Trigram (pg_trgm)

Buscador por forma

Divide texto en trozos de 3 caracteres y compara. Tolerante a erratas y OCR imperfecto.

✓ Detecta erratas, variantes

✗ No entiende significado

🧠

Vector / HNSW

Buscador por significado

Cada texto → vector de 1,536 números. «The impediment to action...» y «τὸ ἐμποδίζον τῇ πράξει...» → vectores casi idénticos.

✓ Cruza idiomas, sinónimos

✗ Puede confundir conceptos ambiguos

📖

FTS (Full-Text Search)

Buscador por palabras

Índice analítico con flexibilidad morfológica. «verificar» encuentra «verificación» y «verificado».

✓ Raíces morfológicas, exactitud

✗ No cruza idiomas

4 contratos formales. 80 casos. 80/80 live. Auditoría runtime end-to-end. La diferencia no es el volumen del sistema, sino su disciplina: contratos verificables, checkers, CI y persistencia de trazabilidad cuando el modelo responde.

§ 04 — Evidencia de realidad

Producción, no prototipo

Ateneo lleva en producción desde febrero 2026 operando sobre corpus humanísticos reales. Estas son las métricas verificadas.

80/80

Validación estática y live — 20 casos por modo, 4 modos, 0 fallos en la batería actual

CI · GitHub Actions · producción

Contratos formales — CITA, FUENTE, MAPA y Stoic Verify

Contratos · checkers Python · CI

Runtime

Auditoría persistida — claims, evidence y policy snapshots confirmados end-to-end

Producción · trazabilidad por respuesta

Verificación de cita estoica en Ateneo — resultado CONFIRMADA 95/100 con contraste multilingüe — Ateneo Stoic Edition · Verificación en producción · Cita contrastada contra texto griego original (Leopold 1908) en 4 idiomas

Corpus Lacan ↗

Seminarios 1–23 en español y francés

Corpus curado de los 23 Seminarios de Lacan. OCR corregido, paginación alineada con ediciones Paidós. El caso difícil: ediciones múltiples, traducciones con varianza, seminarios orales transcritos.

Corpus Estoico ↗

Marco Aurelio + Séneca + Epicteto en 4 idiomas

Aparato crítico con texto griego original (Leopold 1908, Long 1862), inglés, español y francés. Verificación cruzada entre las cuatro lenguas. Ediciones de dominio público con tradición textual estable.

¿Cómo sé que no se inventa citas? Tres niveles: (1) las citas [Libro, p.N] se validan contra la base de datos determinista — si no salió de ahí, se elimina; (2) los literales entrecomillados se verifican carácter a carácter contra los snippets originales; (3) auditoría runtime cruza idiomas para detectar inconsistencias. El contrato cita_fast es 100% determinístico, sin LLM.

§ 05 — Estado del arte

Qué propone el campo
y qué tiene Ateneo

Papers de los últimos 6 meses sobre verificación de citas en LLMs, cruzados contra la arquitectura de Ateneo.

FACTUM

Johns Hopkins / DARPA · ene 2026

Teoría mecanicista: la alucinación es un fallo de Atención vs Feed-Forward en el LLM.

Da marco teórico a por qué las guardas de Ateneo funcionan. No es competencia — es justificación.

Diagnóstico

SemanticCite

U. Sydney · nov 2025

Verificar si la cita realmente sustenta lo que se dice, no solo si existe.

Ateneo verifica existencia. Gap pendiente compartido: verificar la prosa interpretativa.

Parcial

CiteGuard

U. Waterloo + U. Illinois · oct 2025

Attribution alignment con retrieval-augmented validation. 65,4% de precisión en CiteME — casi a nivel humano (69,7%).

Ateneo sigue este mismo esquema: retrieval → LLM → verificación. En humanidades especializadas, la precisión tiende a bajar por la complejidad del corpus.

✅ Sí

CheckIfExist

— · ene 2026

Verificar que las referencias bibliográficas existen realmente antes de incluirlas.

stripDisallowedCitations: si la cita [SEM XI, p.N] no salió de la BD, se elimina automáticamente.

✅ Sí

HalluCitation Matters

NAIST, Japón · 2025

Documenta referencias fabricadas en papers aceptados en ACL, NAACL y EMNLP — conferencias top.

El problema es tan grave que contamina publicaciones académicas revisadas por pares.

Diagnóstico

Citation Failure / CITENTION

TU Darmstadt · sep 2025

Distingue citation failure (cita incompleta) de response failure (respuesta incorrecta).

cita_fast: sin response failure posible (determinístico). FUENTE separa el hallazgo documental del despliegue interpretativo.

✅ Arq.

PaperAsk

arXiv · oct 2025

Benchmark cuantitativo: citation retrieval falla 48–98% en GPT-4o, GPT-5 y Gemini.

No anécdota sino número reproducible sobre los mejores modelos en condiciones reales.

Benchmark

OpenScholar

Allen Institute · 2024

Sistema real: síntesis de literatura científica con RAG y citas ancladas. Paper en Nature, demo pública.

Opera en STEM, no en humanidades. Modelo único (LLaMA 3.1 8B).

Producto

VeriCite

arXiv · oct 2025

Pipeline: generación → selección de evidencia → refinamiento con citas verificadas.

Prototipo sin despliegue productivo visible. No verifica prosa interpretativa entre citas.

Prototipo

4 de 9 papers describen mecanismos comparables a componentes ya implementados en Ateneo. El gap pendiente converge en un punto: que la prosa interpretativa tenga suelo visible en el texto. Ese es precisamente el territorio donde Ateneo está trabajando.

§ 05b — Hallazgos Scite · marzo 2026

Un territorio todavía por explorar

              A — Vacío documental
            

Papers sobre verificación de citas LLM en corpus humanísticos especializados — en 280 millones de fuentes indexadas

Scite · 2 búsquedas · 10 marzo 2026

              B — SciRAG perfilado
            

100%
STEM

SciRAG (nov 2025): opera en literatura científica indexada en inglés con DOIs. Dominio distinto al de Ateneo.

DOI: 10.48550/arxiv.2511.14362

              C — CiteGuard sin refutación
            

Contrasting citations en Scite para CiteGuard. El 65,4% en CiteME es el mejor resultado STEM disponible.

Scite tally · 10 marzo 2026

En 280 millones de fuentes indexadas, no encontré papers sobre verificación de citas de LLMs en corpus humanísticos especializados. El campo sigue mirando sobre todo hacia ciencias. Ese es precisamente el territorio donde está Ateneo.

Búsqueda Scite Smart Citations · 10 marzo 2026

§ 06 — Relevancia estratégica

Por qué humanidades
es el caso difícil

La mayor parte de la investigación en verificación de citas se concentra en STEM. Ateneo opera donde esa investigación aún no ha llegado: corpus humanísticos especializados.

STEM — El caso fácil

Muletas digitales disponibles

DOIs estables. APIs estructuradas (PubMed, Semantic Scholar). Corpus en un solo idioma (inglés). Citas factuales: «X causa Y». Verificación atómica posible y adecuada.

Humanidades — El caso difícil

Sin muletas, con complejidad constitutiva

Variantes de edición. Traducciones con varianza editorial. Atribución disputada. Circulación oral. Y lo fundamental: en humanidades, citar ya es interpretar.

Lo que otros hacen

Suprimir lo probabilístico

La narrativa defensiva: «hemos mitigado alucinaciones». Te pone en la misma carrera que todos: quién suprime mejor lo que el LLM hace naturalmente. Carrera al fondo.

Lo que hace Ateneo

Enmarcar lo probabilístico

Lo que otros intentan suprimir, Ateneo lo enmarca con evidencia real. El suelo es duro. La lectura es abierta pero anclada. En humanidades, eso no es un compromiso — es lo correcto.

Respaldo académico · Scite, marzo 2026

La interpretación como tarea, no como defecto

Gadamer & Derrida · Utrecht U. · 2024 · Open Access

«Doing Justice to Poetry»

Formaliza en literatura revisada por pares la tesis central: en humanidades la interpretación no se puede ni se debe cerrar. DOI: 10.33391/jgjh.171

La apertura como tarea

Extractos citados en Scite

«La tarea de la hermenéutica filosófica es 'dejar lo indecidible sin decidir', porque 'nadie sabe, y nadie tiene el poder de decidir', ni siquiera Gadamer.»

La fórmula: Ateneo no es «un LLM al que le hemos puesto parches para que no alucine». Es un dispositivo de lectura donde lo determinístico (CITA, FUENTE) da el suelo firme y lo probabilístico (MAPA) abre la lectura. Los guardrails no eliminan la probabilidad — la enmarcan. La tesis valiosa no es «hemos convertido el bug en el feature», sino algo más preciso: hemos diseñado una arquitectura adecuada al dominio.

Para quién sirve hoy

Casos de uso actuales

Ateneo opera hoy sobre dos corpus en producción. Estos son los perfiles que ya lo usan o que encajan directamente con su arquitectura.

Investigadores y docentes

Verificación de citas en corpus curados

Un investigador que necesita comprobar si una cita de Lacan (Seminario, página, edición) es literal, aproximada o inexistente. Ateneo lo resuelve en segundos con trazabilidad completa.

Editoriales y proyectos de edición crítica

Control de calidad sobre manuscritos

Un editor que revisa un manuscrito con decenas de citas de Meditaciones de Marco Aurelio y necesita verificarlas contra múltiples ediciones e idiomas. Ateneo cruza 4 lenguas automáticamente.

Centros de investigación y universidades

Infraestructura de validación para IA aplicada

Un centro que quiere integrar IA en sus procesos pero necesita garantizar que las referencias generadas son auditables. La arquitectura de Ateneo es portable a nuevos corpus.

Transferencia tecnológica

Piloto sobre un corpus concreto

Un interlocutor institucional o de transferencia que quiera evaluar Ateneo sobre su propio corpus: jurídico, filosófico, filológico o de patrimonio textual.

Siguiente paso

Una conversación concreta

Lo que proponemos: una sesión privada de 30 minutos donde mostramos Ateneo funcionando en vivo sobre el corpus de Lacan o de los estoicos. Sin presentación de diapositivas — directamente sobre la herramienta. Si hay un corpus propio sobre el que evaluar la portabilidad, podemos explorar un piloto acotado.

Web: ateneo.pablomartinezsamper.com
Contacto: pablo@pablomartinezsamper.com

Formato

Demo privada + conversación abierta

Videollamada o presencial. Sin compromiso. El objetivo es que el interlocutor vea el sistema operando y juzgue por sí mismo.

Exploración

Piloto sobre corpus propio

Si hay un corpus humanístico o de patrimonio textual que requiera verificación, podemos evaluar juntos la viabilidad técnica de una adaptación acotada.

Ateneo: un instrumentode investigacióneditorial

Los LLM punteros siguenfallando en verificación de citas

Qué es Ateneo

Cómo funciona:verificación por capas

1. Whitelist — Solo pruebas admitidas

2. stripDisallowedCitations — Saneamiento

3. Quote Contract — Contrato explícito

4. Detección de hiato — Saltos sospechosos

5. ANCLA / NÚCLEO / VECINDAD / RUIDO

6. Cross-validation — Consenso entre fuentes

Tres métodos, cobertura complementaria

Trigram (pg_trgm)

Vector / HNSW

FTS (Full-Text Search)

Producción, no prototipo

Qué propone el campoy qué tiene Ateneo

Un territorio todavía por explorar

Por qué humanidadeses el caso difícil

La interpretación como tarea, no como defecto

Casos de uso actuales

Una conversación concreta

Ateneo: un instrumento
de investigación
editorial

Los LLM punteros siguen
fallando en verificación de citas

Cómo funciona:
verificación por capas

Qué propone el campo
y qué tiene Ateneo

Por qué humanidades
es el caso difícil