Sobre la demostración del Problema #1196 de Erdős por GPT-5.4 Pro

Por Francisco R. Villatoro, el 1 mayo, 2026. Categoría(s): Ciencia • Matemáticas • Mathematics • Noticias • Science ✎ 7
Fuente: Sebastien Bubeck en X: https://x.com/SebastienBubeck/status/2046756898830213148.

Paul Erdös (1913-1996) llamaba «EL LIBRO» al compendio de las mejores demostraciones de todos los teoremas matemáticos. El matemático Jared Duker Lichtman ha osado afirmar que la demostración de cuatro páginas de GPT-5.4 Pro del Problema #1196 de Erdős merece estar en EL LIBRO. ¡Matemáticos soberbios! En su tesis doctoral de 2017, Lichtman estudió este problema y desde entonces ha publicado varios artículos. En 2024 publicó junto a Ofir Gorodetsky y Mo Dick Wong un artículo de 26 páginas con un intento de solución usando una técnica probabilística basada en el producto primo de Mertens (1874). GPT-5.4 Pro se inspira en dicho trabajo, pero simplifica el argumento usando la función de von Mangoldt (1895), logrando sortear una obstrucción probabilística y concluyendo con una demostración correcta (que ha sido verificada con Lean). El resultado ha pillado por sorpresa a Lichtman, que no entiende cómo no se le ocurrió a él mismo (o su colega James Maynard, Medalla Fields en 2022). Por ello, afirma sin rubor que la idea no le parece nada obvia a primera vista. Pura soberbia. Junto a Terry Tao ha reescrito la demostración de la IA en una sola página. Su soberbia le lleva a afirmar que dicha demostración merece estar en EL LIBRO.

La mayoría de  los medios que se han hecho eco de esta noticia han enfatizado que un joven de 23 años sin formación matemática, Liam Price (alias Leeham), ha sido el «autor» de la demostración del Problema #1196, aunque no sea capaz de entenderla. Ha recurrido a su amigo Kevin Barreto, estudiante de matemáticas en el Queens’ College de la Universidad de Cambridge (Reino Unido) para validar la demostración. Como muchos otros aficionados a la vibe maths (matemáticas usando IA), Price se dedica a enviar problemas de Erdős a ChatGPT (por cierto, un mecenas anónimo le subvenciona la subscripción mensual a la versión Pro). Luego Barreto les echa un vistazo y si les da el visto bueno usan Aristotle para formalizar la demostración en Lean, que realiza la verificación. Un protocolo que ya relaté en «Sobre la resolución de problemas de Erdős usando inteligencia artificial generativa», LCMF, 23 ene 2026. Terry Tao está haciendo una labor colosal verificando, reformulando y contextualizando todas estas demostraciones.

El equipo Price–Barreto ha resuelto 7 problemas de Erdös: #333, refutado usando GPT-5.2 (y por un teorema de Erdős y Newman que había sido pasado por alto); #728, #729, y #401, tres problemas sobre factoriales relacionados entre sí que fueron demostrados usando la misma idea por GPT-5.2; #205, refutado, y #851, probado con la misma técnica por GPT-5.2 Pro; y el famoso #1196 objeto de esta pieza. También han obtenido resultados parciales en otros 4 problemas: #635 con GPT-5.2; #872, y #951, con GPT-5.2 Pro; #1194, con GPT-5.4 Pro. Con el reciente GPT-5.5 Pro afirman haber logrado resolver los problemas #1131, y #836, pero aún está pendiente su verificación con Lean. Sin lugar a dudas, un equipo de vibe maths muy productivo.

Todos los detalles de la solución de este problema en «Erdős Problem 1196», https://www.erdosproblems.com/forum/thread/1196. Puedes leer la pregunta de Price y la respuesta de ChatGPT-5.4 Pro en https://chatgpt.com/share/69dd1c83-b164-8385-bf2e-8533e9baba9c. La demostración original en formato TeX/PDF la puedes disfrutar en Overleaf [https://www.overleaf.com/project/69dd1d8437eba662fda82929]. Yo recuerdo haber visto la versión corta de la demostración de Lichtman y Tao en forma de imagen en redes sociales, pero no la descargué y ahora no la encuentro. Se supone que está integrada en este artículo explicativo de 8 páginas que resume el hilo del problema en la web erdosproblems: Terence Tao, Jared Duker Lichtman, Will Sawin, Kevin Barreto, et al., «A note on Erdős Problem #1196: primitive sets, divisibility chains, and an invariant zeta-weight» [PDF].

Muchos medios se han hecho eco de la demostración de este problema, como Joseph Howlett, «Amateur armed with ChatGPT ‘vibe maths’ a 60-year-old problem,» Scientific American, 24 Apr 2026; Jan Bielik, «The proof that forced mathematics to take AI seriously,» Webiano.digital, 20 Apr 2026; en muchos se destaca que un aficionado de 23 años sin formación matemática avanzada ha demostrado este resultado usando ChatGPT.

Las demostraciones mediante inteligencias artificiales generativas han llevado al genial Terry Tao a sugerir que, por primera vez en la historia, está cambiando el trabajo de los matemáticos. Quizás exagere y solo haya cambiado el suyo (por su implicación en este cambio). Pero lo cierto es que muchos medios se han hecho eco de sus palabras: Davide Castelvecchi, «‘The job description is changing’: mathematician Terence Tao on the rise of AI,» Nature, 27 Apr 2026, doi: https://doi.org/10.1038/d41586-026-01246-9. Para los interesados en el impacto de estos resultados en la filosofía de las matemáticas, recomiendo leer Tanya Klowden, Terence Tao, «Mathematical methods and human thought in the age of AI,» arXiv:2603.26524 [math.HO] (27 Mar 2026), doi: https://doi.org/10.48550/arXiv.2603.26524.

El problema fue propuesto en un artículo de Erdős, Sárközy y Szemerédi (1968), sobre conjuntos primitivos: conjuntos de números enteros mayores de 1 en los que ningún elemento divide de forma exacta a ningún otro elemento del conjunto; por ejemplo, el conjunto {6, 10, 15} es primitivo, pero {2, 6, 15} no es primitivo porque 2 divide a 6. Entre los conjuntos primitivos destacan los conjuntos primos, formados por números primos; por ejemplo, {2, 7, 11}. En cierto sentido, los conjuntos primitivos generalizan los conjuntos primos. En términos matemáticos, un conjunto A \subset \mathbb{N} es primitivo si \forall a,b\in A y a\mid b, entonces a=b. A cada conjunto primitivo se le asocia una suma de Erdős dada por S(A)=\sum_{a\in A}{1}/({a\,\log a}).

El problema #1196 considera el caso en el que todos los elementos de A sean grandes, es decir, si A\subset [x,\infty). La conjetura dice que en este caso la suma de Erdős está acotada por la unidad con un error que tiende a cero: \sum_{a\in A} {1}/({a\log a})<1+o(1), para x\to\infty. La nueva demostración de GPT-5.4 Pro logra obtener una cota más explícita del tipo S(A) < 1+O(1/\log x).

La idea de la demostracíon es la siguiente. Como el conjunto es primitivo, no puede contener números que estén en una misma “cadena de divisibilidad”, por ejemplo, n, n\,p, n\,p\,q, n\,p\,q\,r, \ldots, porque en ella cada número divide a los siguientes. Se considera una cadena probabilística ponderada por la función de von Mangoldt \Lambda(q), que cumple de forma exacta la identidad aritmética \sum_{q\mid n} \Lambda(q)=\log n. La idea clave es construir un peso natural \nu(n), muy parecido a 1/(n\log n), tal que para todo conjunto primitivo se cumpla que \sum_{a\in A}\nu(a)\leq 1. Como para a grande se cumple que \nu(a)\approx {1}/({a\log a}), se obtiene la cota conjeturada para la suma de Erdős. La idea «feliz» de la demostración es usar la función de von Mangoldt en lugar de la función de Mertens, que no permite obtener la demostración.

Como corolario de esta demostración se puede concluir que entre todos los conjuntos primitivos, el conjunto de todos los números primos es el que da la mayor suma: S(A)\leq S(\mathcal P), donde \mathcal P es el conjunto de todos los primos. En este sentido los conjuntos primos son maximales entre los conjuntos primitivos. Este resultado se espera que tenga aplicaciones interesantes en teoría de números, que serán explotadas por los matemáticos (humanos).

Fuente: Sebastien Bubeck en X: https://x.com/SebastienBubeck/status/2046756898830213148.

Hoy en día la generación de imágenes mediante IA permite generar imágenes como esta. En ella ChatGPT-5.4 resume la idea de la demostración de ChatGPT-5.4 Pro. Como es obvio, hay detalles que se podrían haber descrito de una forma más elegante. Pero, a pesar de ello, el resumen me parece muy aceptable. Sin lugar a dudas, la utilidad en docencia de las IA generativas es cada día más imprescindible.

El artículo original con la conjetura apareció en 1968 y luego en inglés en 1970: P. Erdős, A. Sárközy, E. Szemerédi, «On divisibility properties of sequences of integers, Number Theory (Colloq., János Bolyai Math. Soc., 1968), pp. 35-49 (1970) [PDF]. Si te interesa saber más sobre lo que sabía sobre este problema te recomiendo leer la tesis doctoral de Jared Duker Lichtman, «Numbers free of large prime factors,» Dartmouth College (2017) [PDF]; Jared Duker Lichtman, Carl Pomerance, «The Erdős conjecture for primitive sets,» Proc. Amer. Math. Soc. Ser. B 6: 1-14 (2019), doi: https://doi.org/10.1090/bproc/40; Jared Duker Lichtman, «Almost primes and the Banks-Martin conjecture,» Journal of Number Theory 211: 513-529 (2020), doi: https://doi.org/10.1016/j.jnt.2019.11.006, arXiv:1909.00804 [math.NT] (02 Sep 2019); y el artículo de Ofir Gorodetsky, Jared Duker Lichtman y Mo Dick Wong, «On Erdős sums of almost primes,» C. R. Math. Acad. Sci. Paris 362: 83-91 (2024), doi: https://doi.org/10.5802/crmath.650, arXiv:2303.08277 [math.NT] (14 Mar 2023).

Por cierto, atesoro una copia de la primera edición de Martin Aigner, Günter M. Ziegler, «EL LIBRO de las demostraciones» Nivola (2005), traducción de Lourdes Figueiras, Julian Pfeifle y Pedro A. Ramos de «Proofs from THE BOOK», Springer (1998). Te recomiendo disfrutar de este libro si te puedes agenciar una copia. Te recomiendo leer a Erica Klarreich, «In Search of God’s Perfect Proofs. The mathematicians Günter Ziegler and Martin Aigner have spent the past 20 years collecting some of the most beautiful proofs in mathematics,» Quanta Magazine, 19 Mar 2018.



7 Comentarios

    1. Jose, por supuesto, con todos los Problemas del Milenio; cientos de aficionados lo han intentado y todos han fracasado. Ninguna IA actual es capaz de producir una demostración de suficiente complejidad como para resolver un problema de esta dificultad.

  1. Hola Francis,

    ¡Magnifico artículo! Me gustaría preguntarte si los modelos actuales que pueden razonar (y proponer demostraciones com la del artículo ), aún se basan en algoritmos de “predicción de la siguiente palabra “, o ya han incorporado nuevas técnicas lejos de los LLM?

    1. Llorenç, se han incorporado nuevas técnicas sobre una base que sigue siendo modelos preentrenados para la predicción del siguiente token; pero cierto nivel de agencia gracias a un postentrenamiento con aprendizaje por refuerzo, razonamiento deliberativo, cómputo basado en inferencia y ejecución de herramientas externas (como búsqueda en la web, ejecución de código en SymPy, etc.). Hay mucho más que un LLM (loro estocástico).

  2. Buenas tardes, Francis.
    En el número de marzo de este año de la revista Crux Mathematicorum, Shawn Godin da una explicación genial de la conjetura de Erdős-Straus, en la que se ve cómo prácticamente «está rodeada». ¿Sabes si se ha intentado resolver con IA esta conjetura? Un saludo.

Deja un comentario