El Fin de los Relojes de Envejecimiento: Qué Cambia Cuando un LLM Supera al Reloj de Horvath

KRECE · Editorial · Longevity
El Fin de los Relojes
de EnvejecimientoUn modelo de 14.000 millones de parámetros acaba de superar al reloj de Horvath.
Qué cambia para el médico que prescribe longevidad.
CategoríaEditorial
DificultadAvanzado
Lectura12 min
CreaciónAbril 2026
VersiónBlog V1.6
AutorIgnacio Rubio

longevidad
epigenética
edad-biológica
metilación
envejecimiento
epithalon
rapamicina
nad
inteligencia-artificial

Los relojes de envejecimiento fueron la mejor herramienta disponible durante una década. Cada uno confinado a una modalidad, con un set fijo de features y sin capacidad de explicar por qué. Longevity-LLM cambia las reglas: un solo modelo que trabaja con metilación, proteómica, transcriptómica y biomarcadores clínicos simultáneamente. Para el médico que prescribe Epithalon, NAD+ o Rapamicina, la pregunta ya no es "¿funciona?" sino "¿cómo lo vamos a medir?"
01El contexto
Una década de herramientas que no se hablan entre síDesde que Steve Horvath publicó el primer reloj epigenético multitejido en 2013, el campo ha producido docenas de modelos especializados: relojes de metilación, relojes proteómicos, relojes de expresión génica, relojes de microbioma, relojes faciales. Cada uno funciona dentro de su modalidad y produce un número — la edad biológica estimada. Pero ninguno le dice al clínico por qué el paciente está envejeciendo más rápido de lo que debería.
Las limitaciones son estructurales: cada reloj opera con un set fijo de biomarcadores, no puede manejar observaciones incompletas, y añadir una nueva modalidad requiere construir, validar y desplegar un modelo completamente nuevo. Si quieres cruzar datos de metilación con un panel proteómico y biomarcadores clínicos de NHANES, necesitas tres modelos diferentes y un humano que interprete la incoherencia entre ellos.
En marzo de 2026, Insilico Medicine publicó un preprint que propone una alternativa radical.
02Qué dice el paper
Longevity-LLM v0.1: destilación de relojes en un transformerEl equipo de Zhavoronkov y Galkin tomó Qwen3-14B (un modelo de lenguaje de propósito general con 14.000 millones de parámetros) y lo ajustó con supervised fine-tuning (SFT) y reinforcement fine-tuning (RFT) sobre 766.640 ejemplos de entrenamiento que cubren cuatro modalidades: metilación de ADN, proteómica, transcriptómica y biomarcadores clínicos.
El concepto clave es lo que llaman destilación de relojes de envejecimiento: en lugar de equipar un LLM con relojes externos como herramientas, convirtieron el conocimiento acumulado en múltiples relojes especializados en trazas estructuradas de entrenamiento. El resultado es un modelo monolítico que ha internalizado la biología del envejecimiento a través de modalidades.
4.34 años MAE
Error absoluto medio en predicción de edad epigenética tras RFT. Supera al reloj de Horvath (4.61 años) en el mismo set de holdout (n=1.436, p<0.05, bootstrap de dos muestras).
Los númerosTareaResultado Longevity-LLMComparación
Predicción edad epigenética (DNAm)MAE 4.34 años (RFT), R²=0.914, ρ=0.950Horvath: MAE 4.61, R²=0.895
Pronóstico cáncer RNA (TCGA survival)0.77 accuracy — 1º en Longevity BenchGPT-5.2: 0.697
Mortalidad NHANES (binaria, 10 años)0.89 accuracy — 1ºGemini 3 Pro: anterior líder
Mortalidad NHANES (regresión)MAE 51.0 meses — 1ºTodos los frontier LLMs peor
Edad proteómica (Olink 3072)MAE 7.9 años, ρ=0.713Goeminne chrono: 6.7 (UK Biobank, n mayor)
Generación perfiles proteómicosJaccard 0.072 — 1º por 2.4xGrok-3: 0.030, Claude Sonnet 4.5: 0.012
Dato que importaEl modelo base Qwen3-14B, antes del fine-tuning, fue incapaz de producir predicciones válidas en ninguna de las tareas probadas. Todo el rendimiento viene del entrenamiento especializado, no de la capacidad generalista del LLM.
03Qué cambia para el clínico
De un número a una conversaciónSi eres médico y prescribes protocolos de longevidad, esto es lo que Longevity-LLM cambia en tu práctica — no hoy, pero en 2-3 años:
Un solo punto de acceso a múltiples modalidades. Ya no necesitas un reloj de metilación, un reloj proteómico y un panel clínico separados. Un modelo que procesa las tres cosas simultáneamente puede detectar discrepancias entre ellas — y esas discrepancias son clínicamente más interesantes que cualquier número individual.
Maneja datos incompletos. Los relojes actuales necesitan el set completo de features. Si falta un CpG site o una proteína en tu panel, el reloj no funciona. Un LLM entrenado en múltiples formatos de prompt puede operar con observaciones parciales — que es exactamente la situación clínica real.
Potencial de interpretabilidad. Un reloj te dice "tu edad biológica es 7 años mayor que tu edad cronológica". No te dice por qué. Longevity-LLM, por estar construido sobre un transformer conversacional, tiene la arquitectura para articular la lógica biológica detrás de sus predicciones. Los autores reconocen que esta capacidad aún es embrionaria en v0.1 y es el objetivo central de v0.2.
KRECE TIP
Si estás usando relojes epigenéticos para medir la eficacia de un protocolo con Epithalon o NAD+, no dejes de usarlos todavía. Longevity-LLM no está disponible públicamente. Pero empieza a pedir a tu laboratorio de referencia paneles proteómicos junto con metilación. Cuando el modelo multimodal sea accesible, esos datos cruzados serán oro.
04Los caveats
Lo que el paper no diceEs un preprint. No ha pasado peer review. Los resultados son de un sprint de 10 días, y los autores lo describen explícitamente como un "informe intermedio". El modelo es v0.1.
Todos los autores son empleados de Insilico Medicine, una empresa que cotiza en bolsa (HKEX:3696.HK) y desarrolla aplicaciones de IA para descubrimiento de fármacos. Tienen incentivo comercial directo en demostrar la viabilidad de su plataforma MMAI.
El modelo no está disponible. Nadie fuera de Insilico puede validar estos resultados de forma independiente. Los benchmarks son internos contra el Longevity Bench que ellos mismos ayudaron a crear.
En proteómica, el dataset de entrenamiento es pequeño (7.807 ejemplos, 172 sujetos). Los relojes proteómicos de Goeminne se entrenaron con UK Biobank — órdenes de magnitud más datos. El MAE de 7.9 años es competitivo pero no superior.
Regla KRECE para papers de IAUn modelo que no puedes ejecutar es un paper, no una herramienta. Los números son prometedores. El concepto de destilación de relojes es sólido. Pero hasta que exista validación externa y acceso clínico, esto es investigación, no práctica.
05Implicaciones para protocolos KRECE
Dónde encaja esto en lo que ya hacemosLos tres protocolos de longevidad de KRECE que más dependen de endpoints de envejecimiento biológico son:
Epithalon — donde el endpoint natural sería la edad epigenética pre/post ciclo. Hoy usamos Horvath o variantes. Un modelo multimodal que cruzara metilación con melatonina nocturna y expresión de hTERT daría una imagen mucho más completa del efecto real.
NAD+ / NMN — donde medimos NAD+ intracelular (Jinfiniti) pero no tenemos un endpoint de envejecimiento biológico integrado. Un modelo que pudiera cruzar el NAD+ intracelular con datos proteómicos y metilación permitiría distinguir entre "subió el biomarcador" y "el paciente envejece más lento".
Rapamicina — donde el efecto sobre autofagia, mTOR y mitofagia es molecular pero la traducción a envejecimiento biológico medible sigue siendo opaca. Un modelo multimodal es exactamente la herramienta que falta.
KRECE TIP
Para la red médica B2B: empezar a acumular datos multimodales ya. Los relojes epigenéticos unitarea van a ser obsoletos en 2-3 años. Los pacientes que hoy tienen solo metilación tendrán un dataset incompleto cuando la herramienta multimodal esté disponible. Añadir proteómica y biomarcadores clínicos estandarizados ahora es una inversión en datos futuros.
06La posición de KRECE
Lo que defendemosLos relojes unitarea tienen fecha de caducidad.
Un modelo de 14B parámetros acaba de igualar o superar a relojes especializados en metilación, proteómica, transcriptómica y biomarcadores clínicos. Cuando esto se escale (y se va a escalar), mantener modelos separados para cada modalidad será innecesario.
Hoy no es una herramienta. Mañana lo será.
Longevity-LLM v0.1 no está disponible y no ha sido validado externamente. Ningún clínico puede usarlo hoy. Pero el concepto de destilación de relojes en un transformer conversacional es la dirección correcta. KRECE no adopta herramientas sin validación, pero sí prepara la infraestructura de datos para cuando lleguen.
El dato multimodal es la inversión que importa ahora.
Para los médicos de nuestra red: pedir paneles proteómicos junto a metilación hoy no es un gasto — es construir el dataset que hará que las intervenciones de longevidad sean medibles de verdad cuando la herramienta multimodal exista.
La biología del envejecimiento es multimodal. La medición debía serlo hace tiempo.
Un paciente no envejece "epigenéticamente" o "proteómicamente". Envejece en todas las capas simultáneamente. La herramienta de medición que necesitamos es la que cruza esas capas, no la que mira cada una por separado. Longevity-LLM es el primer candidato serio a ocupar ese espacio.
07Referencias
Bibliografía1Zhavoronkov, A. et al. The End of Aging Clocks: Training Foundation Models to Reason in Aging and Longevity. bioRxiv, 2026. DOI: 10.64898/2026.03.28.714980
2Horvath, S. DNA methylation age of human tissues and cell types. Genome Biology, 14:R115, 2013.
3Goeminne, L.J.E. et al. Plasma protein-based organ-specific aging and mortality models. Cell Metabolism, 37:205-222, 2025.
4Kuo, C.-L. et al. Proteomic aging clock (PAC) predicts age-related outcomes. Aging Cell, 23:e14195, 2024.
5Zhavoronkov, A. et al. LongevityBench: Are SotA LLMs ready for aging research? bioRxiv, 2026.
6Galkin, F. et al. Biohorology and biomarkers of aging: Current state-of-the-art, challenges and opportunities. Ageing Research Reviews, 60:101050, 2020.
Este contenido es exclusivamente informativo y editorial. No constituye consejo médico. Longevity-LLM es un modelo de investigación no disponible públicamente. Los resultados citados provienen de un preprint sin peer review cuyos autores son empleados de Insilico Medicine. KRECE no tiene relación comercial con Insilico Medicine.
El Fin de los Relojesde Envejecimiento

Una década de herramientas que no se hablan entre sí

Longevity-LLM v0.1: destilación de relojes en un transformer

Los números

De un número a una conversación

Lo que el paper no dice

Dónde encaja esto en lo que ya hacemos

Lo que defendemos

Bibliografía

El Fin de los Relojes
de Envejecimiento