En los últimos años, la IA ha ampliado el debate sobre cuánto pueden realmente “pensar” los modelos de lenguaje y dónde termina la predicción de patrones. Además de traducción o generación de texto, aparecen nuevas pruebas centradas en habilidades cognitivas tradicionales.
El proyecto TrackingAI.org comenzó a evaluar modelos en tareas típicas de tests de IQ como Raven’s Progressive Matrices o Mensa Norway.
Qué miden estos tests
Los tests de IQ evalúan reconocimiento de patrones, razonamiento deductivo y abstracción. Aplicarlos a IA busca medir algo más que memoria o entrenamiento en texto.
Resultados e interpretaciones
Algunos modelos obtienen resultados comparables a niveles humanos altos en ciertos tests. Sin embargo, esto no significa necesariamente “inteligencia general”. Puede ser resultado de entrenamiento en patrones similares o de fortalezas específicas en tareas visuales o lógicas.


