IA sobre un Pentium II: un ordenador añejo recibe una segunda vida

Un equipo de Oxford puso a trabajar un modelo de lenguaje en un ordenador que data de la época de Windows 98 y las conexiones por módem. Su experimento demuestra que la inteligencia artificial no necesita necesariamente una tarjeta gráfica carísima ni un centro de datos, sino que puede llegar sorprendentemente lejos con software inteligente y apenas 128 MB de RAM.

La prueba fue llevada a cabo por EXO Labs, una organización fundada por investigadores de la Universidad de Oxford. La configuración que emplearon haría reír a cualquier jugador en 2026: un Intel Pentium II a 350 MHz con 128 MB de memoria RAM, funcionando bajo un sistema operativo antiguo.

En lugar de recurrir a una GPU moderna o a un potente sistema multinúcleo, los investigadores apostaron por la optimización. Eligieron un modelo de lenguaje extremadamente ligero, basado en el minimalista código LLama2.c, una variante muy recortada de los conocidos modelos LLaMA, adaptada para consumir la menor cantidad posible de memoria y potencia de cálculo.

Un PC que podría haber retransmitido la final del Mundial de 1998 genera, en 2026, textos con inteligencia artificial usando tan solo 128 MB de RAM.

El modelo utilizado cuenta con apenas unos 260.000 parámetros. Para ponerlo en contexto: los modelos modernos manejan con total naturalidad decenas o cientos de miles de millones de parámetros. Aun así, este pequeño modelo fue capaz de generar texto a una velocidad de aproximadamente 39,3 tokens por segundo, un ritmo sorprendentemente fluido para una máquina tan antigua.

Como referencia, si ese mismo modelo escalara hasta mil millones de parámetros en el mismo hardware, la velocidad caería a unos 0,0093 tokens por segundo. A ese ritmo, habría que esperar varios minutos para obtener unas pocas palabras, lo que haría inviable cualquier uso práctico.

Un resultado técnicamente impresionante, aunque el texto sea caótico

La salida del modelo no es precisamente literatura de calidad. En la demostración, el ordenador produce una historia algo caótica, con giros extraños y repeticiones. Las frases no siempre son gramaticalmente coherentes, pero sí se percibe una estructura reconocible con diálogos, personajes y acción.

Para los usuarios habituales de IA acostumbrados a la calidad de modelos como GPT-4, el resultado puede parecer torpe. Sin embargo, demuestra que incluso modelos con grandes limitaciones, corriendo en hardware de hace décadas, son capaces de construir algún tipo de lenguaje natural. En muchas aplicaciones, lo "suficientemente bueno" importa más que lo "perfecto".

Las frases se encadenan con suficiente coherencia como para poder leerlas.
La máquina responde con rapidez ante una pregunta sencilla.
Todo el procesamiento ocurre de forma local, sin necesidad de conexión a internet.
El hardware consume una fracción de la energía que demandan los servidores modernos.

Precisamente esa combinación —requisitos mínimos, bajo coste y funcionamiento completamente sin conexión— es lo que hace que este experimento resulte interesante más allá de su componente nostálgico.

Por qué esto es más que una simpática hazaña de frikis

EXO Labs no presenta la prueba como un capricho para aficionados al hardware retro, sino como una declaración de intenciones sobre cómo funciona actualmente la industria de la IA. Mientras empresas como Nvidia cobran decenas de miles de dólares por chips de gama alta como el Blackwell B200, Oxford demuestra que existe un camino completamente distinto: software que aprovecha al máximo los recursos mínimos disponibles.

Los investigadores quieren mostrar sobre todo que la IA puede ser menos exclusiva. Si los propios modelos se diseñan con suficiente ligereza, los usuarios no necesitan acceder a grandes plataformas en la nube ni a centros de datos. Un hardware sencillo puede ser más que suficiente, especialmente para tareas que no requieren modelos de enormes dimensiones.

Menos parámetros, código más inteligente y modelos más eficientes pueden hacer que la IA sea accesible para personas con presupuestos reducidos, y para dispositivos que hoy en día todavía se consideran "tontos".

El camino hacia una IA asequible y eficiente energéticamente

Este experimento conecta con un debate creciente sobre el futuro de la inteligencia artificial. La tendencia actual apunta hacia modelos más grandes, más caros y más voraces en consumo energético. Al mismo tiempo, crece la crítica al gasto eléctrico de los centros de datos y a la dependencia de unos pocos grandes proveedores de chips y servicios en la nube.

Proyectos como el de EXO Labs plantean un camino alternativo que prioriza la optimización por encima de la fuerza bruta. Esto puede lograrse de varias maneras:

Técnica	Objetivo
Compresión de modelos	Eliminar parámetros innecesarios para reducir el tamaño del modelo.
Cuantización	Almacenar los valores del modelo con menos bits para ahorrar memoria.
Algoritmos eficientes	Organizar los cálculos de forma más inteligente para reducir la carga del procesador.
Inferencia local	Ejecutar tareas de IA directamente en el dispositivo, sin servidor externo.

Cada uno de estos pasos reduce los requisitos de hardware. En países desarrollados, eso se traduce en menos actualizaciones costosas y menor consumo energético. En regiones con menos recursos, abre la puerta a aplicaciones de IA sobre infraestructuras ya existentes.

Qué pueden y qué no pueden hacer estos modelos tan ligeros

Un modelo compacto de 260.000 parámetros jamás reemplazará a un chatbot completo capaz de responder preguntas complejas de ámbito jurídico o médico. La calidad y los matices son insuficientes para ello. Sin embargo, hay multitud de escenarios en los que una IA tan liviana puede resultar muy útil.

Ejemplos de aplicaciones prácticas

Sugerencias de texto automáticas en software de oficina básico o clientes de correo en ordenadores antiguos.
Control de voz local para electrodomésticos, vehículos o maquinaria industrial.
Software educativo en portátiles económicos en países donde el hardware moderno resulta inaccesible.
Asistentes de chat sencillos en dispositivos sin conexión a internet estable.
Aplicaciones sensibles a la privacidad, donde los datos nunca abandonan el dispositivo local.

Precisamente en entornos donde el suministro eléctrico es irregular o el internet móvil sigue siendo caro, este tipo de soluciones pueden marcar la diferencia. Un modelo de IA ligero sobre un ordenador básico puede tener más impacto allí que una versión perfecta de GPT-4 que solo funciona con una conexión rápida a la nube.

Por qué 128 MB de RAM pueden seguir siendo relevantes

Para el usuario medio con un portátil moderno, 128 MB de RAM suenan a broma. La mayoría de los teléfonos inteligentes actuales disponen de al menos 4 GB, frecuentemente más. Sin embargo, en todo el mundo siguen funcionando millones de dispositivos con recursos extremadamente limitados: viejos ordenadores en colegios, terminales industriales, equipos médicos, cajas registradoras, routers y sistemas embebidos económicos.

Si los modelos de IA pueden seguir aprendiendo y ejecutándose en ese tipo de hardware, se abre un enorme mercado de renovación silenciosa: los equipos existentes adquieren nuevas funciones sin necesidad de ser reemplazados. Eso supone un ahorro económico, pero también una reducción significativa de los residuos electrónicos.

Además, este tipo de restricciones obliga a los investigadores a ser creativos. Cuando el límite de memoria es tan bajo, cada byte importa. Ese tipo de limitaciones generó en el pasado soluciones sorprendentemente ingeniosas, desde algoritmos de compresión hasta sistemas operativos compactos. Esa misma mentalidad parece estar regresando ahora al mundo de la IA.

Qué significa esto para los usuarios de a pie

Para el usuario de PC corriente, mañana apenas cambiará nada: para los grandes modelos de IA de propósito general, seguirás dependiendo de la nube o de hardware potente durante un tiempo. Aun así, este experimento arroja una luz diferente sobre qué es realmente "necesario" para hacer algo útil con inteligencia artificial.

No siempre hace falta el modelo más grande ni la GPU más reciente. Para muchas tareas cotidianas —generar un texto breve, resumir un menú, ejecutar un chatbot sencillo— un modelo más pequeño y eficiente puede ser más que suficiente. Los desarrolladores que apuesten por este enfoque podrán crear aplicaciones que funcionen también en portátiles más antiguos, teléfonos de gama de entrada y mini-PC económicos.

Para quienes se preguntan si la IA aparecerá en todos lados durante los próximos años, esta demostración con un Pentium II es una señal clara de que técnicamente es posible. No instalando servidores gigantescos en todas partes, sino adelgazando el software hasta el punto en que incluso un ordenador de 1998 pueda participar en la revolución.

Author

Begoña Pérez

Begoña Pérez, conocida popularmente como La Ordenatriz, es una experta en orden y limpieza que ha revolucionado las redes sociales en España con sus soluciones prácticas para el hogar. Madre de siete hijos, Begoña comenzó compartiendo consejos basados en su propia experiencia diaria, lo que la llevó a convertirse en una guía indispensable para miles de personas. Su especialidad son los "trucos de limpieza" imposibles: cómo quitar manchas de tinta, vino o grasa usando productos económicos y accesibles. Ha publicado libros de éxito como "Limpieza, orden y felicidad", consolidándose como la máxima autoridad en лайфхаки domésticos.