Por qué la inteligencia artificial consume tanta energía
Investigadores de Zhejiang han demostrado algo que muchos daban por imposible: que la inteligencia artificial no tiene por qué ir de la mano de facturas eléctricas desorbitadas. Mediante un ingenioso sistema de entrenamiento sobre chips de memoria especiales llamados memristores, han conseguido que las redes neuronales profundas realicen exactamente el mismo trabajo consumiendo una fracción mínima de electricidad.
Los grandes modelos de lenguaje y los sistemas de visión artificial funcionan sobre supercomputadoras repletas de potentes GPU. Esa capacidad de cómputo es impresionante, pero el coste energético es brutal. Entrenar un único modelo de gran escala puede consumir tanta electricidad como miles de hogares en un año entero.
El problema está en la arquitectura misma de los chips actuales. Los datos viajan constantemente de un lado a otro entre la memoria y el procesador. Ese ir y venir no solo consume tiempo, sino enormes cantidades de energía. Y a medida que los modelos crecen en tamaño y complejidad, ese consumo se dispara de forma exponencial.
Si la IA sigue creciendo al ritmo actual, el consumo eléctrico de los centros de datos podría alcanzar en pocos años el nivel de países de tamaño mediano.
Memristores: chips que calculan y recuerdan al mismo tiempo
Una de las ideas más prometedoras para cambiar esta situación es lo que se conoce como computación en memoria. En lugar de calcular en un lugar y almacenar datos en otro, todo ocurre dentro del mismo componente: la propia memoria.
Aquí es donde entran en juego los memristores. Se trata de componentes electrónicos que actúan simultáneamente como resistencia y como memoria. Su conductancia depende del historial de señales que han atravesado el dispositivo, lo que les permite tanto almacenar información como ejecutar operaciones sobre ella.
- Memoria con historia: el chip "recuerda" sus estados anteriores.
- Cálculo local: la operación ocurre justo donde están los datos.
- Sin transferencias innecesarias: se elimina el tráfico entre procesador y memoria.
- Eficiencia teórica extrema: especialmente notable en redes neuronales de gran tamaño.
Sin embargo, en la práctica los memristores se han topado con un obstáculo serio: no son perfectos. Generan ruido, no siempre escriben el valor exacto y presentan variaciones entre componentes individuales. Eso provoca errores durante el entrenamiento de modelos y deteriora el rendimiento final.
Convertir las imperfecciones en una ventaja
Investigadores de un laboratorio en Zhejiang publicaron en Nature Communications un nuevo método de entrenamiento que, precisamente, aprovecha esas imperfecciones en lugar de combatirlas. La técnica recibe el nombre de error-aware probabilistic update, o EaPU por sus siglas.
La lógica central del sistema es la siguiente:
- Durante el entrenamiento, el modelo calcula el ajuste habitual de los pesos de la red.
- Para cada memristor, se evalúa si ese cambio supera un umbral de tolerancia del componente.
- Solo cuando se supera ese umbral se ordena una nueva operación de escritura.
- Si el ajuste es menor, el valor permanece inalterado y el pequeño error se acepta sin más.
El resultado es que, en cada paso del entrenamiento, el sistema modifica menos del 0,1% de todos los parámetros. El ahorro es enorme, porque precisamente las escrituras en los memristores son las operaciones más costosas en términos de energía y las que más desgaste provocan. Leer el chip, en cambio, resulta mucho más barato.
Hasta cincuenta veces menos energía durante el entrenamiento
Al gestionar las operaciones de escritura con tanta prudencia, los investigadores obtienen cifras realmente llamativas. Comparado con otros métodos de entrenamiento basados en memristores, EaPU consigue los siguientes resultados:
| Característica | Resultado con EaPU |
|---|---|
| Consumo energético durante el entrenamiento | hasta 50 veces menor |
| Vida útil del hardware | aproximadamente 1.000 veces mayor |
| Precisión del modelo | alrededor de un 60% superior a otros métodos con memristores |
| Comparación con sistemas GPU | aproximadamente un millón de veces menos energía necesaria |
Ese último dato es el que más impacta. Según los investigadores, su enfoque supone una diferencia de seis órdenes de magnitud en el consumo durante el entrenamiento. Dicho de otro modo: un factor de aproximadamente un millón respecto a los sistemas convencionales basados en tarjetas gráficas.
Precisión comparable a la de las supercomputadoras
Y todo esto sin sacrificar la calidad de los modelos entrenados. Mientras que soluciones anteriores con memristores solían quedar claramente por debajo de las supercomputadoras digitales, EaPU se acerca, según sus autores, al rendimiento del entrenamiento clásico sobre CPU y GPU potentes.
Para sus experimentos, los investigadores emplearon una matriz de memristores con una estructura de 180 nanómetros, no el chip más moderno del mercado, pero más que suficiente para validar el principio y el método. Con ese hardware entrenaron redes neuronales para tareas de procesamiento de imágenes, concretamente:
- eliminación de ruido en fotografías
- superresolución: transformar imágenes de baja calidad en versiones más nítidas
Los resultados fueron equiparables a los obtenidos con métodos de entrenamiento tradicionales, pero con un consumo energético drásticamente reducido. Esto confirma que las actualizaciones probabilísticas no comprometen la calidad final de los modelos.
¿Puede este enfoque escalar hacia los grandes modelos de lenguaje?
La pregunta inevitable es si EaPU puede aplicarse a los modelos gigantescos que hay detrás de servicios como los chatbots de última generación. Los investigadores chinos se muestran cautelosamente optimistas. Su configuración actual está limitada por el hardware disponible, pero el principio de actualizaciones más escasas e inteligentes es igual de válido para redes mucho más grandes.
Según sus estimaciones, EaPU podría aplicarse a:
- grandes modelos de lenguaje con cientos de miles de millones de parámetros
- modelos multimodales que combinan texto, imagen y audio
- chips de IA compactos para aplicaciones en el borde de la red, como cámaras inteligentes y sensores
Esto permitiría desplazar una parte significativa de la carga computacional desde enormes centros de datos hacia hardware especializado y eficiente.
Una técnica que va más allá de los memristores
Lo que hace especialmente interesante esta tecnología es que no está ligada a un único tipo de chip. Los investigadores consideran que la misma estrategia tolerante al error puede funcionar en otros tipos de memorias no volátiles, como:
- transistores ferroeléctricos
- RAM magnetorresistiva (MRAM)
Estas tecnologías comparten con los memristores la capacidad de combinar almacenamiento y funciones de cálculo. En todos esos casos, enseñar al modelo de IA a convivir con pequeños errores permite reducir al mínimo las costosas operaciones de escritura.
Qué significa esto para los centros de datos y los objetivos climáticos
Si este tipo de técnicas demuestra ser ampliamente aplicable, el debate energético en torno a la IA podría tomar un rumbo completamente diferente. Las grandes empresas tecnológicas invierten ahora miles de millones en nuevos centros de datos y contratos de suministro eléctrico para satisfacer la demanda creciente de los servicios de inteligencia artificial.
Ahorrar uno o varios órdenes de magnitud en consumo eléctrico puede determinar si la IA se convierte en un punto débil estructural para el clima o si logra mantenerse como una herramienta relativamente eficiente.
Unos costes energéticos más bajos también harían más competitivos a los actores más pequeños. Startups, universidades e institutos de investigación podrían entrenar modelos de gran escala con una infraestructura mucho más modesta, reduciendo la brecha con los gigantes tecnológicos que dominan hoy el mercado del hardware.
Por qué la tolerancia al error resulta tan poderosa
Este enfoque conecta con un principio más amplio del aprendizaje automático: los modelos no necesitan ser perfectos en cada detalle interno para rendir bien en la práctica. Las redes neuronales pueden manejar el ruido y la imprecisión con sorprendente robustez, siempre que la estructura global y las líneas maestras del cálculo se mantengan intactas.
Al llevar este principio al extremo a nivel de chip, EaPU recorta el consumo por varios frentes a la vez:
- menos tráfico de datos dentro del propio chip
- operaciones de escritura drásticamente reducidas
- menor carga de refrigeración, al generarse menos calor
- mayor vida útil del hardware, lo que reduce el impacto de su fabricación
Para quienes trabajan con IA, esto puede tener consecuencias concretas a medio plazo. Imaginemos modelos más compactos que funcionen localmente sobre hardware de bajo consumo, o plataformas en la nube que ofrezcan distintos perfiles energéticos: desde la máxima precisión hasta el modo ultraeficiente con un margen de error algo mayor. La idea de fondo sigue siendo la misma: aceptar pequeñas imprecisiones donde el ser humano no nota la diferencia y, a cambio, recuperar una eficiencia enorme.













