De los fuegos artificiales festivos a los fuegos artificiales de la IA

Mientras los fuegos artificiales iluminaban el cielo sobre Pekín, las grandes empresas tecnológicas chinas aprovecharon las celebraciones del Año Nuevo para lanzar una oleada de nuevos modelos de inteligencia artificial. Lo que hace unos años parecía una cómoda ventaja para Silicon Valley se ha convertido hoy en una carrera muy reñida.

Las compañías chinas están presentando sistemas avanzados de IA generativa para texto, vídeo, imagen y código, muchos de ellos de código abierto y sorprendentemente eficientes en consumo energético. Incluso el director ejecutivo de OpenAI, Sam Altman, ha calificado este avance de "remarkable".

En las grandes celebraciones del Año Nuevo chino, robots humanoides desfilaron sincronizados junto a bailarines humanos, como vivo reflejo de las ambiciones tecnológicas del país. No fue solo una actuación: fue una declaración de intenciones.

La eficiencia como respuesta a las restricciones

Mientras Estados Unidos apuesta por enormes centros de datos y chips de altísima potencia, los actores chinos se han visto obligados a priorizar la eficiencia. El embargo estadounidense sobre chips avanzados de IA les exige lograr más con menor capacidad de cómputo.

Las restricciones en el acceso a chips han empujado a las empresas chinas a optimizar al máximo, lo que está generando modelos de IA más económicos y cada vez más competitivos.

Esto crea una paradoja fascinante: por un lado, los grandes modelos de lenguaje estadounidenses, costosos y voraces en energía; por el otro, modelos chinos cada vez más ligeros, capaces de ejecutarse incluso en servidores locales.

El código abierto como arma estratégica

Una diferencia clave respecto a muchos modelos estadounidenses es que una gran parte de los sistemas de IA chinos se publican como código abierto o como modelos de pesos abiertos.

Código abierto: el código completo y la arquitectura del modelo son públicos y accesibles para cualquiera.
Pesos abiertos: los pesos entrenados están disponibles, pero el código y los datos de entrenamiento permanecen parcialmente cerrados.

En ambos casos, una organización puede descargar el modelo y ejecutarlo localmente, en sus propios servidores o incluso en un ordenador de escritorio potente. Esto elimina costes de suscripción, reduce el tráfico de datos y permite un control total sobre la información interna.

Ejecutar un modelo localmente significa que ningún dato confidencial viaja a servidores externos, ya sean de Google, OpenAI o centros de datos en China. El control permanece completamente en casa.

De este modo, los modelos chinos se posicionan como una alternativa atractiva para organizaciones que manejan secretos empresariales, datos personales o documentos sensibles.

Generación de vídeo: Seedance 2.0 alarma a Hollywood

En la categoría de IA para vídeo destaca un nombre por encima de todos: Seedance 2.0, desarrollado por ByteDance, la empresa detrás de TikTok. Este modelo genera vídeos hiperrealistas a partir de breves indicaciones de texto, con resultados que recuerdan a producciones cinematográficas de alto presupuesto.

Seedance 2.0 no es de código abierto ni de pesos abiertos, pero sus demostraciones se viralizaron en redes sociales en cuestión de horas. Esto desencadenó una nueva controversia: grandes estudios como Disney, Paramount y Netflix acusan a ByteDance de infringir derechos de autor, alegando que los datos de entrenamiento podrían apoyarse en exceso en material cinematográfico protegido.

Esta polémica es prácticamente idéntica a la que rodea a modelos estadounidenses como Sora de OpenAI. Quien participa en la carrera de IA para vídeo se enfrenta inevitablemente a preguntas sobre derechos, reutilización de imágenes y protección de los creadores.

Alibaba, Zhipu y Moonshot: los nuevos pesos pesados

Qwen3.5 de Alibaba: texto, imagen y vídeo en un solo modelo

Alibaba ha presentado Qwen3.5, un modelo de lenguaje visual capaz de procesar texto, imágenes y vídeo en cerca de 200 idiomas. El sistema puede actuar como agente multimodal: lee formularios, navega por sitios web y ejecuta tareas digitales que normalmente requieren intervención humana.

Qwen3.5 se publica bajo una licencia abierta y está disponible para descargar. Los desarrolladores pueden modificarlo, ajustarlo o integrarlo en sus propias aplicaciones sin depender de una API externa.

GLM-5 de Zhipu AI: mayor eficiencia gracias a una atención inteligente

Zhipu AI presenta GLM-5, un modelo diseñado para la inteligencia agéntica y el razonamiento en múltiples pasos. Su arquitectura se basa en DeepSeek Sparse Attention (DSA), una técnica mediante la cual el modelo no analiza todas las palabras simultáneamente, sino que aprende a centrar su atención únicamente en las partes más relevantes de la entrada.

Esto ahorra capacidad de cómputo y memoria, reduciendo significativamente los costes de inferencia. Un detalle destacable: GLM-5 ha sido entrenado íntegramente sobre chips Huawei Ascend, sin utilizar unidades de procesamiento gráfico estadounidenses. Con ello, Zhipu demuestra que es posible desarrollar IA de alto nivel con un ecosistema de hardware completamente chino.

DeepSeek V4: entrenamiento más económico, rendimiento de élite

DeepSeek ya causó sensación con su versión V3, que alcanzó resultados comparables a ChatGPT en pruebas de referencia con costes de entrenamiento muy inferiores. La próxima versión V4, según fuentes en Estados Unidos, superaría aún más estos resultados, especialmente en programación y análisis complejo.

El medio especializado The Information informó de que DeepSeek V4 es capaz de superar en algunas pruebas a modelos de Anthropic (Claude) y OpenAI (serie GPT). Con esto, la empresa se sitúa en lo más alto del ranking mundial de IA generativa.

Kimi K2.5 de Moonshot AI: un equipo de especialistas en un solo modelo

Moonshot AI lanzó a finales de enero Kimi K2.5, un modelo que utiliza una arquitectura de mezcla de expertos (MoE), similar a algunas variantes de Google Gemini. En lugar de una única red grande que lo hace todo, Kimi K2.5 está compuesto por múltiples subredes especializadas, cada una orientada a una tarea concreta como código, matemáticas o escritura creativa.

Con cada consulta, el sistema activa únicamente los expertos relevantes, lo que limita la carga computacional. Así, un modelo relativamente grande puede ejecutarse de forma fluida en hardware menos potente.

Por qué la distancia con Silicon Valley se reduce a gran velocidad

Los modelos estadounidenses como ChatGPT y Gemini siguen obteniendo puntuaciones ligeramente superiores en muchos benchmarks oficiales. Pero la diferencia se reduce cada trimestre. Según múltiples pruebas independientes, los modelos chinos de lenguaje y multimodales obtienen resultados casi equivalentes en tareas clave como traducción, programación, razonamiento y resumen, e incluso los superan en algunos casos.

Aspecto	Modelos estadounidenses	Modelos chinos
Benchmarks de lenguaje y lógica	Puntuaciones algo superiores	Diferencia pequeña, en rápido crecimiento
Disponibilidad	Principalmente a través de API en la nube	Muchos ejecutables localmente
Licencias	Principalmente cerradas	Muchos de código abierto o pesos abiertos
Eficiencia	Grandes centros de datos, costes elevados	Enfocados en ahorro y optimización

Para las empresas internacionales, estas diferencias importan cada vez más. Un banco, un hospital o un despacho de abogados generalmente no quiere que sus documentos confidenciales lleguen a una nube externa, por muy segura que se declare. Los modelos ejecutables localmente resultan entonces muy atractivos.

La combinación de rendimiento sólido, licencias abiertas y posibilidad de uso local podría convertir los modelos de IA chinos en herramientas estándar a nivel mundial en muy poco tiempo.

¿Qué implica esto para las empresas?

Las organizaciones se enfrentan ahora a una nueva decisión estratégica: ¿continúan confiando en los modelos en la nube estadounidenses, o construyen sus propias infraestructuras de IA basadas en modelos de código abierto, posiblemente chinos?

En la práctica, ya se observan fórmulas mixtas:

Modelos en la nube estadounidenses para atención al cliente, marketing y tareas genéricas.
Modelos de código abierto ejecutados localmente para documentos internos sensibles.
Modelos especializados, por ejemplo para vídeo o código, seleccionados según cada proyecto.

Con esto, el papel de los proveedores de IA está cambiando: ya no se trata de un único "chatbot mágico", sino de un ecosistema de múltiples modelos que coexisten, cada uno con sus propias fortalezas y limitaciones.

Conceptos clave y riesgos a tener en cuenta

Los modelos de código abierto ofrecen mayor libertad, pero también exigen mayor responsabilidad. Quien ejecuta un modelo localmente debe encargarse de:

Gestión de accesos y registros de actividad.
Filtrado de resultados no deseados o inapropiados.
Cumplimiento de la normativa de privacidad vigente, como el Reglamento General de Protección de Datos.

Author

Begoña Pérez

Begoña Pérez, conocida popularmente como La Ordenatriz, es una experta en orden y limpieza que ha revolucionado las redes sociales en España con sus soluciones prácticas para el hogar. Madre de siete hijos, Begoña comenzó compartiendo consejos basados en su propia experiencia diaria, lo que la llevó a convertirse en una guía indispensable para miles de personas. Su especialidad son los "trucos de limpieza" imposibles: cómo quitar manchas de tinta, vino o grasa usando productos económicos y accesibles. Ha publicado libros de éxito como "Limpieza, orden y felicidad", consolidándose como la máxima autoridad en лайфхаки domésticos.