Título: China VS. Silicon valley: cómo DeepSeek está cambiando las reglas del juego en IA

DeepSeek ha irrumpido en el mercado de la inteligencia artificial con una propuesta innovadora que desafía a los gigantes tecnológicos. La empresa china ha logrado desarrollar modelos de IA con una eficiencia hasta 45 veces superior a la de otras compañías líderes en el sector, todo ello a pesar de las restricciones impuestas por Estados Unidos en el acceso a hardware avanzado. Su última generación de modelos, DeepSeek V2 y V3, incorpora la arquitectura Mixture of Experts (MoE), un sistema que permite activar únicamente las partes necesarias del modelo en cada operación, optimizando recursos y reduciendo costos.

Uno de los avances más significativos de DeepSeek es la capacidad de su modelo V3, que cuenta con 671 mil millones de parámetros, aunque solo emplea 37 mil millones en cada inferencia. Esto, combinado con técnicas avanzadas como el Multi-Head Latent Attention (MLA) para mejorar la gestión de memoria y el uso de entrenamiento en precisión FP8, permite una mayor eficiencia sin comprometer el rendimiento.

El impacto de DeepSeek no solo se ha visto en términos de innovación tecnológica, sino también en los costos asociados al desarrollo y uso de modelos de IA. Mientras que el entrenamiento de Llama 3.1 de Meta costó diez veces más, DeepSeek logró entrenar su V3 con solo 5.6 millones de dólares, empleando 2.7 millones de horas de GPU H800. Además, la compañía ha apostado por una estrategia agresiva en precios, ofreciendo su API a apenas $0.14 por millón de tokens, en comparación con los $7.50 que cobra OpenAI. Esta política ha generado dudas sobre la sostenibilidad de su modelo de negocio a largo plazo y si se trata de una estrategia inicial para capturar cuota de mercado.

Sin embargo, el crecimiento de DeepSeek también ha estado acompañado de controversia. Existen sospechas de que la empresa ha utilizado respuestas de GPT-4 para entrenar sus modelos sin autorización, una práctica conocida como “distillation”. Análisis recientes han encontrado similitudes notables entre las respuestas de DeepSeek y las de ChatGPT, lo que sugiere que pudo haberse beneficiado de datos ajenos sin el consentimiento de OpenAI. Además, se han detectado sesgos pro-occidentales en sus modelos, algo inusual en una IA desarrollada en China, lo que refuerza la teoría de que el entrenamiento se basó en información proveniente de fuentes no autorizadas.

El impacto de DeepSeek no se limita a la IA, sino que también ha comenzado a afectar a la industria de semiconductores, particularmente a NVIDIA. El modelo R1 de DeepSeek ha mostrado un rendimiento superior a lo esperado, lo que ha llevado a inversores a replantearse la dependencia del hardware de NVIDIA. Este desarrollo pone en evidencia que China ha avanzado más de lo previsto en inteligencia artificial, desafiando las expectativas del mercado y la efectividad de las sanciones tecnológicas de Estados Unidos.

A nivel competitivo, el avance de DeepSeek podría representar un problema para OpenAI, Anthropic y Cohere, compañías que hasta ahora dominaban el sector con modelos cerrados y de alto costo. La caída de los precios en modelos abiertos podría erosionar su rentabilidad y llevar a Microsoft a replantearse su relación con OpenAI. En contraste, empresas como Amazon, Apple y Meta podrían beneficiarse del acceso a modelos de IA más baratos, reduciendo sus costos operativos y facilitando la integración de inteligencia artificial en sus productos y servicios.

DeepSeek ha emergido como un jugador disruptivo en la industria de la inteligencia artificial, combinando eficiencia, innovación y costos reducidos. Sin embargo, su modelo de negocio plantea interrogantes sobre su viabilidad financiera y las implicaciones legales de su entrenamiento de datos. La gran incógnita es si OpenAI y otras empresas podrán proteger su propiedad intelectual frente a estas nuevas prácticas y si NVIDIA logrará mantener su liderazgo en el mercado de hardware de IA ante el ascenso de modelos más eficientes y accesibles.

https://www.lavanguardia.com/economia/20250130/10332936/ia-china-deepseek-comera-ia-estados-unidos-chatgpt.html

https://elpais.com/tecnologia/2025-01-30/deepseek-no-es-un-juego-el-peligro-para-la-privacidad-de-la-nueva-ia-china.html

https://www.eldiario.es/tecnologia/openai-eeuu-acusan-deepseek-destilar-chatgpt-permiso-internet_1_12003873.html

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

×