¿Qué es DeepSeek? Todo lo que debes saber de la IA china que ha sacudido al mundo

💘 ¡Ocasión Flechazo! ¡Mejores cupones y promociones de descuento en AliExpress! [Más info ]

El mundo tecnológico ha sufrido una sacudida inesperada cuando DeepSeek, una startup china de inteligencia artificial (IA) relativamente desconocida, presentó avances que desafiaron las expectativas de la industria.

Mientras gigantes como Meta y Nvidia se enfrentaban a cuestionamientos sobre su futuro, DeepSeek demostró que podía crear modelos de IA potentes con recursos significativamente menores a los que se creía necesarios. Este logro ha encendido un debate global sobre la competitividad de las empresas estadounidenses en el campo de la IA.

Entrada Relacionada

A continuación, exploramos en detalle quién es DeepSeek, cómo logró este impacto y qué implicaciones tiene para el futuro de la tecnología.

 

¿Qué es DeepSeek?

DeepSeek es una startup fundada y controlada por High-Flyer, una firma china de corretaje de valores. Su misión es desarrollar tecnologías de inteligencia artificial similares a ChatGPT de OpenAI o Gemini de Google.

Desde su fundación, DeepSeek ha atraído a jóvenes talentos de las principales universidades de China, ofreciéndoles salarios competitivos y la oportunidad de trabajar en proyectos innovadores.

La empresa ha desarrollado varios modelos de lenguaje a gran escala, que son la base de los chatbots modernos. Su modelo más reciente, DeepSeek-V3, fue lanzado en enero de 2024 y destacó por ser extremadamente eficiente en el uso de recursos.

 

¿Por qué el mercado ha reaccionado ahora a DeepSeek?

Aunque DeepSeek-V3 igualaba las capacidades de los mejores chatbots de OpenAI y Google, lo que realmente llamó la atención fue cómo se logró. En un artículo de investigación, DeepSeek explicó que había entrenado su modelo utilizando solo 2.000 chips Nvidia, mientras que las principales empresas tecnológicas suelen utilizar hasta 16.000 chips o más para tareas similares.

Además, la startup afirmó que había invertido solo 6 millones de dólares en el proceso, una cifra muy inferior a los cientos de millones que suelen gastar las grandes compañías.

 

¿Cómo logró DeepSeek optimizar el uso de chips?

El secreto detrás del éxito de DeepSeek radica en su enfoque innovador para procesar datos. Usando una técnica conocida como «mixture of experts» (mezcla de expertos), distribuyeron el análisis de datos entre varios modelos especializados, reduciendo la pérdida de tiempo en el intercambio de información.

Este método no solo permitió un uso más eficiente de los recursos, sino que también demostró que cualquier empresa con conocimientos similares podría replicar el proceso.

 

¿Cuánto de avanzada es la tecnología de DeepSeek?

DeepSeek-V3 superó pruebas estándar en áreas como resolución de problemas lógicos, redacción de programas y generación de respuestas, alcanzando un nivel comparable al de OpenAI y Google. Sin embargo, OpenAI recientemente presentó un modelo más avanzado, OpenAI o3, diseñado para «razonar» en problemas matemáticos y científicos, lo que lo coloca en una posición superior.

En respuesta, DeepSeek lanzó su propio modelo de razonamiento, DeepSeek R1, que también impresionó a los expertos y avivó el temor de que China esté cerrando la brecha tecnológica.

 

¿Qué implicaciones tiene esto para las empresas tecnológicas de Estados Unidos?

Aunque DeepSeek ha demostrado que se pueden construir sistemas avanzados con menos recursos, las grandes empresas tecnológicas aún tienen ventajas significativas gracias a sus enormes centros de datos y recursos financieros. Estas empresas pueden realizar más experimentos y desarrollar modelos más avanzados que requieran una potencia de cálculo aún mayor.

Sin embargo, el logro de DeepSeek plantea preguntas sobre la sostenibilidad del liderazgo estadounidense en el ámbito de la IA, especialmente si startups chinas continúan avanzando a este ritmo.

 

¿Cómo afecta esto a las restricciones de chips impuestas por Estados Unidos?

Para frenar el avance tecnológico de China, Estados Unidos ha limitado la venta de chips avanzados de Nvidia a empresas chinas. Sin embargo, el éxito de DeepSeek sugiere que estas restricciones podrían estar teniendo el efecto contrario, al forzar a los investigadores chinos a innovar con herramientas más limitadas pero igualmente efectivas.

 

¿Qué es la IA de código abierto y por qué es importante?

DeepSeek ha adoptado el enfoque de código abierto para su tecnología, compartiendo el código base de sus modelos con otras empresas e investigadores. Esto permite que otros desarrollen productos similares y acelera la evolución tecnológica global.

En 2023, Meta lideró esta tendencia con el lanzamiento de su modelo Llama, y ahora empresas chinas como DeepSeek están demostrando que el ecosistema de código abierto puede prosperar independientemente de las grandes compañías estadounidenses.

Sin embargo, el código abierto también plantea riesgos, como la posibilidad de que estas tecnologías sean mal utilizadas, lo que ha llevado a algunos legisladores estadounidenses a considerar regulaciones más estrictas.

 

¿China está liderando la carrera de la IA?

Aunque DeepSeek ha mostrado avances impresionantes, todavía no se puede afirmar que China haya superado a Estados Unidos en IA. OpenAI y otras empresas estadounidenses continúan desarrollando tecnologías de vanguardia, y aún no hemos visto todo el potencial de sus modelos más recientes. Sin embargo, la rapidez con la que China avanza en la IA de código abierto es motivo de preocupación para muchos expertos.

Dejar un comentario

Tu dirección de e-mail nunca será publicada Los campos requeridos están marcados*

Esta web usa cookies para elaborar información estadística y mostrar publicidad personalizada.

Saber más