DeepSeek
Lo que hay detrás de la inteligencia artificial china, DeepSeek, para unos "impresionante" para otros un robo y un riesgo de censura
OpenAI ha señalado que ha encontrado evidencias de que DeepSeek ha utilizado sus modelos de Inteligencia Artificial, mientras, DeepSeek sigue liderando las listas de descargas en las tiendas de aplicaciones App Store y Google Play Store.
Publicidad
10 días lleva Donald Trump en el poder y el mundo ya se tambalea. Las tecnológicas estadounidenses vivieron estos días su particular terremoto por la irrupción de DeepSeek liderando las listas de descargas. Pero, ¿qué es DeepSeek? Se trata de la alternativa china para el desarrollo de la inteligencia artificial. Los avances de este sector desafían el liderazgo de los modelos estadounidenses.
Concretamente, el modelo que está arrasando es el DeepSeek-R1 que se lanzó el pasado 20 de enero y que apuesta por el código abierto, bajos costes y eficiencia. Hasta el CEO de Open AI cayó rendido a sus encantos. "El modelo r1 de deepseek es impresionante, especialmente si tenemos en cuenta lo que pueden ofrecer por el precio", dijo Sam Altman, consejero delegado de la 'startup' estadounidense OpenAI, responsable de ChatGPT.
Este nuevo competidor supone para algunos un "aliciente" y para otro como Donald Trump una "llamada de atención" a la industria de EE.UU. Su repercusión ha sido tal que la compañía asegura haber sufrido ya un ciberataque que ha provocado que la compañía haya tenido que limitar el registro de nuevos usuarios. "Debido a ataques maliciosos a gran escala a los servicios de DeepSeek, el registro puede estar ocupado. Espere e inténtelo de nuevo. Los usuarios registrados pueden iniciar sesión normalmente. Gracias por su comprensión y apoyo".
La firma china no desveló la naturaleza ni el origen de esos ataques, apunta todavía que sus servicios están funcionando actualmente con un "rendimiento deteriorado". Según Marc Rivero, de Kaspersky, es probable que DeepSeek esté afrontando los conocidos como ataques de denegación de servicio distribuido, en el que los servidores son saturados con tráfico masivo con el objetivo de interrumpir su funcionamiento, aunque también podrían ser intentos masivos de acceso no autorizado o explotación de vulnerabilidades.
Otra de las consecuencias directas ha sido el desplome de la cotización de empresas como Nvidia. Se teme que el impacto que el éxito de DeepSeek pueda llegar a tener en la demanda de microchips de alta gama y este miedo se ha extendido a otros fabricantes como Broadcom, AMD, Arm Holdings o Micron. Se sabe que los chips que han usado son de menor potencia y fueron creados para el mercado chino antes de que Biden impusiese prohibiciones a las exportaciones, pero hay más factores que han sabido aprovechar.
Los elogios han durado poco y días después OpenAI tornó las alabanzas en acusaciones y sospechas, según informaciones del periódico económico británico Financial Times. Se insinúa que la empresa china utilizó los modelos patentados de la tecnológica estadounidense para entrenar a su propio competidor de código abierto. ¿Violación de la propiedad intelectual? El fabricante de ChatGPT ha asegurado que ha encontrado alguna evidencia de "destilación" que es como se llama a la transferencia de conocimientos, pero no ha querido dar más detalles.
¿Qué ha sabido hacer mejor DeepSeek que los competidores?
El éxito de la IA china parece estar en haber conseguido la regla de las 3B, buena, bonita y barata. Se estima que el coste computacional de DeepSeek es 35 veces menor al que registran los gigantes norteamericanos que se dejan la friolera cifra de más de 100 millones de dólares para entrenar un modelo, algo que los asiáticos han logrado solo con 5 millones de dólares. La eficacia parece similar a la de los competidores, pero ¿cómo es posible?
Es difícil adivinar el futuro en un campo tan volátil como el de la tecnología y aunque todo el mundo quiere saber si DeepSeek se impondrá en el tiempo a las empresas norteamericanas como Google, Microsoft...lo cierto es que esa respuesta no la sabemos, pero sí podemos analizar qué ha sabido hacer China que otros no han sabido para lograr este éxito y esto podemos hacerlo porque los creadores de DeepSeek han hecho público su informe técnico.
- El modelo chino utiliza la arquitectura DeepSeekMoE que lo que hace es dividir el modelo en diferentes expertos de manera que para cada petición solo se activan los necesarios. Los modelos de OpenAI activan todo el modelo tanto en el entrenamiento como en el uso real.
- Tanto los modelos americanos como los chinos precisan un almacén en el que guardar las claves que se asignan a cada token y eso como puedes imaginar ocupa memoria. La novedad que presenta DeepSeek con respecto a los norteamericanos es que dan prioridad a los tokens principales comprimiendo dicho almacén de claves y valores.
- Auxiliary-Loss-Free Load Balancing El modelo es capaz de equilibrar el trabajo de cada experto de forma dinámica.
- Multi-token Prediction Training Objective Normalmente los modelos proporcionan la respuesta tras analizar token a token, pero DeepSeek predice varios tokens juntos.
- DeepSeek V3 incluye protocolos para evitar cuellos de botella durante el entrenamiento, momento en el que hay que intercambiar datos entre todas las computadoras activas
- En el modelo asiático se usan números FP8, que dicen son menos precisos, pero reducir el consumo de memoria y agilizar los cálculos.
DeepSeek, ¿un arma contra la democracia?
Pese al éxito industrial, DeepSeek, está siendo percibida por muchos como un potencial peligro ya que se posiciona como una poderosa herramienta para controlar, desinformar y erosionar principios democráticos.
AP formuló al chatbot de DeepSeek y a ChatGPT de OpenAI las mismas preguntas sobre las relaciones entre Estados Unidos y China para comparar las respuestas y su conclusión pasa porque el modelo asiático parece censurar los temas delicados en China.
Desde Antena 3 Noticias se ha hecho una comparación similar sobre qué sí gace ChatGPT y DeepSeek y aquí sí se aprecian diferencias significativas.
Síguenos en nuestro canal de WhatsApp y no te pierdas la última hora y toda la actualidad de antena3noticias.com
Publicidad