Hogar Noticias Desarrollo de AI Deepseek: un mito de $ 1.6 mil millones presentado

Desarrollo de AI Deepseek: un mito de $ 1.6 mil millones presentado

May 16,2025 Autor: Sadie

El nuevo chatbot de Deepseek ha tenido un impacto significativo en el mercado de IA, presentándose con la declaración intrigante:

Hola, fui creado para que puedas preguntar cualquier cosa y obtener una respuesta que pueda sorprenderte.

Este modelo de IA no solo se ha convertido en un competidor formidable, sino que también ha contribuido a una de las mayores caídas de precios de las acciones de NVIDIA. El enfoque innovador de Deepseek para el desarrollo de IA lo distingue, utilizando tecnologías avanzadas como:

Predicción múltiple (MTP) : este método permite que el modelo predice múltiples palabras a la vez analizando diferentes piezas de oraciones, mejorando tanto la precisión como la eficiencia.

Mezcla de expertos (MOE) : empleando 256 redes neuronales, con ocho activadas para cada tarea de procesamiento de tokens, esta arquitectura acelera la capacitación de IA y aumenta el rendimiento.

Atención latente de múltiples cabezas (MLA) : al centrarse en las partes más significativas de una oración y extraer detalles clave repetidamente, MLA reduce la posibilidad de faltar información crucial, lo que permite a la IA capturar matices importantes.

Prueba de Speeek Imagen: ensigame.com

Deepseek, una prominente startup china, afirma haber desarrollado un modelo de IA competitivo a un costo mínimo, afirmando que solo gastaron $ 6 millones en capacitar a Deepseek V3 utilizando solo 2048 procesadores gráficos. Sin embargo, los analistas del semianálisis han revelado que Deepseek opera una vasta infraestructura computacional, utilizando aproximadamente 50,000 GPU de la tolva nvidia, incluidas 10,000 unidades H800, 10,000 H100 y GPU H20 adicionales. Estos recursos se distribuyen en múltiples centros de datos y se utilizan para capacitación de IA, investigación y modelado financiero.

La inversión total de la compañía en servidores es de alrededor de $ 1.6 mil millones, con gastos operativos estimados en $ 944 millones. Deepseek es una subsidiaria del Fondo de cobertura chino High-Flyer, que lo estableció como una división separada centrada en AI en 2023. A diferencia de la mayoría de las nuevas empresas que dependen de la computación en la nube, Deepseek posee sus centros de datos, lo que permite un control total sobre la optimización del modelo de IA y la implementación de innovación más rápida. La compañía sigue siendo autofinanciada, mejorando su flexibilidad y velocidad de toma de decisiones.

Deepseek v3 Imagen: ensigame.com

Deepseek también atrae al máximo talento, con algunos investigadores ganando más de $ 1.3 millones anuales, principalmente de las principales universidades chinas. A pesar de esto, el reclamo de capacitar a Deepseek V3 por solo $ 6 millones parece poco realista, ya que esta cifra solo representa el uso de la GPU durante la capacitación previa y excluye la investigación, el refinamiento del modelo, el procesamiento de datos y los costos de infraestructura.

Desde su inicio, Deepseek ha invertido más de $ 500 millones en desarrollo de IA. Su estructura compacta permite la implementación activa y efectiva de innovaciones de IA, a diferencia de las empresas más grandes y burocráticas.

Veterano Imagen: ensigame.com

El ejemplo de Deepseek muestra que una compañía de IA independiente y bien financiada puede competir con los líderes de la industria. Sin embargo, los expertos señalan que el éxito de la compañía se debe a importantes inversiones, avances técnicos y un equipo fuerte, en lugar de un "presupuesto revolucionario" para el desarrollo del modelo de IA.

Veterano Imagen: ensigame.com

A pesar de esto, los costos de Deepseek siguen siendo más bajos que los de sus competidores. Por ejemplo, mientras que Deepseek gastó $ 5 millones en R1, el costo de capacitación para CHATGPT4O fue de $ 100 millones. Sin embargo, sigue siendo más barato que sus competidores.

Últimos artículos

16

2025-05

Las mejores tabletas para la transmisión, los juegos, el trabajo en 2023

https://img.hroop.com/uploads/98/6812f20654369.webp

Elegir la tableta perfecta puede ser una tarea desalentadora, especialmente con la gran cantidad de opciones disponibles. La gama de iPads de Apple ofrece todo, desde modelos económicos hasta potencias de alta gama, cada una con diferentes pantallas y procesadores. Por ejemplo, la diferencia entre una retina líquida DI

Autor: SadieLectura:0

16

2025-05

Lollipop Chainsaw Repop llega a un hito de ventas importante

https://img.hroop.com/uploads/66/173654307567818b630dbc0.jpg

Desde su lanzamiento a fines del año pasado, Lollipop Chainsaw Repop ha estado haciendo olas en la comunidad de juegos, recientemente superando un hito significativo de ventas de más de 200,000 unidades vendidas. Este remaster del clásico juego de acción ha atraído a los fanáticos ansiosos por sumergirse en su mundo único, a pesar de algunas iniciales

Autor: SadieLectura:0

16

2025-05

Fire Emblem Heroes Marca el octavo aniversario con citación gratuita, actualizaciones de calidad de vida

https://img.hroop.com/uploads/76/173925362467aae778ed4f5.jpg

Nintendo continúa manteniendo su leal base de fanáticos comprometidos con sus franquicias insignia, y Fire Emblem Heroes es un testimonio de esta dedicación. Ahora celebrando su octavo año, un hito notable en el mundo de los juegos móviles donde los cierres inesperados son comunes, esta estrategia RPG está implementando Q Special Q

Autor: SadieLectura:0

16

2025-05

Nuevos conjuntos de LEGO Mario Kart que se lanzan el 15 de mayo

https://img.hroop.com/uploads/16/682639f5b17cf.webp

LEGO ENTRADOS, ¡Marque sus calendarios! Si bien LEGO generalmente lanza nuevos sets en el primero de cada mes, algunos sets simplemente no pueden esperar y debutar cuando lo desean. El 15 de mayo, LEGO está tratando a los fanáticos con una emocionante variedad de nuevos lanzamientos, con un destacado set de Mario Kart liderando el Char

Autor: SadieLectura:0