Lar Notícias Desenvolvimento da AI Deepseek: um mito de US $ 1,6 bilhão revelado

Desenvolvimento da AI Deepseek: um mito de US $ 1,6 bilhão revelado

May 16,2025 Autor: Sadie

O novo chatbot da Deepseek causou um impacto significativo no mercado de IA, apresentando -se com a declaração intrigante:

Olá, fui criado para que você possa perguntar qualquer coisa e obter uma resposta que pode até surpreendê -lo.

Esse modelo de IA não apenas se tornou um concorrente formidável, mas também contribuiu para uma das maiores quedas de preços das ações da NVIDIA. A abordagem inovadora de Deepseek para o desenvolvimento de IA a diferencia, utilizando tecnologias avançadas como:

Previsão com vários toques (MTP) : Este método permite que o modelo preveja várias palavras de uma só vez, analisando diferentes peças de frases, aumentando a precisão e a eficiência.

Mistura de especialistas (MOE) : Empregando 256 redes neurais, com oito ativados para cada tarefa de processamento de token, essa arquitetura acelera o treinamento de IA e aumenta o desempenho.

Atenção latente de várias cabeças (MLA) : Ao focar nas partes mais significativas de uma frase e extrair detalhes-chave repetidamente, o MLA reduz a chance de perder informações cruciais, permitindo que a IA capture nuances importantes.

Teste Deepseek Imagem: Ensigame.com

A Deepseek, uma startup chinesa proeminente, afirma ter desenvolvido um modelo competitivo de IA a um custo mínimo, afirmando que gastaram apenas US $ 6 milhões no treinamento do Deepseek V3 usando apenas 2048 processadores gráficos. No entanto, analistas da semiânica revelaram que a DeepSeek opera uma vasta infraestrutura computacional, utilizando aproximadamente 50.000 GPUs NVIDIA Hopper, incluindo 10.000 H800, 10.000 H100s e GPUs H20 adicionais. Esses recursos estão espalhados por vários data centers e usados ​​para treinamento, pesquisa e modelagem financeira de IA.

O investimento total da empresa em servidores é de cerca de US $ 1,6 bilhão, com despesas operacionais estimadas em US $ 944 milhões. A Deepseek é uma subsidiária do fundo de hedge chinês High-Flyer, que o estabeleceu como uma divisão separada de IA em 2023. Ao contrário da maioria das startups que dependem da computação em nuvem, a DeepSeek possui seus data centers, permitindo o controle total sobre a otimização do modelo de IA e a implementação mais rápida da inovação. A empresa permanece autofinanciada, aumentando sua flexibilidade e velocidade de tomada de decisão.

Deepseek v3 Imagem: Ensigame.com

A Deepseek também atrai os melhores talentos, com alguns pesquisadores ganhando mais de US $ 1,3 milhão anualmente, principalmente das principais universidades chinesas. Apesar disso, a reivindicação de treinamento do DeepSeek V3 por apenas US $ 6 milhões parece irrealista, pois esse número apenas explica o uso da GPU durante os custos de pré-treinamento e exclui pesquisas, refinamento de modelos, processamento de dados e infraestrutura.

Desde o seu início, a Deepseek investiu mais de US $ 500 milhões em desenvolvimento de IA. Sua estrutura compacta permite a implementação ativa e eficaz das inovações de IA, diferentemente das empresas maiores e mais burocráticas.

Deepseek Imagem: Ensigame.com

O exemplo de Deepseek mostra que uma empresa de IA independente e bem financiada pode competir com os líderes do setor. No entanto, os especialistas observam que o sucesso da empresa se deve a investimentos significativos, avanços técnicos e uma equipe forte, em vez de um "orçamento revolucionário" para o desenvolvimento do modelo de IA.

Deepseek Imagem: Ensigame.com

Apesar disso, os custos da Deepseek permanecem inferiores aos de seus concorrentes. Por exemplo, enquanto a Deepseek gastou US $ 5 milhões em R1, o custo de treinamento do ChatGPT4O era de US $ 100 milhões. No entanto, ainda é mais barato que seus concorrentes.

Artigos Mais Recentes

27

2025-12

MapleStory Worlds chega às Américas e Europa para dispositivos móveis e PC.

https://img.hroop.com/uploads/60/173706124067897378c55af.jpg

MapleStory Worlds é o mais recente lançamento da popular franquia da Nexon.Está agora sendo lançado simultaneamente nas Américas e na Europa.Crie suas próprias experiências usando uma variedade de ferramentas básicas e avançadas com os recursos do Ma

Autor: SadieLeitura:1

27

2025-12

Back to the Future Writer Rules Out Franchise Expansion

https://img.hroop.com/uploads/37/6810a347a4771.webp

O argumentista de Back to the Future, Bob Gale, afirmou categoricamente que nunca haverá sequências, prequels ou derivações da icónica franquia cinematográfica. Esta declaração surge após especulação ter surgido quando os criadores de Cobra Kai discu

Autor: SadieLeitura:2

26

2025-12

O Reino Mágico da Disney Cresce com o Parque Piston Peak.

https://img.hroop.com/uploads/68/683f1c7cecb01.webp

A Walt Disney World anunciou oficialmente que a sua futura área temática inspirada em "Carros" será chamada de Parque Nacional Piston Peak, marcando o que descreve como a "maior expansão na história do Magic Kingdom."Conforme detalhado no Disney Park

Autor: SadieLeitura:3

26

2025-12

Smith Rejeitou Papel em A Origem, Confirmam Fontes.

https://img.hroop.com/uploads/27/685015d81b8d3.webp

Will Smith se abriu sobre sua decisão de recusar 'A Origem' de Christopher Nolan, marcando seus primeiros comentários públicos sobre a escolha que definiu sua carreira.O revolucionário thriller de ficção científica de 2010 explora paisagens oníricas

Autor: SadieLeitura:2