Casa Notizia DeepSeek AI Sviluppo: un mito di $ 1,6 miliardi svelato

DeepSeek AI Sviluppo: un mito di $ 1,6 miliardi svelato

May 16,2025 Autore: Sadie

Il nuovo chatbot di DeepSeek ha avuto un impatto significativo nel mercato dell'IA, presentandosi con la dichiarazione intrigante:

Ciao, sono stato creato in modo da poter chiedere qualsiasi cosa e ottenere una risposta che potrebbe persino sorprenderti.

Questo modello AI non è solo diventato un formidabile concorrente, ma ha anche contribuito a uno dei maggiori calo dei prezzi delle azioni di Nvidia. L'approccio innovativo di Deepseek allo sviluppo dell'IA lo distingue, utilizzando tecnologie avanzate come:

Multi-Token Prediction (MTP) : questo metodo consente al modello di prevedere più parole contemporaneamente analizzando diversi parti di frasi, migliorando sia l'accuratezza che l'efficienza.

Miscela di esperti (MOE) : impiegando 256 reti neurali, con otto attivate per ogni attività di elaborazione dei token, questa architettura accelera la formazione dell'intelligenza artificiale e aumenta le prestazioni.

Attenzione latente a più testa (MLA) : concentrandosi sulle parti più significative di una frase ed estraendo ripetutamente i dettagli chiave, MLA riduce la possibilità di perdere informazioni cruciali, consentendo all'IA di catturare importanti sfumature.

Test di DeepSeek Immagine: Ensigame.com

DeepSeek, un'importante startup cinese, afferma di aver sviluppato un modello di intelligenza artificiale competitivo a un costo minimo, affermando che hanno speso solo $ 6 milioni per allenare Deepseek V3 utilizzando solo 2048 processori grafici. Tuttavia, gli analisti della seminalisi hanno rivelato che DeepSeek gestisce una vasta infrastruttura computazionale, utilizzando circa 50.000 GPU di Hopper Nvidia, tra cui 10.000 unità H800, 10.000 H100 e GPU H20 aggiuntive. Queste risorse sono distribuite su più data center e utilizzati per la formazione, la ricerca e la modellazione finanziaria dell'IA.

L'investimento totale della società nei server è di circa $ 1,6 miliardi, con spese operative stimate in $ 944 milioni. DeepSeek è una filiale dell'Hedge Fund cinese High-Flyer, che lo ha stabilito come una divisione separata focalizzata sull'intelligenza artificiale nel 2023. A differenza della maggior parte delle startup che si basano sul cloud computing, Deepseek possiede i suoi data center, consentendo il pieno controllo sull'ottimizzazione del modello AI e nell'implementazione più rapida dell'innovazione. L'azienda rimane autofinanziata, migliorando la sua flessibilità e la velocità decisionale.

DeepSeek V3 Immagine: Ensigame.com

DeepSeek attira anche i migliori talenti, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno, principalmente dalle principali università cinesi. Nonostante ciò, l'affermazione della formazione di DeepSeek V3 per soli $ 6 milioni sembra irrealistica, poiché questa cifra rappresenta solo l'utilizzo della GPU durante il pre-allenamento ed esclude la ricerca, il raffinamento del modello, l'elaborazione dei dati e i costi di infrastruttura.

Fin dall'inizio, Deepseek ha investito oltre $ 500 milioni in sviluppo dell'IA. La sua struttura compatta consente un'implementazione attiva ed efficace delle innovazioni di intelligenza artificiale, a differenza di aziende più grandi e burocratiche.

Deep -Week Immagine: Ensigame.com

L'esempio di Deepseek mostra che un'azienda di intelligenza artificiale indipendente ben finanziata può competere con i leader del settore. Tuttavia, gli esperti notano che il successo dell'azienda è dovuto a investimenti significativi, scoperte tecniche e un team forte, piuttosto che un "budget rivoluzionario" per lo sviluppo del modello di intelligenza artificiale.

Deep -Week Immagine: Ensigame.com

Nonostante ciò, i costi di Deepseek rimangono inferiori a quelli dei suoi concorrenti. Ad esempio, mentre DeepSeek ha speso $ 5 milioni in R1, il costo di formazione per Chatgpt4o è ​​stato di $ 100 milioni. Tuttavia, è ancora più economico dei suoi concorrenti.

Ultimi articoli

16

2025-05

Tablet migliori per streaming, gioco, lavoro nel 2023

https://img.hroop.com/uploads/98/6812f20654369.webp

Scegliere il tablet perfetto può essere un compito scoraggiante, specialmente con la miriade di opzioni disponibili. La gamma di iPad di Apple offre di tutto, dai modelli economici ai powerhous di fascia alta, ognuno con display e processori diversi. Ad esempio, la differenza tra una retina liquida di

Autore: SadieLettura:0

16

2025-05

Lollipop Chainsaw Repop colpisce il principale traguardo delle vendite

https://img.hroop.com/uploads/66/173654307567818b630dbc0.jpg

Dal suo lancio alla fine dell'anno scorso, Lollipop Chainsaw Repop ha fatto ondate nella comunità dei giochi, recentemente superando una pietra miliare significativa di oltre 200.000 unità vendute. Questo remaster del classico gioco d'azione ha attirato i fan desiderosi di immergersi nel suo mondo unico, nonostante alcuni iniziali

Autore: SadieLettura:0

16

2025-05

Fire Emblem Heroes segna l'8 ° anniversario con convocazioni gratuite, aggiornamenti QOL

https://img.hroop.com/uploads/76/173925362467aae778ed4f5.jpg

Nintendo continua a mantenere la sua fedele base di fan impegnata con i suoi franchising di punta e Fire Emblem Heroes è una testimonianza di questa dedizione. Ora celebra il suo ottavo anno - una pietra miliare notevole nel mondo dei giochi mobili in cui sono comuni arresti inaspettati - questo RPG strategico sta lanciando speciale Q

Autore: SadieLettura:0

16

2025-05

Nuovi set di Lego Mario Kart lanciati il ​​15 maggio

https://img.hroop.com/uploads/16/682639f5b17cf.webp

Appassionati di Lego, segna i tuoi calendari! Mentre Lego in genere lancia nuovi set sul primo di ogni mese, alcuni set non possono aspettare e fare il loro debutto ogni volta che ne hanno voglia. Il 15 maggio, LEGO sta trattando i fan con una serie entusiasmante di nuove uscite, con un set di Mario Kart che guida il carattere

Autore: SadieLettura:0