Rumah Berita Pembangunan AI DeepSeek: Mitos $ 1.6 bilion yang Diumumkan

Pembangunan AI DeepSeek: Mitos $ 1.6 bilion yang Diumumkan

May 16,2025 Pengarang: Sadie

Chatbot baru dari DeepSeek telah memberi impak yang signifikan dalam pasaran AI, memperkenalkan dirinya dengan pernyataan yang menarik:

Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda.

Model AI ini bukan sahaja menjadi pesaing yang hebat tetapi juga menyumbang kepada salah satu penurunan harga saham terbesar NVIDIA. Pendekatan inovatif DeepSeek terhadap pembangunan AI membezakannya, menggunakan teknologi canggih seperti:

Ramalan Multi-Token (MTP) : Kaedah ini membolehkan model meramalkan beberapa perkataan sekaligus dengan menganalisis bahagian ayat yang berbeza, meningkatkan kedua-dua ketepatan dan kecekapan.

Campuran Pakar (MOE) : Menggunakan 256 rangkaian saraf, dengan lapan diaktifkan untuk setiap tugas pemprosesan token, seni bina ini mempercepat latihan AI dan meningkatkan prestasi.

Perhatian Laten Multi-Head (MLA) : Dengan memberi tumpuan kepada bahagian-bahagian yang paling penting dalam satu kalimat dan mengekstrak butiran utama berulang kali, MLA mengurangkan peluang kehilangan maklumat penting, membolehkan AI menangkap nuansa penting.

Ujian DeepSeek Imej: ensigame.com

DeepSeek, permulaan Cina yang terkenal, mendakwa telah membangunkan model AI yang kompetitif dengan kos yang minimum, menyatakan bahawa mereka hanya menghabiskan $ 6 juta untuk latihan DeepSeek V3 menggunakan hanya pemproses grafik 2048. Walau bagaimanapun, penganalisis dari semianalisis telah mendedahkan bahawa DeepSeek mengendalikan infrastruktur pengiraan yang luas, menggunakan kira -kira 50,000 GPU NVIDIA Hopper, termasuk 10,000 H800 unit, 10,000 H100S, dan GPU tambahan H20. Sumber -sumber ini tersebar di pelbagai pusat data dan digunakan untuk latihan AI, penyelidikan, dan pemodelan kewangan.

Jumlah pelaburan syarikat dalam pelayan adalah sekitar $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan $ 944 juta. DeepSeek adalah anak syarikat dana lindung nilai Cina yang tinggi, yang menubuhkannya sebagai pembahagian AI yang berasingan pada tahun 2023. Tidak seperti kebanyakan pemula yang bergantung kepada pengkomputeran awan, DeepSeek memiliki pusat datanya, yang membolehkan kawalan penuh ke atas pengoptimuman model AI dan pelaksanaan inovasi yang lebih cepat. Syarikat itu tetap dibiayai sendiri, meningkatkan kelajuan fleksibiliti dan membuat keputusan.

DeepSeek V3 Imej: ensigame.com

DeepSeek juga menarik bakat teratas, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setiap tahun, terutamanya dari universiti -universiti China yang terkemuka. Walaupun demikian, tuntutan latihan DeepSeek V3 untuk hanya $ 6 juta nampaknya tidak realistik, kerana angka ini hanya menyumbang penggunaan GPU semasa latihan pra-latihan dan tidak termasuk penyelidikan, penghalusan model, pemprosesan data, dan kos infrastruktur.

Sejak permulaannya, DeepSeek telah melabur lebih daripada $ 500 juta dalam pembangunan AI. Struktur padatnya membolehkan pelaksanaan inovasi AI yang aktif dan berkesan, tidak seperti syarikat birokrasi yang lebih besar dan lebih besar.

Deepseek Imej: ensigame.com

Contoh DeepSeek menunjukkan bahawa syarikat AI yang dibiayai dengan baik dapat bersaing dengan pemimpin industri. Walau bagaimanapun, pakar -pakar mencatatkan bahawa kejayaan syarikat adalah disebabkan oleh pelaburan yang signifikan, kejayaan teknikal, dan pasukan yang kuat, bukannya "anggaran revolusioner" untuk pembangunan model AI.

Deepseek Imej: ensigame.com

Walaupun begitu, kos DeepSeek kekal lebih rendah daripada pesaingnya. Sebagai contoh, sementara DeepSeek membelanjakan $ 5 juta pada R1, kos latihan untuk ChatGPT4O adalah $ 100 juta. Walau bagaimanapun, ia masih lebih murah daripada pesaingnya.

Artikel terkini

16

2025-05

Tablet teratas untuk streaming, permainan, bekerja pada tahun 2023

https://img.hroop.com/uploads/98/6812f20654369.webp

Memilih tablet yang sempurna boleh menjadi tugas yang menakutkan, terutamanya dengan pelbagai pilihan yang tersedia. Pelbagai iPads Apple menawarkan segala-galanya dari model mesra bajet ke rumah kuasa mewah, masing-masing memaparkan paparan dan pemproses yang berbeza. Contohnya, perbezaan antara retina cair di

Pengarang: SadieMembaca:0

16

2025-05

Lollipop Chainsaw Repop Hits Major Majestor Jualan

https://img.hroop.com/uploads/66/173654307567818b630dbc0.jpg

Sejak pelancarannya lewat tahun lepas, Lollipop Chainsaw Repop telah membuat gelombang dalam komuniti permainan, baru -baru ini melepasi kejayaan jualan yang ketara lebih daripada 200,000 unit yang dijual. Remaster permainan tindakan klasik ini telah menarik peminat yang tidak sabar -sabar untuk menyelam kembali ke dunia yang unik, walaupun beberapa awal

Pengarang: SadieMembaca:0

16

2025-05

Heroes Emblem Kebakaran menandakan ulang tahun ke -8 dengan saman percuma, peningkatan QOL

https://img.hroop.com/uploads/76/173925362467aae778ed4f5.jpg

Nintendo terus mengekalkan fanbase setia yang terlibat dengan francais perdana, dan Heroes Emblem Fire adalah bukti dedikasi ini. Sekarang meraikan tahun ke -8 -peristiwa penting yang luar biasa di dunia permainan mudah alih di mana penutupan yang tidak dijangka adalah perkara biasa -strategi ini RPG melancarkan q khas

Pengarang: SadieMembaca:0

16

2025-05

Set Lego Mario Kart yang baru dilancarkan pada 15 Mei

https://img.hroop.com/uploads/16/682639f5b17cf.webp

Peminat LEGO, tandakan kalendar anda! Walaupun LEGO biasanya melancarkan set baru pada setiap bulan, beberapa set tidak boleh menunggu dan membuat debut mereka apabila mereka merasa seperti itu. Pada 15 Mei, Lego merawat peminat untuk pelbagai siaran baru yang menarik, dengan set Mario Kart yang menonjol memimpin char

Pengarang: SadieMembaca:0