Deepseek'ten yeni sohbet botu, AI pazarında önemli bir etki yarattı ve kendisini ilgi çekici bir açıklama yaptı:
Merhaba, yaratıldım, böylece herhangi bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz.
Bu AI modeli sadece müthiş bir rakip olmakla kalmadı, aynı zamanda Nvidia'nın en büyük hisse senedi fiyat düşüşlerinden birine katkıda bulundu. Deepseek'in AI gelişimine yenilikçi yaklaşımı, aşağıdakiler gibi ileri teknolojiler kullanarak onu ayırır:
Çoklu Tahmini Tahmin (MTP) : Bu yöntem, modelin farklı cümle parçalarını analiz ederek hem doğruluğu hem de verimliliği artırarak bir kerede birden fazla kelimeyi tahmin etmesini sağlar.
Uzmanların Karışımı (MOE) : Her bir jeton işleme görevi için sekiz etkinleştirilmiş 256 sinir ağı istihdam eden bu mimari AI eğitimini hızlandırır ve performansı artırır.
Çok Baş Gizli Dikkat (MLA) : Bir cümlenin en önemli kısımlarına odaklanarak ve önemli ayrıntıları tekrar tekrar çıkararak MLA, AI'nın önemli nüansları yakalamasını sağlayarak önemli bilgileri kaçırma şansını azaltır.
Resim: ensigame.com
Önemli bir Çin girişim olan Deepseek, minimum maliyetle rekabetçi bir AI modeli geliştirdiğini iddia ediyor ve sadece 2048 grafik işlemcileri kullanarak Deepseek V3'ü eğitmek için sadece 6 milyon dolar harcadıklarını belirtiyor. Bununla birlikte, Semianaliz'den analistler, Deepseek'in 10.000 H800 birim, 10.000 H100 ve ek H20 GPU dahil olmak üzere yaklaşık 50.000 NVIDIA Hopper GPU'larını kullanan geniş bir hesaplama altyapısı işlettiğini ortaya koydu. Bu kaynaklar birden fazla veri merkezine yayılmıştır ve AI eğitimi, araştırma ve finansal modelleme için kullanılmaktadır.
Şirketin sunuculara toplam yatırımı 1.6 milyar dolar civarındadır ve operasyonel giderlerin 944 milyon dolar olduğu tahmin edilmektedir. Deepseek, 2023'te ayrı bir AI odaklı bölünme olarak kuran Çin Hedge Fonu High-Flyer'in bir yan kuruluşudur. Bulut bilişimine dayanan çoğu girişimin aksine, Deepseek veri merkezlerine sahiptir ve AI model optimizasyonu ve daha hızlı inovasyon uygulaması üzerinde tam kontrol sağlar. Şirket, esnekliğini ve karar verme hızını artırarak kendi kendini finanse ediyor.
Resim: ensigame.com
Deepseek ayrıca en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1.3 milyon doların üzerinde kazanıyor, öncelikle önde gelen Çin üniversitelerinden. Buna rağmen, Deepseek V3'ü sadece 6 milyon dolarlık eğitme iddiası gerçekçi görünmüyor, çünkü bu rakam sadece eğitim öncesi sırasında GPU kullanımını açıklıyor ve araştırma, model arıtma, veri işleme ve altyapı maliyetlerini hariç tutuyor.
Başından beri Deepseek, AI gelişimine 500 milyon doların üzerinde yatırım yaptı. Kompakt yapısı, daha büyük, daha bürokratik şirketlerin aksine AI yeniliklerinin aktif ve etkili bir şekilde uygulanmasına izin verir.
Resim: ensigame.com
Deepseek'in örneği, iyi finanse edilen, bağımsız bir AI şirketinin endüstri liderleriyle rekabet edebileceğini göstermektedir. Bununla birlikte, uzmanlar, şirketin başarısının AI model geliştirme için "devrimci bir bütçe" yerine önemli yatırımlar, teknik atılımlar ve güçlü bir ekipten kaynaklandığını belirtiyor.
Resim: ensigame.com
Buna rağmen, Deepseek'in maliyetleri rakiplerinden daha düşük kalır. Örneğin, Deepseek R1'e 5 milyon dolar harcarken, ChatGpt4o için eğitim maliyeti 100 milyon dolardı. Ancak, hala rakiplerinden daha ucuz.