DeepSeek မှ Chatbot အသစ်သည် AI ဈေးကွက်တွင်သိသိသာသာသက်ရောက်မှုများပြုလုပ်ခဲ့ပြီးစိတ်ဝင်စားဖွယ်ဖော်ပြချက်နှင့်မိတ်ဆက်ပေးခြင်း
မင်္ဂလာပါ, မင်းကိုဖန်တီးပြီးမင်းကိုအံ့အားသင့်စရာကောင်းလောက်အောင်အဖြေရနိုင်တယ်။
ဤ AI မော်ဒယ်သည်ကြောက်မက်ဖွယ်ကောင်းသောပြိုင်ဘက်တစ် ဦး သာမက Nvidia ၏အကြီးမားဆုံးစတော့ရှယ်ယာဈေးနှုန်းကျဆင်းမှုတစ်ခုသို့လည်းလှူဒါန်းခဲ့သည်။ AI Development သို့အထူးဆန်းသစ်သောချဉ်းကပ်မှုသည်၎င်းကိုအထူးသဖြင့်အဆင့်မြင့်နည်းပညာများအသုံးပြုသည်။
Multi-token ခန့်မှန်းခြင်း (MTP) - ဤနည်းလမ်းသည်ပုံစံကိုဝါကျအစိတ်အပိုင်းများကိုခွဲခြမ်းစိတ်ဖြာခြင်းအားဖြင့်စကားလုံးများစွာကိုတစ်ပြိုင်နက်တည်းကြိုတင်ဟောကိန်းထုတ်ရန်,
ကျွမ်းကျင်သူများ (MoE) အရောအနှော - NEWNEAct Networks 256 ခုကို အသုံးပြု. လက်မထပ်မှုလုပ်ငန်းတစ်ခုစီအတွက် 8 ဗိသုကာသည် AI သင်တန်းတက်ခြင်းနှင့်စွမ်းဆောင်ရည်ကိုမြှင့်တင်ပေးသည်။
Multi-Head ငုပ်လျှိုးနေသည့်အာရုံစူးစိုက်မှု (MLA) - ဝါကျ၏အထင်ရှားဆုံးအစိတ်အပိုင်းများကိုအာရုံစိုက်ခြင်းနှင့်အဓိကအသေးစိတ်အချက်အလက်များကိုထပ်ခါတလဲလဲထုတ်ယူခြင်းအားဖြင့် MLLA သည်အရေးပါသောသတင်းအချက်အလက်များကိုလျော့နည်းစေပြီးအရေးပါသောသတင်းအချက်အလက်များကိုလျှော့ချရန်အခွင့်အလမ်းကိုလျော့နည်းစေသည်။
image: ensigame.com
ထင်ရှားသောတရုတ်ကုမ္ပဏီတစ်ခုသည်အပြိုင်အဆိုင် AI မော်ဒယ်လ်ကိုအနည်းဆုံးကုန်ကျစရိတ်ဖြင့်တီထွင်ခဲ့ကြပြီး 2048 ဂရပ်ဖစ်ပရိုဆက်ဆာများကို အသုံးပြု. လေ့ကျင့်ရေးအတွက်ဒေါ်လာ 6 သန်းသာသုံးစွဲခဲ့သည်။ သို့ရာတွင် Semianalysis မှလေ့လာသုံးသပ်သူများက BLUSSEEK သည် 40000 H800 H800 H800, H800 H100s နှင့်နောက်ထပ် H20 GPU များအပါအ 0 င် Nvidia Hopper GPU များကို အသုံးပြု. Nvidia Hopher GPU များနှင့်နောက်ထပ် H20 GPU များအပါအ 0 င် Semidia Hopper GPU များနှင့်နောက်ထပ် H20 GPU များအပါအ 0 င် Semidia Hopper GPU များနှင့်နောက်ထပ် H20 GPU များအပါအ 0 င်။ ဤအရင်းအမြစ်များကိုဒေတာစင်တာများစွာဖြင့်ပျံ့နှံ့သွားပြီး AI သင်တန်း, သုတေသနနှင့်ဘဏ် modelioding ာရေးဆိုင်ရာပုံစံများအတွက်အသုံးပြုသည်။
ကုမ္ပဏီ၏ဆာဗာများတွင်စုစုပေါင်းရင်းနှီးမြှုပ်နှံမှုသည်ဒေါ်လာ 1.6 ဘီလီယံခန့်ရှိပြီးလုပ်ငန်းလည်ပတ်မှုကုန်ကျစရိတ်မှာဒေါ်လာ 944 သန်းရှိသည်။ DeepSeek သည် 2023 တွင်သီးခြား AI-finced discused အဖြစ်သတ်မှတ်ထားသည့်တရုတ်ခြံစောင်ခြံမြင့်မားသောလက်ကမ်းနီ၏လက်အောက်ခံဖြစ်သည်။ Cloud Computing အပေါ်မှီခိုနေရသော startups များနှင့်မတူဘဲ Bodseeek သည်၎င်း၏အချက်အလက်စင်တာများကိုပိုင်ဆိုင်သည်။ ကုမ္ပဏီအနေဖြင့်မိမိကိုယ်ကိုရန်ပုံငွေရှင်းရှင်းလင်းလင်းထားရှိပြီး၎င်း၏ပြောင်းလွယ်ပြင်လွယ်မှုနှင့်ဆုံးဖြတ်ချက်ချခြင်းမြန်နှုန်းကိုတိုးမြှင့်ပေးနေဆဲဖြစ်သည်။
image: ensigame.com
DeepSeek သည် Top Talent ကိုဆွဲဆောင်နိုင်ပြီးအချို့သောသုတေသနပြုသူများသည်နှစ်စဉ်ဒေါ်လာ 1.3 သန်းကျော်ကိုရရှိသည်။ ဤသို့ဖြစ်သော်လည်းဒေါ်လာ 6 သန်းမျှသာရှိသော Dayseek V3 ကိုလေ့ကျင့်သင်ကြားမှု၏ပြောဆိုချက်သည်လက်တွေ့မကျပုံနှင့်သုတေသန, စံပြသန့်စင်ခြင်း,
အစမှစပြီး Bodseek သည် AI ဖွံ့ဖြိုးတိုးတက်မှုတွင်ဒေါ်လာသန်း 500 ကျော်ရင်းနှီးမြှုပ်နှံခဲ့သည်။ ၎င်း၏ကျစ်လစ်သိပ်သည်းသောဖွဲ့စည်းပုံသည်ပိုမိုကြီးမားသောဗျူရိုကရေစီယန္တရားကုမ္ပဏီများနှင့်မတူဘဲ AI ဆန်းသစ်တီထွင်မှုများကိုတက်ကြွစွာနှင့်ထိရောက်စွာအကောင်အထည်ဖော်ရန်ခွင့်ပြုသည်။
image: ensigame.com
BLELSEEK ၏ဥပမာကငွေကြေးထောက်ပံ့ထားသောလွတ်လပ်သော AI ကုမ္ပဏီများသည်စက်မှုလုပ်ငန်းခေါင်းဆောင်များနှင့်ယှဉ်ပြိုင်နိုင်ကြောင်းနက်ရှိုင်းသောပုံသက်သေကဖော်ပြသည်။ သို့သော်ကျွမ်းကျင်သူများကကုမ္ပဏီ၏အောင်မြင်မှုသည် AI Model Development အတွက် "တော်လှန်ရေးဘတ်ဂျက်" ထက်သိသာထင်ရှားသည့်ရင်းနှီးမြှုပ်နှံမှုများ, နည်းပညာဆိုင်ရာအောင်မြင်မှုများနှင့်ခိုင်မာသောအဖွဲ့များကြောင့်ဖြစ်သည်။
image: ensigame.com
ဤသို့ဖြစ်လင့်ကစားအလွန်အရေးကြီးသည်မှာ Bypsseek ၏ကုန်ကျစရိတ်များသည်ပြိုင်ဘက်များထက်နိမ့်ကျနေဆဲဖြစ်သည်။ ဥပမာအားဖြင့် Beysseek သည် R1 တွင်ဒေါ်လာ 5 သန်းသုံးစွဲခဲ့သော်လည်း chatgpt4o အတွက်လေ့ကျင့်မှုကုန်ကျစရိတ်မှာဒေါ်လာသန်း 100 ဖြစ်သည်။ သို့သော်၎င်းသည်၎င်း၏ပြိုင်ဘက်များထက်စျေးသက်သာနေဆဲဖြစ်သည်။