Chatbot ใหม่จาก Deepseek ได้สร้างผลกระทบอย่างมีนัยสำคัญในตลาด AI แนะนำตัวเองด้วยคำแถลงที่น่าสนใจ:
สวัสดีฉันถูกสร้างขึ้นเพื่อให้คุณสามารถถามอะไรก็ได้และรับคำตอบที่อาจทำให้คุณประหลาดใจ
โมเดล AI นี้ไม่เพียง แต่กลายเป็นคู่แข่งที่น่าเกรงขาม แต่ยังมีส่วนร่วมในการลดลงของราคาหุ้นที่ใหญ่ที่สุดของ Nvidia แนวทางที่เป็นนวัตกรรมของ Deepseek ในการพัฒนา AI แยกออกจากกันโดยใช้เทคโนโลยีขั้นสูงเช่น:
Multi-Token Prediction (MTP) : วิธีนี้ช่วยให้แบบจำลองสามารถทำนายได้หลายคำพร้อมกันโดยการวิเคราะห์ชิ้นส่วนประโยคที่แตกต่างกันเพิ่มความแม่นยำและประสิทธิภาพ
ส่วนผสมของผู้เชี่ยวชาญ (MOE) : ใช้เครือข่ายประสาท 256 เครือข่ายโดยมีการเปิดใช้งานแปดครั้งสำหรับงานประมวลผลโทเค็นแต่ละงานสถาปัตยกรรมนี้จะเพิ่มความเร็วในการฝึกอบรม AI และเพิ่มประสิทธิภาพ
ความสนใจแฝงหลายหัว (MLA) : โดยการมุ่งเน้นไปที่ส่วนที่สำคัญที่สุดของประโยคและการแยกรายละเอียดที่สำคัญซ้ำ ๆ MLA จะลดโอกาสในการขาดข้อมูลที่สำคัญทำให้ AI สามารถจับภาพความแตกต่างที่สำคัญได้
รูปภาพ: Ensigame.com
Deepseek การเริ่มต้นของจีนที่โดดเด่นอ้างว่าได้พัฒนาโมเดล AI ที่มีค่าใช้จ่ายน้อยที่สุดโดยระบุว่าพวกเขาใช้เงินเพียง 6 ล้านเหรียญสหรัฐในการฝึกอบรม Deepseek V3 โดยใช้โปรเซสเซอร์กราฟิกเพียง 2048 อย่างไรก็ตามนักวิเคราะห์จาก Semianalysis ได้เปิดเผยว่า Deepseek ดำเนินการโครงสร้างพื้นฐานการคำนวณที่กว้างขวางโดยใช้ GPU Nvidia Hopper ประมาณ 50,000 Nvidia รวมถึง 10,000 H800 หน่วย, 10,000 H100s และ H20 GPU เพิ่มเติม ทรัพยากรเหล่านี้กระจายไปทั่วศูนย์ข้อมูลหลายแห่งและใช้สำหรับการฝึกอบรม AI การวิจัยและการสร้างแบบจำลองทางการเงิน
การลงทุนทั้งหมดของ บริษัท ในเซิร์ฟเวอร์อยู่ที่ประมาณ 1.6 พันล้านดอลลาร์โดยมีค่าใช้จ่ายในการดำเนินงานอยู่ที่ 944 ล้านดอลลาร์ Deepseek เป็น บริษัท ในเครือของกองทุนป้องกันความเสี่ยงของจีนสูง-บินสูงซึ่งจัดตั้งขึ้นเป็นแผนก AI ที่เน้นการแยกต่างหากในปี 2566 ซึ่งแตกต่างจากที่เพิ่งเริ่มต้นส่วนใหญ่ที่พึ่งพาคลาวด์คอมพิวติ้ง Deepseek เป็นเจ้าของศูนย์ข้อมูลทำให้สามารถควบคุมการเพิ่มประสิทธิภาพแบบจำลอง AI ได้อย่างเต็มที่ บริษัท ยังคงได้รับเงินสนับสนุนตนเองเพิ่มความยืดหยุ่นและความเร็วในการตัดสินใจ
รูปภาพ: Ensigame.com
Deepseek ยังดึงดูดความสามารถสูงสุดโดยนักวิจัยบางคนมีรายได้มากกว่า 1.3 ล้านเหรียญสหรัฐต่อปีส่วนใหญ่มาจากมหาวิทยาลัยชั้นนำของจีน อย่างไรก็ตามเรื่องนี้การเรียกร้องการฝึกอบรม Deepseek V3 ในราคาเพียง 6 ล้านเหรียญสหรัฐดูเหมือนจะไม่สมจริงเนื่องจากตัวเลขนี้มีเพียงการใช้งาน GPU ในระหว่างการฝึกอบรมก่อนและไม่รวมการวิจัยการปรับแต่งแบบจำลองการประมวลผลข้อมูลและค่าใช้จ่ายโครงสร้างพื้นฐาน
นับตั้งแต่เริ่มต้น Deepseek ได้ลงทุนกว่า 500 ล้านดอลลาร์ในการพัฒนา AI โครงสร้างขนาดกะทัดรัดช่วยให้การใช้งานนวัตกรรมของ AI มีประสิทธิภาพและมีประสิทธิภาพซึ่งแตกต่างจาก บริษัท ที่มีขนาดใหญ่และมีระบบราชการมากขึ้น
รูปภาพ: Ensigame.com
ตัวอย่างของ Deepseek แสดงให้เห็นว่า บริษัท AI อิสระที่ได้รับการสนับสนุนอย่างดีสามารถแข่งขันกับผู้นำอุตสาหกรรมได้ อย่างไรก็ตามผู้เชี่ยวชาญทราบว่าความสำเร็จของ บริษัท เกิดจากการลงทุนที่สำคัญการพัฒนาทางเทคนิคและทีมที่แข็งแกร่งแทนที่จะเป็น "งบประมาณปฏิวัติ" สำหรับการพัฒนารูปแบบ AI
รูปภาพ: Ensigame.com
อย่างไรก็ตามเรื่องนี้ค่าใช้จ่ายของ Deepseek ยังคงต่ำกว่าของคู่แข่ง ตัวอย่างเช่นในขณะที่ Deepseek ใช้จ่าย $ 5 ล้านใน R1 ค่าใช้จ่ายการฝึกอบรมสำหรับ chatgpt4o คือ $ 100 ล้าน อย่างไรก็ตามมันยังคงถูกกว่าคู่แข่ง