特に無数のオプションが利用可能な場合、完璧なタブレットを選択することは困難な作業になる可能性があります。 Appleの範囲のiPadは、予算に優しいモデルからハイエンドの大国まで、それぞれさまざまなディスプレイやプロセッサを備えたすべてのものを提供しています。たとえば、液体網膜DIの違い
著者: Sadie読む:0
DeepSeekの新しいチャットボットは、AI市場に大きな影響を与え、興味深い声明を紹介しています。
こんにちは、私はあなたが何でも尋ねて、あなたを驚かせるかもしれない答えを得ることができるように作成されました。
このAIモデルは、手ごわい競合他社になるだけでなく、Nvidiaの最大の株価下落の1つにも貢献しています。 AI開発に対するDeepseekの革新的なアプローチは、次のような高度なテクノロジーを利用して、それを際立たせます。
マルチトークン予測(MTP) :この方法により、異なる文の部分を分析し、精度と効率の両方を向上させることにより、モデルが一度に複数の単語を予測できます。
専門家(MOE)の混合:256個のニューラルネットワークを使用し、トークン処理タスクごとに8つのアクティブ化されたこのアーキテクチャは、AIトレーニングをスピードアップし、パフォーマンスを向上させます。
マルチヘッド潜在的注意(MLA) :文の最も重要な部分に焦点を合わせ、重要な詳細を繰り返し抽出することにより、MLAは重要な情報を欠いている可能性を減らし、AIが重要なニュアンスをキャプチャできるようにします。
画像:Ensigame.com
中国の著名な新興企業であるDeepseekは、わずか2048グラフィックスプロセッサを使用してDeepseek V3のトレーニングにわずか600万ドルを費やしたと述べていると述べています。しかし、Semianalysisのアナリストは、DeepSeekが10,000 H800ユニット、10,000 H100、追加のH20 GPUを含む約50,000のNVIDIAホッパーGPUを利用して、膨大な計算インフラストラクチャを運営していることを明らかにしました。これらのリソースは、複数のデータセンターに広がり、AIトレーニング、研究、財務モデリングに使用されます。
同社のサーバーへの総投資は約16億ドルで、運用費用は9億4,400万ドルと推定されています。 Deepseekは、中国のヘッジファンド高飛行者の子会社であり、2023年に別のAI中心の部門として設立されました。クラウドコンピューティングに依存するほとんどのスタートアップとは異なり、DeepSeekはデータセンターを所有し、AIモデルの最適化とより高速なイノベーション実装を完全に制御できます。同社は自己資金のままであり、柔軟性と意思決定速度を向上させています。
画像:Ensigame.com
Deepseekはまた、主要な中国の大学で年間130万ドル以上を稼いでいる研究者の中には、トップの才能を集めています。それにもかかわらず、わずか600万ドルでDeepSeek V3をトレーニングするという主張は非現実的に思えます。この数字は、トレーニング前のGPU使用のみを占め、研究、モデルの洗練、データ処理、およびインフラストラクチャコストを除外しています。
開始以来、DeepSeekはAI開発に5億ドル以上を投資してきました。そのコンパクトな構造は、より大きな官僚的企業とは異なり、AIイノベーションの積極的かつ効果的な実装を可能にします。
画像:Ensigame.com
Deepseekの例は、資金提供された独立したAI企業が業界のリーダーと競争できることを示しています。しかし、専門家は、同社の成功は、AIモデル開発の「革新的な予算」ではなく、多大な投資、技術的なブレークスルー、および強力なチームによるものであることに注目しています。
画像:Ensigame.com
それにもかかわらず、Deepseekのコストは競合他社のコストよりも低いままです。たとえば、DeepseekはR1に500万ドルを費やしましたが、ChatGPT4Oのトレーニングコストは1億ドルでした。ただし、競合他社よりも安いです。
16
2025-05
16
2025-05
16
2025-05
16
2025-05