Mihoyo是Genshin Impact和Honkai:Star Rail的创造力,最近提交了新的商标,引发了粉丝和行业观察家的好奇和猜测。用中文提交并由Gamerbraves翻译的商标名为Astaweave Haven和Hoshimi Haven。这些文件
作者: Sadie阅读:0
来自DeepSeek的新聊天机器人对AI市场产生了重大影响,并以有趣的声明介绍了自己:
嗨,我是被创建的,所以您可以问任何问题,并得到一个甚至可能让您感到惊讶的答案。
这种AI模型不仅成为了强大的竞争对手,而且还为NVIDIA最大的股价下跌之一做出了贡献。 DeepSeek对AI开发的创新方法将其与众不同,并利用了高级技术,例如:
多言论预测(MTP) :此方法允许模型通过分析不同的句子零件,提高准确性和效率来一次预测多个单词。
专家的混合物(MOE) :采用256个神经网络,每项令牌处理任务都激活了8个,该体系结构加快了AI训练并提高了性能。
多头潜在注意力(MLA) :通过重点关注句子的最重要部分并反复提取关键细节,MLA减少了缺少关键信息的机会,从而使AI能够捕获重要的细微差别。
图片:ensigame.com
DeepSeek是一家著名的中国初创公司,声称自己以最低的成本开发了竞争性的AI模型,并指出他们仅使用2048个图形处理器花了600万美元在培训DeepSeek V3上。但是,半分析的分析师表明,DeepSeek使用了大约50,000个NVIDIA HOPPER GPU,其中包括10,000 H800单位,10,000 H100和其他H20 GPU。这些资源分布在多个数据中心,并用于AI培训,研究和财务建模。
该公司对服务器的总投资约为16亿美元,运营费用估计为9.44亿美元。 DeepSeek是中国对冲基金高级飞行者的子公司,该基金在2023年将其确立为以AI为重点的部门。与大多数依靠云计算的初创公司不同,DeepSeek拥有其数据中心,可以完全控制AI模型优化和更快的创新实施。该公司保持自筹资金,提高其灵活性和决策速度。
图片:ensigame.com
DeepSeek还吸引了顶尖人才,一些研究人员每年收入超过130万美元,主要来自中国领先的大学。尽管如此,培训DeepSeek V3的主张仅为600万美元,似乎是不现实的,因为该数字仅在培训期间说明了GPU的使用情况,并排除了研究,改进,数据处理和基础设施成本。
自开始以来,DeepSeek已在AI开发方面投资了超过5亿美元。它的紧凑结构允许积极有效地实施AI创新,这与更大,更官僚的公司不同。
图片:ensigame.com
DeepSeek的例子表明,一家资金充足的独立AI公司可以与行业领导者竞争。但是,专家指出,该公司的成功是由于重大投资,技术突破和强大的团队,而不是AI模型开发的“革命性预算”。
图片:ensigame.com
尽管如此,DeepSeek的成本仍低于其竞争对手的成本。例如,虽然DeepSeek花了500万美元用于R1,但Chatgpt4o的培训成本为1亿美元。但是,它仍然比竞争对手便宜。
16
2025-05
16
2025-05
16
2025-05
16
2025-05