外媒拆解DeepSeek制胜秘籍 揭秘成功关键因素
春节期间,DeepSeek成为当之无愧的春节顶流,热度持续高涨。在面临巨头企业支持和多国政府质疑的复杂局势下,OpenAI紧急推出了全新的推理模型o3-mini,并首次向所有用户免费提供该模型。不过,o3-mini的API定价仍高于DeepSeek模型。
o3-mini发布后,OpenAI CEO萨姆·阿尔特曼在Reddit上表示,他们将学习DeepSeek公开推理模型思考过程的做法,并重新考虑其闭源策略。他承认OpenAI的领先优势已不如从前。与此同时,华为云宣布与硅基流动联合推出基于华为云昇腾云服务的DeepSeek R1/V3推理服务。
SemiAnalysis的一项新报告揭示了DeepSeek成功的关键因素:拥有至少5万块Hopper架构的GPU,投资超过5亿美元;预训练成本仅为600万美元,但不包括硬件研发和总体拥有成本;为有前途的候选人提供超过130万美元的年薪;关键创新多头潜注意力技术显著降低了推理价格。
英伟达创始人兼CEO黄仁勋被紧急召进美国白宫,与美国总统讨论了DeepSeek以及收紧AI芯片出口的问题。特朗普认为这家中国公司的出现意味着“美国公司不必花费大量资金来构建低成本AI替代品”。政府计划在今年春天进一步限制AI芯片出口,以确保美国及其盟友继续拥有先进的计算能力。
上线18天的DeepSeek日活达到1500万,增速是ChatGPT的13倍。目前,DeepSeek依然霸榜,位列苹果应用商店157个国家/地区的第一名。Meta首席科学家杨立昆认为硅谷圈子中的“常见病”是错位的优越感,导致对其他地方创新的怀疑。
阿尔特曼称赞DeepSeek是一个非常好的模型,并表示OpenAI将保持比往年更少的领先优势。OpenAI计划展示更多模型的思考过程,并透露了一些新研究进展,如图像生成功能、高级语音更新、文件附加功能等。
DeepSeek的成功在于其大规模利用多标记预测、混合专家模型和多头潜在注意力技术。这些创新显著降低了推理成本,使得DeepSeek能够在短时间内迅速崛起。未来,随着研发人员进一步优化这一新模式,不同模型之间的能力差距可能会进一步拉大。
DeepSeek的发布对整个行业产生了深远影响,改变了中美之间的AI竞争格局。中国企业在开源领域的积极作为,促使美国重新审视其限制开源的策略。DeepSeek的横空出世重塑了全球AI产业的竞争版图,各国可能需要重新审视AI发展战略,加强投入和合作,共同推动AI技术的进步。
相关文章
- 详细阅读
-
饺子导演名下多家企业已注销,行业巨变下的企业调整与未来展望,饺子导演名下企业调整,行业巨变下的未来展望详细阅读
饺子导演名下多家企业已注销,这是行业巨变下的企业调整。随着市场环境的变化,企业需要不断适应和调整经营策略,以应对日益激烈的竞争。饺子导演的企业将需要更...
2025-02-07 967 饺子导演名下企业注销 行业巨变下的未来展望
-
埃文凯尔欢迎再来 难忘中国之旅详细阅读
1月31日,埃文·凯尔发布了一段视频告别中国。他原本计划在中国待30天,结果却待了90天。在视频中,他哽咽着说:“这真是一生难忘的旅程。我结识了非常棒...
2025-02-06 959
- 详细阅读
-
全球黄金需求创下新高,去年市场分析,全球黄金需求飙升,去年市场分析创下新高详细阅读
全球黄金需求去年创下新高,市场分析显示,这一趋势反映了投资者对黄金的持续兴趣和信心。黄金作为一种避险资产,在市场波动和经济不确定性时期,其价值得到了广...
2025-02-06 597
-
南京地铁10号线故障,大量乘客滞留事件深度解析,南京地铁10号线故障,大量乘客滞留事件深度解析详细阅读
南京地铁10号线发生故障,导致大量乘客滞留。此次事件深度解析表明,故障原因可能涉及设备老化、维护不当等因素。事件发生后,地铁方面迅速采取措施,包括启动...
2025-02-06 753
- 详细阅读
- 详细阅读