热点资讯

你的位置:秒速赛官网开奖查询 > 新闻动态 > 英伟达盘前跌超11%!DeepSeek震动华尔街

英伟达盘前跌超11%!DeepSeek震动华尔街


发布日期:2025-02-02 21:34    点击次数:145


由国产大模型公司深度求索(DeepSeek)旗下最新模型带来的影响在海外持续发酵,市场密切关注上游 AI(人工智能)硬件市场是否会波及。

1 月 27 日,DeepSeek 应用登顶苹果中国地区和美国地区应用商店免费 APP 下载排行榜,在美区下载榜上超越了 ChatGPT。DeepSeek 系量化巨头幻方量化旗下大模型公司,1 月 20 日,该公司正式发布推理大模型 DeepSeek-R1。

推出后不久,R1 就凭借其开源的性质、大幅下降的售价和训练成本获得了广泛关注。作为一款开源模型,R1 在数学、代码、自然语言推理等任务上的性能能够比肩 OpenAI o1 模型正式版,并采用 MIT 许可协议,支持免费商用、任意修改和衍生开发等。

更令市场惊讶的是,据 DeepSeek 介绍,R1 的预训练费用只有 557.6 万美元,在 2048 块英伟达 H800 GPU(针对中国市场的低配版 GPU)集群上运行 55 天完成。

此前,AI 初创企业 OpenAI 和 Anthropic 一直在与谷歌、Meta 等科技巨头围绕大模型展开激烈竞争,"大力出奇迹"的"烧钱"模式成为了在这些企业间流行的选项。例如,Meta 预计 2024 年资本支出为 380 亿至 400 亿美元,而根据此前财报的统计,谷歌的 2024 年资本支出或超 480 亿美元。微软和亚马逊也预计 2025 年资本支出将继续上行。

毫无疑问,DeepSeek 的横空出世又增强了这些企业的危机感。当地时间 1 月 23 日,一名脸书母公司 Meta 的员工在匿名职场论坛 Teamblind 上发帖称,Meta 内部已经因为 DeepSeek-R1 进入"恐慌模式":" Meta 的工程师们正在争分夺秒地分析 DeepSeek,试图复制其中一切可能的技术。"有认证为谷歌员工的网友回复称:" DeepSeek 做的事情很疯狂。不仅是 Meta,OpenAI、谷歌和 Anthropic 都因为他们而火烧屁股。"

R1 发布后不久,Meta 首席执行官马克 · 扎克伯格就宣布,Meta 在 2025 年的资本支出将超 600 亿美元,加大对 AI 的投入。1 月 27 日,据外媒报道,Meta 成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型 DeepSeek 的工作原理,并基于此来改进旗下大模型 Llama。

当地时间 1 月 24 日,2024 年诺贝尔化学奖得主、谷歌 DeepMind 的 CEO 德米斯 · 哈萨比斯(Demis Hassabis)也在采访中评价了 DeepSeek:"可以肯定的是,他们取得的成就令人印象深刻,中国具有极强的工程和规模化能力。"

DeepSeek-R1 的出现不仅让 Meta 等科技巨头产生了危机感,还震动了上游概念股。由于 R1 的显著进步并非完全建立在算力基础上,华尔街开始考虑科技行业巨头对 AI 基础设施的巨额投资以及对英伟达芯片的需求是否合理。

截至发稿时,美股盘前,英伟达(Nasdaq:NVDA)跌超 11%,博通跌超 11%,台积电、Arm 跌超 10%,同时,在日本股市,英伟达的主要供应商 Advantest Corp(TYO:6857)的股价暴跌 8.6%。

外媒分析指出,如果 DeepSeek 的成功能够鼓励 AI 初创公司用更少的芯片构建强大的 AI 模型、并将它们更快地推向市场,那么英伟达的收入增长可能会放缓,因为大模型开发人员会复制 DeepSeek 使用数量更少且配置较低的 AI 芯片的策略。

华尔街研究机构 Yardeni Research 的分析师 Ed Yardeni 在报告中写道:"对于计划通过高昂的 AI 服务主导市场的‘美股七巨头’而言,(DeepSeek-R1)可能是个坏消息。关键在于,当 AI 资本支出的飙升速度远超收入增速,这是否会导致市场失望?" Yardeni 认为,在这种情况下,英伟达的营收也可能受到波及。

美国投行 Raymond James 的分析师 Srini Pajjuri 也在报告中写道:" DeepSeek 显然无法获得与美国超大规模企业一样多的算力,但却设法开发出了一种看起来极具竞争力的模式。一个自然浮现的问题是,DeepSeek 的出现将如何影响算力的增长以及对硬件和半导体的需求?"

不过,Pajjuri 指出,DeepSeek-R1 也可能转而促使美国科技巨头们"更加迫切地利用其关键优势(即英伟达 GPU)来与更便宜的替代品拉开距离"。

摩根大通分析师 Joshua Meyers 写道,DeepSeek 颠覆性的主张是"更多的投资并不等于更多的创新",这一观念开始在美国 AI 领域引起关注。不过,Meyers 也表示,降低的成本并不意味着 AI 企业不再需要更多的算力,更不意味着投入最多资金的一方不会获胜,而是会迫使 DeepSeek 的竞争对手提高效率、降低推理成本。

对于 DeepSeek-R1 为何能大幅降低训练成本,Logenic AI 公司联合创始人李博杰对澎湃新闻记者表示,这是由于 R1 的核心在于后训练阶段,所需要的数据量和成本都会远低于预训练阶段,相当于"站在巨人的肩膀上"。不过,虽然这样的成功可以复制,但最前沿的大模型探索还是需要消耗很大的算力和成本,然后才能实现"左脚踩右脚"的数据飞轮效应。

而对于 AI 模型的训练成本下降是否会影响上游 AI 硬件企业,李博杰认为,虽然 AI 目前看起来发展很快,但背后其实有很多大家看不到的试错的过程,整体依然处于研究阶段,所以"更多的(算力)卡和更多的资源肯定还是有优势的"。

FutureLabs 未来实验室首席专家胡延平表示,接下来要看 DeepSeek 的热度能够持续多久:"如果不看开源生态,只看 C 端角度,DeepSeek 要想站稳,至少需要尽快具备多模态文生图文生视频、理解图像、语音交互等能力,尤其类 AVM(全景影像系统)、知识库、结合 Agent(智能体)等既有形态,能否形成模型矩阵和 Apps 生态等,可能会决定其热度是短期还是长期,舆论热度能否充分转化为市场实地,以及能否内与豆包、外与 ChatGPT 分食市场。"