当前位置:主页 > 科技 > 互联网 > 商业头条No.61 | DeepSeek风暴席卷AI产业链(2)

商业头条No.61 | DeepSeek风暴席卷AI产业链(2)

2025-02-19 04:50:01来源:界面新闻

文章导读
蛇年除夕夜那晚,硅基流动创始人袁进辉没有留在饭桌上,而是在抓紧时间跟技术团队开会,为了尽快解决DeepSeek模型在国产芯片上的适配问题。 经过三天三夜的加班加点,他们联合华为和...

Meta员工此前在美国匿名职场社区上发帖爆料称,公司已经成立了四个专门的研究小组分析研究DeepSeek V3模型的工作原理。内部认为,DeepSeek V3的综合性能已超越Llama 3,公司担心计划推出的下一代模型Llama 4也有“落后的可能”。

张璐推断说,“Llama 4一定会参考DeepSeek现在的算法模型。”事实上,现在全行业都在学习参考DeepSeek成功的秘密。

据DeepSeek开发团队介绍,V3模型采用了模型压缩、多头潜在注意力机制(MLA)、混合专家模型(MoE)、FP8混合精度训练等一系列创新技术降低成本,R1模型又有组相对策略优化算法(GRPO)这一重要创新。

摩尔线程市场生态高级总监吕其恒告诉界面新闻,DeepSeek的核心突破在于算法优化和算力效率的提升,虽然模型项目开源,但公司独有的这些技术具有相当高的壁垒,需要大量工程师团队投入研发和工程优化,其他公司短期内很难直接复制,但行业依然能从DeepSeek的创新中获得灵感。

张璐自己在硅谷最明显的感受是,之前OpenAI和Anthropic在谈到DeepSeek的时候,不会觉得“他们会比我们做得更好”,而现在,“尤其是OpenAI,可能会把DeepSeek作为一个竞争对手。”OpenAI CEO山姆·奥特曼更是在近期一场播客上直言,有计划跟DeepSeek团队进行一场交流。

搅动算力市场

以“鲸鱼”为标志的DeepSeek,如今遭视为一条搅动全球科技市场的“鲶鱼”。

中信建投证券研究所所长武超则向界面新闻记者表示,DeepSeek的 “鲶鱼效应” 最直观的体现,便是其掀起的“AI降本浪潮”——未来大家都能以更低的成本开发大模型。

据DeepSeek官方论文介绍,DeepSeek训练V3模型使用了2048张英伟达H800 GPU,全面训练消耗了278.8万个GPU小时,按照租赁价格每小时2美元计算,成本约为557.6万美元。

作为对比,Llama-3.1动用了超过1.6万张英伟达H100GPU训练,训练成本高达数亿美元,GPT-4o模型的训练成本业内估计在1亿美元上下。

Anthropic创始人Dario Amodei在个人播客网站上撰文称,虽然“用600万美元实现数十亿美元投入效果”的说法在传播上遭严重夸大,但DeepSeek所做的创新确实大幅降低了成本。更令硅谷震惊的是,当全球都在追求降低AI模型成本时,“第一个做到的是家中国公司。”

华尔街再次对AI算力泡沫心生恐慌。投资者们担心,未来DeepSeek的低成本模式一旦推广,科技公司是否还需要持续大量购入英伟达先进的AI芯片支持模型开发?

在美股市场芯片股1月27日受到的重挫中,英伟达跌超17%,台积电跌超13%,阿斯麦跌5%。

DeepSeek走红引发英伟达股价大跌。图片来源:东方IC

不过,英伟达在股价暴跌隔日发给界面新闻的声明中强调, 在中国大陆AI算力资源受限的背景下,DeepSeek主要在AI模型推理阶段运用了创新技术,但推理仍然需要大量英伟达GPU及配套的高性能网络技术。DeepSeek的进步不仅不意味算力过剩,“反而证明市场需要更多AI芯片”。

市场近期正流行用一项经济学经典理论“杰文斯悖论”(Jevons Paradox)来解释算力市场的供需变化。即一项技术创新在降低成本、提高效率的同时,资源消耗非但不会减少,反而会因成本降低和应用范围扩大而急剧增加。

事实上,最近微软、亚马逊、Meta、谷歌等巨头都相继在各自的财报会上表态大幅增加2025年的资本开支,重点投资数据中心等AI基建项目。四家巨头2025年资本支出总额将超过3200亿美元,总增速约为30%。

此外,OpenAI、软银、甲骨文等多家公司联合发起了一项“星际之门”AI基建计划(The Stargate Project),该计划要在2029年之前在算力市场投资高达5000亿美元,第一笔初始投资1000亿美元。

英国GPU公司Imagination产品管理副总裁Dennis Laudick在采访中告诉界面新闻,DeepSeek所做的创新属于一种降低人工智能功耗与优化效率的进步。“任何工作负载的简化都能让算力资源得到更充分利用,未来对算力的需求将持续超过供给。”

“现在就连DeepSeek自己都因为服务器不够用网站频繁卡顿。事实上,算力市场相当长时间内都处在一个高增长扩容的周期。”武超则说。因此无论从巨头资本开支的基本盘,还是更多公司对推理端算力的新增投资,算力泡沫都看不到有破裂的迹象。


免责声明
融易新媒体转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
热门文章
日榜 周榜
1 马斯克宣布新一代大模型Grok 3将于2月18日发布,称其为“地球上

2月16日,马斯克在社交平台X上宣布,Grok 3大模型将于太平洋时间周一晚上8点(北京时间2月1...

2 商业头条No.61 | DeepSeek风暴席卷AI产业链

蛇年除夕夜那晚,硅基流动创始人袁进辉没有留在饭桌上,而是在抓紧时间跟技术团队开会,...

3 时隔近一个月后,TikTok重新上架美国苹果与谷歌应用商店

界面新闻记者 | 宋佳楠 时隔近一个月后,TikTok重新上架美国苹果与谷歌应用商店。 当地时间...

4 李彦宏态度反转,百度文心一言免费后还要开源下一代模型

界面新闻记者 | 宋佳楠 2月14日,百度在其官方微信公众号上宣布,将在未来几个月中陆续推出...

5 美团在广西试点“超时免罚”,将骑手超时扣款改为积分制

2月14日,美团宣布结合各方建议,本周将正式在广西部分城市首次上线“超时免罚”试点。在...

6 米哈游严打游戏泄密:追责200余人,有侵权人遭判赔最高55万元

界面新闻记者 | 宋佳楠 米哈游针对游戏泄密行为的专项行动有了新进展。 2月14日,米哈游官方...

7 百度美股涨近4%,消息称苹果仍与百度合作为iPhone开发AI功能

2月13日,消息人士称,即便与阿里巴巴集团开展合作后,苹果仍在继续与百度合作,为中国的...

8 《哪吒2》再次带火潮玩直播

晚上十点,泡泡玛特直播间里的主播仍在奋力介绍各种盲盒产品,屏幕里放着的是一排“哪吒...

9 经济日报头版肯定即时零售:美团闪电仓等为线下业态、实体门

经济日报头版肯定即时零售:美团闪电仓等为线下业态、实体门店提供新增长机会 经济日报头...

10 阿里苹果“牵手”传闻成真,蔡崇信确认双方合作

界面新闻记者 | 宋佳楠 苹果选定阿里为AI合作商的传闻终遭验证。 2月13日,据第一财经报道,...

1 马斯克宣布新一代大模型Grok 3将于2月18日发布,称其为“地球上

2月16日,马斯克在社交平台X上宣布,Grok 3大模型将于太平洋时间周一晚上8点(北京时间2月1...

2 商业头条No.61 | DeepSeek风暴席卷AI产业链

蛇年除夕夜那晚,硅基流动创始人袁进辉没有留在饭桌上,而是在抓紧时间跟技术团队开会,...

3 时隔近一个月后,TikTok重新上架美国苹果与谷歌应用商店

界面新闻记者 | 宋佳楠 时隔近一个月后,TikTok重新上架美国苹果与谷歌应用商店。 当地时间...

4 李彦宏态度反转,百度文心一言免费后还要开源下一代模型

界面新闻记者 | 宋佳楠 2月14日,百度在其官方微信公众号上宣布,将在未来几个月中陆续推出...

5 美团在广西试点“超时免罚”,将骑手超时扣款改为积分制

2月14日,美团宣布结合各方建议,本周将正式在广西部分城市首次上线“超时免罚”试点。在...

6 米哈游严打游戏泄密:追责200余人,有侵权人遭判赔最高55万元

界面新闻记者 | 宋佳楠 米哈游针对游戏泄密行为的专项行动有了新进展。 2月14日,米哈游官方...

7 百度美股涨近4%,消息称苹果仍与百度合作为iPhone开发AI功能

2月13日,消息人士称,即便与阿里巴巴集团开展合作后,苹果仍在继续与百度合作,为中国的...

8 《哪吒2》再次带火潮玩直播

晚上十点,泡泡玛特直播间里的主播仍在奋力介绍各种盲盒产品,屏幕里放着的是一排“哪吒...

9 经济日报头版肯定即时零售:美团闪电仓等为线下业态、实体门

经济日报头版肯定即时零售:美团闪电仓等为线下业态、实体门店提供新增长机会 经济日报头...

10 阿里苹果“牵手”传闻成真,蔡崇信确认双方合作

界面新闻记者 | 宋佳楠 苹果选定阿里为AI合作商的传闻终遭验证。 2月13日,据第一财经报道,...

备案号:鄂ICP备2022006215号 Copyright © 2002-2024 关于我们 网站地图