蛇年除夕夜那晚,硅基流动创始人袁进辉没有留在饭桌上,而是在抓紧时间跟技术团队开会,为了尽快解决DeepSeek模型在国产芯片上的适配问题。
经过三天三夜的加班加点,他们联合华为和DeepSeek,赶在2月1日上线了基于国产芯片服务的DeepSeek-V3和DeepSeek-R1。此时,距离DeepSeek AI智能助手同时登顶中美两国App Store免费应用榜,还不到一周时间。
DeepSeek登顶AppStore排行榜。来源:东方IC也许是巧合,最近三年,每年春节前后都会赶上一波AI热潮。2023年,ChatGPT引爆了国内大模型创业热。2024年,视频生成模型Sora的突然亮相震撼了所有人。
而今年,主角变成了DeepSeek。这家技术开放但行事低调的中国公司,以一己之力改变了AI大模型的世界格局。
2024年底及2025年初,DeepSeek相继发布新一代MoE模型V3以及推理模型R1,凭借“高性能、低训练成本”和“对齐OpenAI o1”两项最直观的表现,引爆海内外。据Xsignal数据,截至2月8日,DeepSeek国内APP端日活为3494万,海外APP端日活达3685万,上线不到一个月时间就超过了其他同类应用,直追ChatGPT。
最先坐不住的是硅谷科技巨头Meta。原本Meta开发的Llama系列模型才是全球开源大模型的领头羊。如今,DeepSeek用不到其十分之一的成本做出了性能更好的模型,还免费开源了,这让Meta的“巨额成本开支”处境尴尬。
随后受到冲击的是英伟达。因为市场担忧DeepSeek带来的低成本模式会减少算力需求,英伟达市值一夜蒸发近6000亿美元,创下了美股单日最大跌幅纪录。随即,一众美股芯片股接连下跌。
冲击的另一面,几乎所有与大模型行业有关的企业,都在春节忙着加入这场巨浪,渴望承接背后的流量红利。全球范围的主流云厂商,无一例外迅速跟进部署DeepSeek API;华为昇腾之外多家国产AI芯片厂商,宣布适配DeepSeek不同尺寸模型。
国内投资者的热情也遭瞬间点燃。由AI产业链公司构成DeepSeek概念股,包括算力基础设施、大模型技术与算法、应用场景等相关公司,已在二级市场连续多日普涨。
而在聚光灯外,大模型“六小虎”面临的行业质疑再度抬头。模型影响力,技术认可度,产品用户规模,看上去他们正在这些维度完整落后。但一年之前,“六小虎”们才是遭资本选中要跟OpenAI打擂台的中国初创力量。
DeepSeek的此番影响就是如此之广。它既是对手的威胁,也是行业的东风。无论如何,它已成为2025年的绝对主角。
“来自东方的神秘力量”在今年的达沃斯论坛上,无论是否身处科技圈,许多老外都会向 Fusion Fund 创始合伙人张璐打听起DeepSeek——这家他们最近刚刚听闻的中国公司。
甚至在Fusion Fund内部,张璐的合伙人,在AI和深度学习领域有超过20年经验的David Gerster,也一直在群里问她:你对这家公司了解多少?你认识这家公司的创始人吗?
仿佛一夜之间,所有人都想了解DeepSeek横空出世的背景。
不同于其他大模型公司,成立于2023年的DeepSeek脱胎于知名量化基金幻方量化,目前没有进行任何外部融资。公司创始人梁文锋1985年出生于广东湛江,2010年从浙江大学毕业,之后一直在从事量化交易相关工作,并创立了杭州幻方。
DeepSeek创始人梁文锋。图片来源:视觉中国DeepSeek成立之后也异常低调,几乎没有进行任何对外宣传。但是在AI技术圈,自去年年中起,这家公司就凭借 DeepSeek-V2 在 MLA 等方面的创新得到了业内认可,遭硅谷视作一股“来自东方的神秘力量”。
张璐告诉界面新闻记者,半年多以前,OpenAI和Anthropic的员工就在谈论这家公司。当时,主要是因为它在开源生态中十分活跃,而行业格外关注新模型在架构层面的创新。
在Meta从事大模型相关工作的华人员工马克(化名)也对界面新闻记者表示,他们去年就关注到了DeepSeek,但当时只觉得“这是中国第一梯队的模型,还不是世界级的,比OpenAI等更是差上一截。”
但是,最近DeepSeek-V3和DeepSeek-R1的出现成为一个转折点。特别是DeepSeek-R1引爆了用户端,它是首个复现OpenAI o1推理模型能力的开源大模型,而且完全免费。
DeepSeek叠加的四层“Buff”也让硅谷的华人工程师们不得不佩服:纯中国团队,算力资源有限,效果打败或持平美国最先进模型,并且完全开源。
马克和同事们对此讨论了很多,核心观点是:“如果DeepSeek花这么一些钱就可以训练出这么好的模型,那我们花这么多钱在干嘛?”
2月16日,马斯克在社交平台X上宣布,Grok 3大模型将于太平洋时间周一晚上8点(北京时间2月1...
2 商业头条No.61 | DeepSeek风暴席卷AI产业链蛇年除夕夜那晚,硅基流动创始人袁进辉没有留在饭桌上,而是在抓紧时间跟技术团队开会,...
3 时隔近一个月后,TikTok重新上架美国苹果与谷歌应用商店界面新闻记者 | 宋佳楠 时隔近一个月后,TikTok重新上架美国苹果与谷歌应用商店。 当地时间...
4 李彦宏态度反转,百度文心一言免费后还要开源下一代模型界面新闻记者 | 宋佳楠 2月14日,百度在其官方微信公众号上宣布,将在未来几个月中陆续推出...
5 美团在广西试点“超时免罚”,将骑手超时扣款改为积分制2月14日,美团宣布结合各方建议,本周将正式在广西部分城市首次上线“超时免罚”试点。在...
6 米哈游严打游戏泄密:追责200余人,有侵权人遭判赔最高55万元界面新闻记者 | 宋佳楠 米哈游针对游戏泄密行为的专项行动有了新进展。 2月14日,米哈游官方...
7 百度美股涨近4%,消息称苹果仍与百度合作为iPhone开发AI功能2月13日,消息人士称,即便与阿里巴巴集团开展合作后,苹果仍在继续与百度合作,为中国的...
8 《哪吒2》再次带火潮玩直播晚上十点,泡泡玛特直播间里的主播仍在奋力介绍各种盲盒产品,屏幕里放着的是一排“哪吒...
9 经济日报头版肯定即时零售:美团闪电仓等为线下业态、实体门经济日报头版肯定即时零售:美团闪电仓等为线下业态、实体门店提供新增长机会 经济日报头...
10 阿里苹果“牵手”传闻成真,蔡崇信确认双方合作界面新闻记者 | 宋佳楠 苹果选定阿里为AI合作商的传闻终遭验证。 2月13日,据第一财经报道,...
2月16日,马斯克在社交平台X上宣布,Grok 3大模型将于太平洋时间周一晚上8点(北京时间2月1...
2 商业头条No.61 | DeepSeek风暴席卷AI产业链蛇年除夕夜那晚,硅基流动创始人袁进辉没有留在饭桌上,而是在抓紧时间跟技术团队开会,...
3 时隔近一个月后,TikTok重新上架美国苹果与谷歌应用商店界面新闻记者 | 宋佳楠 时隔近一个月后,TikTok重新上架美国苹果与谷歌应用商店。 当地时间...
4 李彦宏态度反转,百度文心一言免费后还要开源下一代模型界面新闻记者 | 宋佳楠 2月14日,百度在其官方微信公众号上宣布,将在未来几个月中陆续推出...
5 美团在广西试点“超时免罚”,将骑手超时扣款改为积分制2月14日,美团宣布结合各方建议,本周将正式在广西部分城市首次上线“超时免罚”试点。在...
6 米哈游严打游戏泄密:追责200余人,有侵权人遭判赔最高55万元界面新闻记者 | 宋佳楠 米哈游针对游戏泄密行为的专项行动有了新进展。 2月14日,米哈游官方...
7 百度美股涨近4%,消息称苹果仍与百度合作为iPhone开发AI功能2月13日,消息人士称,即便与阿里巴巴集团开展合作后,苹果仍在继续与百度合作,为中国的...
8 《哪吒2》再次带火潮玩直播晚上十点,泡泡玛特直播间里的主播仍在奋力介绍各种盲盒产品,屏幕里放着的是一排“哪吒...
9 经济日报头版肯定即时零售:美团闪电仓等为线下业态、实体门经济日报头版肯定即时零售:美团闪电仓等为线下业态、实体门店提供新增长机会 经济日报头...
10 阿里苹果“牵手”传闻成真,蔡崇信确认双方合作界面新闻记者 | 宋佳楠 苹果选定阿里为AI合作商的传闻终遭验证。 2月13日,据第一财经报道,...
备案号:鄂ICP备2022006215号 Copyright © 2002-2024 关于我们 网站地图