另外,在业内人士看来,DeepSeek的创新对国产算力芯片也是一大利好。比如DeepSeek用到的FP8混合精度算力训练,这种混合低精度的训练方法在一定程度上可弥补国内芯片硬件性能的不足,提供了更多软件算法的创新空间,像摩尔线程已将相应技术引入产品中。
AI六小虎遭“卷”到月之暗面联合创始人张予彤最近更新了一条朋友圈,她发出一张Kimi用户量增长图,在配文中称“很高兴Kimi新版本上线后用户量又创新高”。
很多人不知道的是,月之暗面最新版大模型Kimi1.5是跟DeepSeek-R1在同一天发布的,但完全遭淹没在了铺天盖地的DeepSeek浪潮之中。
月之暗面的总部,离DeepSeek北京团队所在的融科资讯中心的直线距离不足1公里。去年春节,DeepSeek还默默无闻,而月之暗面因为拿下了阿里的巨额投资声名鹊起,跻身大模型创业“六小虎”头部。
如今,一年时间过去,无论是技术创新,产品认知,抑或是企业影响力,DeepSeek无可置疑已经一飞冲天,迈入世界级的擂台了。而“六小虎”们各有各的难题。
李扬(化名)整个蛇年春节都是在加班中度过的,他在“六小虎”其中一家从事AI infra的优化工作。虽然在他看来,DeepSeek-V3的MFU(模型算力利用率)在其模型架构下是合理的,但作为成本控制极为重要的一环,其所在团队的工作仍遭施加了压力。
不只是李扬,有多位“六小虎”员工告诉界面新闻,他们只在除夕和大年初一休假,其他时间照常扑在了工作上。据界面新闻记者了解,其中一家公司的算法团队几乎整个假期都在加速推进自己推理模型的参数scale up。
一名在“六小虎”就职的技术负责人表示,最近工作氛围的确变紧张了,因为看到了大众对AI的高期待。公司总体会保持原有的迭代节奏,“但有些项目的优先级可能会有调整”。
一名大模型领域投资人对界面新闻记者表示,因为DeepSeek的爆火,“六小虎”接下来的融资和估值会完整受到影响。据其了解,现在参投某大模型公司的一家国资,已经在内部遭质疑当初为什么选择投那家公司?“这其实也是一种问责。”
眼下,“六小虎”走出自己核心差异化路线的紧迫感,比过去任何时候都要突出:如果不继续烧钱创新,它们的预训练模型和推理模型都很难打过DeepSeek;但如果不做预训练,又难以撑起下一次融资的估值。
而在第一条路上更艰难的是,DeepSeek还极可能冲击了闭源生态。朱啸虎直言,在中国,只有互联网大厂有继续卷闭源模型的意义。
事实上,就连互联网大厂的闭源生态堡垒也出现了裂缝。一直遭视为业内最坚定走闭源路线的百度,也于2月14日正式宣布,将在未来几个月推出文心大模型4.5系列,并从6月30日起首次开源。
去年在业内争论模型开源与闭源模式之争最激烈的时候,百度创始人李彦宏曾在多个场合公开力挺闭源模式,直言“开源模型是智商税”。前后一年时间不到,无论百度当下的选择出于主动还是遭动,这样180度的大转弯都令行业不得不重新审视开源与闭源模式的未来。
“中国闭源大模型几乎成为一个死局了。”前述投资人也如此表示。
分一杯羹在DeepSeek今年春节爆火的一个月之前,梁文锋曾问过袁进辉,要不要在他们的平台上部署DeepSeek-V3模型。袁进辉创办的硅基流动主做大模型云服务平台,为生成式AI提供基础设施。
梁文锋当时建议,如果要部署的话,最好要准备80台H100服务器。袁进辉接着算了一笔账,发现一个月对应需要五六百万元成本,于是没有下注。转眼DeepSeek火遍全球,他顿感“决策失误,欲哭无泪”。
看着DeepSeek不断创造奇迹的时候,袁进辉内心焦急但苦于没有资源。一个同事突发奇想,“用国产卡吧!”这个想法也得到了华为昇腾云团队的大力支持,这也就有了开头的故事。
此后的袁进辉在社交平台上变成一个活跃的“客服号”,不断反馈产品体验的不足,以及将要加强改善的地方。因为抓住时机而卷入DeepSeek流量漩涡,袁进辉话里话外不外乎“传播速度太快了、用户太多了、需求太大了”。
“参与”DeepSeek的狂欢成为一个行业共识,尤其是云厂商。在DeepSeek因为访问量太大频频出现“服务器繁忙,请稍后再试”的时候,无处可去的流量转向接入了DeepSeek的云平台。
这一波外企的动作反而更加迅速。1月最后两天,微软Azure、亚马逊AWS先后宣布上线DeepSeek-R1,谷歌云也随即发布了R1部署指南。2月第一周,除硅基流动及华为昇腾云外,腾讯云、阿里云、百度智能云、火山引擎、京东云等厂商,融易新媒体消息,均宣布接入R1推理模型,部分同时引入了V3。
不仅如此,此前在AI领域声量并不突出的三大电信运营商,中国移动、中国电信、中国联通相继在其云服务中上线DeepSeek模型。
2月16日,马斯克在社交平台X上宣布,Grok 3大模型将于太平洋时间周一晚上8点(北京时间2月1...
2 商业头条No.61 | DeepSeek风暴席卷AI产业链蛇年除夕夜那晚,硅基流动创始人袁进辉没有留在饭桌上,而是在抓紧时间跟技术团队开会,...
3 时隔近一个月后,TikTok重新上架美国苹果与谷歌应用商店界面新闻记者 | 宋佳楠 时隔近一个月后,TikTok重新上架美国苹果与谷歌应用商店。 当地时间...
4 李彦宏态度反转,百度文心一言免费后还要开源下一代模型界面新闻记者 | 宋佳楠 2月14日,百度在其官方微信公众号上宣布,将在未来几个月中陆续推出...
5 美团在广西试点“超时免罚”,将骑手超时扣款改为积分制2月14日,美团宣布结合各方建议,本周将正式在广西部分城市首次上线“超时免罚”试点。在...
6 米哈游严打游戏泄密:追责200余人,有侵权人遭判赔最高55万元界面新闻记者 | 宋佳楠 米哈游针对游戏泄密行为的专项行动有了新进展。 2月14日,米哈游官方...
7 百度美股涨近4%,消息称苹果仍与百度合作为iPhone开发AI功能2月13日,消息人士称,即便与阿里巴巴集团开展合作后,苹果仍在继续与百度合作,为中国的...
8 《哪吒2》再次带火潮玩直播晚上十点,泡泡玛特直播间里的主播仍在奋力介绍各种盲盒产品,屏幕里放着的是一排“哪吒...
9 经济日报头版肯定即时零售:美团闪电仓等为线下业态、实体门经济日报头版肯定即时零售:美团闪电仓等为线下业态、实体门店提供新增长机会 经济日报头...
10 阿里苹果“牵手”传闻成真,蔡崇信确认双方合作界面新闻记者 | 宋佳楠 苹果选定阿里为AI合作商的传闻终遭验证。 2月13日,据第一财经报道,...
2月16日,马斯克在社交平台X上宣布,Grok 3大模型将于太平洋时间周一晚上8点(北京时间2月1...
2 商业头条No.61 | DeepSeek风暴席卷AI产业链蛇年除夕夜那晚,硅基流动创始人袁进辉没有留在饭桌上,而是在抓紧时间跟技术团队开会,...
3 时隔近一个月后,TikTok重新上架美国苹果与谷歌应用商店界面新闻记者 | 宋佳楠 时隔近一个月后,TikTok重新上架美国苹果与谷歌应用商店。 当地时间...
4 李彦宏态度反转,百度文心一言免费后还要开源下一代模型界面新闻记者 | 宋佳楠 2月14日,百度在其官方微信公众号上宣布,将在未来几个月中陆续推出...
5 美团在广西试点“超时免罚”,将骑手超时扣款改为积分制2月14日,美团宣布结合各方建议,本周将正式在广西部分城市首次上线“超时免罚”试点。在...
6 米哈游严打游戏泄密:追责200余人,有侵权人遭判赔最高55万元界面新闻记者 | 宋佳楠 米哈游针对游戏泄密行为的专项行动有了新进展。 2月14日,米哈游官方...
7 百度美股涨近4%,消息称苹果仍与百度合作为iPhone开发AI功能2月13日,消息人士称,即便与阿里巴巴集团开展合作后,苹果仍在继续与百度合作,为中国的...
8 《哪吒2》再次带火潮玩直播晚上十点,泡泡玛特直播间里的主播仍在奋力介绍各种盲盒产品,屏幕里放着的是一排“哪吒...
9 经济日报头版肯定即时零售:美团闪电仓等为线下业态、实体门经济日报头版肯定即时零售:美团闪电仓等为线下业态、实体门店提供新增长机会 经济日报头...
10 阿里苹果“牵手”传闻成真,蔡崇信确认双方合作界面新闻记者 | 宋佳楠 苹果选定阿里为AI合作商的传闻终遭验证。 2月13日,据第一财经报道,...
备案号:鄂ICP备2022006215号 Copyright © 2002-2024 关于我们 网站地图