首页 > 信息 > IT科技 > 正文
2023-07-08 10:45

狂飙 200 天:进退两难的中国大模型团战

以下文章来源于暗涌 Waves ,作者暗涌

 狂飙 200 天:进退两难的中国大模型团战

共识可以快速形成,也可以快速瓦解。

何丽芯

编辑于丽丽、刘旌 ‍

来源|暗涌 Waves(ID:waves36kr)

封面来源|Christ in the Storm on the Sea of Galilee ( Rembrandt van Rijn, 1633 ) , Isabella Stewart Gardner Museum, Boston

极速 200 天

两个月前," 暗涌 Waves" 曾向一位投资了王慧文光年之外的基金合伙人提问:中国创投史上,哪个公司在创办之初就众望所归、并且最终也拥有美好结局?

" 说实话,我很难想到。" 这位投资人答道。

作为一位 AI 行业的 " 门外人 ",王慧文的杀入格外有戏剧性,最终能有多大的胜算?

沉吟片刻后,这位合伙人打趣说道:" 至少,老王是一个有争议的人。" 他的言下之意是,对于多数头部美元基金来说,大概没有理由不投资王慧文这样 " 能够集资源、钱、以及号召力为一体的大佬 "。

后来的故事众人皆知。伴随着王慧文确诊抑郁症,光年之外被美团接手,这个大模型创业潮中引发最多关注的故事戛然而止。

当我们提出那个问题时,中国大模型的创业还在狂飙之中。人们无比相信那个比 " 移动互联网大 10 倍 " 的平台级大机会:在 GPT-4 推出不过 20 余天时,已有超 10 余家创业公司坐上大模型牌桌,总融资额数十亿美金。此后包括大厂在内的 20 多家公司公布了自研 AI 大模型," 就连上古神仙的名字都不够用了 "。

顷刻间,光年之外的戏剧化故事,似乎应验了通用大模型很难属于创业公司的预言。越来越多的公司开始逃离大模型神话。

时间回到一年前。在旧金山第 18 街和 Folsom 街交叉口,有一座不起眼的灰色三层小楼,很快它将名声大振——这是 OpenAI 的办公所在地。一位硅谷人士告诉我们,红杉的一位投资人和 OpenAI 沟通之后," 大为震撼 ",这位如饥似渴的投资人而后便令团队 " 动起来!"

红杉再次展现出了它一贯的战斗力。2022 年 9 月,红杉官网发表了《Generative AI, a Creative New World》一文,第一次提出生成式 AI 的概念。

" 从硅谷到国内,创投风潮的传递大约会有 3 个月的延后。" 一位美元投资人对 " 暗涌 Waves" 表示,所以 ChatGPT 在去年 11 月底发布,直至今年春节后,国内关于大模型的讨论才瞬间热烈起来。

春节后,踏上去硅谷航班的源码资本合伙人黄云刚,本来还想一并考察 SaaS、Bio-tech,但最后几乎所有会议都和 AI 相关。此时想约 OpenAI 的人已不再容易:其员工后来基本关闭或隐藏了包括 linkedIn 在内的各类个人联系方式。

这可能是过去十年、从硅谷到国内最快的一次共识收敛。

在生成式 AI 面前,本就力竭的移动互联网,顷刻仿若陈旧之物。新一轮的世界交接俨然已经开始。

人人都能感受到市场的躁动。2 月中旬,在微软战略孵化器组织的一次 AI 分享会上,人头攒动,茶歇区被挤满,连咖啡师都在柜台里拿着手机拍 PPT。墙上各种 NFT 印刷品的包围,似乎又在提醒人们这里数月前还属于 Web3。

仿佛一种应激反应,国内投资人一头扎进 AI,却又发现大量功课要做。多位投资人在采访中不约而同称自己 " 还在学习 ",以及反问:你们最近还跟谁聊了?

今年 3 月,在接受我们访谈前一天的凌晨,阿尔法公社创始合伙人 &CEO 许四清正在 " 读 paper",然后接到一位成功创业者师弟的微信,问能否一聊 AI。后者驱车 20 公里来到他的住处,两人一直讨论到凌晨三点才散去。

创投界的大小人物纷至沓来,王慧文也是群情激昂中的一份子。曾有接近他的人对 " 暗涌 Waves" 透露,王慧文对大模型创业的态度变化非常之快,原本他只是计划以投资的方式入股一家公司,但在三天内就决定躬身入局。

但风口总是不长命。尽管严格来说,相比于移动时代尾声的众多议题,大模型或 AGI 无疑是一个真命题。在 GPT-4 推出不过 20 余天时,市场已明显感受到,在这个注定是少数人的游戏中,国内通用大模型的创业潮首战已基本终结。

6 月底,猎豹移动 CEO 傅盛和金沙江创业投资基金主管合伙人朱啸虎在朋友圈的互怼,在体现投资人和创业者视角种种差异的同时,也显示出一种异常冷静的共识:有机会,但不会是 BAT 式的大机会。

短短 200 天,更多的投资人和创业公司的焦点开始往垂直大模型或中间层、应用层迁移,而那个狂热的平台级或颠覆性的大机会,也逐渐被更现实的 " 零零散散的小机会 " 替代。

真格基金管理合伙人戴雨森曾对我们说,随着一波波新技术的兴衰,AI 在创投界不断进入冬天和春天。每一次看似高蹈的技术理想面前,都悬着一把难以商业化的达摩克利斯之剑。

这次也没有例外。

 狂飙 200 天:进退两难的中国大模型团战

浮沙上的高塔

共识可以快速形成。

ChatGPT 的发布让国内市场的 FOMO 情绪在年初达到顶峰,团队和资金快速集结大模型。牌桌上的选手,分为:互联网创业派、大厂派,以及来自高校和研究机构的学院派。

共识也可以快速瓦解。

注定是烧钱游戏的属性,算力、数据和人才的门槛,以及当下资本市场的变化,让 " 大模型是否是创业公司的机会?" 的诘问一直悬在头顶。

事实是在今年 4 月," 暗涌 Waves" 就注意到国内通用大模型创业潮的首战,已基本终结。这一说法后来也得到一些投资人证实," 就这些了 ",此后声称要入局大模型的创业公司基本绝迹。

在一位一级市场观察人士看来,关于大模型,不光创业团队,敢下场的大基金也只有少数大名字,而且机构主要基于赌人的逻辑,前方还有漫长的证明题要做。

和傅盛论辩完的朱啸虎,第二天就在朋友圈表示,他的核心观点是:不要迷信通用大模型,因为明年 GPT-3.5 就成 commodity(通用基础设施),而 3 年后,GPT-4 也会是。

这背后正是关于大模型的另一重隐忧:底层的大模型本身在变,而未来很可能大量开源,或者 1-2 个头部厂商赢者通吃。如此一来,中国大模型创业的价值与投入就根本不成正比。

至于那个众人言说中的 " 比互联网更大的机会 ",在戴雨森看来,立足点是 " 能做出可以使用工具、解决任务、分解任务的 AGI",而能实现这一点的团队,即便在世界范围内都很稀缺。

前不久,在 Waves 大会的一场圆桌论坛上,中国人民大学高瓴人工智能学院卢志武教授,就质疑了所谓 " 国产大模型的春天 "。在他看来,这不过是很多公司在 " 微调国外底座模型 " 的假象。

现实也的确如此。一位 AI 创业者告诉我们,很多声称要做大模型的创业公司,其实从一开始就是在用 Supervised Fine Tuning 等快捷技术,做一个 " 还可以的 " 语言大模型出来,真正有资金和技术实力去挑战 GPT4 的团队和项目屈指可数。

更多创业公司开始向医疗、法律等垂直大模型以及中间层、应用层迁移。王慧文的光年之外,以及王小川的新公司,后来都选择了同时做大模型和基于模型的应用。

"42 章经 " 曲凯发布的数据显示,以他的体感,前一段拿到融资的 AI 项目中,做底层模型的大概有 10%-20%,做 infra/ 中间层的有 20%-30%,做应用层的有 60%-70%。其中如果把还没拿到钱的也加进来,做应用的估计至少是 95%+。

但垂直大模型以及应用这条路也并非坦途。对创业公司来说,垂直领域的场景和数据很难获取。而它所构建的能力又不能是通用大模型轻易覆盖的。

像 infra/ 中间层,一位投资人曾在社交媒体上表示,旨在满足数据采集、标注、模型调度等 MLOps 需求的创业公司,会面临 " 中间商难赚差价 " 的夹心尴尬——前有免费开源工具,后有云厂商打包工具和服务。同时," 国内客户付费习惯仍然没有很好地养成,尤其在企业开支紧缩的经济恢复期 "。

在 Waves 大会上,真格基金戴雨森提到,在中国做 2B 服务,会受到市场付费意愿、客户采购方式特点的限制。" 中国互联网之前一大特点,就是要直接找用户收钱很难,很多时候都是羊毛出在猪身上。" 像 OpenAI 和 Claude 在美国可以直接通过公有云卖 API 服务,而在中国只提供 API 还不够," 很多做大模型的公司针对企业客户,现在是连服务器带模型一起卖,还得提供训练和微调服务 "。

上述在社交媒体发文的投资人还提到,应用层项目可以分为两种:那些垂直场景里深耕的老项目在积极接入大模型,手握数据做微调;而新项目谈格局为时尚早,在大模型的迭代能力被充分释放前,很容易 " 速生速死 "。

这在海外市场已有表征。例如去年尚风头无两的美国独角兽 Grammarly 和 Jasper,在 GPT4 发布后,现有功能即被代替,价值迅速被摊薄,朱啸虎公开称 " 这两家公司或将很快归零,根本守不住 "。

今年 3 月,OpenAI 发布论文开源了新模型代码:效果一步成图,1 秒 18 张。有人因此评价 " 扩散模型 Diffusion 的时代结束了 "。而此时距离后者成为 2022"AIGC 元年 " 诞生的重要技术基石,以及基于此带来许多模型的涌现,还不到一年。

所以这一波 AI 创业者、尤其是应用层公司,始终存在于一个左右互搏的困局里:不做,错过了是输;做了可能很快被替代,同样是输。

在 Waves 大会上,昆仑万维 CEO 方汉提到,他和中国最顶尖的产品经理交流后发现,对方还处在很懵的状态:" 这一波大模型远超产品进展 "。随后的独立演讲中,猎豹 CEO 傅盛快速反驳了这一判断:" 产品经理并不懵,很多已经在行动 "。但显然至今,还没有令人满意的杀手级产品出现。阿里巴巴、百度推出大模型的当日,股价均不同程度下跌。

这些特性也造成了一级市场的一种奇观:除了红杉中国、真格、源码、五源、IDG 资本等机构," 机构新出手很谨慎,更多积极在促成老项目和 portfolio 往 AI 方向转,从而多出去融钱 "。

在一些投 AI 投资人眼中,不光是模型升级问题,如果 AI 安全冲突——这个普罗大众更关心的问题——进一步加剧,也可能会让 AI 浪潮再次进入低谷,这一次的 AI 信仰还能持续多久?

 狂飙 200 天:进退两难的中国大模型团战

十年 AI 梦

十余年来,AI 风口在创投界一直回环往复地出现。

技术路线的不停演化,让这个行业充满了那种 " 枪出现之前,研究如何能磨一把更快的刀 " 以及 " 发现未被识别的枪 " 的故事。

如同深度学习路线在 2012 年以前被忽视一样,在 AlphaGo 最热的 2016 年,通用人工智能被业界普遍认为不可能实现。"2018 年 GPT1 推出,在当年看来是离经叛道的路。" 绿洲资本创始合伙人张津剑曾对我们描述,当时的行业主流路线是垂直模型、人工标注," 仿佛雕花 ",而 GPT 做通用," 强行用大量数据硬怼,在学界看起来很粗鲁 "。

出门问问创始人兼 CEO 李志飞回忆起 2 年前开始做大模型的经历:团队顶着很大压力,技术总监几度提出离职。而此时其实距离谷歌 2017 年发表 Transformer 模型、为通用人工智能打开了第一扇门,已经过去了三年,然而少有人识别出背后的意义。

追溯历史,从 1960 年代人工智能概念在学界被提出以来,仅本世纪就诞生过两次 AI 浪潮。

2012 年,在全球最大规模的视觉识别比赛中,时年 65 岁的 Geoffrey Hinton 教授带领两名学生拿下冠军。成功来源于在一种新的 AI 研究范式中找到突破:以深度学习为代表的神经网络派,从此前沉寂 20 余年的学术边缘研究,一跃成为正统主流。

之后十年间,深度学习成为大多数人工智能企业的底层技术基础,并从学术走向产业,在视觉、语音和语义技术等领域率先应用。

在中国,语音识别领域,诞生了出门问问、科大讯飞、云知声等公司,图像识别领域,则出现了 AI 四小龙旷视、依图、商汤、云从以及第四范式等。

而在 2016 年,谷歌 AlphaGo 在人机围棋比赛中以绝对优势击败世界围棋冠军李世石,让 " 机器智慧战胜了人类 " 的现实,第一次在大众层面上被广泛认知。这迅速引发了全球 AI 军备竞赛,并很快迎来国家政策层面的支持。

在这场 AI 热潮中,大厂宣布 All In,陆奇空降百度,腾讯、字节等相继组建 AI Lab,阿里达摩院成立,马云喊出 " 三年投入 1000 亿元 " 的豪言。

各大科技论坛上,人们乐此不疲地探讨 " 奇点已来 " 和机器人三定律,投资人笃信,人工智能将是继蒸汽机、内燃机和互联网之后的第四次生产力革命。

彼时的创投行业正面临投资主题的缺乏(与当下不无相似),几次互联网大并购相继落幕,平台型机遇消退,巨头的触角无处不在。AI 和直播短视频、共享单车等一起,接棒成为热门赛道。

AI 投融资趋于狂热。有报告显示,2016 年全球 AI 融资规模近百亿美元,相当于 2000 年到 2013 年 13 年间总融资额之和。一个侧面佐证是,在 2016 年全球股市低迷的情况下,英伟达股价依然涨了 3 倍。

但疲态很快显现。2019 年,中国在 AI 领域的投资额与投资笔数大幅下降,9 成 AI 创业公司处于亏损状态。猛烈降温开始了。

据 IT 桔子等数据显示,2014 年至 2018 年,中国人工智能领域的 IPO 退出平均回报仅为 1.83 倍,2018 年全年有将近 90% 的人工智能公司处于亏损状态。2019 年," 投资人逃离人工智能 " 刷屏,经过几年凋敝,除联想之星、创新工场等机构外,国内真正在持续关注 AI 的投资人寥寥,大基金也几乎没有专人在长期覆盖。

可以说,除了少数早期投资者落袋为安,AI 至今是一个没能让投资人赚到大钱的赛道。

一则至今被反复提起的投资人旧闻,或能代表其间惨烈:成立于 2013 年的格灵深瞳,传言公司在拿到天使轮后,徐小平在饭局上称其至少估值 5000 亿美元,而沈南鹏认为 1000 亿美元比较实际,最终妥协在了估值 3000 亿美元的中间数上。而现实让所有人意外,时隔 9 年,经历了流血上市的格林深瞳去年终登科创板,当前市值是 65 亿人民币(以 7 月 6 日收盘价计算)。

AI 十年,至今还走在阻且长的道路上。

在旷视的首位投资人、联想之星总裁 / 主管合伙人王明耀看来,十年前的 AI 创业者处在摸索阶段,背景大多来自学术界,对变现的思考不甚清晰,加上并不成熟的产业配套,共同导致了 AI 商业化道路的漫长。

2011 年,联想之星决定扶持三位年轻人走上创业之路,旷视当时估值仅 1400 万人民币。天使轮后,为避免人民币无钱可融,公司才转为美元架构。彼时资本市场的低预期,让 " 早年的 AI 创业者起步很难 "。之后,旷视从 CV 游戏一路到相亲社交、商品推荐的尝试都不顺利,直到 2015 年与支付宝开始人脸支付合作。王明耀回忆,公司甚至 " 成立 5 年才拿到第一笔政府安防订单 "。而今天的市场,不可同日而语。

这也让创投界对 AI 的又一次狂热,显得格外义无反顾。而这次技术进步最大的意义不同在于—— AI 第一次具备了通用的可能。

如果说过去十年深度学习的两轮 AI 创新,仍然是点状分布,是面向特定任务的智能、作用于垂直行业,这一轮的大模型则是李开复所说的 " 从孤岛到大陆 " 的进步:无需人工标注,模型规模大,具备跨领域能力。

技术突破对旧世界的改造是剧烈的。一位互联网投资人对我们说,新浪潮之下,像商汤、旷视这样的大公司,至少还留下了大量算力和经验储备。而对更多的 AI 企业来说,随着技术的演化,或将 " 创业未半而中道崩殂 "。

 狂飙 200 天:进退两难的中国大模型团战

回不去的旧世界

"Holy shit!"DCM 董事合伙人林欣禾脱口而出。

这是 22 年初联系到 Tiamat 创始人青柑时,林欣禾第一次看到文生图效果的下意识反应。

这位亲历互联网浪潮的成功创业者,一直活跃在一线的古典互联网投资人。在对 " 暗涌 Waves" 描述当时情境时,他毫不掩饰惊讶,并坚定认为 " 新一代 AI 浪潮真的来了 "," 不再以 TMT 时代的推荐为逻辑,而是直接替人完成所有事,人连鼠标都不用动。"

尽管对 AI 的投资还在迷雾中行走,甚至在短期内都将保持低沉,但这不妨碍它持续向旧世界开炮:像 SaaS、出海等大量原有商业模式,面对即将被 AI 改写的命运。

一位长期关注企业服务的投资人认为,未来中国的 SaaS 公司,甚至所有 2B 企业,都应该是人工智能公司,软件将被智能即服务所替代。

AI 一方面降低服务成本 & 提高人效,另一方面打通服务的流程环节。如果仍然是一家传统的软件公司," 那基本没戏了。"

风暴同样席卷原有的 AI 创业者,技术路线的失灵,带来的危机只会更甚:上一波基于深度学习做垂直小模型的 AI 公司,要么革命,要么死亡。

李志飞举例,以前很多做 NLP 的人,总觉得这些变化影响不到自己," 过去有 PhD 或教授专门研究语法解析、词性标注,未来这些中间环节都会消失 "。很多从业者如今终于意识到,未来就不应该存在一个专门做机器翻译、问题回答或语音识别的工种。如果不转型,就将面临失业或工作无人关注的窘境。

在一些投资人看来,当生产力的供应结构被重新塑造,无限量的初级工程师将由 AI 替代。被长期作为中国商业自信叙事一部分的 " 工程师红利 ",或将不再存在。

心识宇宙创始人陶芳波认为,面对 AI,接下来只有两种人:" 溺水者 or 淘金者 ",他进而反问到:" 蒸汽火车来的时候,难道只影响马车司机吗?"

真格基金合伙人刘元则表示,对于投资人和创业者来说,这意味着 " 三五个人可以干翻大厂的机会 " 又重新存在了。他甚至感觉," 之前所有的积累恰好是为这一刻准备的 "。

刘元在 2014 年入行,作为早期投资人,他 " 偶尔觉得有些生不逢时 ":错过了移动互联网最好的 2011-2012,后来的双碳、新能源、汽车等风口又极度资本密集。而突然,TMT 投资人所熟悉的数据飞轮、颠覆式创新、产品思维同理心等经典理论," 好像又重新有用了 "。

在访谈中,刘元反复向我们提到维特根斯坦的那句名言:" 语言的极限就是世界的极限 "。他说,这是 AGI 更令他激动的部分:如果人的思维就是一个语言过程,那文科生臆想中的世界极可能在语言大模型上实现。

目前,经过第一阶段的角逐,许多投资人们似乎更看好大厂的大模型试验。

不过,正如不久前下场大模型的幻方创始人梁文锋所言," 市场是变化的。真正的决定力量往往不是一些现成的规则和条件,而是一种适应和调整变化的能力。" 而这或许才是创业公司的缝隙。

林欣禾在欢呼新时代到来的同时,也认为当前很多大模型有 " 因为缺乏应用而受阻 " 的可能。他类比五六年前美国 AR/VR 赛道的火热:谷歌眼镜烧钱无数,但至今未做出来。何况在这波 AI 革命中,软件尚未和硬件充分结合," 很多事情 We still have to see"。

但无论如何,在林欣禾看来,ChatGPT 就像一道玻璃门,一旦跨过就再也回不去了:"AI is the new internet."

这场至今不过 200 天的创业潮,或许正是未来创投故事的典型样貌:道路无疑正确,但注定漫长。