尽管Q4季才刚开始,但人工智能大模型公司智谱已公开宣布,今年累计获得超过25亿人民币融资。
这距离智谱上一次正式公布融资消息已经过去了一年多的时间。
实际上如果翻阅智谱官方公众号,你会发现官方几乎是以一年一次的频率来公布融进展,A轮融资「过亿」,B轮融资「数亿」,今天则直接公布了年度融资总额。
清华系受追捧,AI 创投背后的学术谱系
当然,市场上流传的智谱融资规模和节奏比官方公布的更详细,就在9月有两个关于智谱融资的消息传来,一个是它完成B-4轮融资,参与的机构包括了腾讯和阿里。
另一个是它和同为清华系的大模型公司聆心智能进行全面合作,其「全面」的程度之深,一度有传言认为智谱实际上收购了后者。
稍早在7月,美团战投主导了智谱B-2轮的融资,至于中间的B-3轮在何时由谁主导,目前外界尚无确切消息。
不过仔细阅读官方发布的这篇不到150字的公告,不仅上面提到的几个企业赫然在列证明了市场传言不虚,更指出智谱的融资方还有包括蚂蚁、小米、金山和红杉、高瓴以及君联资本在内的一众国内科创领域头部公司和VC,或许B-3轮的投资方正在其中,而时间则可能在8月。
当然,以智谱的低调作风来看,我们恐怕永远也无法从官方那里得到公开准确的消息,但有件事情是毋庸置疑的——智谱已经成为人工智能大模型领域新晋独角兽。
尽管有不同的测算口径,但智谱的估值早已超过10亿美元的门槛,有不少分析认为甚至有可能上看150亿人民币,考虑到今年三个季度的融资总额达到25亿,这个数字并没有夸张。
智谱进击
智谱格外豪华的融资机构名单中最引人瞩目的是腾讯和阿里的参与。
历来在创投领域有「王不见王」的两家,历史上共同投资过的公司屈指可数,像美团、滴滴和小红书等无不是各自赛道上的独角兽,而现在这个名单里加上了智谱。这从侧面反映了智谱在中国人工智能大模型领域的地位。
一直以来,智谱都被称为「三有企业」,意即有人、有技术,有客户。也就是说智谱和其它大模型创业公司最大的不同在于,它不是追赶风口匆匆成立的公司,而是清华科研成果累积到一定时候自然而然的产物,智谱和它的前身——清华大学知识工程实验室在人工智能领域投入了十数年。
尽管人工智能的浪潮起起伏伏,但智谱的方向不仅从来没有变过,甚至很大程度上引领着整个行业的趋势。
这种不变,成了智谱最大的优势。
比如大模型领域大家最关心的算力问题,智谱早在这件事变成一个卡脖子难题之前就有所布局。
CEO张鹏在公开采访中透露过,智谱有一部分算力购自一家云服务商,那时还没有多少人意识到算力之于大模型的重要性,以至于这批GPU正被放在仓库里吃灰,智谱最后用「可接受成本范围内」的价格拿下了这批显卡。
类似这样快人一步的先手棋,智谱还下过很多。
随着这种先发优势累积的壁垒越来越高,智谱的投资格局实际上已经变成了标准的「卖方市场」——它不愁没有钱,甚至在融资的同时也在布局投资,比如上面提到的聆心智能。智谱最终对收购传闻进行了澄清,不是全资收购,而是大幅增持后者的股份。
有趣的是,聆心智能其实也是一家清华系的企业,它的创始人黄民烈是清华大学基础模型研究中心的副主任,而这家全国唯一的专攻大模型的高校研究中心的主任正是唐杰。
清华朋友圈
智谱的投资版图几乎就是一个清华朋友圈。
聆心智能的天使轮和Pre-A轮智谱都有参与,除此之外,智谱还投资过面壁智能和幂律智能。
前者的联合创始人刘知远,正是清华大学基础模型研究中心的另一位副主任,后者的创始人涂存超更是标准的清华人,在清华园度过了九年时光,他拿到清华优秀论文奖的博士论文《面向社会计算的网络表示学习》指导老师之一正是刘知远。
可以看到,智谱的投资脉络同清华系背景有着不可分割的关系,这本是意料之中事,但如果我们把眼光放得更远一点就会看到,实际上清华系背景已经在这一轮大模型创业浪潮中成为一个鲜明的标签。
就在几天前,百川智能宣布完成A1轮战略融资,金额高达3亿美元,它的创始人王小川来自清华,而另一位高调创业,却因个人身体原因踩下急刹车的光年之外创始人王慧文,同样来自清华电子工程系。
特别值得一提的是,作为智谱在大模型领域主要的竞争者之一,百川智能同样也拿到了腾讯和阿里的钱。
当然,如果说百川智能和光年之外两家公司拿到巨额融资,除了清华出身,还和创始人在商业鏖战多年成就斐然有密不可分关系的话,那么杨植麟的例子则更能说明问题。
人工智能领域的人提到杨植麟,往往会冠以天才二字,他被认为是大模型创业赛道上少见的个人明星,而杨植麟本科正就读于清华大学计算机系,是唐杰的得意门生。
在美国读博期间,杨植麟研究的合作者包括深度学习三巨头中的两位,90后的他更是以第一作者身份发表多篇和大模型相关的论文,谷歌学术显示其引用次数高达上万次。
杨植麟的清华系背景和他的大模型赛道创业历程几乎交织在一起,比如说公开身份上他除了是循环智能和月之暗面两家公司的创始人外,还是清华大学交叉信息研究院的助理教授。
再比如,他的新公司月之暗面内部清华背景的人占相当大的比重,别的不说,两位联合创始人周昕宇和张宇韬都是清华毕业。
就在这个10月,月之暗面发布了首款基于大模型的对话式AI产品Kimi Chat,它支持输入20万汉字的超长文本。
与产品一同发布的还有融资信息,月之暗面据悉已经拿到了包括红杉资本在内的近20亿元融资,这距离月之暗面这家公司成立,仅仅六个月。
创投百模大战的新阶段
总结起来,在这一波人工智能浪潮中涌现出来的明星公司背后几乎都有着清华大学的身影。
某种程度上说,这座中国最顶尖的理工科大学,默默主导乃至影响着中国大模型浪潮的发展,于是资金自然也涌向这里。
背后的原因和人才稀缺性紧密关联,以至于我们甚至会得出一个乍听上去有些荒谬的结论:大模型人才是如此的缺乏,相比之下,资本都显得很充分了。
这种稀缺性细分起来有两部分,一个是理论层面的,那就是对深度学习架构有深刻理解,有大模型训练经验的人在世界范围内都很稀缺。而另一个层面某种意义上更重要,那就是工程化能力。
如何驾驭超大规模显卡集群,恰当充分运用好本已稀缺的算力,对大模型性能在硬件上的表现进行有针对性的提升是一个极端重要,却又极为罕见的能力,而国内数得上号的相关方面的人才,大半集中在清华。
于是我们看到了一个出现分化和调整的百模大战新阶段。有公司力推所谓「垂直模型」概念,有的则向市场讲述大模型在应用领域的巨大潜力,还有的则聚焦于B端商业化部署和辅助客户进行模型微调。
但以智谱为代表的清华系背景公司几乎不约而同选择继续提升基础模型能力,其中的逻辑很简单,基础模型能力是一道最深的护城河,商业化能力和应用落地从根本上说仍有赖于强大的底座模型,而清华系无论从人才储备还是科研积累方面都有很强的优势。
在大环境如此不确定的情况下,清华系背景某种程度上成为了投资人的一颗定心丸。仅仅是上文提到过的几家清华系公司的融资规模,粗略算来已达80亿人民币左右,堪称整个投资赛道中为数不多的亮点,这既是对大模型商业前景投下的高度赞成票,也是对清华在中国科研创新领域首屈一指能力的肯定。
基础模型能力的持续提升将把百模大战带领到一个全新阶段,这背后清华所发挥的作用不容小觑。
出自:https://mp.weixin.qq.com/s/SMFQeNneOTg-nZY6EhnkBw
本文档由网友提供,仅限参考学习,如有不妥或产生版权问题,请联系我们及时删除。
客服请加微信:skillupvip