近日,名为「月之暗面」的国内AI团队,以超过10亿美金的巨额融资,震撼了整个科技界。此次融资,这不仅是对「月之暗面」实力的一次肯定,更是预示着国内AI大模型的“骨骼”开始逐渐硬了起来。「月之暗面」成立于2023年3月,由清华大学交叉信息学院的杨植麟教授领衔,团队成员中还包括来自Google、Meta、Amazon等国际科技巨头的人才。
其上一轮融资是在2023年,获得了超过2亿美金的资金,投资方包括红杉中国和真格基金等。而经过本次融资,月之暗面在成立不到一年的时间里,估值已经达到了约25亿美金。那么,这次巨额融资背后,「月之暗面」究竟有着怎样的道行,能够让资本市场为之倾倒,纷纷投下重注?
1
团队介绍
月之暗面(Moonshot AI)的团队构成以其年轻、专业和经验丰富的特点脱颖而出,团队的创始人杨植麟,虽然是一位90后,但却在学术界有着深厚的积累。其不仅拥有清华大学计算机科学的背景,以及卡内基梅隆大学的博士学位,还曾与多位图灵奖得主合作发表过论文,其学术成就和行业经验,为月之暗面带来了强大的技术背书。
杨植麟(中)同样的,其他几位关键成员,如联合创始人周昕宇和吴育昕,在拥有清华大学背景的同时,也拥有在旷视科技和Meta等知名科技公司的工作经验。参与过Google Gemini、Google Bard、盘古NLP、悟道等项目,这使得月之暗面在大模型领域具备了领先的研发能力。
吴育昕可以说,强大的技术背景和研发能力,以及团队成员背景的多样性,成为了各路资本看好月之暗面的原因。因为只有在拥有技术实力的基础上,从不同的角度看待问题,才能够更好地理解和满足市场的需求。
2
产品介绍
相比当前市面上一些追求“面面俱到”的大模型,月之暗面的大模型Kimi Chat更专注于长文本方面的能力。例如,其实际使用效果能够支持约20万汉字的上下文,2.5倍于Anthropic公司的Claude-100k(实测约8万字),8倍于OpenAI公司的GPT-4-32k(实测约2.5万字)。
同时,Kimi Chat通过创新的网络结构和工程优化,在千亿参数下实现了无损的长程注意力机制,不依赖于滑动窗口、降采样、小模型等对性能损害较大的“捷径”方案。这些改进允许Kimi
Chat在不牺牲理解能力和生成质量的前提下,处理长达20万汉字的输入,这在当前的AI模型中是非常罕见的。而这样的优势,也让Kimi Chat在金融、法律、科研等需要快速分析和总结长篇文档的领域,展现出了巨大的潜力。
3
总结分析
从技术和市场两方面来看,月之暗面及其大模型Kimi Chat,之所以能在众多国产大模型中脱颖而出,主要有两大原因:其一是Kimi Chat的主攻方向,触及了当前大模型的技术本质。
毕竟,现阶段的AI大模型,本质上就是为了在信息爆炸的时代,辅助人类处理过载信息而诞生的。而这也是只有杨植麟这样具备深厚学术背景的创业者,才能深刻理解的一点。因此,Kimi Chat的长文本处理能力,正好迎合了“处理海量信息”这一市场需求。
其二,则是Kimi
Chat在C端市场的定位在众多国产大模型或保守,或跟风地投身B端市场时,Kimi Chat却明确定位于C端市场,通过提供个性化和便捷的AI服务,与同类大模型形成了差异化竞争。同时,C端产品的用户通常对产品的体验和功能有直接的反馈。这种即时反馈机制使得Kimi
Chat能够迅速进行产品迭代和优化,从而在竞争激烈的市场中保持领先地位。