我为什么不看好大模型行业

这是《生成式AI到Agent economy：产业再分工与场景再想象》的续篇。展望未来总是宏大而乐观的，这一篇则恰恰相反。我想，这两篇文章放在一起，能更完整地表达我的观点，只不过太长了，分开发。

看好不看好，日子总归还要过。今天是平安夜，题图是我制作的贺卡，以承泽园的建筑为背景，我家俩闺女为主角，祝愿大家平安夜平安，圣诞节快乐！

本文从以下四个方面展开：

1 大模型厂家为什么赚不到钱

2 基于大模型创业的几个误区

3 大模型企业的竞争优势

4 中国大模型行业的结构性问题

以下为正文：

1 大模型厂家为什么赚不到钱

英伟达是大模型产业唯一的现金赢家，除此之外没有任何第二个，包括微软。大模型企业难以盈利的两大原因是什么？

第一，英伟达是一个近乎垄断的上游供应商。英伟达的价值份额超过100%，意思是其他人是负份额。英伟达那么牛吗？不就是设计硬件？中国的设计能力也很牛呀。英伟达的竞争优势绝不仅仅是硬件的设计能力，也不是制造能力，而是生态锁定。它提供的不仅仅是GPU硬件，更是一系列基于GPU去开发软件的工具链，几十年培养出来的这个生态为它带来难以撼动的优势。你可以开发另一套工具链，但你可能在市场上招不到人，即便你的工具比它的更好。这方面的经典例子是我们使用的键盘布局方式，不赘述了。

第二，开源。Meta开源前，国内很多大模型项目都拿到融资。但是，开源来了，并且开源的比你闭源的还好，门槛一下子降低了。诚然，开源模型目前还没有赶上ChatGPT的水平，但一些不那么需要拼参数的场景，或者受制于成本不希望参数过大的场景，开源提供了一个足够好的基础。你可能雄心勃勃融了10亿人民币想搞大模型，但巨头把自家投了10亿美金的东西，出于战略性考量开源了。降维打击，随时出现。这个往深里讲，是商业模式的降维打击。我如果有一个更高效的商业模式，为了维护这个商业模式，就根本不在意这个10亿美金。创业者无法想象，是因为你没有这么高效的商业模式。

以上两点结合起来：大模型开源最大的受益者是英伟达。因为开源意味着大模型的供给变便宜，对应的需求就变多，对于GPU的供应就变更紧张了，英伟达就更赚钱了。接下来，我们暂时跳出大模型，谈谈技术创新为什么不一定能够盈利。尤其是技术创业者，通常觉得我把技术做好了，产品做好了，盈利自然就来了。其实不是这样的。

这个背后的理论解释至少有三种

波特五力模型- 该理论认为企业收益水平取决于行业整体吸引力和该企业在行业内的相对定位。五力模型是判定行业吸引力的工具。在上述案例中，英伟达作为一个强势供应商存在，而开源因素则促进了替代品的出现并刺激同业竞争。这使得大模型行业结构基本面非常糟糕。这时，行业内相对定位即便再高也不能从中获益。比如Open AI或者微软+Open AI，即便其产品领先且对用户有较高的议价权，但都在亏钱。

破坏性创新理论- 该理论认为产品性能提升的速度通常高于市场吸收这些性能的速度，进而使得创新可能“过于好”却无人愿意付费，面临被破坏者后来居上的险境。尽管很难说大模型行业已经出现性能过剩，但局部过剩是可能的。最近披露的信息表明，GPT4具有1.8万亿参数，而目前很多情境下的开源模型把参数限制在13B或70B。启示是：技术追求极致无可厚非，但商业必须要性价比才能成立

创新获利理论- 该理论最直接相关但不如前两者影响大。该理论指出，创新者不一定获利可能因为1）缺乏知识产权保护导致创新被模仿；2）互补品稀缺导致价值流向互补品。大模型创新难以获利是因为它恰恰同时踩上了这两条红线：我们大体可以把开源视为对知识产权的放弃，因而培育了大量模仿者；没有GPU支持的大模型无法兑现价值，因而GPU正是稀缺而攫取最多价值的互补品

2 基于大模型创业的几个误区

上面的分析很容易被批判为基于现状的静态分析。对未来抱有乐观预期的投资人或管理者会有下面几个理由，我一一回应：

第一，很多人带着消费互联网的烙印，期盼一个赢家通吃的格局，现在先烧钱，未来一定会棒棒的。赢家通吃对于通用大模型有可能是成立的。但我想请大家思考，赢家通吃说的是什么？这4个字说的是同业竞争，仅仅是五力分析的一个力。波特反复告诫，企业的盈利性要看整个产业结构，英伟达就属于另外一个力，就算你赢家通吃了又怎么样呢？微软和Open AI的组合现在应该“遥遥领先”了吧，但是仍然不盈利。可见，赢家通吃不解决行业的结构性问题。另外，过去互联网讲赢家通吃，现在大家不要讲了，现在被反垄断死死地盯着。英伟达为什么不被盯？因为英伟达通吃是基于自身能力，而互联网企业包括Google，包括Facebook，包括国内的这样一些曾经被敲打过的企业，它的通吃是基于什么？是基于结构性的网络效应，而网络效应在一些人的词典里面天然是和垄断相联系的。好吧，这个是对第一个观点的评论，我觉得是需要被浇一盆冷水的。

第二，商业模式未来可能得到优化。如果上游的成本刚性，要提升盈利水平的唯一的方向就是优化变现率。ChatGPT升级一波就会有很多这种应用开发者就会去死掉，为什么？它不想做个好人吗？是没办法，成本投进去了，必须要提升模型的变现水平，就不得不去做越来越多的功能，把人家全部吃进去。终归来说是边界扩张，一点垂直都不做的话，通用倒是通用了，谁付费呢？所以，大家会以能力为基础拼商业模式创新。大家知道，创新就是不同资源的重新组合。搞技术的人脑袋里面总是想着说我一堆GPU，我一堆算法，我一堆的集群什么。但是商业创新是讲的是不同资源的各种整合。在大模型创新里面有很重要的资源，你比如说数据资源在客户那里，你用什么样的方式整合？没有数据，你这个东西还是没有价值的，因为你要解决的问题是客户的问题，而不是你自己的问题，而这个问题存在于客户的数据里面。这个时候就会出现垂域大模型解决方案等等东西。

大体上，我区分智能要素和产业要素。大模型确实是高超的进步、高级的智能要素。但是它还要与产业要素相结合，这就要求大模型厂家要跳出技术思维，具备产业整合思维。那些仅仅包装大模型能力的套壳应用是走不长的。我们可能看它赚钱还赚的不错，但是从我们搞战略这种角度，这种钱是不可持续的，因为很简单——你会被模仿，你没有持续竞争优势。什么叫持续优势？就是我就告诉别人我很赚钱，但是你模仿不了我。这个东西从哪里来，这个是做战略的人反复去锤炼跟思考的。坦率地说，我个人认为，那些有稀缺产业要素的人反过来整合智能要素相对容易，而智能要素要整合产业要素，是难的。这是我对第二个方向的评价。

第三，有人会觉得，英伟达的垄断一定会被打破的。我承认这是大概率事件，尤其在中国。你不得不去打破它的垄断。但打破英伟达垄断和大模型厂家盈利是两码事。一句话：打破了英伟达垄断的厂商难道不是新的垄断者吗？对国家而言当然是OK的，很棒！但华为是做慈善的吗？对于大模型厂家而言，它仍然是卡在上游的一个垄断玩家，一个新的英伟达，对于改善糟糕的行业结构没有太大的变化。

第四，有人说通用大模型没机会了，我们看细分赛道，垂直大模式。我的建议是，那些本身就很强的IT提供商，有自己的客户资源，有原有的解决方案，他把大模型整合到他的产品组合里面是OK的。但创业专门做一个垂直大模型不是一个特别好的点子，你要想清楚你独特的东西在哪里，为什么别人不能模仿你？

这里面有一个点。消费互联网是可以快速扩张的，所以不是不可以模仿，是模仿的时间窗很短，因为很短时间你就可能建立规模门槛，但2B或者产业互联网的扩张注定是慢的，模仿的窗口长长的。一旦陷入同质化竞争，那盈利就遥遥无期了。对于这一点，我的观点是，垂直大模型一定在中国会成为主流，但这个不意味着这是一个独立的创业机遇。有一些企业走着就把事情就顺便做了，因为本身这个项目就在那里，客户资源也就在那里，大模型的API也就在这里，我拿进来就可以了。但你如果去创业做这个事情，最好的结局就被收购。

3 大模型企业的竞争优势

我们从红杉对于美国市场的反思说起，来佐证我前面一分部包括上一节内容的观点。

我们显然看到了很多早期的成功者。Mid journey是个神话，十几个人1亿美元的这样一个量级的收入，人均的产出非常高。有人说，这才是新一代AI企业应该有的样子，十几个人就能够扛起一个亿或者几个亿美金的这种收入。我想说，这是往他们脸上贴金了。人效的叙事逻辑源自互联网。互联网企业最宝贵的资产是人，所以把 Revenue一除以人数，很有说服力。但是Mid journey的价值主要是算力创造的，甚至不是训练算力创造的，其推理算力的成本也非常高，与业务量是线性关系。这个时候，你说他一个亿的revenue好像都是这十几个人创造了，是有点脸上贴金吧？这种企业已经不是以人力资本为中心的互联网企业了，成本结构跟互联网公司非常不一样。

言归正传，红杉说：这些早期成功的迹象不能改变一个现实：很多AI公司根本没有产品与市场的契合点，也没有可持续的竞争优势。AI生态系统的整体繁荣当前仍然是不可持续的。

我非常认同。当一个生态里只有一个玩家赚钱，怎么可能持续呢？

红杉还反思了他在一年前做的预测。我特别喜欢这种分析方式，就怕那些做完的预测第二年又继续做预测，但每一年预测都全错。红杉把它的反思发表出来就很好。让我们知道，像红杉的认知是怎么进步的。原文列出了很多点，这里只谈两点。

第一点，他过去曾经做大模型的和做应用的分离，但现实情况是很多成功的都是垂直整合的，其实百度是已经在这么做了。这和我前面的理论分析是一致的。第二点，跟所谓的数据飞轮相关，他明确说：数据护城河并不稳固。国内创投圈包括从业者基本上被数据飞轮这种这种宏大叙事，这种非常具有吸引力的隐喻给征服了，基本上是消费互联网的遗毒。

红杉说更稳固的来源是工作流程跟用户网络。什么是工作流程？以前面提到企业级的 AI独角兽为例（见上一贴），它有没有数据护城河？有，但是只在一个企业。意味着，在一个企业内部，越多的企业的员工用了你的生成式AI产品，你的产品就会越理解这家企业，而对该企业其他用户该应用的价值就越大。这确实是一个循环，但限制在一家企业客户内部，对另外一家企业没有任何意义。这个逻辑，和我过去批评滴滴商业模式的逻辑是一致的。我说滴滴不要试图去跟淘宝、微信去讲同样的故事，你网络效应或者说飞轮跟他们不是一个级别的，为什么？北京的司机再多，也只证明你在北京区域具有获客优势，与上海无关。类似地，在上面的案例中，无论你在一个客户那里多牛，不会为获取下一个客户创造优势。

真正创造竞争优势是工作流程，这句话怎么理解？它的意思是说，怎么样把生成式AI的产品设计好，很好地嵌入到组织的工作流里面去。XX在内部正在这么做，很好，由此形成的能力相对于大模型的技术能力而言，是相对更难被偷去的。现在讲人机合一，这对于个人竞争优势是对的，但对组织竞争优势而言，可能要讲组织与AI的合一，重点就是工作流程。这个应该是接下来几年数字化转型的新热点。一家大模型供应商如果能够帮助客户实现组织流程与技术的整合，就可能具备持续竞争优势。这是红杉的看法。但在中国还不一定，因为客户会成为你最大的竞争对手，他会觉得“我最懂我自己”，还是自己干吧！

红杉还强调用户网络。什么意思？其实我们常讲的越多的买家，越多的卖家，就是用户网络。我们不要老盯着数据网络，数据网络把用户网络抽象化了，过多聚焦数据了。正如我前面分析的，你对一个企业越来越了解，其实和你能获取越来越多的企业，这是两码事。用户网络效应和数据网络效应的区别，比如说微信，是有很多数据，但是我们用微信是因为微信有我们的数据呢？还是因为微信上有我们的好友呢？用户网络是指后者。有数据是好的，因为更精准更盈利，但有数据没有用户是不行的。这两个相关，但不等同。基本上，有用户网络一定有数据网络，但有数据网络不一定有用户网络。

最后，红杉还列举了一些数据，为什么生成式AI的企业其实很危险。这个指标很有趣，就是DAU除以MAU，可以看到，互联网企业的这个指标远远高于生成式AI的当红辣子鸡。ChatGpt的这个值在14%，相当于就10个月度活跃用户里只有1.4个日活跃用户，意味着绝大多数用户使用它并不频繁。ChatGPT的月留存率为56%，说明大约一半的用户在一个月内会不再使用。注意，这还是ChatGPT哦，国内的数据可能更低。这也解释了为何国内的企业不咋发力推广自身的产品，全靠自媒体用爱发电。之前我觉得核心原因是成本扛不住，现在看来，推广了获客了也留不住，不推是对的。这东西的价值还没有得到验证。

以上观点提醒大家思考：我们创造价值的源泉到底是什么？在你手上还是别人手上？当你还是在吹大模型，而大模型又必须依赖于英伟达芯片时，源泉实际上在人家那里。是不是这个道理？当你确信你能掌握了某种源泉，你还需要继续问自己，你的这种源泉是稀缺的吗？是竞争对手不可复制的吗？搞战略就是永远追问这些基础问题，但现在没有几个大模型相关的企业经得起这样的追问。

中国大模型行业的结构性问题

正如红杉所说，大模型行业的可持续性是存疑的。放在中国来看，其可持续性则更加脆弱。这种脆弱性会有后果。

我们不妨比较，为什么大模型作为基础设施赚不到钱，但是电信运营商赚得到钱。须知，电信运营商的上游也有垄断的巨头，尤其是华为。有人会立刻说这是因为运营商行政垄断。我说这是表面原因，真正的理由是运营商掌控了一个极度稀缺的互补性资源：频谱。

国外的运营商不是行政垄断，他们仍然掌握频谱，与国内运营商区别在于：中国的运营商频谱是国家分配的，看起来是免费的，国外运营商都是天价竞标，动辄上亿美金。但是，免费背后的代价是，中国的运营商要承担普遍服务的义务。所以国内运营商的信号覆盖到珠穆朗玛，是伦敦的地铁里面是没信号的。总之，甭管行政手段还是市场化拍卖，终归运营商拥有一个非常稀缺的互补性资源，使其境遇可能比大模型厂家好。

电信行业大家可能觉得太封闭了。我之前也是这么觉得的，所以从这个行业出来。到产业互联网也就是2B行业混了一圈，现在又在学术圈里面混，感到每个行业都有它独特的问题。从理论上提炼，可以叫产业的治理结构。电信产业的治理结构是成熟而精妙的。百年历史，老旧归老旧，但终归沉淀了智慧。它的行业协会广泛而成熟，比如说3G，4G，5G的节奏，研发与商用的对接，基本上全球是一盘棋的。这得益于各种行业协会提供了一个巨头之间博弈的平台，包括设备商、运营商、终端商等等。大家共同制定的规则（技术为主，也有商业的）一定是符合行业整体利益的，制定出来了全球遵守。行业发展的可持续性一直是这种行业协会关注的核心问题，电信产业会抱团去跟互联网博弈，争取行业的整体利益。

相比之下，大模型产业太嫩了。一个新兴体系，豪门大户与草莽龙蛇忙于争锋，博弈的桌子都没有建立起来。大家听了我前面对于智能基础设施的阐释，应该是兴奋的，但基础设施没有完全依靠市场竞争建立起来的，你必须同时接受这一点。

我逐渐成为了一个制度主义者，非常强调技术背后的制度力量，可能是推力可能是束缚。你可以不喜欢它，但不能忽视它。在大模型的语境下，我说的制度不是伦理、法律之类的，这个有其他领域的专家操心，我最关心的就是产业治理结构这个东西。像XX这种自诩为行业领袖的企业，不去思考这些是说不过去的。

沿着这个话题往下思考，中国的大模型产业的不可持续性非常突出。我们有一个说法，美国有技术优势，我们有场景优势。在大模型语境下，这是自欺欺人。

我们C端用户没什么付费意愿，B端用户数字化基础薄弱（Saas化程度低是一个重要因素），所谓的场景优势难以兑现，落地起来尤其费力，并且都费在低价值环节。这导致我们的大模型能力的进化迭代又进一步落后。简单说，一个2C/2B付费能力都很低的市场，还面临后端购买GPU需要付出比市价更贵的成本，相对于红杉判断的美国市场更不可持续，这么说没毛病吧？这是一个巨大的问题。现在看是一个经济问题，但如果解决不好，很可能成为一个政治问题。因为这个行业是中美竞争的前沿，太重要了。

出自：https://mp.weixin.qq.com/s/BXHReOtuh7J1tSLvpGu2aA