我按照我的理解,简单地做了一个产业链的图表。这个图表在1月底的时候,我就以文字版内容分享给大家了,让大家去思考。我的理解是这样的:我把产业链切分为上中下游。准确地说,上游的核心其实是电力,以及人工智能上游所需要的硬件。硬件主要是算力硬件,比如GPU。如果我们再加一个服务器,我觉得会更准确。当然,服务器也包括云服务等。但本质上,它是上游的算力硬件。至于为什么英伟达的GPU具备这样的能力,这里涉及到技术细节,我们就不展开了。
中游实际上是一个加工工艺。怎么理解呢?我觉得我们都是干工业体系出身的,所以用工业体系的话来描述产业链会更简单。工业体系中,比如炼油或炼钢,都有基础性的硬件,比如反应炉或高炉。这个高炉就是硬件,它的特点是固定件。很多时候,我们说上游的基建投资是准确的。就像做工业一样,需要建一个工厂,工厂有土地、厂房,重点是有设备,无论是催化设备还是炼钢设备。我们可以把它们统称为“大基建高炉”。
高炉的好坏,本质上就是算力硬件,比如GPU和服务器。这些东西可能组成了整个高炉反应塔的每一层。我们需要往高炉里投料,工业体系中经常讲“喂料”。那么,这个料是什么呢?其实就是数据。这个头道的料就是数据,然后让高炉预热,先把它热起来,产生铁水。根据不同的蒸馏法,会出来不同的汽油、柴油等。其实这和工业是一样的。
现在我们在投喂大数据的时候,有一个叫“预训练”的过程。广义上来说,这就是数据投入,去看整个高炉每一层的这种反应。往后,还有一个修正的过程。修正就是调整比例,调整后会产生不同的结果,比如这个多一点,那个少一点,用于不同的用途。这一块就是广义的大数据投喂后的“铁水”,然后经过进一步修正,出来的就是专用的半成品。
这些成品或半成品,在上游出来的是“铁水”,比如铁水,这些东西还不是直接用于最终端产品的,准确地说,对整个产业链来说是个半成品。因为对于下游来说,它又是一种原材料。这里实际上是一个比较抽象的概念,实际上是一种能力,一种运算能力、推理能力。这个能力是一个项目,它不是一个物化的存在,但它可以作为叠加其他应用端的原材料。所以,这里进入的应用端实际上就是下游。就像把铁水拿出去,可以做钢材、板材。钢材、板材做好后,可以进一步应用。越往下游,应用场景就越细分。有些专用的半成品会用于专用的行业和应用端。
当今年讨论到Deepseek(深度伪造)的时候,大家讨论比较多的是中间的模型和算法。其实这也就是当时一月春节后,我写日记关于Deepseek到底引发的是什么。当然,我还是强调我们不要明确,要冷静地看待它到底激活了什么,带来了什么。
在整个产业链中,所谓的模型和算法,如果放到工业体系中,其实并不难理解。放到工业体系中,它是什么东西呢?其实就是你的工艺,我们称之为“加工工艺”“生产工艺”,这就是算法。我经常举的例子是,以前的院士手上掌握着一些配方,这些配方实际上通过调整温度、调整投入的数据比例、调整炼钢工艺,可能会得到同样的结果,但成本可能会更低,效率会更高。
实际上,我们投入原料到硬件的高炉里,里边所有的反应模式,其实就是大家一直在寻求的所谓的模型和算法。所谓的通用模型,实际上就是我讲的通用的配方。再往下的可能会涉及到细分的数据不一样,细分的算法和模型不一样,那你出来的可能还有专用的。其实我觉得这和产业链的逻辑和体系没有什么太大的差异性。
这个工艺,比如配方,可以达到降本增效的目的。那么,这个时候很重要的一点就涉及到你的配方到底是保密的还是开放的。实际上,开放的话,就是大家讲的“开源”。你会发现,为什么人工智能的生产工艺这一端一定是开源的,它并不像以前的产业链中实际上还有一个对应的保密期。因为有保密期,所以算法和模型就可以给到估值。
怎么理解呢?比如OpenAI,它实际上还要进行收费。收费实际上就是说它不想完全把它的模型和算法打开,它想保密来获取利润。只要你能够获取利润,那本质上就有了估值的条件。就像投资一样,万事万物都是如此。比如以前你拿着配方,我是高炉的投资方,我是老板。我投了硬件,买了原材料,准备挣钱。然后老教授过来说,他的配方可以降本增效,让我看看怎么给他估值。我就算账了,比如我高炉能挣多少钱,我预估一下,他的配方可能在三年之内目前来讲没有人能够抄得到,也破解不了。那么他每年能帮我降本增效多少,我的产出的竞争力也能够维持。比如他的降本增效可以帮我多挣5个亿,那么我给他分两个亿,这是没有问题的。
所以,我可以给他的估值,其实本质上还是来自于他能够带给我的利润,在降本增效层面带给我的利润。在这个产生的结果上带给我的利润,比如降本,他可能对GPU的依赖度会下降。以前我可能用两个高炉才能产出这么多水,现在效率提高了,我一个高炉可能就能产生这么多水。那么我的效率提高了,我的数据投入的成本也下降了,我最后用的产成品的成本也就进一步降低了。
这就是我们给模型和算法估值的原因。其实我注意到很多专业的投资人,仔细思考这个链条后,会发现这个不难。会发现什么呢?发现生产工艺的迭代周期,在以前工业时代的时候,它是有周期性的。比如你能挣三年,三年后,别人都会这套工艺了,那这个工艺也就对应的不值钱了,也就没有估值了。比如整个产业周期三年后,大家都同样的成本,同样的效率了。换句话说,你的优势其实就没了,你开不开源其实意义就不大了。
所以说,在传统工业时期,比如举例的可能有三年,不同的行业中间的组成配方,肯定有不同的周期性。比如医药,如果没有仿制,有很强的法律保护,那你生产一款新药,你可能垄断时间会更长,其实准确说就是垄断的利润。
那么模型和算法呢,它的迭代周期太快了。所以Deepseek其实是一个现象,但我一直不会像民粹一样去加那么多情绪在里面。它是一个现象,是因为它是第一挑战,直接把降本增效这一环以这种方式打开了。但它也激活了模型算法的高效率进化。也就是说,它把周期中间的周期给压缩完了。比如现在如果给Deepseek估值,怎么估呢?比如我给你估一到两年内你是领先的,你是商用的,你是有价值的,还是说我给你估一到两个月还是一到两周。
当然,有人说,现在大家都去用Deepseek,那如果收费呢?如果变成收费模式,下游的厂商、中游的厂商,甚至其他人会不会去做更好的呢?当然还有开源。所以这之间就是一个竞争效率不断提高,然后螺旋式不断循环和进化的过程。你只有不断投入,才能保持自己所谓的领先性。当然,现在硬件端会不会就此买单呢?可能暂时会,但周期太短了。
同时,你看现在全球的竞争,你一出,然后那边你会发现GPT也在进化,Groq也在进化。这里边存不存在着谁绝对领先呢?我认为其实是不存在的,因为它的周期,它的进化周期要比工业里获取垄断领先性的周期要短。我可能给一年,半年都顶头了,因为如果你仔细看人工智能的特点,它和工业不一样。人工智能的特点其实不是一个斜线,它不是一个斜线,它是一个曲线。也就是说,在单位时间内,它的斜率到后半段的时候,它会在产业链的上中下,然后到它的后半程的时候,它是成几何倍数扩张的,也就意味着你的时间是成几何倍数压缩的。
比如前面硬件我可能要花10年,到中间的这块投入可能花三年,但到这儿,算法的进化、推理能力的形成,甚至到末端应用的叠加,它可能就是一天。比如才过短短一个月,大家发现,下面所有的场景应用,原有的产业都可以去叠加所谓的降本增效的这种优势。这些成品可以快速向下游扩散,这是好事吗?从产业链来讲是好事,但从另一个维度上理解,你的价值函数其实缩得太快了。
到了下游的应用端,你会发现这个问题。因为下游的准入门槛是最低的,就好像做衣服一样。你获取AI加,那就意味着你先获取了竞争优势。但如果大家都同时获取AI加,那其实意味着什么呢?大家其实相对都没有优势了。比如,你发现现在大家都接入了GPT,都接入了Deepseek,那大家今天用Kimi,明天用豆包,后天可能就用腾讯的了,然后后天就不知道用谁了。因为大家都介入了,也就意味着实际上的竞争优势都不明显了。
作为产业链的下游末端,这就产生了巨大的问题,你的优势在哪里?因为你获取不到这个优势,实际上就获取不到利润,它是一样的道理。最后你会发现,它一定是个赢家通吃的逻辑,也就是说我自己不断地进化算法,就像埃隆·马斯克一样,我不断地进化算法。但如果你没有竞争对手出来,我其实就不会把最新的算法拿出来开源给你用。然后呢,如果有竞争,那我就迅速开源和竞争,这一环上实际上就很难获得利润。
到了末端,实际上大家只是为了获取流量,因为用这个竞争优势去获取一定的领先性,这个时间窗口。因为随着中间的时间窗口的压缩,下面的时间窗口其实也被压缩掉了。最终大家会发现,最难的其实还是上游,上游实际上是最难的。
所以说,你会发现,最后的赢家通吃就是掌控着上游的人,你掌控着GPU,你掌控着服务器,你掌控着云服务算力。因为最后你会发现,我有工艺,你没高炉,白搭;你没原料,白搭;你没这个,你光有模型和算法,光有下面的一个单一的应用端,有啥用。所以说大家会发现,现在的所谓互联网中国的逻辑,单纯你有下游的,你得死;单纯有中游的,你得死。可能像一个大厂一样,它的中下游都有,但并不是核心的,并不是在中下游,核心一定是在上面的能力上。
那么还有谁能够在这条链条上获得额外收益呢?实际上还有就是数据,就是通用的大数据,这个大家都能够去做,当然训练的成本很高。你没高炉,你光获得这类数据没用,但将来数据可交易的话也行,你可以卖给有高炉的人。还有一些就是我们说这些专业的需要金条的这些数据和人,那么他们可以去服务于这条链条。
这条链条最后的利润其实将全部归于上游,也就是算力成本。然后服务器,然后我拥有电,我拥有GPU,那么这种情况下我有了高炉,剩下的我才能做。没有高炉的,在这其实很难获得利润。当然这和我们的产业链一样,工业的产业链发展到最后你会发现下游不挣钱,中游白打工。最后上游只要不去扩产,原则上利润就会逐渐向上游垄断,上游就会变成一个现金奶牛定价的模式。
虽然大家都用上这个东西了,但利润的归结,它的周期性就是这样滚动的。只是说在原来传统产业链中这个周期性长,它每一环能够获得一定的时间优势,进而也都获得利润的优势。而人工智能它本身第一不断在进化,它的效率很高。
所以我其实比较担心的就是这种高效率下,其实它会将原有的整个产业周期的逻辑快速压缩。那么这个其实对于我们来讲,给估值就有问题了。我们前几年实际上给了上游的估值,然后到上游的正名和正尾,也就是这儿基本上是正名和正尾并且形成寡头垄断了。那么市场肯定会逐渐往下走,给中游的、给下游的估值。但最终会发现这个估值的确定性、持续性,真正对应的盈利能力,以及这个产业链特征的T函数的压缩,都会导致一个估值其实更不稳定。
所以说我觉得可能根本就给不了你一两年的时间,你就会迎来这个产业链向下游走,向应用端走,最后发现不对。然后一把杀估值,起泡沫,然后大幅度杀估值出清的一个结果。出清以后最后就是收并购,啪啪啪收并购以后还是那句话,形成一个综合性的平台。有高炉者得天下,有高炉者得天下,你下面的所有东西我都可以收,我甚至收完了都可以不赚钱。最后大家会发现什么呢?你似乎还是没有逃脱一个核心,就是互联网思维,其实准确说不是早期互联网的思维,而是近十年互联网的产业链发展的逻辑。其实你可以从工业跳到互联网这个上中下游,然后再跳到现在AI产业的上下游,你会发现是相通的。互联网已经把原来传统工业的时间周期压缩了,而现在的AI会进一步压缩。这就是我们在长白山论坛里仔细聊的中微观上我担心的事情。