4月6日,一则“中国AI大模型调用量连续五周超美国”的消息在中文互联网疯传。

每日经济新闻报道,根据OpenRouter最新数据,今年2月中国AI大模型Token调用量首次超过美国后,已经连续五周领先,而且双方差距越来越大,1月初美国的Token调用量还是中国的3.6倍,现在变成中国Token调用量是美国的4.2倍了。

啥是Token呢?Token是大模型的最小信息单元,国内将Token译为词元,咱普通人就记一个结论,Token调用量越高,代表模型被用得越多。

中国网友还没来得及开心,就有人“辟谣”,说OpenRouter数据不完整,《联合早报》还酸溜溜地说“Token调用量不反映创新能力”。

奇怪,跪舔美国大模型的时候Token调用量还是核心依据,怎么中国反超就变得不重要了?第一名需要不断“说服”别人相信自己是第一名,这件事本身不就很可疑?

客观来说,OpenRouter的统计数据来自自身转发的API请求日志,不包括厂商直调、C端App、私有化部署等场景数据,确实有一定局限性,但数据本身是真实的,它反映了中国AI大模型暴涨的客观趋势。

即便采用摩根大通的最新估算,全球周均Token调用量2400-2600万亿,中国占比40%-45%,美国占比30%-35%,仍然是中国领先。

实际上,在过去的两年里,中美AI大模型已经在视频生成领域,发生过一场腥风血雨的交锋,并且在这个过程中,“永远领先一代”的美国AI大模型已经开始掉队。

这次交锋的源头,还得从清华大学2022年的一篇论文说起。

2022年9月,清华大学的研究团队发表了一篇题为《All Are Worth Words: A ViT Backbone for Diffusion Models》论文,首次把扩散模型的卷积U-Net换成Transformer

就是这个新脑洞,一下子打通了AI视频生成的任督二脉。

在此之前,人类对计算机生成视觉图像的探索,已走过了半个多世纪,产生了Transformer、扩散模型等技术路线。

那个叫Transformer的哥们,是一个逻辑性很强但手很笨的编剧,它能写出完美的剧本,但当它打算把这个剧本变成视频时,只能生成一张张图片再强行拼起来,所以画面会卡顿。

那个叫扩散模型的哥们,是一个脑子不大好但手很巧的画师,它能画出一只栩栩如生的卢胖子,但如果你下的指令是卢胖子吃蛋烘糕,它可能画出来的蛋烘糕长在卢胖子的肚子上,甚至直接把卢胖子变成蛋烘糕。

过去,这两位哥们一直是各玩各的,井水不犯河水,直到清华大学的理论创新,将它俩撮合到了一起。就在个月后,Facebook的研发团队也发布了一篇论文,和清华大学的点子如出一辙。

中美两国不但几乎同时实现理论突破,也同时开始推动应用突破。

2023年4月,字节跳动的AI技术老将王长虎,在北京创立了爱诗科技,打算进军AI视频生成赛道。

王长虎是纯技术出身,博士毕业于中国科学技术大学,主要研究方向正是计算机视觉。

博士毕业后,王长虎先是在微软当研究员,后跳槽到字节跳动任AI Lab总监,完整参与了抖音和TikTok从0到1的建设,2021年从字节离职后,开始折腾自己的事业。

王长虎的野心,是面向全球C端用户做出一款较为先进,又能让大家用得起的AI视频生成软件,这款软件就叫PixVerse。

但是对中国公司来说,做AI视频生成实在过于超前。

因为AI视频生成所需的模型技术,和ChatGPT这种语言模型完全不是一码事。

语言模型的局限性,在于它会忽略掉真实世界的大部分信息,比如当我们输入“卢胖子狂炫工作室的小饼干”这行字时,文本模型“看不到”卢胖子的表情、饼干的质感、工作室的光照等等。

如果换成多模态模型来干这事儿,效果就完全不一样,它会“看到”卢胖子嚼第一口时瞪大的眼睛,饼干碎屑掉在衣服上的轨迹,还能听到嘎嘣脆的嚼饼干声,甚至助理小姐姐那声“差不多得了”的叹气。

虽然听起来很爽,但多模态大模型比以烧钱著称的语言模型,还要烧钱十倍不止。

王长虎拉融资的时候,投资人一个个把头摆成了拨浪鼓,咱们连ChatGPT都还没赶上,怎么敢做多模态的?这种烧钱又不产生生产力的事情,让美国去做就行,我们中国人还是老老实实做应用端。

当时金沙江创投合伙人朱啸虎就直接给王长虎浇了一盆冷水,说你们还是回去上班吧,这个事情可能在中国没有什么机会。

王长虎不死心,一定要在多模态上杀出一条血路。

因为融不到太多钱,PixVerse不得不在缺钱少芯的情况下,勒紧裤腰带研发。可能是为了避开和字节正面竞争,PixVerse早期主要是发展海外市场。

2024年初,PixVerse开发至第二代架构时,突然杀出来一个BUG级选手,Sora

Sora是OpenAI的多模态大模型,如果按时间倒推,Sora和PixVerse可能是在差不多同一时间立项,只是OpenAI此前并未公布任何消息。

2024年2月,Sora发布了一段预览片,片中的流体、光影、人物表情和动作极其逼真,被业界公认为是多模态大模型的顶级水准。

昂撒精神领袖欣喜若狂,宣布中国公司已彻底输掉AI竞赛,你看!人家美国还是碾压我们!好像美国碾压我们,能给他们涨工资似的。

当时国内财经媒体最喜欢写的一句话是:中美的差距不但没缩小,反而越来越大。

有个专家接受媒体采访时说:Sora发布后国内没有跟进,因为我们跟进不了,我们没有人才储备,没有架构准备,未来两三年都没法拿出像样的产品……

社交平台流传一张梗图,巨大的Sora神像跟话事人一样坐在王座上,下面跪着Runway、Pika、SVD、PixVerse等软件,“跪”在第一排的PixVerse,还是唯一一家中国公司。

王长虎看到这张图时,心情十分复杂。他有些遗憾,更有些不服气,甚至有些质疑。

当时媒体采访他时,他说:“如果我们过去一年有更多的投资和算力资源,有可能最先做出Sora的不是美国人,有可能是我们。”

王长虎还委婉地表示,他很想知道,Sora的正式版本到底好到什么程度。但是Sora有OpenAI背书,所以他宁愿相信Sora是真的这么强,并打算在3-6个月之内追平Sora。

除了PixVerse,阿里、字节跳动、快手、Minimax等一众中国公司,在短短数月内推出AI视频生成工具,引爆了多模态模型混战。

为了追赶Sora,中国公司在紧迫而逼仄的氛围中卷生卷死。

早在2024年底,可灵就能生成接近2分钟的视频,并且在人体骨骼一致性、物理拟真等方面超越了Sora。

虽然中国公司干得热火朝天,但当时专家和大V的普遍情绪,就是别自取其辱了,快投降吧,追平?能追平吗?你以为Sora会站在原地等你?

呃,事实证明会,甚至……还倒退了好几步。

被传得神乎其神的Sora,整整一年半都没拿出成品,直到2025年9月才迟迟上线。

爱诗科技联合创始人谢旭璋看到成品后,淡淡地评价,这和预览片差距非常大,“前后差了十个PixVerse”。

有种网恋奔现大型翻车现场的感觉,有种遇到了诈骗犯只想报警的感觉!

国内媒体发文称,用户吐槽Sora如同人工智障,但狂热的Sora信徒淹没了评论区,清一色都在讽刺“愚蠢的人不去追赶,却在别人的成果里挑小毛病”。

你质疑的对象可是OpenAI啊,How dare you?

结果Sora又辜负了它的信徒。2026年3月26日,Open AI宣布将正式关停Sora。

这个“只有一点小毛病”的Sora,以一周留存率2%,月留存跌破1%,75%用户生成一次后永久卸载的负分战绩,只活了半年,就彻底退出AI视频生成赛道。

Sora溃不成军时,中国AI视频军团正以惊人的速度狂飙。

全球AI视频生成赛道,现在几乎被字节跳动即梦(Seedance2.0)、快手可灵和爱诗科技PixVerse等几家中国公司瓜分,其中PixVerse的全球用户规模突破1亿,可灵用户突破6000万,今年2月Seedance2.0出圈后,下游应用一夜爆发,中国AI模型拉爆了Token调用量。

Sora被中国AI视频军团击溃的原因很简单,死贵还不好用。

一位影视动画行业技术人员告诉我,AI视频还没出现时,团队是用一款叫Midjourney的国外软件来生成图片,现在都换成了可灵和即梦,“Sora用来玩玩还行,但抽卡太贵了”。

所谓抽卡,就是当前的视频生成技术,都很难一次生成目标效果,得像抽卡一样多抽几次,运气好几块钱搞定一个视频,运气差要几十上百块,如果制作需求量大,就得开会员才比较划算。

但Sora的定价,比国内软件高太多了。

Sora最高版本折合人民币每月约1400元、最低版本约每月140元,即梦最高版本每月499元、最低版本每月69元,可灵最高版本每月1314元、最低版本每月58元。

我问过几位从业者,可灵最高版本也挺贵的,为什么用户那么多?

他们回答,可灵偏B端,在画质清晰度上优势明显,能制作高质量商业片,即梦偏C端,适合生产对画质要求不那么高的AI漫剧,二者的定位非常清晰,就是Sora,找不出任何长板,一副不知道自己要干嘛的样子。

这种完败,对于Open AI来说是奇耻大辱——你可以死于便宜但难用,也可以死于好用但太贵,但你居然死于又贵又难用!

而且真正的问题在于,当房间里出现一只蟑螂,就不可能只有一只蟑螂。

在Sora神话崩塌的前一年,F119发动机也发生了类似的翻车“事故”。

2025年2月,马斯克应特朗普指示,去查美国国防部的账,随后公布了一份震惊世界的资料,显示美国五代机F22使用的F119发动机疑似数据造假。

这份资料显示,F119的推重比并不是此前宣称的10.5,而是7,整整缩水了50%。F135发动机更夸张,宣称的推重比是11.47,实际推重比只有6.7,缩水了71.2%!

对中国航空人来说,F119也曾是BUG般的存在。

中国从1997年就开始苦苦追赶F119,花了近30年,才将涡扇发动机的推重比从3.82提高到10。

曾有中国技术人员曾指出F119的数据不对劲,还有人指出美国没有把散热器之类的器件重量计算在内,但我们一是没有铁证,二是我们认为,即便美国虚标数据,也不是我们故步自封的借口,美国指不定藏着掖着什么吊炸天的技术,咱们要料敌从宽,当成真的来追赶。

马厂公曝出真实数据时,中国看着手中的涡扇发动机陷入了沉思:那我造的是个啥玩意儿?

F119和Sora的翻车绝非偶然,它揭示了中美科技竞争的本质区别。那么,美国造神、中国灭神的规律,是否将在未来中美AI竞争中再次应验?

首先,我们需要回答一个问题,不缺钱、不缺芯片、不缺技术人才的Sora,为啥把一手好牌打稀烂?

Open AI作为一家全球知名的公司,故意吹牛打自己脸的可能性不大,实际上,Sora死在它无法解决工程化难题。

什么叫工程化难题呢?

我们在《固态电池全球大战》中,写过一家叫QuantumScape的美国初创公司,这家公司2020年发布了一份震惊全球的测试数据,说它研发的固态电池性能逆天,仅凭这份样品,这家公司就在没有半个产品、半毛钱收入的情况下,拥有近500亿美元市值,但后来这家公司长期未公布车规级关键数据,样品越做越差,市值较最高点蒸发了95%。

QuantumScape,就是死于工程化难题。

一家公司从画PPT到真正实现量产,中间还有个实验室阶段,公司需要披露阶段性样品,不然资本故事就讲不下去了,公司也拿不到融资了。

以美国在基础科研方面的优势,搞出一个完美的实验室样品,并不太难,难就难在,实验室样品不需要考虑成本,但商业化量产必须兼顾性能、成本、供应链等种种因素。

制造业也好,大模型也好,手搓生产的逻辑,都无法照搬到工业化生产上,而无法工业化生产,你就无法跑通盈利逻辑。

在很多人的理解中,训练一个模型,就和普通软件一样,一些工程师在后台写代码或者喂数据,产品上线后,付费用户越多,赚得越多。

但现实截然相反,AI大模型之所以烧钱,不仅是因为训练成本高昂,而是推理成本也极其高昂。即便你训练好了,日后每多一个用户,你还是要多付一笔算力钱。

这个过程比单纯的制造业更复杂,因为工厂可以通过规模化生产+市场扩张,摊薄固定资产的成本,但大模型呢?用户的推理需求越多,后台调用的Token也越多,最后你反而可能因为用户太爱用你而亏钱。

正因如此,软件的毛利率很容易达到70%以上,但AI应用的毛利率却在20%-50%之间上蹿下跳,背后原因就是Token成本不可控。

大模型的成本和性能,主要由三个因素决定:算力,数据,算法。任何大模型,都需要在三者之间找平衡,否则,你产品再华丽,也只会越卖越亏,你将烧钱烧到死。

这就好比,你请米其林大厨,用每斤1000块的和牛,配200块一袋的日本米,在希尔顿酒店的厨房里折腾半天,结果是去路边卖10块一份的米其林和牛炒饭。

听起来很抽象是吧?但这就是Sora干的事。

根据福布斯新闻,业内人士估算Sora每年至少烧掉50亿美元(约350亿人民币)。那么Sora一共赚回多少钱呢?150万美元(约1000万人民币)。

如何看待这种烧钱现象呢?为了尽量保持中立,我们有请Deepseek来当裁判,仅输入“一家公司每年成本50亿美元、营收150万美元,是什么水平?”Deepseek是这样回答的:

Deepseek都惊了:大哥你是单位搞错了,还是在洗钱?!

我们再来看看中国公司的情况。

根据快手公布的财报,可灵去年的营收为10.4亿元人民币,全年研发开支为145亿元,其中超60%的研发投入用于AI,约87亿人民币,快手用OpenAI四分之一的成本,做出了盈利能力100倍于Sora的模型。而PixVerse方面称,其收入已能覆盖大部分支出。

那些说中国模型赔钱赚吆喝的,不如先聊聊Open AI的烂账。

中国公司能够花更少的钱,建立更好的模型,最重要的原因是算法创新。

从事AI算法落地研究的某高校控制和科学博士陈军(化名)说,Seedance们实现突围的核心因素正是算法。

陈军解释,算法不但影响Token成本,也影响大模型输出的最终效果,更好的算法,能用更少的算力,完成更复杂的任务,从而在某些关键性能上逼近甚至超过高级模型。“你可以简单理解为,Seedance的工程图纸比Sora的工程图纸更好。”

但说实话,Sora不是不想解决工程化问题,而是不能,臣妾做不到。

首先,Sora的使命从来就不是“活下去”,而是“炫技”,OpenAI才能继续融到钱。

OpenAI去年上半年亏135亿美元,一年至少亏掉200亿美元,但估值依然高达8520亿美元,超过世界上绝大多数国家的GDP,这种估值极其不正常。

原因很简单,美国的金融资本需要OpenAI维持这样的估值。

OpenAI背后的四大金主,是亚马逊、英伟达、软银、微软,其余股东是红杉、贝莱德、黑石等顶级私募,当然还有被绑在美国利益链上的中东土豪基金。

这只是第一层利益绑定。在这些科技巨头、顶级私募背后,还有美国各州政府的养老基金、大学基金。

微软是纽约州共同退休基金的第二大持仓股,英伟达是新泽西州公共退休基金的第一大持仓股,亚马逊是马里兰州退休系统的第五大持仓股,贝莱德、黑石、富达们,是美国政府养老基金、美国大学基金的资管方。

正是因为这种复杂的利益绑定,Sora就不能去拼命优化算法,因为优化算法,会减少英伟达芯片的消耗量,Sora烧越多芯片,它的股东英伟达才越开心。

同时,它也不能死掉,否则私募股权、投行、美国人的退休金、大学基金将一个一个爆雷。美国的金融资本会不停给它打鸡血,将它的估值推向更高,直到新的工具人出现,这些资本才会提前撤出,全世界在懵圈中被迫接盘。

Sora可以不盈利,但必须维持泡沫,才能支撑OpenAI的估值、微软的云合同、英伟达的芯片订单、美国人的养老金、大学基金的投资收益。

当商业逻辑被证伪时,就赶紧吹下一个泡泡,只要吹得够快,打脸就追不上我。

现在OpenAI说,以后不搞多模态模型了,我要造机器人。造机器人,请问你的工程师呢?你的供应链呢?你用来训练模型的行业数据呢?

OpenAI嘿嘿一笑:不就是再搓一个实验室样品么,这不手拿把掐?

或许不久后,我们将看到媒体又开始大呼小叫,说OpenAI研发了屌炸天的机器人,中美机器人比赛又结束了,宇树科技们完了,OpenAI估值突破万亿美元。

可是这种把戏,美国还能玩多久?

被金融资本浸泡的土壤看似“宽容”,但这种宽容的代价是,企业长期泡在温水煮青蛙的舒适圈中,逐渐丧失斗争意志和生存能力。

麻省理工2025年的一份报告指出,美国95%的生成式AI项目,都卡在试点阶段,走不到规模化生产。

美国的金融毒饲料,把自家的AI公司喂得像走不动道的肥猪,肥猪只会摇头晃脑地听金主使唤,但打死不参与市场竞争。它们一旦走进真实的市场丛林,就会原形毕露,被长着獠牙的中国AI公司撕得粉碎。

而中国的AI产业,则走向另一条截然不同的道路。

燕子(化名)是一名广东的AI漫剧编剧,管理着国内一个影响较大的AI影视群。

2024年,燕子成为一位网络小说推书视频制作者。燕子回忆,“有一段时间,推书视频的生意非常好做,我加入的时候,国内已经形成一套非常成熟的赚钱模式。”

燕子说,据她了解,AI短剧和AI漫剧都缘起于同一个根,就是网络小说的推书视频。

几年前,小说网站会同平台合作,提供推广链接,然后请燕子这样的创作者制作成推书视频,视频下面挂链接并发布到相关账号上,根据转化率和拉新量来赚钱。燕子跟着一个中间商做了一年多,在一个接单群里抢单,片子过审后就可以收到钱。

也就是说,可灵们并不是脑子一热就去追赶Sora的,在它们诞生之前,中国已经有了堪称繁荣的图文生成产业链,这为AI视频生成提供了一定的产业迁移基础和消费场景。

燕子回忆,推书视频是较简单的漫画PPT+声音解说+动画效果,“当时有家企业找到我,自称有阅文、喜马拉雅的IP资源,它打算在油管做海外推书账号,说是非常赚钱。但没过多久,这个项目就停了,因为AI漫剧爆发了,推书视频被迅速淘汰。”

燕子说原先做推书视频的创作者,纷纷转型去做AI漫剧,她原本用来做PPT视频的APP“巨日禄”也迅速转型为AI漫剧软件,这种剧烈的变化就发生在短短一年间。

过去半年,AI漫剧和短剧密集上线,第三方机构的统计数据显示,2025年全国微短剧市场规模预计接近680亿元,其中AI短剧占比接近1/3,可见发展之迅猛。

最焦虑的是广告公司,燕子说她群里有个老板,在广东开了一家广告公司,AI视频出现后,他天天焦虑得不行,说不学AI视频必死无疑,天天让手下的人学用AI。

字节们的赚钱模式不复杂,AI短剧公司用Seedance、可灵生成视频,卖给抖音、Tiktok、红果短剧、快手等平台,平台日活上去了,字节们左手卖Token,右手卖广告,养家糊口问题不大。

中国AI公司比美国AI公司“持家”,表层原因是资本不够“宽容”,分分钟问你要盈利数据,底层原因是中国的国家意志和金融体制安排不允许这么搞。

炒股来钱那么容易,谁还有心思苦哈哈地做实业?

没有强大的实业,就养不起基础工业,养不活基础工业,就造不出飞机导弹,没有飞机导弹,就保护不了中国的海外经济利益。

A股对公司盈利有硬性要求,科创板虽然放宽了对盈利条件的要求,但对科技属性有严格审查。

A股情绪过热,国家队会立刻把炒作苗头给摁下去。

中国没有孕育神话的土壤,没有资本的过度泡沫化,中国公司的账面资产也不如美国公司。

截至2026年4月1日,字节跳动估值约5500亿美元,阿里估值约3878亿美元,腾讯估值约6400亿美元,Meta估值1.5万亿美元,谷歌(Alphabet)超3万亿美元,只看纸面数据,字节+阿里+腾讯才等于一个META。

我们不但烧不起那个钱,也没有那么多先进芯片可烧。

很多人听到这里,估计又要绝望了,其实大可不必。

正是因为缺钱少芯,我们的AI产业,从一开始就知道自己必须在极端残酷的环境下活下去,长出极强的生存能力,长出锋利的獠牙。

就像PixVerse在挣扎求生的过程中,掌握了从海量数据中筛选出一小部分高质量数据,来训练优秀模型的能力,最终把训练成本打到大厂的十分之一甚至更低(此为PixVerse创始人团队披露)。

但中国AI的优势,绝不仅仅是会省钱,更会长出自己的核心竞争力。

在很多人的想象中,未来是美国掌握最先进的AI底层技术,中国只能赚下游应用端的钱,产生这种误解的根源,来自于两个假设:

第一,人工智能是在实验室里,由一群科学家和IT工程师捯饬出来的。第二,美国钱多,可以在科研上烧更多钱。

第二个假设一定程度上是事实,但第一个假设却完全错误。

人工智能的未来,并不取决于极少数科学技术精英。

就拿大模型的三大技术要素来说,很多人只知道算力重要,才会对我们缺乏先进芯片哭哭啼啼,但根据我对AI技术人员的访谈,大家也许过度高估了芯片的作用,严重低估了数据和算法的重要性。

先说中国的第一个突破口,算法。

上文提到,Seedance们的突围主要是靠算法创新,这也是我们面对算力封锁,实现AI突围最现实、最有效的路径。

现在来看,芯片仍然是成本大头。

最近,沐曦股份在行业交流会上的一份数据疑似流出,该数据显示,一个1GW的数据中心的成本,GPU成本占了45%,接近一半。

网络流传的数据中心成本拆解图

但这种情况不会一直持续下去,因为严酷的竞争环境,将倒逼中国公司绕开美国芯片生态,在算法和国产专用芯片上发力,开发出用更少算力完成更多任务的能力,最终把堆砌算力的旧生产方式,扫进历史的垃圾桶。

中国疯狂卷算法,一是外部封锁所迫,二是我们内部没有历史包袱,不会像OpenAI那样被强行绑架在芯片巨头的利益链上,可以轻装上阵。

美国想通过芯片封锁,扼杀中国AI的未来,只会得到一个结果:

中国AI公司在不需要美国芯片的前提下,用压倒性的成本优势,做出和美国AI性能匹敌的产品。

黄仁勋就是看到了这个终局,才会不断游说美国政府,向中国倾销算力鸦片,无非是中国政府非常清醒,根本不接招。

中国实现算法突围的底气,来自于我们的本土数学人才储备,因为算法本质上就是拼数学能力。

美国之所以是数学强国,是因为它凭借极高的工资待遇,从全球吸走了大量数学人才,尤其是顶级数学家。

但是,这种优势正在动摇。

仅靠顶级数学家,远不足以撑起一国的尖端工业。没有数量庞大的中高级数学人才做支撑,再伟大的理论,也只能停留在论文里。

中国顶级数学家数量虽然不如美国多,但却是全球数学人才的“源头工厂”,而美国本土的数学能力,正在经历严重倒退。

2022年,中国授予的S&E(科学与工程)博士学位数量约5.34万,首次超过美国的4.47万,而且这4.47万S&E博士中,超过一半是“进口人才”,这些进口人才,又大部分来自印度、中国、墨西哥。

2023年TIMSS评估中,美国八年级学生的数学成绩在18个发达经济体中排名后三分之一,较2019年平均分下降27分,中国的上海、江苏、浙江等地常年位居全球前列。

过去,美国能够轻易地从别国抢走数学人才,在于其国力和财力的强大,但特朗普上台后的各种操作,让全世界都看到了美国的虚弱,更不要说特朗普粗暴的留学和移民政策,让原本打算把孩子送到美国的各国中产家庭瑟瑟发抖。

美国的临时签证持有者中,40%是获得S&E硕士/博士的人才,有的人签证刚好过期滞留,就成了非法移民。

去年美国派出军机,把大量签证过期的印度STEM人才,跟押犯人一样押回印度,这种翻脸不认人的做法,极大地消耗了美国的国家信任资本,即便日后民主党上台修复,但谁知道四年后美国人又选出什么样的总统呢?谁还敢轻易润到美国?

在美国随时会撕破脸的情况下,中国能够稳定产出本土数学人才,是赢得AI竞争的关键。

我们的第二个突破口,甚至可以说是未来的王炸牌,是数据。

咱们卷算法,美国就不会卷算法么?能,但卷法有限,因为算法也不是在实验室里凭空变出来的。

任正非说过一句话,“从根本上说,算法不掌握在IT人手里面,而是掌握在电力专家、基建专家、煤炭专家、医药专家、各类行业专家……手里面。”

这话是啥意思呢?

芯片是锅,算法是一种加工烹饪方法,数据才是被加工的原材料。没有数据,就不可能产生相关算法,更不要说训练模型,一句话,首先你得有数据。

什么是数据?数据就是人类的知识,储量非常非常庞大,现在大模型用来训练的数据,只是人类知识库的冰山一角。

某头部公司AI算法工程师阿诚(化名),曾负责人脸识别模型训练。他举例说:“在大模型出现之前,人类早已训练过各种模型,比如人脸识别技术,就是一种模型。”

阿诚回忆,当年他训练人脸识别模型的第一步,就是采集数据,大致过程为,先在全球召集志愿者,然后给大家拍照,采集数亿张人脸照片,接着将这些数据“喂”给计算机,计算机才具备了识别人脸的能力。

阿诚说,语言模型公司搜集数据的主要方法,是通过网页爬虫,爬遍所有网页,这些数据容易获得,且有规范的格式,取得难度较低。

想要获得更优质的数据,你还要去线下搜集,比如Anthropic当年训练Claude时,曾扫遍美国市场的全部二手书,一页一页地录入数据。

越是优秀的模型,越是需要大量优质的数据,否则喂出来的模型就是人工智障。

阿诚说美国的量化基金,本质上也是一种模型,它们的算法之所以强,前提就是美国拥有全世界最丰富、质量最好的金融数据。

同样的道理,字节和快手能训练出优秀的视频模型,是因为抖音、Tiktok、快手本身就是视频平台,视频数据量大管饱且极其获得。

Sora被美国影视行业抵制后不久,视频质量就发生了严重下滑,一个重要原因就是失去了优质影视数据,它想获得短视频数据,得找扎克伯格、马斯克重金购买。

更关键的是,人类有大量重要珍贵的知识,至今未被明确记录,或记录的形式、承载的介质是散乱无章的,这种知识的典型代表就是工程经验。

打个比方,中国电网是全球唯一一个同时运行特高压交流、直流、多端直流的超大规模电网,覆盖国土面积、接入的新能源装机量都是全球第一。

调度这种系统,需要处理海量的不确定性情况,以及风电、光伏、水电、火电之间的协同问题。中国电网的调度员因此积累了世界上最丰富的大电网协同经验,这些经验,不是一两个人的经验,而是几代调度员经验的数据集。

美国的制造业,除高端军工、半导体、医疗设备、生物制药等部分核心环节外,几乎都死绝了,也就不可能产生这样庞大丰富的工程数据集。

你可能会说,美国不需要这些数据,只保留研发和设计数据就行,这也是今天中文互联网上最流行的理论,说什么美国擅长从0到1,中国擅长从1到100。

不是的朋友,20世纪中叶的美国不是这个样子的,那时美国有完整的工业体系、庞大的产业工人、愿意投十年二十年的长期资本,它既能从0到1,更能从1到100。

一国产业升级的客观规律,就是不断从0到1到100的螺旋式上升,这种“只做从0到1就吃尽利润”的分工,是美国经济金融化之后强加给全世界的。

如果研发离生产太远,中间会形成无数的数据黑箱,研发也会失去土壤,实验室人员不去产线上跑一跑,就永远不知道某个零件降本10%良率会掉多少这种问题,最终只能做出华丽但不实用的“样品”。

所以不是美国“擅长”做0-1,是它现在的产业土壤已经退化到只能做0-1。

现在的AI竞争,还在过家家阶段,你爬爬我的网页,我爬爬你的文库。GPT-4已经用完了互联网上几乎所有高质量的英文语料,但开源数据爬完之后呢?

农业、基建、工业、商业、军事等高壁垒、高价值的闭源数据,都不是IT人员写几个爬虫软件就能爬到的,AI竞赛进入下半场后,美国在工程经验上的短板将更加原形毕露。

就拿具身智能来说,美国到后面可能连设计都不知道怎么设计。

阿诚告诉我,这是因为人才迁移有客观规律,人形机器人的核心技术骨干,主要就来自工业机器人领域。

工业机器人,或者说机械臂,与人形机器人在运动控制、轨迹规划、力控、伺服驱动、仿真环境等技术模块上高度重叠,工业场景中的3D视觉、目标检测、抓取位姿估计等能力,也为人形机器人的环境交互提供了宝贵的基础数据。

那么工业机器人最发达的国家是哪个国家呢?中国。

根据国际机器人联合会(IFR)发布的《2025世界机器人报告》,2024年全球工业机器人安装量达54.2万台,其中亚洲占全球新部署量的74%,欧洲占16%,美洲占9%,中国占全球部署量的一半以上,美国虽然位列第三,但部署量还不到中国的12%。

工业机器人产业为中国培养了大量的运动控制算法工程师、伺服驱动工程师、机器人系统集成工程师、仿真工程师……这些技术和人才积累到一定程度,才能低成本地、自然地迁移到具身智能领域。

你现在跑去问美国的蓝领,他们手上那点工程数据,可能还没他们手机里“怎么安全嗑药”的群聊记录丰富,真要是搞个“嗑药AI大模型”,美国绝对是全球领先,数据又多又真实。

美国也有自己擅长的数据领域,比如上文提到的金融。我如果是美国公司,我就做个TACO模型,通过分析特朗普的TACO数据和美股美债变动的规律,预测K线走势,包赚钱的。

总之,AI竞争越向深水区,数据争夺战就会越激烈,最后是国家对国家,联盟对联盟,间谍对间谍,甚至是真理对真理的争夺。

中国赢得数据战争的根本信心,在于人心向背。

数据的最终载体,是一个个具体的人。

中国AI视频模型的背后,是成千上万的短视频内容创作者;中国工业机器人模型的背后,是无数的流水线工程师;中国AI崛起的背后,是14亿为生存和发展不断奋斗的中国人。

人民群众创造了最伟大的数据,数据以AI的形式回馈给人民群众,这才是中国AI应该走向的未来。

当中国通过算力突破、算法创新、数据沉淀,将Token成本打到白菜价时,AI才会迎来真正的应用级大爆发,中国将诞生一大批基建、电力、农业、工业模型和智能体,推动人类生产力的大解放。

中国将用自己的道路证明,AI不是少数精英用来谋利的玩具,而是人类驶向星辰大海的巨轮。