观星小仙：美国AI造神，中国AI灭神

4月6日，一则“中国AI大模型调用量连续五周超美国”的消息在中文互联网疯传。

每日经济新闻报道，根据OpenRouter最新数据，今年2月中国AI大模型Token调用量首次超过美国后，已经连续五周领先，而且双方差距越来越大，1月初美国的Token调用量还是中国的3.6倍，现在变成中国Token调用量是美国的4.2倍了。

啥是Token呢？Token是大模型的最小信息单元，国内将Token译为词元，咱普通人就记一个结论，Token调用量越高，代表模型被用得越多。

中国网友还没来得及开心，就有人“辟谣”，说OpenRouter数据不完整，《联合早报》还酸溜溜地说“Token调用量不反映创新能力”。

奇怪，跪舔美国大模型的时候Token调用量还是核心依据，怎么中国反超就变得不重要了？第一名需要不断“说服”别人相信自己是第一名，这件事本身不就很可疑？

客观来说，OpenRouter的统计数据来自自身转发的API请求日志，不包括厂商直调、C端App、私有化部署等场景数据，确实有一定局限性，但数据本身是真实的，它反映了中国AI大模型暴涨的客观趋势。

即便采用摩根大通的最新估算，全球周均Token调用量2400-2600万亿，中国占比40%-45%，美国占比30%-35%，仍然是中国领先。

实际上，在过去的两年里，中美AI大模型已经在视频生成领域，发生过一场腥风血雨的交锋，并且在这个过程中，“永远领先一代”的美国AI大模型已经开始掉队。

这次交锋的源头，还得从清华大学2022年的一篇论文说起。

一

2022年9月，清华大学的研究团队发表了一篇题为《All Are Worth Words: A ViT Backbone for Diffusion Models》论文，首次把扩散模型的卷积U-Net换成Transformer。

就是这个新脑洞，一下子打通了AI视频生成的任督二脉。

在此之前，人类对计算机生成视觉图像的探索，已走过了半个多世纪，产生了Transformer、扩散模型等技术路线。

那个叫Transformer的哥们，是一个逻辑性很强但手很笨的编剧，它能写出完美的剧本，但当它打算把这个剧本变成视频时，只能生成一张张图片再强行拼起来，所以画面会卡顿。

那个叫扩散模型的哥们，是一个脑子不大好但手很巧的画师，它能画出一只栩栩如生的卢胖子，但如果你下的指令是卢胖子吃蛋烘糕，它可能画出来的蛋烘糕长在卢胖子的肚子上，甚至直接把卢胖子变成蛋烘糕。

过去，这两位哥们一直是各玩各的，井水不犯河水，直到清华大学的理论创新，将它俩撮合到了一起。就在三个月后，Facebook的研发团队也发布了一篇论文，和清华大学的点子如出一辙。

中美两国不但几乎同时实现理论突破，也同时开始推动应用突破。

2023年4月，字节跳动的AI技术老将王长虎，在北京创立了爱诗科技，打算进军AI视频生成赛道。

王长虎是纯技术出身，博士毕业于中国科学技术大学，主要研究方向正是计算机视觉。

博士毕业后，王长虎先是在微软当研究员，后跳槽到字节跳动任AI Lab总监，完整参与了抖音和TikTok从0到1的建设，2021年从字节离职后，开始折腾自己的事业。

王长虎的野心，是面向全球C端用户做出一款较为先进，又能让大家用得起的AI视频生成软件，这款软件就叫PixVerse。

但是对中国公司来说，做AI视频生成实在过于超前。

因为AI视频生成所需的模型技术，和ChatGPT这种语言模型完全不是一码事。

语言模型的局限性，在于它会忽略掉真实世界的大部分信息，比如当我们输入“卢胖子狂炫工作室的小饼干”这行字时，文本模型“看不到”卢胖子的表情、饼干的质感、工作室的光照等等。

如果换成多模态模型来干这事儿，效果就完全不一样，它会“看到”卢胖子嚼第一口时瞪大的眼睛，饼干碎屑掉在衣服上的轨迹，还能听到嘎嘣脆的嚼饼干声，甚至助理小姐姐那声“差不多得了”的叹气。

虽然听起来很爽，但多模态大模型比以烧钱著称的语言模型，还要烧钱十倍不止。

王长虎拉融资的时候，投资人一个个把头摆成了拨浪鼓，咱们连ChatGPT都还没赶上，怎么敢做多模态的？这种烧钱又不产生生产力的事情，让美国去做就行，我们中国人还是老老实实做应用端。

当时金沙江创投合伙人朱啸虎就直接给王长虎浇了一盆冷水，说你们还是回去上班吧，这个事情可能在中国没有什么机会。

王长虎不死心，一定要在多模态上杀出一条血路。

因为融不到太多钱，PixVerse不得不在缺钱少芯的情况下，勒紧裤腰带研发。可能是为了避开和字节正面竞争，PixVerse早期主要是发展海外市场。

2024年初，PixVerse开发至第二代架构时，突然杀出来一个BUG级选手，Sora。

Sora是OpenAI的多模态大模型，如果按时间倒推，Sora和PixVerse可能是在差不多同一时间立项，只是OpenAI此前并未公布任何消息。

2024年2月，Sora发布了一段预览片，片中的流体、光影、人物表情和动作极其逼真，被业界公认为是多模态大模型的顶级水准。

昂撒精神领袖欣喜若狂，宣布中国公司已彻底输掉AI竞赛，你看！人家美国还是碾压我们！好像美国碾压我们，能给他们涨工资似的。

当时国内财经媒体最喜欢写的一句话是：中美的差距不但没缩小，反而越来越大。

有个专家接受媒体采访时说：Sora发布后国内没有跟进，因为我们跟进不了，我们没有人才储备，没有架构准备，未来两三年都没法拿出像样的产品……

社交平台流传一张梗图，巨大的Sora神像跟话事人一样坐在王座上，下面跪着Runway、Pika、SVD、PixVerse等软件，“跪”在第一排的PixVerse，还是唯一一家中国公司。

王长虎看到这张图时，心情十分复杂。他有些遗憾，更有些不服气，甚至有些质疑。

当时媒体采访他时，他说：“如果我们过去一年有更多的投资和算力资源，有可能最先做出Sora的不是美国人，有可能是我们。”

王长虎还委婉地表示，他很想知道，Sora的正式版本到底好到什么程度。但是Sora有OpenAI背书，所以他宁愿相信Sora是真的这么强，并打算在3-6个月之内追平Sora。

除了PixVerse，阿里、字节跳动、快手、Minimax等一众中国公司，在短短数月内推出AI视频生成工具，引爆了多模态模型混战。

为了追赶Sora，中国公司在紧迫而逼仄的氛围中卷生卷死。

早在2024年底，可灵就能生成接近2分钟的视频，并且在人体骨骼一致性、物理拟真等方面超越了Sora。

虽然中国公司干得热火朝天，但当时专家和大V的普遍情绪，就是别自取其辱了，快投降吧，追平？能追平吗？你以为Sora会站在原地等你？

呃，事实证明会，甚至……还倒退了好几步。

被传得神乎其神的Sora，整整一年半都没拿出成品，直到2025年9月才迟迟上线。

爱诗科技联合创始人谢旭璋看到成品后，淡淡地评价，这和预览片差距非常大，“前后差了十个PixVerse”。

有种网恋奔现大型翻车现场的感觉，有种遇到了诈骗犯只想报警的感觉！

国内媒体发文称，用户吐槽Sora如同人工智障，但狂热的Sora信徒淹没了评论区，清一色都在讽刺“愚蠢的人不去追赶，却在别人的成果里挑小毛病”。

你质疑的对象可是OpenAI啊，How dare you？

结果Sora又辜负了它的信徒。2026年3月26日，Open AI宣布将正式关停Sora。

这个“只有一点小毛病”的Sora，以一周留存率2%，月留存跌破1%，75%用户生成一次后永久卸载的负分战绩，只活了半年，就彻底退出AI视频生成赛道。

Sora溃不成军时，中国AI视频军团正以惊人的速度狂飙。

全球AI视频生成赛道，现在几乎被字节跳动即梦（Seedance2.0）、快手可灵和爱诗科技PixVerse等几家中国公司瓜分，其中PixVerse的全球用户规模突破1亿，可灵用户突破6000万，今年2月Seedance2.0出圈后，下游应用一夜爆发，中国AI模型拉爆了Token调用量。

Sora被中国AI视频军团击溃的原因很简单，死贵还不好用。

一位影视动画行业技术人员告诉我，AI视频还没出现时，团队是用一款叫Midjourney的国外软件来生成图片，现在都换成了可灵和即梦，“Sora用来玩玩还行，但抽卡太贵了”。

所谓抽卡，就是当前的视频生成技术，都很难一次生成目标效果，得像抽卡一样多抽几次，运气好几块钱搞定一个视频，运气差要几十上百块，如果制作需求量大，就得开会员才比较划算。

但Sora的定价，比国内软件高太多了。

Sora最高版本折合人民币每月约1400元、最低版本约每月140元，即梦最高版本每月499元、最低版本每月69元，可灵最高版本每月1314元、最低版本每月58元。

我问过几位从业者，可灵最高版本也挺贵的，为什么用户那么多？

他们回答，可灵偏B端，在画质清晰度上优势明显，能制作高质量商业片，即梦偏C端，适合生产对画质要求不那么高的AI漫剧，二者的定位非常清晰，就是Sora，找不出任何长板，一副不知道自己要干嘛的样子。

这种完败，对于Open AI来说是奇耻大辱——你可以死于便宜但难用，也可以死于好用但太贵，但你居然死于又贵又难用！

而且真正的问题在于，当房间里出现一只蟑螂，就不可能只有一只蟑螂。

在Sora神话崩塌的前一年，F119发动机也发生了类似的翻车“事故”。

2025年2月，马斯克应特朗普指示，去查美国国防部的账，随后公布了一份震惊世界的资料，显示美国五代机F22使用的F119发动机疑似数据造假。

这份资料显示，F119的推重比并不是此前宣称的10.5，而是7，整整缩水了50%。F135发动机更夸张，宣称的推重比是11.47，实际推重比只有6.7，缩水了71.2%！

对中国航空人来说，F119也曾是BUG般的存在。

中国从1997年就开始苦苦追赶F119，花了近30年，才将涡扇发动机的推重比从3.82提高到10。

曾有中国技术人员曾指出F119的数据不对劲，还有人指出美国没有把散热器之类的器件重量计算在内，但我们一是没有铁证，二是我们认为，即便美国虚标数据，也不是我们故步自封的借口，美国指不定藏着掖着什么吊炸天的技术，咱们要料敌从宽，当成真的来追赶。

马厂公曝出真实数据时，中国看着手中的涡扇发动机陷入了沉思：那我造的是个啥玩意儿？

F119和Sora的翻车绝非偶然，它揭示了中美科技竞争的本质区别。那么，美国造神、中国灭神的规律，是否将在未来中美AI竞争中再次应验？

二

首先，我们需要回答一个问题，不缺钱、不缺芯片、不缺技术人才的Sora，为啥把一手好牌打稀烂？

Open AI作为一家全球知名的公司，故意吹牛打自己脸的可能性不大，实际上，Sora死在它无法解决工程化难题。

什么叫工程化难题呢？

我们在《固态电池全球大战》中，写过一家叫QuantumScape的美国初创公司，这家公司2020年发布了一份震惊全球的测试数据，说它研发的固态电池性能逆天，仅凭这份样品，这家公司就在没有半个产品、半毛钱收入的情况下，拥有近500亿美元市值，但后来这家公司长期未公布车规级关键数据，样品越做越差，市值较最高点蒸发了95%。

QuantumScape，就是死于工程化难题。

一家公司从画PPT到真正实现量产，中间还有个实验室阶段，公司需要披露阶段性样品，不然资本故事就讲不下去了，公司也拿不到融资了。

以美国在基础科研方面的优势，搞出一个完美的实验室样品，并不太难，难就难在，实验室样品不需要考虑成本，但商业化量产必须兼顾性能、成本、供应链等种种因素。

制造业也好，大模型也好，手搓生产的逻辑，都无法照搬到工业化生产上，而无法工业化生产，你就无法跑通盈利逻辑。

在很多人的理解中，训练一个模型，就和普通软件一样，一些工程师在后台写代码或者喂数据，产品上线后，付费用户越多，赚得越多。

但现实截然相反，AI大模型之所以烧钱，不仅是因为训练成本高昂，而是推理成本也极其高昂。即便你训练好了，日后每多一个用户，你还是要多付一笔算力钱。

这个过程比单纯的制造业更复杂，因为工厂可以通过规模化生产+市场扩张，摊薄固定资产的成本，但大模型呢？用户的推理需求越多，后台调用的Token也越多，最后你反而可能因为用户太爱用你而亏钱。

正因如此，软件的毛利率很容易达到70%以上，但AI应用的毛利率却在20%-50%之间上蹿下跳，背后原因就是Token成本不可控。

大模型的成本和性能，主要由三个因素决定：算力，数据，算法。任何大模型，都需要在三者之间找平衡，否则，你产品再华丽，也只会越卖越亏，你将烧钱烧到死。

这就好比，你请米其林大厨，用每斤1000块的和牛，配200块一袋的日本米，在希尔顿酒店的厨房里折腾半天，结果是去路边卖10块一份的米其林和牛炒饭。

听起来很抽象是吧？但这就是Sora干的事。

根据福布斯新闻，业内人士估算Sora每年至少烧掉50亿美元（约350亿人民币）。那么Sora一共赚回多少钱呢？150万美元（约1000万人民币）。

如何看待这种烧钱现象呢？为了尽量保持中立，我们有请Deepseek来当裁判，仅输入“一家公司每年成本50亿美元、营收150万美元，是什么水平？”Deepseek是这样回答的：

Deepseek都惊了：大哥你是单位搞错了，还是在洗钱？！

我们再来看看中国公司的情况。

根据快手公布的财报，可灵去年的营收为10.4亿元人民币，全年研发开支为145亿元，其中超60%的研发投入用于AI，约87亿人民币，快手用OpenAI四分之一的成本，做出了盈利能力100倍于Sora的模型。而PixVerse方面称，其收入已能覆盖大部分支出。

那些说中国模型赔钱赚吆喝的，不如先聊聊Open AI的烂账。

中国公司能够花更少的钱，建立更好的模型，最重要的原因是算法创新。

从事AI算法落地研究的某高校控制和科学博士陈军（化名）说，Seedance们实现突围的核心因素正是算法。

陈军解释，算法不但影响Token成本，也影响大模型输出的最终效果，更好的算法，能用更少的算力，完成更复杂的任务，从而在某些关键性能上逼近甚至超过高级模型。“你可以简单理解为，Seedance的工程图纸比Sora的工程图纸更好。”

但说实话，Sora不是不想解决工程化问题，而是不能，臣妾做不到。

首先，Sora的使命从来就不是“活下去”，而是“炫技”，OpenAI才能继续融到钱。

OpenAI去年上半年亏135亿美元，一年至少亏掉200亿美元，但估值依然高达8520亿美元，超过世界上绝大多数国家的GDP，这种估值极其不正常。

原因很简单，美国的金融资本需要OpenAI维持这样的估值。

OpenAI背后的四大金主，是亚马逊、英伟达、软银、微软，其余股东是红杉、贝莱德、黑石等顶级私募，当然还有被绑在美国利益链上的中东土豪基金。

这只是第一层利益绑定。在这些科技巨头、顶级私募背后，还有美国各州政府的养老基金、大学基金。

微软是纽约州共同退休基金的第二大持仓股，英伟达是新泽西州公共退休基金的第一大持仓股，亚马逊是马里兰州退休系统的第五大持仓股，贝莱德、黑石、富达们，是美国政府养老基金、美国大学基金的资管方。

正是因为这种复杂的利益绑定，Sora就不能去拼命优化算法，因为优化算法，会减少英伟达芯片的消耗量，Sora烧越多芯片，它的股东英伟达才越开心。

同时，它也不能死掉，否则私募股权、投行、美国人的退休金、大学基金将一个一个爆雷。美国的金融资本会不停给它打鸡血，将它的估值推向更高，直到新的工具人出现，这些资本才会提前撤出，全世界在懵圈中被迫接盘。

Sora可以不盈利，但必须维持泡沫，才能支撑OpenAI的估值、微软的云合同、英伟达的芯片订单、美国人的养老金、大学基金的投资收益。

当商业逻辑被证伪时，就赶紧吹下一个泡泡，只要吹得够快，打脸就追不上我。

现在OpenAI说，以后不搞多模态模型了，我要造机器人。造机器人，请问你的工程师呢？你的供应链呢？你用来训练模型的行业数据呢？

OpenAI嘿嘿一笑：不就是再搓一个实验室样品么，这不手拿把掐？

或许不久后，我们将看到媒体又开始大呼小叫，说OpenAI研发了屌炸天的机器人，中美机器人比赛又结束了，宇树科技们完了，OpenAI估值突破万亿美元。

可是这种把戏，美国还能玩多久？

被金融资本浸泡的土壤看似“宽容”，但这种宽容的代价是，企业长期泡在温水煮青蛙的舒适圈中，逐渐丧失斗争意志和生存能力。

麻省理工2025年的一份报告指出，美国95%的生成式AI项目，都卡在试点阶段，走不到规模化生产。

美国的金融毒饲料，把自家的AI公司喂得像走不动道的肥猪，肥猪只会摇头晃脑地听金主使唤，但打死不参与市场竞争。它们一旦走进真实的市场丛林，就会原形毕露，被长着獠牙的中国AI公司撕得粉碎。

而中国的AI产业，则走向另一条截然不同的道路。

三

燕子（化名）是一名广东的AI漫剧编剧，管理着国内一个影响较大的AI影视群。

2024年，燕子成为一位网络小说推书视频制作者。燕子回忆，“有一段时间，推书视频的生意非常好做，我加入的时候，国内已经形成一套非常成熟的赚钱模式。”

燕子说，据她了解，AI短剧和AI漫剧都缘起于同一个根，就是网络小说的推书视频。

几年前，小说网站会同平台合作，提供推广链接，然后请燕子这样的创作者制作成推书视频，视频下面挂链接并发布到相关账号上，根据转化率和拉新量来赚钱。燕子跟着一个中间商做了一年多，在一个接单群里抢单，片子过审后就可以收到钱。

也就是说，可灵们并不是脑子一热就去追赶Sora的，在它们诞生之前，中国已经有了堪称繁荣的图文生成产业链，这为AI视频生成提供了一定的产业迁移基础和消费场景。

燕子回忆，推书视频是较简单的漫画PPT+声音解说+动画效果，“当时有家企业找到我，自称有阅文、喜马拉雅的IP资源，它打算在油管做海外推书账号，说是非常赚钱。但没过多久，这个项目就停了，因为AI漫剧爆发了，推书视频被迅速淘汰。”

燕子说原先做推书视频的创作者，纷纷转型去做AI漫剧，她原本用来做PPT视频的APP“巨日禄”也迅速转型为AI漫剧软件，这种剧烈的变化就发生在短短一年间。

过去半年，AI漫剧和短剧密集上线，第三方机构的统计数据显示，2025年全国微短剧市场规模预计接近680亿元，其中AI短剧占比接近1/3，可见发展之迅猛。

最焦虑的是广告公司，燕子说她群里有个老板，在广东开了一家广告公司，AI视频出现后，他天天焦虑得不行，说不学AI视频必死无疑，天天让手下的人学用AI。

字节们的赚钱模式不复杂，AI短剧公司用Seedance、可灵生成视频，卖给抖音、Tiktok、红果短剧、快手等平台，平台日活上去了，字节们左手卖Token，右手卖广告，养家糊口问题不大。

中国AI公司比美国AI公司“持家”，表层原因是资本不够“宽容”，分分钟问你要盈利数据，底层原因是中国的国家意志和金融体制安排不允许这么搞。

炒股来钱那么容易，谁还有心思苦哈哈地做实业？

没有强大的实业，就养不起基础工业，养不活基础工业，就造不出飞机导弹，没有飞机导弹，就保护不了中国的海外经济利益。

A股对公司盈利有硬性要求，科创板虽然放宽了对盈利条件的要求，但对科技属性有严格审查。

A股情绪过热，国家队会立刻把炒作苗头给摁下去。

中国没有孕育神话的土壤，没有资本的过度泡沫化，中国公司的账面资产也不如美国公司。

截至2026年4月1日，字节跳动估值约5500亿美元，阿里估值约3878亿美元，腾讯估值约6400亿美元，Meta估值1.5万亿美元，谷歌（Alphabet）超3万亿美元，只看纸面数据，字节+阿里+腾讯才等于一个META。

我们不但烧不起那个钱，也没有那么多先进芯片可烧。

很多人听到这里，估计又要绝望了，其实大可不必。

正是因为缺钱少芯，我们的AI产业，从一开始就知道自己必须在极端残酷的环境下活下去，长出极强的生存能力，长出锋利的獠牙。

就像PixVerse在挣扎求生的过程中，掌握了从海量数据中筛选出一小部分高质量数据，来训练优秀模型的能力，最终把训练成本打到大厂的十分之一甚至更低（此为PixVerse创始人团队披露）。

但中国AI的优势，绝不仅仅是会省钱，更会长出自己的核心竞争力。

在很多人的想象中，未来是美国掌握最先进的AI底层技术，中国只能赚下游应用端的钱，产生这种误解的根源，来自于两个假设：

第一，人工智能是在实验室里，由一群科学家和IT工程师捯饬出来的。第二，美国钱多，可以在科研上烧更多钱。

第二个假设一定程度上是事实，但第一个假设却完全错误。

人工智能的未来，并不取决于极少数科学技术精英。

就拿大模型的三大技术要素来说，很多人只知道算力重要，才会对我们缺乏先进芯片哭哭啼啼，但根据我对AI技术人员的访谈，大家也许过度高估了芯片的作用，严重低估了数据和算法的重要性。

先说中国的第一个突破口，算法。

上文提到，Seedance们的突围主要是靠算法创新，这也是我们面对算力封锁，实现AI突围最现实、最有效的路径。

现在来看，芯片仍然是成本大头。

最近，沐曦股份在行业交流会上的一份数据疑似流出，该数据显示，一个1GW的数据中心的成本，GPU成本占了45%，接近一半。

网络流传的数据中心成本拆解图

但这种情况不会一直持续下去，因为严酷的竞争环境，将倒逼中国公司绕开美国芯片生态，在算法和国产专用芯片上发力，开发出用更少算力完成更多任务的能力，最终把堆砌算力的旧生产方式，扫进历史的垃圾桶。

中国疯狂卷算法，一是外部封锁所迫，二是我们内部没有历史包袱，不会像OpenAI那样被强行绑架在芯片巨头的利益链上，可以轻装上阵。

美国想通过芯片封锁，扼杀中国AI的未来，只会得到一个结果：

中国AI公司在不需要美国芯片的前提下，用压倒性的成本优势，做出和美国AI性能匹敌的产品。

黄仁勋就是看到了这个终局，才会不断游说美国政府，向中国倾销算力鸦片，无非是中国政府非常清醒，根本不接招。

中国实现算法突围的底气，来自于我们的本土数学人才储备，因为算法本质上就是拼数学能力。

美国之所以是数学强国，是因为它凭借极高的工资待遇，从全球吸走了大量数学人才，尤其是顶级数学家。

但是，这种优势正在动摇。

仅靠顶级数学家，远不足以撑起一国的尖端工业。没有数量庞大的中高级数学人才做支撑，再伟大的理论，也只能停留在论文里。

中国顶级数学家数量虽然不如美国多，但却是全球数学人才的“源头工厂”，而美国本土的数学能力，正在经历严重倒退。

2022年，中国授予的S&E（科学与工程）博士学位数量约5.34万，首次超过美国的4.47万，而且这4.47万S&E博士中，超过一半是“进口人才”，这些进口人才，又大部分来自印度、中国、墨西哥。

2023年TIMSS评估中，美国八年级学生的数学成绩在18个发达经济体中排名后三分之一，较2019年平均分下降27分，中国的上海、江苏、浙江等地常年位居全球前列。

过去，美国能够轻易地从别国抢走数学人才，在于其国力和财力的强大，但特朗普上台后的各种操作，让全世界都看到了美国的虚弱，更不要说特朗普粗暴的留学和移民政策，让原本打算把孩子送到美国的各国中产家庭瑟瑟发抖。

美国的临时签证持有者中，40%是获得S&E硕士/博士的人才，有的人签证刚好过期滞留，就成了非法移民。

去年美国派出军机，把大量签证过期的印度STEM人才，跟押犯人一样押回印度，这种翻脸不认人的做法，极大地消耗了美国的国家信任资本，即便日后民主党上台修复，但谁知道四年后美国人又选出什么样的总统呢？谁还敢轻易润到美国？

在美国随时会撕破脸的情况下，中国能够稳定产出本土数学人才，是赢得AI竞争的关键。

我们的第二个突破口，甚至可以说是未来的王炸牌，是数据。

咱们卷算法，美国就不会卷算法么？能，但卷法有限，因为算法也不是在实验室里凭空变出来的。

任正非说过一句话，“从根本上说，算法不掌握在IT人手里面，而是掌握在电力专家、基建专家、煤炭专家、医药专家、各类行业专家……手里面。”

这话是啥意思呢？

芯片是锅，算法是一种加工烹饪方法，数据才是被加工的原材料。没有数据，就不可能产生相关算法，更不要说训练模型，一句话，首先你得有数据。

什么是数据？数据就是人类的知识，储量非常非常庞大，现在大模型用来训练的数据，只是人类知识库的冰山一角。

某头部公司AI算法工程师阿诚（化名），曾负责人脸识别模型训练。他举例说：“在大模型出现之前，人类早已训练过各种模型，比如人脸识别技术，就是一种模型。”

阿诚回忆，当年他训练人脸识别模型的第一步，就是采集数据，大致过程为，先在全球召集志愿者，然后给大家拍照，采集数亿张人脸照片，接着将这些数据“喂”给计算机，计算机才具备了识别人脸的能力。

阿诚说，语言模型公司搜集数据的主要方法，是通过网页爬虫，爬遍所有网页，这些数据容易获得，且有规范的格式，取得难度较低。

想要获得更优质的数据，你还要去线下搜集，比如Anthropic当年训练Claude时，曾扫遍美国市场的全部二手书，一页一页地录入数据。

越是优秀的模型，越是需要大量优质的数据，否则喂出来的模型就是人工智障。

阿诚说美国的量化基金，本质上也是一种模型，它们的算法之所以强，前提就是美国拥有全世界最丰富、质量最好的金融数据。

同样的道理，字节和快手能训练出优秀的视频模型，是因为抖音、Tiktok、快手本身就是视频平台，视频数据量大管饱且极其获得。

Sora被美国影视行业抵制后不久，视频质量就发生了严重下滑，一个重要原因就是失去了优质影视数据，它想获得短视频数据，得找扎克伯格、马斯克重金购买。

更关键的是，人类有大量重要珍贵的知识，至今未被明确记录，或记录的形式、承载的介质是散乱无章的，这种知识的典型代表就是工程经验。

打个比方，中国电网是全球唯一一个同时运行特高压交流、直流、多端直流的超大规模电网，覆盖国土面积、接入的新能源装机量都是全球第一。

调度这种系统，需要处理海量的不确定性情况，以及风电、光伏、水电、火电之间的协同问题。中国电网的调度员因此积累了世界上最丰富的大电网协同经验，这些经验，不是一两个人的经验，而是几代调度员经验的数据集。

美国的制造业，除高端军工、半导体、医疗设备、生物制药等部分核心环节外，几乎都死绝了，也就不可能产生这样庞大丰富的工程数据集。

你可能会说，美国不需要这些数据，只保留研发和设计数据就行，这也是今天中文互联网上最流行的理论，说什么美国擅长从0到1，中国擅长从1到100。

不是的朋友，20世纪中叶的美国不是这个样子的，那时美国有完整的工业体系、庞大的产业工人、愿意投十年二十年的长期资本，它既能从0到1，更能从1到100。

一国产业升级的客观规律，就是不断从0到1到100的螺旋式上升，这种“只做从0到1就吃尽利润”的分工，是美国经济金融化之后强加给全世界的。

如果研发离生产太远，中间会形成无数的数据黑箱，研发也会失去土壤，实验室人员不去产线上跑一跑，就永远不知道某个零件降本10%良率会掉多少这种问题，最终只能做出华丽但不实用的“样品”。

所以不是美国“擅长”做0-1，是它现在的产业土壤已经退化到只能做0-1。

现在的AI竞争，还在过家家阶段，你爬爬我的网页，我爬爬你的文库。GPT-4已经用完了互联网上几乎所有高质量的英文语料，但开源数据爬完之后呢？

农业、基建、工业、商业、军事等高壁垒、高价值的闭源数据，都不是IT人员写几个爬虫软件就能爬到的，AI竞赛进入下半场后，美国在工程经验上的短板将更加原形毕露。

就拿具身智能来说，美国到后面可能连设计都不知道怎么设计。

阿诚告诉我，这是因为人才迁移有客观规律，人形机器人的核心技术骨干，主要就来自工业机器人领域。

工业机器人，或者说机械臂，与人形机器人在运动控制、轨迹规划、力控、伺服驱动、仿真环境等技术模块上高度重叠，工业场景中的3D视觉、目标检测、抓取位姿估计等能力，也为人形机器人的环境交互提供了宝贵的基础数据。

那么工业机器人最发达的国家是哪个国家呢？中国。

根据国际机器人联合会（IFR）发布的《2025世界机器人报告》，2024年全球工业机器人安装量达54.2万台，其中亚洲占全球新部署量的74%，欧洲占16%，美洲占9%，中国占全球部署量的一半以上，美国虽然位列第三，但部署量还不到中国的12%。

工业机器人产业为中国培养了大量的运动控制算法工程师、伺服驱动工程师、机器人系统集成工程师、仿真工程师……这些技术和人才积累到一定程度，才能低成本地、自然地迁移到具身智能领域。

你现在跑去问美国的蓝领，他们手上那点工程数据，可能还没他们手机里“怎么安全嗑药”的群聊记录丰富，真要是搞个“嗑药AI大模型”，美国绝对是全球领先，数据又多又真实。

美国也有自己擅长的数据领域，比如上文提到的金融。我如果是美国公司，我就做个TACO模型，通过分析特朗普的TACO数据和美股美债变动的规律，预测K线走势，包赚钱的。

总之，AI竞争越向深水区，数据争夺战就会越激烈，最后是国家对国家，联盟对联盟，间谍对间谍，甚至是真理对真理的争夺。

中国赢得数据战争的根本信心，在于人心向背。

数据的最终载体，是一个个具体的人。

中国AI视频模型的背后，是成千上万的短视频内容创作者；中国工业机器人模型的背后，是无数的流水线工程师；中国AI崛起的背后，是14亿为生存和发展不断奋斗的中国人。

人民群众创造了最伟大的数据，数据以AI的形式回馈给人民群众，这才是中国AI应该走向的未来。

当中国通过算力突破、算法创新、数据沉淀，将Token成本打到白菜价时，AI才会迎来真正的应用级大爆发，中国将诞生一大批基建、电力、农业、工业模型和智能体，推动人类生产力的大解放。

中国将用自己的道路证明，AI不是少数精英用来谋利的玩具，而是人类驶向星辰大海的巨轮。