算力炼金术:Token工厂的崛起与全球电力大博弈
2026-06-24   |   发布于:赛立信

赛立信通信研究部出品

引言:一间机房,一座城市

当我们谈论人工智能(AI)的星辰大海时,话题往往围绕着算力、算法和海量的GPU芯片。然而,在这些璀璨的词汇背后,隐藏着一个极其冰冷且沉重的物理现实:电力

一个典型的超大规模数据中心(Hyperscale Data Center),其设计容量往往以50MW(兆瓦)为分水岭。50MW意味着什么?从物理参数上看,它是5万千瓦的IT负载;从社会维度看,它意味着每小时消耗5万度电,其一年的耗电量约为5.7亿度。这个数字,足以支撑一座拥有10万人口的中型城镇的全社会用电量。

“一间机房,一座城”,不再是夸张的修辞,而是AI时代的基础设施基准。随着ChatGPT、Sora、Llama等高性能模型以及像Hermes这类框架应用的爆发,人类社会正以前所未有的速度将电力转化为算力。在这种背景下,一个全新的物种应运而生——“Token工厂”。

在这场竞赛中,我们猛然发现,卡住人类通往通用人工智能(AGI)之路的,或许不是芯片的制程,而是那一根根跟不上时代的高压电缆。

一、解构“Token工厂”:双重驱动的AI心脏

1.1 什么是Token工厂?

Token工厂(Token Factory)是智算中心在AI商业化语境下的精准定义。如果说传统数据中心是“数字图书馆”或“静态仓库”,那么Token工厂就是“数字炼油厂”。

在Token工厂里,核心设备不再是通用的CPU,而是成千上万颗并行的GPU(如英伟达H100、华为升腾910B)。它的投入是电力和模型权重,产出是“Token”——即大模型生成的每一个字、每一段代码、每一帧像素。

1.2 训练与推理:竞赛与生意的完美结合

一个完善的Token工厂集群通常同时承担两个核心使命,这两个使命构成了科技公司截然不同的竞争维度:

使命一:大模型训练(未来的竞赛)

这是Token工厂的“实验室”功能。通过大规模GPU集群进行千亿级参数模型的预训练和迭代,确保技术代差不被对手甩开。这是一个极高投入、高风险但决定未来生死的竞赛。谁的工厂训练速度快,谁就能先率先发布下一个版本的“GPT-5”或“Sora”。

使命二:生产Token售卖(旱涝保收的生意)

这是Token工厂的“流水线”功能。随着OpenAI、Claude以及各种开源高性能模型(如Hermes、Mistral)的普及,全球开发者和企业对API调用的需求呈指数级增长。生产并售卖Token是一门现金流极佳的生意:只要模型部署好,每一度电转化出来的Token都在产生利润。

1.3 为什么建设速度决定生死?

在AI领域,技术半衰期极短。一个领先的模型可能只有3-6个月的领先期。如果你的机房建设慢了半年,当你开机时,你训练的模型可能已经过时,或者你的Token售价已经降到了你成本线以下。

因此,对于字节跳动、阿里巴巴、微软等巨头而言,Token工厂的建设不再是传统的基建,而是一场抢滩登陆的特种作战

二、中国式困局:50MW的物理量级与能耗枷锁

2.1 50MW:超大规模算力的“准生证”

在中国建设一个Token工厂,面临着极其复杂的行政与物理双重挑战。首先是“能耗指标”。在国家“双控(能耗总量和强度控制)”的背景下,每一个省份、每一个城市都有严格的能源配额。一个50MW的机房,其巨大的能耗足以让一个地级市的减排目标化为泡影。

过去,数据中心挤在北上广深,但现在那里的指标已近封顶,且PUE(能源效率)要求近乎苛刻(通常要求1.15以下)。虽然“东数西算”战略将重心引向西部,但经过前几轮圈地,枢纽节点的存量指标也正被迅速消耗。

2.2 电力配套:被卡住的“最后一公里”

即便拿到了“准生证”,电力配套的建设周期则是另一个阻碍项目上线的巨大泥潭。

50MW的负载,电网预留的10kV配电网根本带不动,必须接入110kV甚至220kV的高压骨干网。这意味着必须建设专门的配套变电站。在中国,建设一座高压变电站涉及征地、规划、环评、设备采购及施工,周期通常在24至36个月。而数据中心的IT主体建设仅需12个月。这种“供电错配”,让无数算力中心在落成后只能守着空机房“等电开锅”。

2.3 “魏桥模式”的消逝与AI企业的焦虑

当年山东魏桥集团通过自建煤电厂和“独立孤网”实现了铝业电力的自给自足。但在当今的“双碳”政策下,这种“自建煤电站”的路径已被彻底封堵。现在的AI巨头越来越等不及了,他们需要更激进、更灵活的电力方案。

三、东南亚的算力“避风港”:短暂红利与隐忧

在国内能耗指标收紧、电力错配的背景下,中国互联网巨头集体“下南洋”,马来西亚的柔佛州(Johor)成为了算力的避风港。

3.1 马来西亚:25%电力储备率的吸引力

马来西亚半岛的电力储备率长期维持在24%-30%之间,拥有大量闲置的发电能力。为了吸引字节跳动、万国数据(GDS)等巨头,马来西亚推出了“绿色通道(Green Lane Pathway)”,承诺将电力接入周期缩短至12个月。

3.2 繁华背后的发展瓶颈

但深入观察发现,东南亚同样面临瓶颈。由于数据中心在柔佛州过度集中,当地变电站的承载力已接近极限。关键零件——主变压器,由于AI建设的全球拉动,生产厂家的订单周期已被拉长至2年以上。

更致命的是连通性。机房可以在18个月内平地而起,但铺设一条跨越海域的高容量光缆往往需要3-5年。这对于依赖算力租赁和实时推理的中国企业而言,无异于在孤岛上建设工厂。

四、美国模式的狂欢:资本对能源的掠夺

与中国的统筹规划不同,美国在AI建设上展现出了一种极端的“资本优先”逻辑。

暴力破局:直接买下核电站

当遇到电力瓶颈时,美国巨头的做法简单粗暴:重金收购。亚马逊(AWS)斥资6.5亿美元收购了宾夕法尼亚州的一个工业区(Cumulus Data Center Campus),该工业区临近萨斯奎哈纳核电站(Susquehanna Nuclear Power Station),两者的大股东是能源巨头 Talen Energy。

其核心逻辑是“表后供电(Behind the Meter)”——核电站发的电不进公共电网,直接进机房。这意味着它绕过了拥挤、缓慢且审批复杂的公共电网,无需排队等政府批准用电指标,直接从“核反应堆”里拿电。而亚马逊这一买,等于把这座核电站未来几十年的大部分增量电力全部“锁定”在自己手里,竞争对手(如谷歌或微软)在附近再想建数据中心,就没电可用了。

这种“绑定核电站”的模式已经成了美国科技巨头的标配:

微软(Microsoft):2024年9月宣布了一个更疯狂的计划 —— 联手 Constellation Energy 重启已经关停的三里岛核电站(Three Mile Island)。微软承诺把重启后未来 20 年的电全部买光,专门用来跑它的 AI 集群和 OpenAI 的模型。

谷歌(Google): 走的是“科技流”,与 Kairos Power 签署协议,计划在2030 年左右部署多个小型模块化反应堆(SMRs)。

五、他山之石:马斯克的“特种作战”思路

面对“等电开锅”的全球性困境,马斯克在建设xAI数据中心(Colossus集群)时,为中国科技公司提供了一个极其重要的借鉴方案:模块化与去中心化

5.1 马斯克的“发电机卡车”思路

马斯克没有等待当地电力公司花几年时间去扩容变电站,而是采取了“自带电源”的策略:

他找来了35台集装箱大小的移动式天然气发电机组。

通过临时的微电网组网,这些“发电机卡车”在122天内就为10万张卡提供了动力。

这是一种典型的“以空间换时间”——虽然烧气的成本高于电网,但抢出来的这半年时间,足以让他的模型(Grok)完成一次关键迭代,抢占市场先机。

5.2 对中国厂商的借鉴价值

对于急于部署算力的中国厂商,这种思路极具启发:

分布式燃气能源站:在电网接入前,利用小型燃气轮机实现局部供电,快速上线训练任务。

二次开发旧有资产:寻找拥有闲置电容的旧工厂、旧钢厂进行改建。这些地方有现成的巨型变压器,是建设Token工厂的天然温床。

模块化部署:将电力模块、算力模块、散热模块全部集装箱化,像搭积木一样在电力充足的偏远节点快速铺开。

六、终局猜想:中亚崛起与全球能源利用重构

当一线城市的电力被榨干后,“算力难民”将迫使人类重新审视地理边界。

6.1 中亚:燃气发电的算力新疆界

中亚国家(如哈萨克斯坦、乌兹别克斯坦)拥有极其丰富的天然气资源,但基建落后。如果将中亚的天然气在井口直接转化为电力,并就地建设Token工厂,将实现从“输气”到“输出算力”的跨越。

6.2 结论:谁掌握了“插座”,谁就掌握了未来

AI的竞争,上半场比的是谁能买到更多的芯片;下半场比的则是谁能为这些芯片找到最稳定、最廉价、最可持续的电力“插座”。

在这场加速竞赛中,Token工厂的运转轰鸣,正是这个时代最强劲的脉搏。



分享
赛立信集团总部

地址:广州市天河区体育东路116号财富广场东塔18楼

电话:020-22263200,020-22263284

传真:020-22263218

E-mail:smr@smr.com.cn



                
赛立信旗下网站
关注赛立信
免费咨询顾问一对一服务
请留下您的电话,我们的咨询顾问会在当天(工作时间)直接和您取得联系。