一年前,人工智能还是一种新鲜事物,而现在,它已经变成了一场五级飓风,掀翻了商业、政治乃至现实本身。最初的冲击来自于 ChatGPT 和 NVIDIA 的万亿美元飙升,但那仅仅是表面。
现在新闻头条变得如此安静,就像我们进入风暴眼时旗帜突然无力地落下一样,这是一种诡异的平静,因为扩展基础模型的成本激增阻碍了重大突破。然而,在表面之下,激烈的竞争仍在继续,实验室陷入了一场残酷的游戏中,就像在曼谷市中心又开了一家泰国餐厅一样,被迫一点一点地更新和运营,他们一次分发一种令人痛苦的配料的食谱和商业计划,每个人都拼命地坚持在人工智能无情的公告牌排行榜上占有一席之地。
这种看似平静的局面背后隐藏着不断加剧的计算风潮,各大企业竞相将人工智能嵌入……一切事物之中。步伐混乱,规模全球,没有一家公司、政府或工作能够幸免于这场风暴。
现在出现了致命的后墙——应用程序革命。
未来 18 个月不会是温和的进化。对于那些建立在关于机器能做什么和不能做什么的过时假设之上的商业模式来说,这将是一场灭绝事件。我们正在目睹技术、经济和地缘政治的根本性重塑。
我们正站在人工智能飓风的中心。
一 五类模型登陆
仅在一年前,GPT-4 还是 AI 领域令人敬畏的巅峰。如今,一类新模型如风暴般涌现。Anthropic 的 Claude 3.7 被称为第一个“混合推理”AI,可以根据需求从近乎即时的答案切换到深度的分步逻辑。它甚至可以通过名为 Claude Code 的代理工具链编写可用于生产的代码,本质上是从命令行自动化软件工程的大量工作。软件工程的“中途时刻”即将到来。
与此同时,埃隆·马斯克的 xAI 已将 Grok 升级到版本 3,这是一个具有讽刺意味和多模式能力的模型,而谷歌的 DeepMind/Brain 团队推出了 Gemini 2.0,以在多语言、图像和音频任务方面胜过其他所有模型。
然后中国DeepSeek进入了该领域。
二 OpenAI 的商业模式陷入动荡
不久前,OpenAI 看起来所向披靡——它是人类集体智慧高速公路上的收费站运营商,拥有完美的条件为每一个过往的想法收费,因为它们有望成为所有智能的 API。
付给他们几分钱,他们就能从盒子里得到魔法。这曾经是个很棒的故事。如今,这个故事已经结束了。大型语言模型 (LLM) 的商品化已经撕碎了 OpenAI 曾经坚不可摧的护城河。正如我早先预测的那样,仅仅通过 API 提供通用 AI 模型永远不会带来可持续的竞争优势。核心技术太容易移植,而且几乎没有任何转换成本。事实上,一旦出现更好的模型,人们就会集体转移——除了聊天记录之外,没有什么可以把你锁定。

我们在 Anthropic 的 Claude 身上清楚地看到了这一点。有一天,我还在用 GPT-4 做所有事情;第二天,Claude 2 面世了,突然间它在编写我需要的东西方面有了显著的进步。我一夜之间就抛弃了 ChatGPT。现实世界中没有人关心 OpenAI 投入了 1 亿美元的计算来训练他们的模型——如果竞争对手的产出更好或更便宜,我们就完了。这个基本事实一次又一次地上演:从 GPT-3 到 GPT-3.5,再到 Claude 到 GPT-4,现在又出现了一大批新模型(Claude 3.5、3.7、GPT-4.5 及更高版本)。每当一个新的竞争者提供渐进式改进或专业技能时,用户就会毫不犹豫地迁移。单一主导 AI API 的时代几乎和它的开始一样快地结束了。
很快,用户就会厌倦每月支付 20 美元购买那些一旦更智能的产品出现就会过时的型号。毕竟,当今天的更灵敏、更快、更强大的版本已经出现时,谁愿意继续为昨天的劣质助手付费呢?这不是订阅疲劳,而是冗余疲劳。
看着 OpenAI 努力寻找商业模式,这种感觉似曾相识——ChatGPT Plus 最初每月收费 20 美元,然后又推出每月收费 200 美元的“企业级”诱饵,最近又推出了每月收费 2,000 美元甚至 20,000 美元的“代理架构”。还记得他们尝试为所谓的“GPT”建立市场吗?这些微型人工智能机器人承诺可以处理所有事情,但最终却一无所获,悄无声息地消失在广阔的数字世界里。现在,据说他们又回来了,准备重启另一次市场。
此时,也许他们应该将其称为Slopify。
OpenAI 的领导层从惨痛经历中吸取了教训。他们试图建立一个生态系统锁定机制——应用商店、插件平台、专有工具——以巩固其垄断地位。但这种做法行不通。既然你可以免费下载开源模型并自行运行,为什么还要使用具有使用上限、内容过滤器和延迟问题的僵化 API?
到 2024 年底,一些公司开始悄悄转变方向:许多公司不再单纯依赖 OpenAI 的 API,而是开始内部尝试规模较小、更专业的模型,或者越来越多地转向充满活力、快速发展的开源社区。
OpenAI 大幅降低了 API 价格,但如果竞争对手稍胜一筹,即便免费也未必足够便宜。商品化陷阱已然闭合,OpenAI 深陷其中。
正如MacroVoices上所说,每次 API 调用收取几美分从来都不是一个站得住脚的商业模式——“最终的现实是,这些基础模型并没有真正的商业模式”。这一现实现在已经无法忽视。
三 开源主导地位和闭源模式的崩溃
如果说 2023 年是专有模型震惊世界的一年,那么 2024 年则是开源夺冠的一年。开源LLM和工具的激增彻底摧毁了大型科技公司和资金雄厚的初创公司自以为拥有的“护城河”。去年泄露的一份谷歌备忘录说得最好:“我们没有护城河,OpenAI 也没有”,因为“第三派系”——开源社区——比科技巨头“更快、更可定制、更私密、更有能力”。这份预言备忘录得到了充分证实。
Facebook(Meta)通过发布其 LLaMA 模型来引领潮流,故意将其部分核心技术公之于众,以超越 OpenAI ,尽管称其为“开源”一直有些牵强。这是一场企业级的神风特攻队,即使有限制,它还是成功了。几周之内,LLaMA 的权重不可避免地泄露,爱好者们迅速微调出可与 GPT-3 相媲美的版本。当 Meta 在其备受争议、不太开放的许可证下推出 LLaMA 2 时让开源纯粹主义者非常恼火,社区的迭代速度已经比许多资金充足的实验室更快了。突然之间,一支由研究人员和黑客组成的全球大军——不受保密协议、利润目标或严格许可证的约束——在短短几个月内就成功复制了多年来秘密进行的企业研发。社区驱动模型的改进速度比任何封闭式商店所能处理的速度都要快。 OpenAI 和谷歌最可怕的噩梦变成了现实:人工智能创新的前沿不再只属于他们;它现在正在野外发生,不管许可证是什么。
看看 2024 年末发生的事情:一家名为 DeepSeek 的中国初创公司横空出世,引发了整个行业的冲击波。DeepSeek 团队利用有限的资源训练出了一个推理模型(“R1”),其性能优于许多花费100 倍成本构建的西方模型。怎么做到的?通过利用所有可用的开源见解、在效率上进行创新,以及对硅谷正统观念的合理漠视。
他们的 R1 模型在相对较弱的硬件上运行,但取得了有竞争力的结果——这充分证明了人工智能的皇冠上的宝石现在是知识、技术和执行力,而不是无限 GPU 农场的访问权限。当 DeepSeek 的降价模式与巨头相媲美的消息传出后,它让惊慌失措的投资者损失了超过一万亿美元的市值。我的意思是,160 名在杭州从事一个副业项目的不知名工程师 通过优化进入了与 OpenAI 的 GPT-4 相同的联盟——市场对西方人工智能投入数万亿美元感到恐慌是理所当然的。
其影响是深远的。首先,它验证了开放的方法:DeepSeek 没有从秘密专有数据集或其他人无法获得的魔法算法中获益。他们站在开源的肩膀上,推动了新的优化(我们稍后会讨论他们的硬件技巧)。别忘了,OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 最初说过,90% 的人工智能在 40 篇公开的论文中得到了解释。
其次,它抹杀了所有关于现有企业的“规模优势”将保证其安全的论点。如果真有的话,事实恰恰相反——规模大已经成为一种负担。虽然 OpenAI、微软和谷歌正在拖累其庞大的成本结构和行政体系,但规模较小的公司却在以超快的速度前进。正如一位谷歌工程师所哀叹的那样,开源模型的迭代速度比大型实验室更快、更私密。创新的洪流现在正来自外围。
即使是 OpenAI 的最新产品 GPT-4.5,在与深度研究一起使用时也确实令人印象深刻,就像拥有一个随时待命的中级研究助理。OpenAI 的问题在于它明显处于中级水平,根据我的使用经验,当“深度研究”未开启时,它无法很好地编写代码。优势之窗正在迅速关闭。
据说,DeepSeek 即将推出的模型 R2在 ARC-AGI 上的得分约为 90%,ARC-AGI 是一个专门用于衡量人工智能与人类智能水平的基准。如果这是真的,OpenAI 的渐进式改进将不仅让人觉得微不足道,而且会让人觉得无关紧要。GPT-4.5 非常昂贵,每百万输入 75 美元,每百万输出 1.5 亿美元,而且这还不包括“深度研究”,目前无法通过 API 获得。R2 的代码可能是免费的,并且可以在您自己的硬件(尤其是中国硬件)上运行,成本很低。
我们已经达到了这样的水平:任何新颖的模型架构或训练方法都会在几个月甚至几周的时间内被社区以开放版本的形式复制。
很难夸大这意味着什么:护城河不仅在流失,而且正在蒸发。构建一个有能力的人工智能模型的公式是众所周知的。是的,它仍然需要技能(和一些资本),但不是人们在 2022 年认为的那种数十亿美元的资金和多年的工作。我们已经看到大学团体、独立研究人员和小型初创公司制作出不久前被认为是最先进的模型。
这场人工智能风暴的中心是 OpenAI——曾经是无可争议的先驱,现在正努力在这场风暴中生存下来。它的旗舰产品 ChatGPT 仍然令人眼花缭乱,但该公司的现金正在大量流失。据报道,OpenAI 仅在 2024 年就烧掉了 70-80 亿美元,预计2027 年的烧钱率将达到 200 亿美元,以追逐更大的模型。正如人工智能投资者李开复直言的那样,“问题不在于谁的模型好 1%……问题是:OpenAI 的商业模式是否可持续?”。
残酷的事实是,基础模型已经成为商品。当像 DeepSeek 这样的中国开源项目能够以 2-10% 的成本复制 GPT-4 90% 的性能时,它削弱了整个 OpenAI 模型昂贵的 API 访问。资金充足的竞争对手基本上免费提供的产品很难收取高价。
当然,中国在训练人工智能模型方面也拥有不可动摇的竞争优势:他们根本不关心版权。
当美国公司小心翼翼地处理许可协议,雇佣大批律师为GPT 能否背诵《哈利波特》中的两行而不被起诉而苦恼时,中国却兴高采烈地抓取整个互联网——包括你的推文、电子邮件,甚至可能是你祖母的秘密食谱——并将其直接输入他们的神经网络。忘记数据湖吧;中国正在运营一个数据海洋。这就像参加一场拳击比赛,一只胳膊被绑在身后,而你的对手拿着电锯。祝你好运赢得这场比赛。
我最近和一位 Anthropic 工程师谈论了这个问题。他们若无其事地说:“你认为我们为什么现在在日本和韩国设有办事处?”
我从来都不喜欢先发优势——先发者必须耗费大量精力才能改变消费者的行为。另一方面,后发者则能顺势而为,轻松搭上领先者的顺风车。
如果下个月的头条新闻报道 50 名不知名的工程师在班加罗尔的一个地下室里推出了一个开源模型,让 ChatGPT 看起来像一个袖珍计算器,我不会感到惊讶——这是对萨姆·奥特曼 (Sam Altman)以居高临下的态度将印度的人工智能野心斥为“完全无望”的一次有力反驳。
还记得他的访问吗?当被问及印度在人工智能未来中扮演的角色时,他基本上是拍了拍印度的肩膀,建议印度坚持做一个好的消费者,而不是创造者。
我们已经看到,突破性模型并不需要数十亿美元的预算或斯坦福大学的博士学位——只需要独创性、决心,也许还有一点义愤填膺。下一个人工智能“泰国餐厅”很容易从一个意想不到的角落冒出来,手里拿着食谱,准备重新定义菜单。
开源的主导地位不仅仅体现在文本生成方面。图像模型(稳定扩散等)在 2022 年首次证明了这一点。到目前为止,我们已经有了用于编码辅助、语音合成甚至多模态视觉语言任务的开放模型。人工智能的前沿已经分裂成无数社区驱动的项目。难怪 OpenAI 如此混乱——Altman 从一年前宣称开源模型“愚蠢”到现在称 DeepSeek“令人印象深刻”。
生活来得很快。
尽管 OpenAI 一直高调地谈论利他人工智能,但David Sacks 的批评一针见血:他们“从非营利慈善机构变成了食人鱼、营利性公司”。在短短几年内,Sam Altman 的团队就从理想主义的研究实验室变成了幕后交易,为微软提供了巨额财务和知识产权——想想 OpenAI 皇冠上的宝石技术的独家许可(只有微软才能获得 GPT-3 底层代码的独家访问权)、通过 Azure 进行优先集成(微软是 OpenAI 的独家云领地),以及惊人的 75% 的利润分成,直到微软收回其数十亿美元的投资(这意味着最高回报率为 100 倍,这意味着 10 亿美元的股份可以卖到 1000 亿美元)。
如果 OpenAI 拥有牢不可破的领先优势,所有这些甜心条款也许还可以容忍,但事实并非如此。
与此同时,Altman 的领导能力也受到了各方的抨击:他与 Elon 发生争执,结果却发现 Elon 买下了世界上最强大的政治武器 Twitter,他利用 Twitter 通过DOGE成为美国财政部长。除此之外,Elon 的好友 David Sacks(发表了食人鱼评论的人)现在是 AI 沙皇,而 Elon Musk 则将 OpenAI 告上法庭,指责其使命转向营利性,甚至 OpenAI 自己的董事会去年也曾以“不信任”他的领导能力为由短暂罢免了 Altman,后来投资者的反抗迫使他复职。此外,11 位最初的联合创始人中有 8 位已经离开。
真是一片混乱。
如果我是一个赌徒,我会估计 Sam 可能已经接近跳槽并创办一家摆脱困境的新 AI 公司,然后他的Thielian Zero to One创始人故事线将不可避免地从英雄变成恶棍。
如果发生这种情况,微软将会采取其一贯的做法,‘拥抱并延伸’自身至上。
四 硬件战争:当模型和制裁如雨点般落下时,中国却倾注了替代方案
如今,英伟达正处于人工智能风暴的中心位置——在训练巨型模型方面,英伟达仍然是无可争议的硅片之王,其赚钱速度与台积电蚀刻晶体管的速度一样快。其最新的 GPU(想想价格像跑车一样的 H100)卖得飞快,其股价走势似乎只朝着一个方向发展。但就在黄仁勋沐浴在创纪录利润的阳光下时,地平线上的乌云正在聚集。英伟达垄断地位的裂缝虽然微妙,但正在不断增加:每一代硬件都在迅速淘汰,最大客户即将面临垂直整合的威胁,以及全球芯片供应受到地缘政治裂痕的侵蚀。英伟达仍然处于领先地位,但其脚下的土壤正在开始发生变化。
让我们从硬件跑步机开始。在 AI 领域,今天的尖端芯片很快就会成为昨日新闻。Nvidia 的商业模式喜欢这种模式 — — 说服每个人你需要最新的 GPU,否则你就会落后。但这种淘汰的节奏是一把双刃剑。每一代新产品都会使价值数十亿美元的上一代硬件变得有些多余,甚至让最富有的超大规模企业的预算也捉襟见肘。这就像一场永无止境的军备竞赛,你要么升级,要么死亡。结果如何?即使是 Nvidia 最好的朋友(谷歌、亚马逊、微软等)也感到疲倦,并在寻找退出途径 — — Nvidia 46% 的收入来自仅四家公司。垂直整合是他们的退路。如果你可以投资其中的一小部分来设计满足你需求的 AI 芯片,为什么还要每年购买价值 100 亿美元的 GPU ?
多年来,谷歌一直在悄悄地利用其TPU来实现这一目标。TPU 是一种张量处理器,可以处理从搜索到 YouTube 再到 DeepMind 的所有工作负载,而没有一块 Nvidia 芯片。亚马逊的 AWS 也不甘示弱,推出了 Trainium 用于训练,推出了 Inferentia 用于推理,这些芯片都是内部设计的,以控制 AWS 账单。据报道,微软正在开发自己的 AI 加速器(Project Athena),以减少对 Nvidia 的长期依赖。简而言之,Nvidia 硬件的最大买家正在开发自己的替代品。
这是 Nvidia 主导地位的一个细微裂痕,而且这个裂痕可能会迅速扩大:当你最大的客户成为竞争对手时,造雨者很快就会发现自己陷入了困境。
然后是地缘政治洪流。美国决定充当天气预报员,对向中国出口顶级人工智能芯片实施严厉制裁,旨在减缓中国在人工智能方面的进步。英伟达一向精明,它通过创建“中国友好型” GPU 版本(即:略微阉割的 H100,如 H800 和带有上限互连的新型 H20)来应对,以遵守规则,同时仍向最近占其收入近 20% 的市场销售产品。
2019 年,华为发布了采用台积电 7nm 工艺节点制造的顶级 Ascend 910 芯片。作为回应,美国政府于 2020 年将华为列入制裁实体名单。但华盛顿的举动也产生了意想不到的效果:它促使中国加倍努力发展自己的半导体产业。
当模式和制裁层出不穷时,中国却提供了替代方案。
输入华为的Ascend硅。
几年前,华为的人工智能芯片还被视为奇特之物——适合用作爱国标题,但并未对英伟达构成严重威胁。
现在情况已经不同了。华为公开宣称想要成为“中国的英伟达”,而且从最近的进步来看,他们距离这个目标已经不远了。
即便在制裁之下,华为仍在加大 Ascend 910 系列的产量。这些并不是像Apple Intelligence那样的虚幻软件;它们是大规模部署的真实硬件。
华为必须重新设计其 Virtuvian 芯片以便在中芯国际生产,中芯国际使用其 N+1 技术(第一代 7nm 级工艺)重新设计 910B 以避免这些制裁。
第二代 Ascend 910B 芯片的最大性能更高,将 910 的运行速度从 320TFLOPS 提升至 910B 的 400TFLOPS。它的时钟速度更高,但活跃的 AI 核心更少,每个 AI 核心中有一个额外的矢量单元,并且采用带宽和容量更高的新型内存类型。华为减少了 910 和 910B 系列之间的活跃 AI 核心数量——可能是由于中芯国际 7nm 制造工艺的良率低或产能有限。
50% 的提升归功于时钟速度的提升。另外 25% 则归因于每个 AI 核心中额外的矢量单元。两代芯片之间其余 25% 的性能提升似乎源于华为计算峰值性能的方式发生了变化。
Ascend 910C 只是芯片上的两个 910B,运行速度为 800TFLOPS。它采用中国 7nm 工艺(中芯国际的 N+2 节点),处于制裁云层之下——许多人持怀疑态度,没有 EUV 光刻技术——但它在推理任务上的性能约为 Nvidia H100 的 60%。没错:经过批准的 2019 年设计,经过升级和重新包装,现在在运行大型 AI 模型领域占有一席之地。
由于制裁迫使他们使用不太先进的晶圆厂和更少的工程师来管理和维护芯片工具,因此产量一直很低,而且成本很高,但他们正在迅速取得进展。据报道,910C 的良率已经从 20% 提高到 40% 左右,产量的提高现在使 Ascend 盈利。简而言之:中国正在投入蛮力、资金和顶尖工程人才来打破 NVIDIA 的瓶颈。他们会做到的。如果不是这一代,那么就是下一代。美国在人工智能硬件领域拥有一扇转瞬即逝的无可争议的主导地位之窗——那扇窗户正在迅速关闭。
华为花了至少两年时间重新设计并在国内生产第二代Ascend 910B芯片,但改进甚微。
2024年,华为生产了20万颗Ascend 910B处理器,没有生产910C。
今年他们计划开发10万辆910C和30万辆910B。
除此之外,据报道,台积电通过空壳公司非法生产了超过 200 万个 Ascend 910B 逻辑芯片,这些芯片现在都已经在华为手中,足以生产 100 万个 910C。
在训练巨型模型方面,Nvidia 仍然遥遥领先(软件生态系统、成熟度、可靠性——数十年的领先优势不会在一夜之间消失)。但在推理方面——人工智能部署的主力——华为已经有效地缩小了大部分差距。而关键在于:华为正在用这些东西充斥市场。尽管存在预期的初期问题(尖端工艺的产量问题、500 多亿个晶体管的芯片封装的复杂性等),但他们仍在全力以赴地提高产量。
定价也受到了影响。在北京方面“购买本土产品”的温和推动下,中国云服务提供商已采用 Ascend 芯片来支持其 AI 服务。结果就是,西方公司目前无法匹敌推理成本。
想象一下叫一辆 Uber 并被收取 5 美分,因为这基本上就是中国人工智能推理正在发生的事情。
DeepSeek R1 在 SiliconFlow 等云平台上提供,价格低得令人咋舌,每百万输入令牌收费 1 日元,约合 0.15 美元。输出令牌收费约 4 日元(约合 0.60 美元)。即使合并起来,处理每百万令牌的费用也远低于 1 美元。
相比之下,OpenAI 备受赞誉的 GPT-4 及其所有由 Microsoft Azure 支持的基础设施,如果将即时定价和完成定价相加,每百万代币的收费约为 30 美元或更多。我们说的是 200 倍的价格差异。是的,这些模型在功能上并不完全相同,但 OpenAI/Microsoft 等公司享有的经济护城河——假设只有它们才有规模为数百万用户提供服务——正在被打破。
当中国云平台能够以极低的价格提供 GPT-4 类模型时,“人工智能超级昂贵,因此定价过高”的整个说法就开始崩塌。OpenAI 发现自己陷入了一场它从未想过的价格战,对手(中国人工智能生态系统)并没有按照华尔街的丰厚利润策略行事。当竞争对手通过补贴或纯粹的成本优势以 0.00015 美元的价格提供每 1,000 个代币 API 调用时,很难以 0.03 美元的价格出售。在短短几个月内,人工智能服务的价格底线已跌至谷底,而英伟达的硬件霸权是部分原因——或者更确切地说,是霸权的崩溃。
现在,让我们来谈谈 DeepSeek R1 模型,以及为什么每个 AI 投资者在 1 月底都吐出了咖啡。如果说华为硬件的崛起是这场战争的一个战线,那么对暴力思维的攻击则是另一个战线。
多年来,人工智能的策略一直很简单:要训练更大的模型吗?那就投入更多 GPU(当然最好是 Nvidia 的 GPU)。规模、规模、还是规模——效率才是王道。DeepSeek 给这种方法带来了令人愉快的挫败。面对只有“廉价”的 H800 GPU(Nvidia 可以合法运往中国的 H100 的简化版),DeepSeek 的工程师决定从零开始。他们从低级开始——我们说的是 CUDA 以下,直接进入 Nvidia 的 PTX 汇编说明。
这是大多数团队甚至不会考虑的硬核优化工作,因为它极其困难并且将软件以不可移植的方式绑定到特定硬件上。但中国的特殊时期需要采取特殊措施。而且它奏效了——非常出色。通过重新配置代码在 H800 核心上的运行方式、优化内存访问模式以及将某些任务卸载到通常处于空闲状态的 GPU 部分,DeepSeek 实现了相对于基线 10 倍的惊人训练效率提升。让我们来看一下:不是 10%——而是 10 倍。他们有效地将每台 H800 变成了更像使用类固醇的 H100 的东西。仅使用 2,048 块 GPU 和一个从事附带项目的杂牌团队,DeepSeek在大约两个月内训练了一个 6710 亿个参数的混合专家模型 (DeepSeek R1) 。
相比之下,Meta 需要大约 2,000 块顶级 Nvidia GPU(A100)来在类似时间范围内训练其 650 亿参数的 LLaMA 模型。对于大 10 倍的模型,DeepSeek 的硬件使用效率要高出一个数量级。这是电影中音乐停止、每个人都环顾四周、喃喃自语“等等,这可能吗?”的部分。这本来不应该是可能的——但他们还是做到了。
DeepSeek 的成功对 Nvidia 造成了打击,它最痛处就是市值。投资者意识到一家雄心勃勃的初创公司只能用更少的 Nvidia 芯片来完成一项艰巨的 AI 任务,无限 GPU 需求的说法受到了打击。Nvidia 的股价曾因 AI 炒作而呈抛物线式飙升,但突然又受到了重压。几天之内,Nvidia 市值缩水了 8660 亿美元。
现在,股价波动往往是反应过度,但从象征意义上讲,很明显:仅靠拥有最强大的计算能力就能取胜的时代可能即将结束。优化是新的扩展方式。当一个巧妙的技巧或算法改进可以为你节省 90% 的计算预算时,你就会注意。如果你忽略它,你的竞争对手就不会。在全球 AI 部署的规模上,即使是适度的 2 倍效率提升——甚至 20%——也会改变游戏规则。这就是需要五个数据中心还是四个数据中心,或者在 GPU 上花费 1 亿美元还是 8000 万美元之间的区别。这些金额决定了季度收益的成败。DeepSeek 证明了蛮力是可以被战胜的,在此过程中,它削弱了 Nvidia 不可或缺的光环。
把所有这些加在一起,我们看到了什么?人工智能硬件领域正在酝酿一场分裂风暴。就在一年前,人们认为 Nvidia 赢得了这场战争是可以理解的——他们的 GPU 几乎出现在每个人工智能实验室和数据中心,他们的软件堆栈 CUDA 是人工智能的通用语言,而挑战者则被视为学术注脚或小众玩家。当赌注如此之高时,事情变化得多么快。我们现在正飞速走向人工智能硬件的去中心化、多极化时代。在一个角落里,Nvidia 的 GPU 不会消失——它们将继续成为许多任务的黄金标准,而 Jensen 无疑将带着更强大的硅片(Blackwell 及其他)和改进的软件卷土重来。
但垄断时代正在消退。在另一个角落,华为(以及其他将效仿的公司)领导的中国公司正在开辟一条独立的道路——一条优先考虑充足性和规模而不是前沿霸权的道路。它们在绝对性能上可能略有落后,但它们会在数量和成本上弥补这一点,而且它们不受西方束缚。在另一个角落,云超大规模企业和大量初创公司正在建造一艘由新型芯片组成的诺亚方舟:TPU、IPU、NPU、模拟芯片、光子芯片——随便什么都可以——每种芯片都针对特定工作负载或效率目标进行了优化。
就好像人工智能计算宇宙分裂成多个平行的时间线,所有地方的所有事物同时展开。
这种分裂并不是创新放缓的迹象,而是商品化和民主化的迹象。计算正在成为一种商品,因为每个人都可以通过某种方式获得强大的人工智能能力。当多个国家和公司都可以批量生产“足够好”的芯片时,没有一家公司可以垄断市场。价格将下降;利润将缩减。(Nvidia 不会永远卖40,000 美元的主板——竞争对手将会看到这一点。)与此同时,真正的差异化因素将从原始计算转向如何巧妙地使用计算。这就是优化作为新范式发挥作用的地方。DeepSeek 的教训将得到回响:不要只用金钱和硅片来解决问题,而要用智慧来解决问题。让算法更精简,软件更紧凑,硬件更专业。从某种程度上来说,这是对计算早期的回归——当时效率很重要,因为硬件有限。现在硬件很丰富,但规模化仍然很昂贵,所以效率再次成为王道。
在这个风雨飘摇的十年结束时,全球人工智能硬件格局将不再像我们开始时那样一盘散沙。它将在地缘政治上四分五裂——一个由美国主导的领域,一个由中国主导的领域,可能还有其他国家加入竞争(欧洲、印度,无论哪个国家提出要求)。它将在技术上多样化——GPU 与 ASIC、FPGA 以及任何出乎意料的新架构共享舞台。而且它将更具弹性——没有单点故障或控制,没有单一的阻碍可以利用来阻碍进步的瓶颈。Nvidia 的 GPU 仍然非常重要(你完全打赌反对它们是愚蠢的),但它们将是众多选择之一,而不是唯一的选择。通用 GPU 占主导地位的时代正在让位于遍布全球的专门优化计算拼凑而成的时代。
归根结底,人工智能的硬件战争不会产生一个孤独的赢家。相反,它正在给曾经统一的队伍带来暴风雨,并催生出一片繁茂但混乱的替代雨林。每个生态系统——英伟达、华为、谷歌、开源努力——都像一个不同的物种,正在进化以填补其利基。具有讽刺意味的是,这种多样性将推动人工智能的发展,速度比单一垄断企业更快。风暴确实已经到来,它正在冲走左右的假设。
对于我们这些旁观者(投资者、研究人员、政策制定者)来说,有一件事是清楚的:人工智能的未来将建立在全球分布的硅片网络上,而运用它的最聪明的方法——而不仅仅是最大的芯片——将决定谁引领这个故事的下一章。
DeepSeek 实现了 10 倍的训练效率提升,仅使用 2,048 个 NVIDIA H800 GPU 就只用了两个月的时间就完成了 6710 亿参数的模型,而 Meta 或 Google 通常需要投入 20,000 个 GPU。
DeepSeek 凭借智慧而非蛮力,有效抵消了 NVIDIA 的硬件优势。通过这一举措,他们证明了全球 GPU 短缺和美国出口禁令至少可以部分通过智慧和努力来规避。
如果一家新贵能做到这一点,其他公司也会效仿。我们将看到一波“PTX 级”优化浪潮,因为中国(可能还有俄罗斯,甚至西方渴望成功的初创公司)的每一家主要 AI 参与者都试图在他们能得到的任何硬件上最大限度地提高性能。这进一步削弱了 NVIDIA 的事实垄断地位,并加速了 AI 计算分散化的趋势。
另类 AI 芯片初创公司(从美国的Cerebras到中国的Biren)已经嗅到了血腥味。到 2026 年,AI 硬件格局可能会大不相同——NVIDIA、中国国产 AI 加速器和针对模型本地运行进行优化的奇特新架构的混合体。无论如何,NVIDIA 不会像在繁荣顶峰时期那样占据主导地位。硬件战争将世界分成了不同的阵营——具有讽刺意味的是,它也推动着每个人都追求效率而不是蛮力。
最后一个转折:尽管世界对推理计算的需求无疑将爆发式增长——由我们尚未大规模部署的人工智能应用浪潮推动——但关键问题是这些计算将存在于何处。随着推理从集中式云堡垒迁移到边缘(想想智能手机、汽车、工厂和无处不在的传感器),当今许多大型数据中心的建设可能突然看起来不那么具有战略意义。我们目前正在目睹一个典型的兴衰场景:超大规模企业竞相用 GPU 机架填满整个足球场,如果重心转向边缘的分散推理,可能会超出需求。
不过,值得记住的是,我所说的斯克罗吉定律:无论你建造多少个数据中心,计算量都不可避免地会扩大,以填满可用的数据中心。
人工智能代理的崛起:边缘嵌入式智能
尽管人们都关注云端的大型 AI 模型,但也许更深刻的转变是智能向外迁移——向实时代理、设备和边缘迁移。我们正在从一个 AI 意味着“调用 API 来获得答案”的时代走向一个 AI 嵌入到任何你需要的地方的时代,通常在本地、自主和连续运行。这具有巨大的影响:它颠覆了 AI 以云为中心的主导地位,改变了软件的构建方式,并有望提高无数云端大型模型无法有效服务的细分市场的生产力。
2023 年,热门话题是浏览器中的 ChatGPT。2025年,热门话题是所有事物中的 AI 副驾驶:您的文字处理器、汽车、冰箱、公司的客户支持工作流程。这些都是 AI 代理——专门的、任务驱动的 AI,它们不仅被动地响应提示,而且积极主动地实时观察、计划和执行目标。
早期的实验,如 AutoGPT 和 BabyAGI,都是笨重的概念验证,但它们点燃了火花。现在我们已经开发出部署在生产中的版本。
在我自己的公司Freelancer,我们建立了一个 AI 代理框架来处理一级客户支持和销售咨询。这些代理可以用自然语言与客户互动,回答问题,解决问题,甚至推销我们的服务——所有这些都在某个时间点之前不需要人工参与。我们也为其他人做这件事——未来两年内,世界上的每一家小企业都将让 AI 接听电话、进行预订、接受信用卡并处理订单——请访问freelancer.com/ai查看一些演示。
这里有一个有趣的发现:这些代理并不是简单地取代人类,而是增强了我们的团队,承担了繁重的工作,并在人类遇到限制并需要升级时为他们创建新的任务,从而实际上增加了我们的净就业人数。
这虽然违反直觉,但却合情合理——人工智能处理了 1,000 份简单的票据,而如果由人类单独处理这些票据,则绝对不经济,但这样做可以发现 100 起需要更高级别人工干预的案例(从而产生原本不存在的工作)。我们实际上聘请了一支不知疲倦、反应超快的初级员工团队,在需要时可以向(人类)经理汇报。这只是客户支持的一个例子。
除此之外,我们现在有额外的产品团队致力于框架本身 – 所以至少在我们的情况下,就目前而言,就像过去的所有技术一样,它们创造的就业机会比它们摧毁的要多。
现在将这种模式扩展到各个行业。每个涉及日常沟通或数据处理的业务流程都适合使用 AI 代理自动化。我们谈论的是销售电话、技术支持、人力资源入职、内部帮助台、研究分析、个人助理——所有这些。在房地产领域,正如我在之前的 Macrovoices 采访中提到的那样,想象一下一个 AI 代理处理所有烦人的租赁物业管理电话——租户打电话说水龙头坏了,安排维修,向房东汇报最新情况。
人工智能可以对所有这些进行分类和响应,只在实际的物理修复过程中引入人类。或者考虑医学:人工智能“转录代理”已经监听了患者的就诊情况并起草临床笔记;下一步是人工智能代理可以进行初始患者接收,询问症状问题,甚至可能为医生提供初步诊断建议。这不是科幻小说——它的组成部分现在已经存在。如果政府允许 ChatGPT 编写脚本,它可能会让全国一半的全科医生腾出时间从事更高价值的工作。
至关重要的是,许多此类代理应用程序都需要实时或现场 AI。如果本地 AI 可以无延迟且完全保密地处理敏感的商业电话,您可能不希望云服务器处理该电话。此外,正如我在《AI 知道你去年夏天做了什么》中提到的那样,随着 AI 功能越来越好(也越来越可怕),我认为 SaaS 即将迎来“皇帝没有穿衣服”的时刻。
我认为你会越来越多地看到很多消费者和公司说“我不希望我的数据出现在互联网上,我不希望人工智能吸收它,我不希望人工智能知道我的用户群,我不希望他们知道我的商业模式,我不希望我的研究立即被商业化”。
你可能会看到互联网大规模地变暗。
我的意思是现在就去看看你的 Gmail 并思考一下……
谷歌的人工智能已经知道其中的一切……一切。
他们欺骗你,说他们不会查看这些数据,而是根据这些数据向你提供上下文广告。
嘿谷歌,请告诉我与我的公司竞争的最佳方式是什么?
嵌入式推理(在本地设备(手机、笔记本电脑、本地服务器、汽车)上运行 AI 模型)的驱动力已进入高速发展阶段。就像个人计算机革命的第一阶段将计算从中央大型机转移到个人台式机一样,我们现在正在将 AI 从中央数据中心转移到个人和边缘设备。
2024 年,高通演示了在智能手机上运行大型语言模型;到 2025 年,消费设备将普遍配备设备上的 AI 功能,而以前这些功能需要互联网连接。苹果的神经引擎、谷歌的 Tensor 芯片——它们都旨在直接在您的设备上运行模型。开源使这成为可能:得益于模型压缩技术(量化、提炼),人们可以将 2022 年的 130 亿参数模型压缩为如今在 1,000 美元的笔记本电脑上可以接受的模型。
云端 AI 主导地位的终结对某些大型科技商业模式来说是一场噩梦。如果重心转移到边缘,云端 AI 提供商可能会发现其增长受到限制。如果您可以拥有本地运行且无需持续成本的模型,为什么要按令牌或按月为 API 付费?
我们已经看到了早期迹象:精明的公司正在采用 Llama 2 这样的开放模型,根据专有数据对其进行微调,并在内部运行它们——无需 OpenAI 或 Azure。这样做的成本已经大幅下降。现在,中型企业可以在内部拥有自己的 GPT 式模型,并根据其需求进行量身定制(而且不太可能将机密泄露给外部人员)。这大大削弱了“人工智能即服务”(ASS)范式。我的意思是,你们中有多少人在向 ChatGPT 输入内容之前会再三考虑?
我甚至有一些朋友,他们每次输入 ChatGPT 时都会确保他们非常友好,这样当天网具有自我意识时他们就会记住他们。
边缘 AI 也预示着软件开发的复兴。开发人员不再将“AI”视为一个独立的东西,而是开始将其视为应用程序中包含的另一个库或运行时。下一代应用程序的核心将内置 AI。想象一下,打开 Excel 时,您不仅会看到静态公式,还会在工作表中看到一个 AI 代理,它可以分析数据、构建数据透视表、生成预测,甚至突出显示异常 – 所有这些都在您的 CPU 或 GPU 上运行。微软已经在通过 Office 365 Copilot 推动这一目标,但现在它需要借助云端。再过一两年,您的 PC 可能会自行处理很多推理,尤其是对于小规模任务。
这里一个有趣的隐含就是垂直 AI 代理的崛起。随着通用模型商品化,价值转向如何在上下文中使用它们。一个擅长供应链物流、医疗账单或法律合同分析的 AI 代理——这些都是建立在可能的商品模型之上但通过领域数据和流程集成得到增强的垂直解决方案。赚钱在于部署AI 来解决特定的痛点,而不仅仅是拥有最花哨的模型。我之前说过:真正的钱在于将 AI 应用于每个行业,就像在互联网时代将每个企业放到网上赚钱一样。我们正在看到这种情况的发生。每个行业都将拥有自己定制的 AI 助手和代理,互联网将不再提供新数据集和公开数据集(你不能再从 ArtStation 中抓取训练数据了,对吧?)。
出于可靠性、延迟和机密性的原因,许多垂直代理将在本地或专用设备上运行。
还要考虑自主性方面。这些代理不仅仅是问答机器人;它们可以行动。我们有效地在软件中灌输了一定程度的决策自主性,而这些软件过去总是由人类编写脚本。这很强大,但你最好确信代理正在按照你的意图行事。如果有一个领域我敦促谨慎,那就是释放没有护栏的自主代理。我们从第一波中吸取了教训(一些 AutoGPT 用户发现代理无休止地循环或做一些愚蠢的事情)。希望在下一波中,我们能够建立更强大的目标和安全检查,以防止做一些愚蠢的事情(例如 AI 旅行代理抛出过度折扣,或根据要求完成人们的数学作业)。
自主人工智能代理可以执行交易、发送电子邮件、与数据库交互、控制物联网设备。这带来了一系列全新的机遇和风险。一家贸易公司可能会让人工智能代理监控市场状况,并比任何人类都更快地执行策略。一家工厂可以拥有人工智能控制系统,可以动态调整运营。安全摄像头将了解场景中的一切,并从每个人的面部、步态和其他特征中反向查找每个人的身份。
尽管如此,魔咒已经从瓶子里跑出来了。自主人工智能代理将继续存在,而且它们只会变得更加强大。现实世界的效应器(如机器人或软件特权)与人工智能大脑相结合,形成了一个反馈循环:人工智能可以尝试一些东西,观察结果,然后学习——这是实现目标的一种基本的迭代形式。它不是有自我意识的天网,但它不必是革命性工作流程。一个设计良好的客户服务代理,不断从成功和失败的互动中学习,一年后就能胜过整个外包呼叫中心部门。
总结:我们正在分散和专业化人工智能。可以处理所有事情的巨型云模型正在被一群更小、更专注、更接近行动地点的代理所取代。这种转变类似于从大型机转向 PC,或从单片应用程序转向微服务。它改变了谁来获取价值(预计边缘设备制造商和精明的集成商将受益,而云使用量的增长可能会放缓)。它还挑战了“人工智能 = 大数据中心”的概念。几年后,这可能听起来像“互联网 = AOL”一样过时。
GPT 监管:政府恐慌剧
如果你认为神经网络的扩展和硬件战争是混乱的,那么等着瞧吧,看看各国政府在做什么。美国禁止向中国出口芯片;中国禁止出口某些人工智能软件;欧盟正在讨论强制“GAI”模型获得政府许可等等。欢迎来到全球马戏团:人工智能民族主义与官僚主义的相遇。
欧洲走在了前面,以其具有里程碑意义的《欧盟人工智能法案》一举领先,该法案由其久经考验的“预防原则”推动——本质上意味着先监管,再创新。这是典型的欧盟做法:彻底禁止某些用途,对“高风险”系统提出严格的合规要求,巨大的合规成本,广泛的限制,无休止的文书工作,以及足以让小国破产的巨额罚款(高达 3500 万欧元或全球收入的 7%)。欧洲可能会自我监管,使其大陆变成一个数字主题公园,而世界其他国家则在建设真正的人工智能未来。
相比之下,美国坚持“快速行动,打破常规”的口号,通过行政命令、指导方针和自愿框架发布人工智能规则。这是美国式的轻监管——依靠硅谷的自我监管,同时又紧张地想要为人工智能设置一个终止开关,或者至少是一个关闭开关——他们只是还没有想出如何在不破坏经济的情况下安装它。拜登的行政命令基本上要求科技巨头公平竞争,分享他们的功课,并在他们的深度伪造作品上加水印。与此同时,国会正以冰川般的紧迫感讨论人工智能监管问题——希望在他们的任期内不会发生任何灾难性的事情。
中国的战略再明确不过了:快速创新,更快审查。北京的新规定迫使人工智能坚持“社会主义核心价值观”——这并不奇怪。人工智能生成的每个字节都受到监控、过滤,并被乖乖地贴上“中国制造”的标签。与西方同行不同,他们甚至不会假装自己没有在监视。如果用户以某种方式诱使人工智能产生违禁材料,提供商必须立即停止生成、删除输出,并向当局报告此事件。这不仅仅是监管,这是具有中国特色的人工智能——高效、创新且绝对受控。
这种三方拉锯战——欧洲谨慎的保姆国家、美国的自由放任创新和中国的威权主义结盟——正在撕裂人工智能生态系统。公司现在必须对其模型进行地理围栏,维护内置审查的中国版模型,并处理美国对其硬件甚至模型的出口管制(想象一下需要商务部许可才能共享权重文件!)。
人工智能初创公司面临着合规噩梦,全球平台变得千疮百孔,根据你的护照改变个性和功能。我们正走向一个支离破碎的人工智能格局,分为欧盟的围墙花园、美国开放但有风险的游乐场和中国受国家控制的数字堡垒。
正如《经济学人》 在 2024 年即将到来时所说,“欢迎来到人工智能民族主义时代”,届时“世界各地的主权国家都在竞相控制自己的技术命运”。
所有这些中有一个不确定因素:开源 AI 叛逆者。他们让基础模型民主化,在大型科技公司的专有护城河上打开了漏洞,让监管机构摸不着头脑。欧洲曾试图拉拢他们,但后来改变了主意——意识到监管数千个分散的 AI 项目就像放牧数字猫一样。美国赞扬他们的独创性(同时私下担心滥用),而中国则大多忽略他们,相信其防火墙会过滤掉任何麻烦的创新。
与此同时,各国政府正努力应对深度伪造、虚假信息和数字身份问题。一些政府正危险地尝试实施强制性数字身份验证(互联网的“了解你的客户”),威胁要摧毁网络匿名性。
不久前,我曾推测,如果 ChatGPT 被破解或流氓软件落入坏人之手,政府将对互联网进行严厉打击——加强监控、限制言论自由等等。这种前景不再是假设。只要看看西方政府对选举和新冠疫情期间的虚假信息的反应就知道了——他们往往过于热心,偶尔还会践踏公民自由。现在,如果再加上人工智能,这种恐惧感将增加十倍(“想想那些使用疯狂 GPT 的恐怖分子!”),你就明白了。
一个特别严厉的想法正在获得关注——作为解决人工智能信任问题的“解决方案”——那就是“互联网的 KYC”。用简单的英语来说,它是一种“上网许可证”,迫使每个互联网用户在发布或访问某些内容之前验证他们的真实身份(可能是政府颁发的身份证),以阻止人工智能机器人和深度伪造巨魔大军。
澳大利亚政界——无论是左翼的执政党工党还是右翼的自由党-国家党联盟——都可耻地联合起来实施了一项实际上是“互联网 KYC”的法案,并被玩世不恭地辩解为“保护儿童”的措施。尤其令人恼火的是,长期以来一直宣称言论自由是基本原则的联盟却热情地支持这项立法。丑陋的现实是,这项法律与儿童安全关系不大,而与政客们想要让那些使用傀儡账户在网上说他们坏话的澳大利亚人噤声有关。
这一概念曾经只限于独裁者的剧本,现在正渗透到西方主流辩论中。支持者认为,这可能是区分胡言乱语的 Twitter 账户是人类还是人工智能的唯一方法,也是追究恶意部署生成模型的人责任的唯一有效方法。我明白这种诱惑——互联网上已经充斥着虚假账户、机器人和人工智能生成的虚假信息,而且情况还会变得更糟 100 倍。但现在让我们来揭穿这个“解决方案”的谎言:牺牲匿名性和隐私并不能真正解决人工智能滥用问题。要求每个用户使用护照或指纹登录并不能解决人工智能问题——它只会附带损害免费互联网的生存。
然而,我担心,如果没有其他方法,我们就会走向这个方向。因为坦率地说,技术对策失败了。我们尝试了 CAPTCHA(“点击交通灯来证明你不是机器人”)——现在人工智能可以解决这些验证码。我们尝试通过让用户拿着身份证自拍来验证用户身份——现在人工智能可以深度伪造这段视频。我们很快就会到达这样一个地步:任何数字身份验证都可以被足够复杂的人工智能欺骗。
正如我在之前的一次演讲中严肃地指出的那样,我们可能很快就没有可靠的方法来在线验证人类身份。这是一场正在酝酿的社会危机。政府的回应将是加倍验证:也许对所有内容进行加密签名,也许要求对人工智能生成的内容进行水印(祝你好运)。或者确实强迫每个用户在其行为上附加经过验证的身份令牌。这些措施中的每一项都会带来巨大的公民自由影响和实际麻烦。
所有这些监管也有一个致命的缺陷:人工智能以超光速发展,而官僚机构却缓慢前行。等到法律跟上时,模型已经发展得面目全非。这种“速度差距”意味着我们一直在监管昨天的技术。例如,欧盟的人工智能法案是在 GPT-3 处于最先进水平时构思出来的,直到 GPT-6 出现在我们的屏幕上才会完全生效。这就像在汽车发明后试图监管马匹一样。
因此,我们现在处于互联网的风口浪尖,任何事物都不能单凭表面来相信——无论是文字、图像,甚至是说话的视频——而我们领导人最好的想法实际上是要求每个人上网时请携带证件。监管舞台遭遇技术大流行。
公平地说,我没有一个完美的答案。这是一个前所未有的挑战。但我要说的是:恐惧驱动的严厉监管往往会超出预期,造成的损害比问题本身还要大。全球人工智能规则的混乱局面很可能产生许多意想不到的后果和不一致的结果,至少在短期内是如此。一些司法管辖区将超出预期(扼杀创新),其他司法管辖区将低于预期(助长狂野西部滥用)。在此期间,企业和用户在试图遵守规定时会受到重创。未来两年监管方面将异常混乱。预计会出现法庭挑战、贸易纠纷(“你的人工智能法让你的公司比我们的公司更有优势!”),有时公司会说“去他的”,然后开源或转移到海外以避开规则。
未来几年将是过山车般的时期,因为这些相互竞争的监管理念将正面碰撞。人工智能民族主义已经到来,规则正在分裂,创新正在不受约束地飞速发展。最终,那些能够实现最明智平衡的国家——既拥抱创新又不破坏隐私和自由——将塑造未来十年。目前,情况一片混乱、混乱,而且需要无休止地遵守规定。
欢迎来到人工智能监管时代。
合成互联网:信任的崩塌
2023 年,一张人工智能生成的好莱坞标志被野火吞没的图片迅速在网上传播。这张照片完全是假的,但却令人恐惧地可信,在被揭穿之前,它已经欺骗了数百万人。欢迎来到合成互联网——现实和虚构在这里天衣无缝地模糊着。
在人工智能令人眼花缭乱的奇迹背后,一场更深层次的风暴正在酝酿:我们的整个信息生态系统正在崩溃。网络世界正迅速充斥着合成内容——人工智能生成的文章、图像、视频,以及与真实创作难以区分的整个数字角色。2024 年,涓涓细流变成了洪流。到 2025 年,我敢打赌,网上的大部分内容都将是机器制作的。我之前讨论过“互联网死亡理论”——互联网上的大部分内容已经是假的或由机器人生成的——我们现在正在实时看到它的体现。
举一个简单的例子:社交媒体。滚动浏览你的 Facebook 动态,你可能会注意到有些不对劲。奇怪的账户发布奇怪的图片,比如一张略显“怪异”的房间室内设计照片,看起来几乎真实,但又不完全真实。下面是数百条来自使用人工智能生成的个人资料图片的普通评论。
或者突然涌现出大量超级特定兴趣小组,这些小组的活跃讨论让人感觉算法很贴切。这不是科幻故事——它正在发生。很大一部分社交网络活动是由机器人驱动的,通常用于广告欺诈或垃圾邮件。人工智能增强了这种能力。这些机器人现在有无数可信的话要说,有无数虚假图片要分享。它们可以凭空捏造整个社区。就好像一种数字致幻剂被倾倒在我们的信息水源中。
但其风险远不止垃圾邮件和滋扰。
我们正陷入一场信任危机。
你看到了一篇看起来像 CNN 新闻的文章——但它完全是由人工智能编写的,由内容农场为了广告点击而制作。你看到了一段世界领导人发表惊人言论的视频——但这是深度伪造的。你接到女儿打来的电话,说她被绑架了,需要钱——但那不是你的女儿,只是一个克隆她声音的人工智能,骗子们用它来欺骗你。
所有这些例子都已经发生在去年。现在再把它们乘以几倍。生成错误信息或欺诈内容的成本趋于零,而这些内容的质量和真实性却飞速提升。这是一场认知危机的完美风暴。
查看Freelancer.com/ai上的一些演示,您就会知道与 AI 代理的音频通话效果有多好。
当涉及到数字内容时,我们根本无法再相信自己的眼睛和耳朵。如果所有信息都变得可疑,会发生什么?我们冒着一种集体精神分裂的风险,因为没有人知道什么是真实的,所以公共话语会恶化。骗子和宣传者已经在利用这种不确定性作为武器(“除非我们说它是真的,否则不要相信任何东西”)。我们看到独裁领导人为了逃避责任而将真实证据斥为“深度伪造”,而活动人士则试图揭露真正的深度伪造,以防止虚假恐慌。
信息战急剧升级。
这就像那个喊狼来了的孩子,但狼和男孩的数量是无限的。最终村民们只是耸耸肩,不再对一切做出反应,不管是真实的还是虚假的。或者更糟的是,他们相信他们想相信的任何东西,不管事实如何,因为客观事实是混乱的。我们已经深陷在主观现实的时代;人工智能生成的内容可能是对共识真理的致命一击。
科技公司正在尝试一些措施。OpenAI 构建了一个(大部分无效的)分类器来检测 AI 编写的文本——它基本上不起作用,他们停止了它。
甚至谷歌也无法阻止人工智能内容被用于网络内容,它最初告诉所有人,使用人工智能内容会降低搜索排名,最后还是放弃了——如果你不能打败他们,就加入他们——提供人工智能内容生成工具。
研究人员正在研究人工智能图像和视频的水印——但任何这样的水印都有可能被删除或伪造,尤其是在存在多个模型架构的情况下(恶意行为者可以使用不应用水印的模型)。内容真实性计划(由 Adobe 领导)等努力旨在在创建时对合法内容进行加密签名(例如,您的相机会在您拍照时对其进行签名,以证明其来源)。也许这对未来的新内容有用,但它无法解决数十亿张可以重新利用的遗留图像和视频的问题,也无法强迫坏人使用签署伪造内容的硬件。
我不想这么说,但目前唯一合理的立场是假设所有数字信息都可能是假的,除非有证据证明是假的。这真是太糟糕了。想象一下将这种标准应用到日常生活中——每封电子邮件、每个视频通话、每条新闻在被证明无罪之前都被视为有罪。这令人筋疲力尽,而且具有腐蚀性。
在我的MacroVoices 讨论中,我强调了这种现象的早期迹象已经显现。2022 年,博客垃圾和 SEO 内容工厂开始使用 GPT-3 大量生产低质量文章。到 2024 年,整个垃圾网站都由人工智能从上到下生成,用人工智能撰写的耸人听闻的标题吸引点击。即使是经验丰富的分析师也会偶尔被人工智能生成的研究报告或乍一看很真实的虚假采访所欺骗。合成互联网悄无声息地潜入你的身体;除非你主动寻找,否则你可能不会注意到你阅读的一些 Medium 帖子是由 GPT-4 编写的,并经过了一些人工编辑。
最可怕的是,当合成内容被故意用来造成伤害时。我们已经看到国家支持的虚假信息运动利用人工智能来扩大其影响范围并定制信息。这不再是一个农场里的一千个巨魔——而是一个巨魔用 GPT-4 自动生成一万个虚假角色。
人工智能的发展方向——2025-2026 年预测
模型商品化和专有优势的终结
开源模型的繁殖速度比兔子还快,彻底摧毁了 GPT-4 等封闭系统曾经占据的优势。很快,没有哪家大公司会为通用模型的使用权支付高昂的租金——专业化和应用现在才是关键。OpenAI 将面临非常艰难的时期。我猜 Altman 可能会在沮丧中愤怒地辞职,趁着自己还有街头信誉时创办一家新公司,让 OpenAI 的剩余部分被微软吞并。
无论喜欢与否,大型科技公司都深度嵌入人工智能
预计微软、谷歌和亚马逊会将人工智能植入您使用的每款软件中 — 强制性的 Copilot 集成、人工智能优先的 Salesforce 界面等等。人工智能不再是附加组件;它是您的新默认设置。准备好迎接令人尴尬的人工智能失败吧,因为一些公司在毫无头绪的情况下就加入人工智能,这可能会导致皇帝没穿衣服的时刻,然后冲出云端,进入本地运行的边缘人工智能 — “不是我的人工智能,不是我的数据! ”
GPU 短缺转为过剩;硬件开始分化
随着训练需求趋于平稳,边缘计算呈爆炸式增长,今天 Nvidia 的短缺将成为明天的供应过剩。与此同时,中国国产硅片产量不断上升,打破了 Nvidia 近乎垄断的地位。
监管混乱与“人类认证”互联网的兴起
为更加混乱的人工智能立法做好准备——可能首先来自欧盟——这将处以巨额罚款,并让合规部门手忙脚乱。注意数字身份证和内容认证的严厉尝试以及公众对此的强烈反对。“经过验证的人类”徽章可能是下一个,因为你在 Instagram 上发布的身穿比基尼的失业模特将被大量由人工智能生成的与真实模特难以区分的诱惑陷阱所取代。
人工智能代理改变工作方式——人类地位不断提升
忘掉静态聊天机器人吧;人工智能代理将成为您的新同事,将客户支持和销售等常规工作量减少两位数。人类不会消失;相反,他们会监督人工智能或处理升级问题。向“人工智能工作流程设计师”或“人工智能审计员”等角色问好。像 Alexa 这样的个人助理终于长出了大脑,可以做值得您花时间的任务。
Netflix 和无限的 AI 内容过剩
Netflix 即将体验到 ChatGPT 推出那天维基百科的感受——曾经伟大的内容之王突然淹没在无尽的人工智能生成的山寨品、疯狂的同人小说和以零边际成本大量生产的合成衍生品海洋中。当一夜之间出现一千个人工智能生成的衍生品时,祝你订阅费好运,这些衍生品是由拥有太多 GPU 和空闲时间的青少年炮制出来的。我们终于可以修复《权力的游戏》第 8 季,还有第 9、10、11 季,以太空为背景,以西部片的形式,由你担任主角,你所有的朋友都担任角色。
真实性危机:互联网的现实检验
随着人工智能以令人信服的虚假内容充斥网络,信任度跌至谷底。真实性成为一种奢侈品——预计提供“经过验证的真实”内容的初创企业和平台将爆发式增长。本地调查性新闻业已开始卷土重来,因为媒体组织难以生成原创内容。密切关注由深度伪造引发的重大危机,这将迫使政府将某些欺骗性的人工智能内容定为犯罪,并以此为借口来更好地控制选民。
经济赢家、输家和生产率提升
宏观数据终于显示出温和的生产率增长,这让经济学家感到困惑,因为尽管工资上涨,但通胀率仍然很低。随着呼叫中心等大型就业场所受到干扰,外包给大型低成本劳动力中心的业务减少。与此同时,医疗保健和教育等以前抵制技术的行业开始因实际的人工智能整合而蓬勃发展。
人工智能驱动的自由职业者爆炸式增长
人工智能点燃了全球自由职业市场,一夜之间提升了技能,释放了来自世界各地的人才。借助先进的工具(例如实时人工智能副驾驶、多语言翻译以及专家级写作和编码助手),新兴经济体的自由职业者现在可以以闪电般的速度提供顶级工作,通常与纽约或伦敦的经验丰富的专业人士没有区别。
西方工人的旧地域优势正在迅速消失;企业现在可以利用更聪明、更快速、成本更低的全球人才库。这是一个无边界、竞争激烈的市场的曙光——要么快速适应,要么做好被超越的准备。
所有的工作都在向更高层次发展,微型创业的激增既是由人工智能带来的颠覆所促成和推动的。
社会反弹和政治 AI 斗争
有机食品流行起来后,文化上也出现了反弹:“人类制造”的标签随处可见。从政治上讲,人工智能成为一个棘手问题——“人工智能抢走了你的工作”的演讲接踵而至。年轻人很容易适应,而老一辈则反击,在关于什么是可以接受的人工智能使用的棘手辩论中寻找出路。如果 GPT 被允许开处方,那么全科医生一半的工作将在一夜之间消失,治疗师 70% 的工作可能也会消失——而且效果会更好。
黑箱问题:人工智能不断给我们带来惊喜
新兴能力甚至让创造者感到困惑。人工智能的黑箱行为促使人们加强对透明度和监管的研究。准备好迎接更多“它自学了做什么?”的时刻,推动更严格的监督。我再次感受到了那一刻,使用 Claude Sonnet 3.5 撰写营销文案,使用 GPT 4.5 和 Deep Research 进行研究。
公共叙事追随现实——为聪明人提供机会
普通投资者会低估人工智能在日常生活中的渗透程度,这为精明的投资者和技术专家提供了优势。人工智能不会从头条新闻中消失——它只是会悄悄成为基础设施,就像电力一样。
人工智能风暴肆虐,重塑了从地缘政治到日常工作流程的一切。是时候扎根、迅速适应并渡过接下来的难关了。
如果有一件事我很确定,那就是世界即将陷入疯狂小镇。
我的意思是,等到尼日利亚 419 诈骗者完全获得最新的 GenAI 工具的访问权限时,就可以使用 GPT-4.5/Claude Sonnet 3.7 后端进行实时高保真视频会议流。
没有人会再接听陌生来电。您需要预先共享的一次性密码才能知道来电者是否是他们本人。
OnlyFans 将成为OnlyBots。游戏不仅会让人上瘾,还会变成身临其境的增强现实,数百万人将愉快地放弃平凡的日常生活,享受他们以前只能梦想的生活。
当主流媒体大规模散布国家认可的宣传,而所谓的“开放”社交媒体平台被大量人工智能生成的角色所占领,真相淹没在合成噪音之下时,你会相信谁?