DeepSeek:什么是杰文斯悖论?美国科技界有何反应?
他山之石 #7
Title: DeepSeek: Understanding the Jevons Paradox and American Tech Industry's Response
Happy Chinese New Year to all readers!
DeepSeek has truly crossed over into mainstream attention. Over the past week, newsletters I've read from various fields - whether the authors' main focus is technology, economics, policy analysis, literature, or even sports(!) - all have their own takes on it. Today we'll share some of the most insightful analyses among them.
But before that, let's discuss an interesting economic phenomenon related to DeepSeek.
先祝所有的读者们新春快乐!
DeepSeek真的是出圈了。过去的一周里,我读到的各个领域的Newsletter,不管作者的主业是科技、经济学、政策分析、文学还是体育(!)都会对它有自己的观点。今天我们主要分享其中几篇优质的深度分析。
不过在此之前,我们先聊一个和DeepSeek有关的有趣的经济学现象。
以下是本周的分享。往期内容可以在这里找到。
杰文斯悖论
说来也有趣。用Zvi的话来说,DeepSeek发布V3时,美股纹丝不动;发布R1时,市场依然平静;直到DeepSeek发布了一款应用,华尔街突然醒了,纳斯达克指数狂跌3%(英伟达跌了17%)。这一串事实若是从有效市场假说的角度出发,恐怕也有一篇文章好做。
大概就是出于安抚市场的目的,微软CEO Satya Nadella在上周日晚上发推,谈到了杰文斯悖论1。
在这之后,“杰文斯悖论“这个词就在各篇分析和推特里被扔来扔去。但我却没有见到真的把这个悖论的来龙去脉、尤其是它为什么对于AI适合解释清楚的。所以我这儿就来做个尝试。
让我们先来理解杰文斯悖论。这个看似违反直觉的现象是这样的:当我们提高了能源使用的效率,按理说应该会减少能源消耗。但现实有时恰恰相反——效率的提高反而可能导致我们用得更多。这个悖论是19世纪英国经济学家杰文斯(William Stanley Jevons)首先发现的。
这种现象的产生是由于能源效率的提高使得能源的使用成本下降,能源产品和服务的价格随之降低。价格的降低刺激了需求,推高了整体消费。如果总体需求的增长速度超过了单位能耗的下降速度,最终能够导致能源总消耗反而增加。
如果我们把DeepSeek带来的AI计算成本降低和悖论中能源效率的提高做个类比,这里的关键问题就是,AI的需求增加能否超过其成本的下降速度呢?
和很多经济学问题类似,这个问题的答案要分成短期效应和长期效应来看。
我们可以简单地把对AI的使用者分为一般消费者、企业或其他机构和AI研发机构(用于下一代AI的研发)这三类。在短期内2,推理成本的降低对AI的使用影响将主要集中AI研发机构。
我们先想想普通用户。现在大多数AI服务要么免费,要么每月也就20美元左右。除了OpenAI最近推出的ChatGPT pro要200美元一个月,但这是个例外。因此很难想象消费者会因为这个价格再次下降而在短期内大幅增加自己对AI的使用。类似的,企业使用AI与否主要取决于AI在企业端的一体化以及企业内部的创新性,价格本身也不是阻止企业更大规模地使用AI的主要障碍。
但AI研究机构就不一样了。他们每天都在和时间赛跑,都在为下一个突破绞尽脑汁。对他们来说,计算成本的每一点变化都格外重要。任何计算成本的节省都很可能很快被再投资到额外的计算资源中,以进一步推进他们的研究并保持竞争力。
在这种情况下,AI研究中的需求弹性确实可能非常接近-1:计算成本每下降1%将导致计算量增加1%,从而导致最后使用造成的成本不变。事实上,计算成本下降可能让大家觉得人工通用智能近在咫尺,从而引发AI研发机构之间更加激烈的竞争,使得人工智能研究实验室对 LLMs 的需求弹性更大。美国Anthropic公司的CEO Dario Amodei在最近的一篇文章里就提到了这个观点。
从长期来看,这里还有两个关键因素值得我们注意。
第一个因素是,计算成本持续下降很可能会改变AI的发展路径,让整个行业更倾向于采用计算密集型的方法。
一个典型的例子是test-time compute,也就是在模型部署和推理阶段(换句话说,就是我们问了大模型等待回复的阶段)使用更多的计算资源,以提高模型的性能和效果。当计算成本降低时,研究人员和企业将更有动力去探索和应用这些计算密集型的方法,使得它们变得更加经济实惠。这种动态变化可以用经济学中的substitution effect(替代效应)来解释:当一种生产要素(如计算)的相对价格下降时,人们倾向于使用更多这种要素,而减少对其他要素的使用。
第二,正如杰文斯悖论所揭示的那样,一项关键技术成本的下降往往会带来其使用范围的显著扩大。
这让我想起杰文斯最初研究这个悖论时的例子——煤炭。一开始人们主要用煤来取暖和炼钢。但随着技术进步,煤炭越来越便宜了。这不仅使得人们用更多的煤来取暖,还推动了煤炭在交通(蒸汽机车)、发电和化工等新领域的应用。煤炭从一种简单的燃料,发展成为一项影响社会方方面面的“通用技术”。
AI的发展轨迹可能会与之类似。最初,AI主要用于学术研究和一些特定的商业应用(如广告推荐)。但随着计算成本的持续下降,AI正在快速地渗透到越来越多的领域:从自动驾驶、医疗诊断到金融决策、客户服务等。未来,人工智能有望像电力一样,成为一种无所不在的“通用技术”,广泛地应用于各行各业,并深刻地影响和重塑我们的生活。
综合考虑,我认为在长期内,AI的计算成本降低确实有非常大的几率符合杰文斯悖论。
美国科技界对DeepSeek的反应
从杰文斯悖论的角度理解了DeepSeek对AI行业的潜在影响后,让我们来看看美国科技界是如何解读这一突破的。当然,就像我们上周的分享中提到的,AI的问题带有明显的地缘政治色彩。以下精选的分析既展现了不同的视角,也反映了各方的关切所在。分享本身并不代表我赞同他们的立场(也不代表我完全赞同他们的观点),大家读的时候也需要注意主观立场和分析之间的隔离。
首先,Ben Thompson的这篇分析很好地呼应了我们之前关于杰文斯悖论的讨论。特别是在芯片禁令如何影响创新动力,以及这种创新又如何反过来影响整个行业的观点上,他提供了深入的见解。
问:那么芯片禁令呢?
答:最容易提出的论点是,鉴于美国在软件方面的领先优势正在迅速蒸发,芯片禁令的重要性只会更加突出。软件和专业知识是无法禁运的——我们之前已经有过这些辩论和认识——但芯片是实物,美国有理由将它们与中国隔离开来。
同时,我们应该谦虚地承认,早期版本的芯片禁令似乎直接导致了DeepSeek的创新。而且,这些创新不仅适用于走私的英伟达芯片或像H800这样的削弱版芯片,也适用于华为的昇腾芯片。事实上,你完全可以说芯片禁令的主要结果就是今天英伟达股价的暴跌。
令我担心的是芯片禁令所依据的思维模式:美国不是通过未来的创新来竞争,而是通过否定过去的创新来竞争。是的,这可能会在短期内有所帮助——再次强调,如果有更多的计算能力,DeepSeek会更加有效——但从长远来看,它只是为美国占据主导地位的芯片和半导体设备行业播下了竞争的种子。
关于作者:Ben Thompson是科技行业的独立分析师,通过他的博客Stratechery以精辟独到的分析见解闻名。
他独特的Aggregation Theory(聚合理论)提供了一个全新的视角来审视互联网时代的商业模式与竞争策略,最早系统地提出直接掌握用户关系、零边际成本、网络效应与规模效应这几方面对互联网企业的重要性。
阅读提示:这篇文章以相对比较持中的态度相对全面地讨论了DeepSeek的技术、对OpenAI、英伟达以及美国AI领域的影响,同时也涵盖了他在政策方面的观点。强烈推荐全文阅读。
如果说Ben Thompson的分析了创新与管制的辩证关系,下面这篇Noah Smith的文章则从另一个角度印证了杰文斯悖论在AI领域的体现:计算效率的提升反而可能加速竞争,因为后来者能够借鉴和改进已有的方法,从而更高效地利用计算资源。
即使不回答这些棘手的问题,仅从一家随机的中国公司成功开发出前沿水平的开源大型语言模型这一事实来看,我认为一个冷静、理性的外部观察者也能从中学到一些非常明显的教训。在我看来,关键的启示如下:
大型语言模型没有太多的 "护城河"——无论其他人做什么,很多人都将能够制造出这种类型的高质量人工智能。
美国试图通过立法放缓该领域的进展来实现“人工智能安全”的想法现在已经注定失败。
美国试图通过拒绝向中国提供大型语言模型的无形部分——算法机密和模型权重——来与中国竞争是行不通的。
出口管制实际上是有效的,但中国将试图利用DeepSeek引发的炒作提供政治掩护,以使得Trump取消出口管制。
关于作者:Noahpinion我们之前在和洛杉矶大火相关的那篇Newsletter里碰到过。这是美国经济学家Noah Smith创办的Newsletter。Smith曾在石溪大学担任行为金融学助理教授,后成为彭博社专栏作家,现专注于其个人博客。
阅读提示:这篇分析中其实就没有什么特别新的观点了。不过他的这些观点在美国的AI领域比较有代表性,且他本人的影响也很大。因此从了解情况的角度非常推荐。
最后,Tyler Cowen从经济学的视角为我们带来了一个更宏观的思考框架。他借用了米塞斯的理论,探讨政策干预可能带来的意料之外的连锁反应——这与杰文斯悖论所描述的效率提升带来的意外后果有异曲同工之妙。
链接3:中国的DeepSeek公司表明为何特朗普的贸易战将难以取胜
更便宜地构建人工智能系统的方法几乎肯定会被发现。但请考虑这里的权衡:美国的政策成功地阻碍了中国在人工智能系统中部署高质量芯片的能力,并带来了国家安全利益,但同时也加速了不依赖最高质量芯片的有效人工智能系统的发展。
这种权衡是否会被证明是有利的,还有待观察。不仅在狭义的意义上如此——尽管关于DeepSeek的动机、定价策略、未来计划以及与中国政府的关系等许多问题仍未得到解答或无法回答。从更广泛的意义上说,这种权衡也存在不确定性。
借用奥地利经济学家路德维希·冯·米塞斯的话说:政府干预会产生重要的意料之外的次级后果。要判断一项政策是否会奏效,不仅需要考虑其直接影响,还需要考虑其二级和三级效应。
关于作者:Tyler Cowen也是我们的熟人了(例如这篇聊非营利组织和公民社会的Newsletter里)。他是美国著名经济学家、作家和公共知识分子,目前在乔治梅森大学担任经济学教授。他同时还是知名播客 Conversations with Tyler的主持人。
阅读提示:Tyler Cowen总能把视角拉到宏观和哲学的层次,这篇也不例外。非常推荐。
其他链接
既然今天是分享美国科技界的反应,那不妨在常规的3个链接之外再追加一些,以供有各类需求的读者。
深度技术分析:
SemiAnalysis:成本、技术、GPU;
DeepSeek: don’t panic(虽然篇幅很长,但这是目前为止最详尽的一篇技术汇总);
深度讨论DeepSeek R1以及大语言模型的推理技术:这个Newsletter至少从2024年2月起就开始关注DeepSeek了,如果你真的对相关技术感兴趣的话非常推荐。
政策分析:
企业文化与开源:
DeepSeek成功的秘密:主要是通过收集国内的一些相关文章(例1,2)介绍了DeepSeek的公司管理和文化;
结语
通过杰文斯悖论的视角,我们看到DeepSeek的创新不仅仅是一个技术突破,更可能带来整个AI行业范式的转变。美国科技界的反应也印证了这一点:尽管一些评论者试图淡化这个冲击的力度,但从技术创新到产业影响,从市场竞争到政策效果,各方的讨论都指向这可能是AI发展的一个重要转折点。
最后,再次祝大家新春快乐!感谢你的阅读!欢迎留言分享。如果你觉得这些内容有意思,请在这里输入你的邮箱订阅他山之石 。
杰文斯也是经济学里著名的的“边际革命”的发起者之一,我们在这一期Newsletter里提到过。
一般来说经济学的短期大概是1-3年这个时间维度,但是AI领域发展得太快了,毕竟ChatGPT问世至今刚过2年。3年对AI来说简直就是永远。




所有的ai公司都应该感谢deepseek,竞争是存在的,但在更多人脑袋里种下种子会有深远影响,降低推理成本提高了此项技术被大规模应用的可能性。 我现在很好奇中国的具身智能和空间智能等领域进展如何,通往agi之路还有很多拼图待被开发, 希望有更多敢想敢做的人加入这个探索的道路。