AlphaGo之父认为AI走错了路

📅 2026-04-27 · 📁 research · 👁 0 阅读 · 🏷️ David SilverAlphaGo强化学习超级学习者AGI

💡 AlphaGo核心设计者David Silver创立价值数十亿美元的新公司，致力于打造AI「超级学习者」，挑战当前大语言模型主导的AI发展路线，引发行业对AI未来方向的深度反思。

引言：一位AI传奇人物的逆流宣言

David Silver，这个名字或许不像Sam Altman或Elon Musk那样频繁出现在科技头条，但在人工智能研究领域，他的分量举足轻重。作为DeepMind强化学习团队的核心负责人、AlphaGo项目的灵魂人物，Silver曾带领团队创造了AI击败人类围棋世界冠军的历史性时刻。如今，这位AI先驱公开表示：当前以大语言模型（LLM）为核心的AI发展路线可能走错了方向。

更引人注目的是，他并非仅仅停留在批评层面——Silver已经创立了一家估值高达数十亿美元的新公司，目标是打造一种全新范式的AI「超级学习者」（Superlearners）。

核心观点：大语言模型并非通往通用智能的正确道路

Silver的核心论点直指当前AI行业的最大共识。在他看来，以GPT系列为代表的大语言模型虽然在文本生成、对话交互等任务上表现惊艳，但它们本质上仍然是一种「模仿学习」的产物——通过海量人类文本数据进行训练，学会预测下一个词元（token）。这种方式存在一个根本性的天花板：模型的能力上限被人类已有的知识所束缚。

回顾AlphaGo的成功历程，Silver有充分的理由持这一立场。AlphaGo最初的版本确实从人类棋谱中学习，但真正实现质的飞跃是在其后续版本AlphaGo Zero中——该系统完全抛弃了人类棋谱数据，仅通过自我对弈和强化学习，从零开始探索围棋的奥秘，最终达到了远超人类的水平。

Silver认为，这一经验揭示了一个深刻的道理：真正强大的智能不应该仅仅复制人类已知的知识，而应该具备自主探索、发现新知识的能力。当前的LLM路线，本质上是在用越来越大的模型、越来越多的数据去逼近人类知识的边界，但永远无法突破这个边界。

新公司的愿景：打造AI「超级学习者」

Silver新创立的公司将「超级学习者」作为核心概念。虽然目前公司尚未披露全部技术细节，但从已知信息可以勾勒出其基本思路：

第一，强化学习优先。 与依赖静态数据集训练的LLM不同，超级学习者将以强化学习为核心驱动力，通过与环境的持续交互来积累经验和提升能力。这种学习方式更接近人类和动物在真实世界中的学习过程。

第二，自主发现能力。 超级学习者不仅要能解决已知问题，更要具备在未知领域自主探索和发现规律的能力。就像AlphaGo Zero发现了人类数千年未曾想到的围棋策略一样，Silver希望新一代AI能够在科学研究、药物发现等领域产生超越人类认知的突破。

第三，跨领域通用性。 不同于AlphaGo只能下围棋，超级学习者的目标是成为真正的通用学习系统，能够在多种任务和领域中展现出强大的自适应学习能力。

该公司已获得数十亿美元级别的估值，这在AI创业公司中属于顶级水平，反映出资本市场对Silver团队和这一技术方向的高度认可。

行业分析：一场关于AI路线的深层争论

Silver的观点并非孤立声音。近年来，越来越多的顶尖研究者开始对「规模即一切」（Scaling is all you need）的LLM路线提出质疑。图灵奖得主Yann LeCun多次公开批评当前LLM缺乏真正的世界模型和推理能力；Ilya Sutskever在离开OpenAI后也暗示，单纯扩大预训练规模的路线可能已接近瓶颈。

然而，反对的声音同样强烈。OpenAI、Anthropic、Google等公司的实践表明，通过扩展模型规模和数据量，LLM的能力仍在持续提升。GPT-4、Claude、Gemini等模型在推理、编程、多模态理解等方面的进步有目共睹。支持者认为，LLM并非简单的「模仿」，它们在训练过程中已经涌现出了某种形式的推理和泛化能力。

从更宏观的视角来看，这场争论的本质在于：通往通用人工智能（AGI）的最优路径究竟是什么？ 是继续沿着LLM的方向扩展规模，期待更多能力的涌现？还是需要引入强化学习、世界模型等全新的架构范式？抑或是将两者融合，走出一条混合路线？

值得注意的是，这些路线并不一定是互斥的。事实上，当前最前沿的AI系统已经开始融合多种技术。OpenAI的o1和o3系列模型就引入了强化学习来增强推理能力，这在某种程度上印证了Silver关于强化学习重要性的判断。

展望：AI发展的多元化未来

Silver的新征程代表着AI领域一个重要的信号：行业正在从LLM的单一叙事走向更加多元化的技术探索。这对整个AI生态而言是一件好事——多条技术路线的并行竞争，往往能催生出最具突破性的创新。

对于中国AI产业而言，Silver的思路同样具有重要的参考价值。当国内众多企业仍在大模型的参数竞赛中激烈角逐时，或许应该更多地关注强化学习、自主探索等方向的前沿进展。在通往AGI的道路上，能够率先找到正确范式的一方，将获得真正的战略优势。

当年AlphaGo落子如神，震惊世界。如今Silver再次出发，试图证明AI的未来不在于更大的模型，而在于更聪明的学习方式。这场关于AI路线的深层变革，或许才刚刚开始。