AlphaGo之父认为AI走错了路

📅 2026-04-27 · 📁 research · 👁 0 阅读 · 🏷️ David SilverAlphaGo强化学习超级学习者AGI
💡 AlphaGo核心设计者David Silver创立价值数十亿美元的新公司,致力于打造AI「超级学习者」,挑战当前大语言模型主导的AI发展路线,引发行业对AI未来方向的深度反思。

引言:一位AI传奇人物的逆流宣言

David Silver,这个名字或许不像Sam Altman或Elon Musk那样频繁出现在科技头条,但在人工智能研究领域,他的分量举足轻重。作为DeepMind强化学习团队的核心负责人、AlphaGo项目的灵魂人物,Silver曾带领团队创造了AI击败人类围棋世界冠军的历史性时刻。如今,这位AI先驱公开表示:当前以大语言模型(LLM)为核心的AI发展路线可能走错了方向。

更引人注目的是,他并非仅仅停留在批评层面——Silver已经创立了一家估值高达数十亿美元的新公司,目标是打造一种全新范式的AI「超级学习者」(Superlearners)。

核心观点:大语言模型并非通往通用智能的正确道路

Silver的核心论点直指当前AI行业的最大共识。在他看来,以GPT系列为代表的大语言模型虽然在文本生成、对话交互等任务上表现惊艳,但它们本质上仍然是一种「模仿学习」的产物——通过海量人类文本数据进行训练,学会预测下一个词元(token)。这种方式存在一个根本性的天花板:模型的能力上限被人类已有的知识所束缚

回顾AlphaGo的成功历程,Silver有充分的理由持这一立场。AlphaGo最初的版本确实从人类棋谱中学习,但真正实现质的飞跃是在其后续版本AlphaGo Zero中——该系统完全抛弃了人类棋谱数据,仅通过自我对弈和强化学习,从零开始探索围棋的奥秘,最终达到了远超人类的水平。

Silver认为,这一经验揭示了一个深刻的道理:真正强大的智能不应该仅仅复制人类已知的知识,而应该具备自主探索、发现新知识的能力。当前的LLM路线,本质上是在用越来越大的模型、越来越多的数据去逼近人类知识的边界,但永远无法突破这个边界。

新公司的愿景:打造AI「超级学习者」

Silver新创立的公司将「超级学习者」作为核心概念。虽然目前公司尚未披露全部技术细节,但从已知信息可以勾勒出其基本思路:

第一,强化学习优先。 与依赖静态数据集训练的LLM不同,超级学习者将以强化学习为核心驱动力,通过与环境的持续交互来积累经验和提升能力。这种学习方式更接近人类和动物在真实世界中的学习过程。

第二,自主发现能力。 超级学习者不仅要能解决已知问题,更要具备在未知领域自主探索和发现规律的能力。就像AlphaGo Zero发现了人类数千年未曾想到的围棋策略一样,Silver希望新一代AI能够在科学研究、药物发现等领域产生超越人类认知的突破。

第三,跨领域通用性。 不同于AlphaGo只能下围棋,超级学习者的目标是成为真正的通用学习系统,能够在多种任务和领域中展现出强大的自适应学习能力。

该公司已获得数十亿美元级别的估值,这在AI创业公司中属于顶级水平,反映出资本市场对Silver团队和这一技术方向的高度认可。

行业分析:一场关于AI路线的深层争论

Silver的观点并非孤立声音。近年来,越来越多的顶尖研究者开始对「规模即一切」(Scaling is all you need)的LLM路线提出质疑。图灵奖得主Yann LeCun多次公开批评当前LLM缺乏真正的世界模型和推理能力;Ilya Sutskever在离开OpenAI后也暗示,单纯扩大预训练规模的路线可能已接近瓶颈。

然而,反对的声音同样强烈。OpenAI、Anthropic、Google等公司的实践表明,通过扩展模型规模和数据量,LLM的能力仍在持续提升。GPT-4、Claude、Gemini等模型在推理、编程、多模态理解等方面的进步有目共睹。支持者认为,LLM并非简单的「模仿」,它们在训练过程中已经涌现出了某种形式的推理和泛化能力。

从更宏观的视角来看,这场争论的本质在于:通往通用人工智能(AGI)的最优路径究竟是什么? 是继续沿着LLM的方向扩展规模,期待更多能力的涌现?还是需要引入强化学习、世界模型等全新的架构范式?抑或是将两者融合,走出一条混合路线?

值得注意的是,这些路线并不一定是互斥的。事实上,当前最前沿的AI系统已经开始融合多种技术。OpenAI的o1和o3系列模型就引入了强化学习来增强推理能力,这在某种程度上印证了Silver关于强化学习重要性的判断。

展望:AI发展的多元化未来

Silver的新征程代表着AI领域一个重要的信号:行业正在从LLM的单一叙事走向更加多元化的技术探索。这对整个AI生态而言是一件好事——多条技术路线的并行竞争,往往能催生出最具突破性的创新。

对于中国AI产业而言,Silver的思路同样具有重要的参考价值。当国内众多企业仍在大模型的参数竞赛中激烈角逐时,或许应该更多地关注强化学习、自主探索等方向的前沿进展。在通往AGI的道路上,能够率先找到正确范式的一方,将获得真正的战略优势。

当年AlphaGo落子如神,震惊世界。如今Silver再次出发,试图证明AI的未来不在于更大的模型,而在于更聪明的学习方式。这场关于AI路线的深层变革,或许才刚刚开始。