learn.ifix.xin / structured study

AI 自进化学习站

把一组分散的文章压缩成一个能顺着读、能横向比、也能直接追问的学习工作台。

6

主题模块

20

文章节点

6

入门首选

学习路径

六个模块看懂 AI 如何一步步学会改进自己

01

概念与思想起源

所谓“AI 自进化”到底是什么,它为什么会让人既兴奋又紧张?

这一组解决的是概念边界问题。Good 提出的不是“模型自动微调”这么窄的想法,而是一个更强的反馈回路:一个足够强的系统开始改进制造更强系统的过程本身。MIRI FAQ 把这条链条拆成定义、可行性与后果,而 2026 年的 TechCrunch 则把古老概念重新翻译成今天的工程语言:模型诊断自身短板、提出修改、验证修改、再继续下一轮。

  • “自进化”不是单次优化,而是会反复运行的改进闭环。
  • 核心不是模型会不会写代码,而是它能不能参与“改进 AI 本身”的完整链条。
  • 概念层面必须区分局部自优化、领域内自增强和广义递归自我改进。
  • 今天的讨论已经从哲学猜想转到工程问题:评测、验证器、反馈回路和安全控制。
02

自我对弈:AI 第一次自己变强

机器第一次“自己练自己”到底发生了什么?

自我对弈是 RSI 最容易理解的低风险原型。AlphaZero 的关键不是单纯赢棋,而是它证明:在规则明确、反馈清晰、胜负可验证的封闭环境中,系统可以不靠人类示范数据,仅凭自博弈和搜索快速超过人类长期积累。它展示了“自动生成训练数据 + 自动评估 + 自动迭代”这一最小闭环。

  • 自我对弈是 RSI 的第一个成功模板,但它依赖清晰规则和自动评分器。
  • AlphaZero 的成功来自环境闭合,而不是通用世界理解。
  • 它说明 AI 可以靠自生成经验变强,但不等于 AI 已能在开放世界里自进化。
  • 从封闭博弈走向现实世界,关键瓶颈是验证器和任务边界。
03

AI 自己发现算法

从学会下棋,到发明新算法,中间跨过了哪道坎?

这一组说明 RSI 的下一个层级不是“自己玩环境”,而是“自己改方法”。AlphaEvolve 把大模型的代码生成能力、自动评测器和进化搜索结合起来,用于算法发现和系统优化;AutoML-Zero 则更像前身,展示了从极简原子操作中重新长出基础学习算法的可能性。两者共同点是:评价函数仍然至关重要,AI 不是凭空发明,而是在可验证目标下搜索。

  • AI 真正开始“改进 AI”时,验证器比生成器更关键。
  • AlphaEvolve 代表的是“LLM + evaluator + evolutionary loop”的新范式。
  • AutoML-Zero 证明从低级操作重新发现算法是可能的,但计算代价极高。
  • 算法自发现目前更适合目标清晰、可自动评分的问题,而不是开放式研究。
04

让模型边用边学

为什么今天的大模型大多是“训练完即冻结”,而继续学习这么难?

这一组聚焦 RSI 最硬的一堵墙:持续学习。现有大模型会在训练结束后冻结权重,靠上下文窗口和检索临时补知识,但不会像人一样长期积累。Nested Learning 试图把模型视为多层嵌套、不同更新频率的优化问题,并借助 Hope 这样的自修改架构缓解灾难性遗忘。它不是简单增大上下文,而是改学习机制本身。

  • 持续学习的核心难题是学新东西时别把旧能力弄丢。
  • 上下文变长和真正会学习不是一回事。
  • Nested Learning 试图把“架构”和“优化器”统一看成多层学习系统。
  • Hope 之类原型显示方向可行,但距离大规模稳定落地还有很长路。
05

产业前沿:谁在押注自进化

为什么 2026 年资本和实验室突然重新追这条线?

这一组讲的是资金、组织和叙事如何把 RSI 从边缘概念拉回主舞台。Recursive Superintelligence 的大额融资表明,投资者相信下一阶段竞争不只是拼更大模型,而是拼谁能把模型、评测、研究自动化和开放式搜索串成更强飞轮。与此同时,主流媒体和研究机构也开始把“AI 帮助构建下一代 AI”当成现实中的近中期命题。

  • 产业界押注 RSI,本质上是在押注“研发自动化”会成为下一代护城河。
  • 资本现在接受的不是科幻叙事本身,而是更快的研究与系统优化闭环。
  • 创业公司常把 open-endedness、rainbow teaming、自动研究员等概念绑在一起讲。
  • 商业化落地短期仍集中在可评估的内部基础设施优化,而不是完全自治科学家。
06

另一种声音:冷静与质疑

为什么很多人认为“智能爆炸”未必会以人们想象的方式发生?

这一组的价值不在于泼冷水,而在于校正尺度。Chollet 的核心反驳是:智能从来不是脱离身体、环境、文化与工具的纯脑力变量;现实世界中的自改进系统通常受瓶颈、收益递减和外部摩擦限制,更像线性或 S 型增长,而不是无穷加速。IEEE 的报道则把这类怀疑更新到了 2026 年:即便实验室里出现越来越多自改进迹象,它们也很可能是‘带损耗的飞轮’,而非无上限爆炸。

  • 怀疑者并不否认 AI 会持续变强,否认的是无摩擦、无上限、瞬时爆炸。
  • 评估 RSI 时必须把环境摩擦、验证成本和真实世界约束算进去。
  • 单个模型的能力,不等于整个文明级认知系统的能力。
  • 真正值得警惕的,也许不是神话式奇点,而是更现实的研发加速与风险扩散。

推荐阅读

一张表看明白

“AI 自进化”不是一件事,而是四层能力台阶

层级它怎么变强谁来判分现实天花板
自我对弈自己生成训练数据,自己承担对手胜负结果封闭规则世界
算法发现提出代码候选,再用评测器淘汰与保留自动评分器 / benchmark / 系统指标必须可编程验证
持续学习边运行边更新记忆与参数结构新任务表现 + 旧任务保真灾难性遗忘与稳定性
产业 RSI把模型、评测、研究工具链串成研发飞轮研发速度、基础设施收益、可控性现实世界摩擦与安全治理

站内 AI 助教

把阅读清单压成一个可追问的老师

回答会优先引用站内知识结构,并主动标注限制与争议。

适合追问概念差异、历史脉络、技术限制和 2026 年产业含义。

关键判断

读完整个清单后,最值得留下的三条判断

今天最真实的自进化,不是“全面自治”,而是“局部闭环越来越多”。

AlphaZero 在封闭规则里闭环,AlphaEvolve 在算法评测里闭环,Nested Learning 试图在记忆更新里闭环。真正的突破不是一句“AI 会自我改进”,而是闭环范围在不断扩张。

验证器决定了这条路能走多远。

只会生成不算自进化。能不能自动知道“这次变得更好了吗”,才是把输出变成飞轮的关键。越难验证的任务,离真正 RSI 就越远。

最该警惕的不是神话式奇点,而是现实中的研发加速。

怀疑者反对的是无摩擦爆炸,不是能力提升本身。对组织和社会真正有影响的,是 AI 越来越深地进入 AI 研发、测试、安全和基础设施链路。

术语表

把讨论里最容易混掉的词先钉住

递归自我改进

AI 系统不只是完成外部任务,还参与设计、训练、评测或部署下一轮更强 AI 的闭环。

智能爆炸

Good 提出的假设:一旦机器在设计更强机器这件事上超过人类,可能触发加速增强循环。

自我对弈

代理通过与自己反复交互来生成训练数据和课程,从而提升能力。

灾难性遗忘

模型在学习新任务或新知识时显著丢失旧能力的现象,是持续学习的核心难题。

开放式进化

系统不追单一固定目标,而是在不断生成的新挑战和环境中持续适应和扩展能力。