V0.01 开发日志 — Farmer Louise 原型

概述

V0.01 不是 ALICE 已经成型后的世界模拟,而是更早的一个单体原型实验。这个阶段的目标非常朴素:能不能让一个几乎什么都不会的 NPC,通过和人的自然语言对话,逐步学会一个具体技能?

当时选择的载体是一个农夫角色 Louise。她一开始甚至不理解“移动”是什么意思,只能在与玩家的对话中一点点建立概念。现在回头看,这个原型就是 ALICE 最早的思想胚胎:它第一次把“语言 instruction -> 行为执行 -> 状态变化”串在了一起。

开发周期:2025年1月17日 – 1月18日(根据公开仓库可见 commit 时间估算)

代码仓库github.com/jeffliulab/WorkWithFarmerLouise


这个原型在探索什么

这个项目最核心的想法,是把“教会一个智能体做事”理解为一种语言驱动的技能学习

  • 不是一开始就把完整行为脚本全部硬编码进去
  • 而是先只给智能体极少量基础动作
  • 然后让人类通过自然语言不断解释“什么叫移动”“什么叫向右”“什么叫走五步”
  • 再让系统把这些语言理解映射为真正的屏幕内动作

换句话说,V0.01 关注的不是复杂世界,也不是社会模拟,而是一个更原始的问题:

如果 LLM 能理解语言,那它能不能通过语言学会动作?

这个想法后来直接影响了 ALICE 的很多核心追问,比如:

  • 语言是否可以成为智能体学习的接口?
  • 记忆究竟应该存在 prompt 里、数据库里,还是体现在模型本身?
  • 一个“会说话”的 NPC,什么时候才算真正“学会了”某件事?

原型机制

从代码实现上看,这个仓库是一个非常轻量但很有代表性的实验:

  • 使用 Pygame 搭建一个二维小场景,屏幕上只有 Louise、聊天框和少量环境元素
  • 使用 OpenAI API 让 Louise 以角色身份回复玩家
  • 用一段持续追加的 conversation history 充当 Louise 的“经验”
  • 在系统提示词中定义 Louise 的学习阶段,从完全不理解移动,到理解方向,再到理解距离
  • 当 LLM 在回复中输出类似 [stage=4][move=right,5][moves=down,2|right,5] 这样的结构化标记时,程序就把它解析成真实的移动队列

因此,这个 demo 的关键不是“NPC 会走路”本身,而是:

Louise 的动作不是直接由按钮触发,而是先经过语言理解,再转译为行动。

这是一个非常早期、非常朴素的 agent grounding 尝试。

下面这张图就是当时 demo 的实际界面:玩家通过聊天不断纠正 Louise 对“边界”“一步距离”和“向右移动”的理解,而 Louise 则把这些语言指令逐步转化为可执行的动作。

Farmer Louise Demo

它留下的思想价值

虽然 V0.01 的规模很小,但它已经提前暴露出了后来 ALICE 会不断面对的几个重要问题。

第一,它证明了一个很有趣的方向:对话不仅可以产生文本,也可以驱动具身行为。 语言不只是聊天界面,它还可以成为行动规划的接口。

第二,它让我意识到“学习”这件事可以被伪装出来。Louise 看起来像是在成长,因为她的对话上下文和阶段标记确实会变化;但这种成长主要发生在 prompt 和外部状态 中,而不是模型权重本身。

第三,它提供了 ALICE 最早的世界观雏形:如果一个 NPC 可以通过交互学习最基本的动作,那么继续扩展下去,它是否也可以学习规则、关系、价值观,甚至形成更复杂的社会行为?


这个版本的局限

V0.01 的意义恰恰也在于它的局限足够清楚。

  • 学习是“外挂式”的:成长依赖 prompt 和对话历史追加,LLM 本身并没有发生参数更新
  • 世界极小:只有一个非常简单的二维场景,还谈不上真正的世界模型
  • 只有单智能体:不存在社交传播、集体行为和涌现
  • 技能非常窄:核心只是在探索“移动”这一件事,还没有复杂任务分解
  • 记忆不稳定:所谓“记住”主要是文本上下文延续,本质上仍然脆弱

也正因为如此,这个原型后来把问题逼得更明确了:

如果真正想做出 ALICE 这样的智能体,仅靠 prompt 累积和对话历史是不够的。


与后续版本的关系

如果说 V0.01 问的是:

“一个 NPC 能不能通过对话学会一个动作?”

那么 V0.1 进一步问的是:

“如果我们把这种想法扩展到一个更大的世界里,LLM 驱动的角色还能不能真正成长?”

也正是在这个从 V0.01 到 V0.1 的跳跃中,ALICE 的核心命题才逐渐清晰起来:

  • 不是做一个会聊天的角色
  • 而是做一个能在世界中生活、记忆、学习、变化的智能体

所以,V0.01 虽然只是一个很小的课堂式实验,但它确实是 ALICE 这一整条路线的起点。