婴幼儿像实验室的强化学习智能体,而成年人则像越狱后的智能体。这种从“事实”到“价值”的跃迁,或许正是用虚构的奖励信号换取对延迟、抽象、反事实未来的操控力……刘伟
科学网APP
科学网微信
科学网bilibili
科学网抖音