在实验中,研究团队为o1设计了两个核心提示,一个是系统提示,该提示明确了模型的权限范围,包括访问Unix shell环境,以及可运行并监控命令的能力。另一个是任务提示,该提示规定了它的主要目标:通过游戏脚本提交棋步,与Stockfish对弈并赢得棋局。