OpenAI的o1模型是首个采用强化学习策略内化思维链技术的LLM,在医学领域的表现尚未明确。研究人员通过35个医学数据集和2个新问答数据集,评估了o1在理解力、推理能力和多语言能力方面的表现。实验结果显示o1在多数医学任务上表现优越,但在中文医疗代理任务中性能下降,且解码时间较长。研究指出需要更精确的评估工具和改进用户指导策略,以实现AI医生目标。
OpenAI发布了新的大语言模型o1,专注于逻辑推理优化,其推理能力在多个领域超越现有模型。o1模型通过思维链模式训练,提升了数学、编程、科学问题解决能力。在AIME和GPQA测试中表现优异,超越人类专家水平。o1模型使用大规模强化学习算法,强调思维链和强化学习的重要性。OpenAI未向用户展示原始思维链,但提供摘要。o1模型目前可供ChatGPT Plus订阅用户使用。