第三财经网 2024-11-15 21:06 882
6月28日,OpenAI宣布推出CriticGPT,这是一款基于GPT-4的创新工具,专门用来揪出ChatGPT生成代码时的错误。就像用放大镜检查自家产品,CriticGPT能对ChatGPT的响应进行深度点评,协助训练师识别强化学习中的人工智能错误,提升训练效率。借助CriticGPT,训练师在RLHF(基于人类反馈的强化学习)中的表现提升60%,他们的纠错不仅更频繁,而且更精确。
随着ChatGPT的智能升级,其错误变得越来越隐蔽,给评估带来了挑战。CriticGPT应运而生,旨在成为评估高级AI输出的强大工具。举例来说,当ChatGPT被要求编写Python代码时,CriticGPT能够提出改进意见,提供更优的解决方案。OpenAI的实验显示,多数情况下,训练师更认可结合CriticGPT的修正建议,尽管它并非每次都正确,但无疑增强了训练师发现并修复模型问题的能力。
热门文章