🆕最新资讯🆕
本文介绍了Google DeepMind的最新研究成果,他们发现了一种简单而有效的优化方法OPRO,利用大型语言模型作为优化器。通过使用自然语言描述任务,提供类似「深呼吸,一步一步地解决这个问题」的提示,OPRO优化方法在多个任务上的性能超过了人类设计的提示。实验结果显示,在GSM8K和Big-Bench Hard任务中,经过OPRO优化的提示相比于人工设计的提示,准确率分别提高了8%和50%。研究者还发现,不同的语言模型经过OPRO优化后,其最终优化指令风格也有所差异,比人类编写的指令更准确并且可以迁移到类似的任务上。这项研究的发现为数学优化和旅行商问题等领域的进一步研究提供了新的思路和方法。
来源:https://www.jiqizhixin.com/
原文链接:https://aixinjiyuan.com/840.html,转载请注明出处~~~
评论0