当前位置：首页 AI最新资讯正文

提升大型语言模型上下文学习能力的方法：输入更多字符

2023-11-15 AI最新资讯 49 0

🆕最新资讯🆕
基于 Transformer 的大型语言模型（LLM）已经展现出执行上下文学习（ICL）的强大能力，并且几乎已经成为许多自然语言处理（NLP）任务的首选模型。LLM 的训练使用的序列长度被称为上下文窗口，该窗口大小决定了模型可以处理的示例空间量，从而限制了其 ICL 能力。本文介绍了一种方法，通过增加模型的上下文窗口，可以提供更多的示例，从而提升模型的学习能力。此外，还介绍了一种改进的位置编码方法，用于解决位置信息编码的问题。最后，研究者提出了一种新的方法，可以扩展使用旋转位置嵌入（RoPE）的模型的上下文窗口，以实现更好的性能。具体方法和实验结果详见论文。
来源：https://www.jiqizhixin.com/

原文链接：https://aixinjiyuan.com/933.html，转载请注明出处~~~

0

广告位招租

评论0

请先

升级VIP
全屏浏览
夜间模式
返回顶部

暂时无公告