所有分类
  • 所有分类
  • 未分类

百川智能发布全新商用大模型:Baichuan2-7B比LLaMA更强

🆕最新资讯🆕
百川智能在最新发布会上推出了全新的商用大模型Baichuan2-7B,相比于LLaMA,它具有更强的能力。Baichuan2-7B是百川智能保持一个月发布一次大模型的最新作品,该模型经过微调后免费提供商用。根据百川智能CEO王小川的介绍,70亿参数量的Baichuan2-7B在英文主流任务上与130亿参数的LLaMA2相当。此外,百川智能还开源了Baichuan2-13B、Baichuan 2-13B-Chat以及其4bit量化版本,并公布了模型训练的详细介绍。Baichuan2系列大模型的数据取自万亿互联网数据和垂直行业,训练token规模达到2.6TB。这些模型支持多种语言,适用于学术研究、互联网、金融等领域。相比一代模型,Baichuan2数学能力提升了49%,代码能力提升了46%,安全能力提升了37%,逻辑能力提升了25%,语义理解能力提升了15%。此外,百川在infra层也做了优化,提高了训练性能。Baichuan大模型在参数和结构设置上尽量靠近LLaMA系列,以便用户能够直接从LLaMA换成百川的模型。百川智能还计划在明年推出更大规模的模型和超级应用。
来源:https://www.qbitai.com

原文链接:https://aixinjiyuan.com/732.html,转载请注明出处~~~
0
广告位招租

评论0

请先
暂时无公告
显示验证码
没有账号?注册  忘记密码?