🆕最新资讯🆕
回顾两个月前,LLaMA2的开源使大模型领域的竞争格局发生了变化。LLaMA2在推理、编码、精通性和知识测试等任务中取得了巨大的性能提升,甚至在某些数据集上接近GPT-3.5。由于其强大的性能和开源特性,LLaMA2在发布后的一周内就收到了超过15万次的下载请求,并吸引了大量开发者进行二次创作。然而,大模型技术的进化速度常常超出预期。最近,一位选手在开源大模型社区中的关注度不断攀升,逐渐超越LLaMA2成为新晋顶流。在Huggingface社区,来自中国的百川智能公司成立仅五个月,其Baichuan系列是过去一个月全球下载量最高的开源大模型。这家公司以惊人的节奏保持着平均每月发布一款大模型的更新速度。Baichuan-7B在6月15日发布,Baichuan-13B在7月11日发布,8月8日发布了搜索增强大模型Baichuan-53B。9月6日,百川智能再次宣布重量级更新:Baichuan2-7B、Baichuan2-13B的Base版和Chat版同时开源,并提供Chat版的4bits量化,且均为免费可商用。这种平均28天发布一款大模型的迭代速度代表了中国开源力量迎头赶上的决心。迄今为止,Baichuan-7B和Baichuan-13B这两款开源大模型的下载量已经突破500万,其中仅一个月的下载量就超过300万。除了开发者,还有200多家企业申请部署开源大模型。未来的大模型竞争格局尚不确定,但可以想象,国产开源大模型的黄金时代应该不会太远。
来源:https://www.jiqizhixin.com/
原文链接:https://aixinjiyuan.com/1028.html,转载请注明出处~~~
评论0