🆕最新资讯🆕
深圳一家名为衡宇的公司成立仅5个月,团队规模不到10人,却积极挑战人工通用智能(AGI)的研究。他们在过去一年中,在CVPR、ICML、ECCV等顶级学术会议上发表了16篇与大模型相关的论文,其中一篇论文还被提名为ACL 2023最佳论文。衡宇的成果不仅限于论文发表,他们开发的模型在C-Eval榜单上取得了不错的成绩,并在中文能力上击败了ChatGPT和Claude-v1.3。该团队打造的自研大模型GS-LLM在C-Eval榜单上一直保持前列位置,其参数规模从7B到130B不等,根据用户需求灵活调整。衡宇的核心竞争力之一在于他们构建了完备的训练框架,并重视数据质量。他们通过清洗大量文本数据,持续提高模型的训练质量。此外,衡宇还有一个独特的创意,即打造一个数据精炼工厂,将训练好的参数数据进行共享和交易,以提高模型效率和降低成本。衡宇团队的成就令人瞩目,尽管团队规模较小,但他们通过精英团队的高效合作,取得了令人称赞的成果。
来源:https://www.qbitai.com
原文链接:https://aixinjiyuan.com/919.html,转载请注明出处~~~
评论0