🆕最新资讯🆕
数据是决定机器学习模型性能的重要因素之一,然而,训练大模型时缺乏高质量数据成为了制约因素。随着开源大模型的兴起,尤其是面向垂直行业的定制模型,高质量的行业数据变得尤为重要。然而,获取高质量数据并不容易,而且随着时间的推移,公开可用的中文高质量数据将越来越稀缺。为了解决这一问题,隐私计算成为了一个新的选择。隐私计算能够在保护数据安全的前提下对数据进行处理和使用,为数据开放和共享提供了一种安全的方式。然而,实际应用中的隐私计算还存在一些局限,包括对业务系统的修改、计算量的增加以及分布式训练的复杂性等。基于密码学和可信执行环境的方案也存在各自的问题。针对这些问题,本文介绍了一种新的解决方案,旨在保护高质量数据的隐私同时实现数据的共享。该方案通过联邦学习和同态加密等技术解决了数据安全和隐私保护的问题,为大模型训练提供了一种可行的方法。
来源:https://www.jiqizhixin.com/
原文链接:https://aixinjiyuan.com/728.html,转载请注明出处~~~
评论0