目前的国际主流大模型数据集以英文为主。建议:一、联合研究出台关于版权数据用于大模型训练的司法支持政策,在确保数据来源合法的情况下,降低版权数据使用的侵权法律风险。二、降低版权数据用于大模型训练的成本,促进版权数据开放用于大模型训练。三、建设央企大模型数据开放集群,打造大模型的产业应用集群,实现高质量发展。
编辑:李敏杰