首 页 资讯 宏观 金融 行业 国企 民企 人物 新资讯

首页>经济>行业

大模型赛道“终极跑”成绩, 取决于技术成本与产品市场的契合度

2024年05月14日 14:58  |  来源:人民政协网 分享到: 

人民政协网5月14日电 5月13日,我国人工智能大模型独角兽公司零一万物,对外发布了其具有千亿参数规模的闭源模型Yi-Large。同样是在此次发布会上,零一万物Yi系列开源模型也迎来全面升级,据了解,Yi-1.5分为34B、9B、6B三个版本,且提供了Yi-1.5-Chat微调模型可供开发者选择。从评测数据来看,Yi-1.5系列延续了Yi系列开源模型的出色表现,在数学逻辑、代码能力全面增强的同时,语言能力方面也保持了原先的高水准。

在国际领先的底座模型之上,零一万物本月同步宣布了从应用到生态的产品线:2C 生产力应用“万知”正式提供服务、赋能2B 生态的“API开放平台”正式全球上线。

成立一周年之际,零一万物此次不仅公开开源闭源双轨大模型的战略布局,其“掌门人”、 零一万物 CEO李开复还亲自拆解了发展计划背后的战略思路。

李开复表示,国内大模型赛道上的“竞跑”已从狂奔到长跑,终局发展将取决于各个选手如何有效达到“TC-PMF”(Product-Market-Technology-CostFit,即技术成本与产品市场的契合度)。大模型从训练到服务都很昂贵,算力紧缺是赛道的集体挑战,行业应当共同避免陷入不理性的“烧钱”打法,让大模型能够用健康良性的投资回报率(ROI)蓄能长跑,奔赴属于中国的AI2.0变革。

零一万物以全球为目标市场,基于全球领先的Yi系列模型做出符合TC-PMF的B端和C端优质应用,进而与行业携手推进AI2.0生态。中国市场的AI普惠必然到来,零一万物将结合国际经验,打造国内AI-First应用生态,实现“让通用人工智能普惠各地,人人受益”。

在第三方权威评测中,零一万物Yi模型在全球头部大模型的中英文双语 “PK”上表现出色。最新出炉的斯坦福评测机构 AlpacaEval2.0经官方认证的模型排行榜上,Yi-Large模型的英语能力主要指标LC Win Rate(控制回复的长度)排到了世界第二,仅次于GPT-4 TurboWin Rate更排到了世界第一,此前国内模型中仅有Yi和 Qwen曾经登上此榜单的前二十。而在中文能力方面,SuperCLUE更新的四月基准表现中,Yi-Large也位列国产大模型之首,Yi-Large的综合中英双语能力皆展现了卓越的性能。

从行业落地的角度来看,理解人类指令、对齐人类偏好已成为大模型不可或缺的能力,指令遵循(Instruction Following)相关评测也越发受到全球大模型企业重视。斯坦福开源评测项目AlpacaEval和伯克利LM-SYS推出的MT-bench是两组英文指令遵循评测集,AlignBench 则是由清华大学的团队推出的中文对齐评测基准。在中外权威指令遵循评测中,Yi-Large的表现均优于国际前五大模型。

李开复表示,零一万物已启动下一代Yi-XLarge MoE 模型训练,将冲击 GPT-5 的性能与创新性。从MMLU、GPQA、HumanEval、MATH 等权威评测集中,仍在初期训练中的Yi-XLarge MoE 已与 Claude-3-Opus、GPT4-0409等国际厂商的最新旗舰模型互有胜负,训练完成后的性能令人期待。(崔吕萍)

编辑:秦云