首页>经济>行业

大模型赛道“终极跑”成绩，取决于技术成本与产品市场的契合度

2024年05月14日 14:58 | 来源：人民政协网分享到：

人民政协网5月14日电 5月13日，我国人工智能大模型独角兽公司零一万物，对外发布了其具有千亿参数规模的闭源模型Yi-Large。同样是在此次发布会上，零一万物Yi系列开源模型也迎来全面升级，据了解，Yi-1.5分为34B、9B、6B三个版本，且提供了Yi-1.5-Chat微调模型可供开发者选择。从评测数据来看，Yi-1.5系列延续了Yi系列开源模型的出色表现，在数学逻辑、代码能力全面增强的同时，语言能力方面也保持了原先的高水准。

在国际领先的底座模型之上，零一万物本月同步宣布了从应用到生态的产品线：2C 生产力应用“万知”正式提供服务、赋能2B 生态的“API开放平台”正式全球上线。

成立一周年之际，零一万物此次不仅公开开源闭源双轨大模型的战略布局，其“掌门人”、零一万物 CEO李开复还亲自拆解了发展计划背后的战略思路。

李开复表示，国内大模型赛道上的“竞跑”已从狂奔到长跑，终局发展将取决于各个选手如何有效达到“TC-PMF”（Product-Market-Technology-CostFit，即技术成本与产品市场的契合度）。大模型从训练到服务都很昂贵，算力紧缺是赛道的集体挑战，行业应当共同避免陷入不理性的“烧钱”打法，让大模型能够用健康良性的投资回报率（ROI）蓄能长跑，奔赴属于中国的AI2.0变革。

零一万物以全球为目标市场，基于全球领先的Yi系列模型做出符合TC-PMF的B端和C端优质应用，进而与行业携手推进AI2.0生态。中国市场的AI普惠必然到来，零一万物将结合国际经验，打造国内AI-First应用生态，实现“让通用人工智能普惠各地，人人受益”。

在第三方权威评测中，零一万物Yi模型在全球头部大模型的中英文双语 “PK”上表现出色。最新出炉的斯坦福评测机构 AlpacaEval2.0经官方认证的模型排行榜上，Yi-Large模型的英语能力主要指标LC Win Rate（控制回复的长度）排到了世界第二，仅次于GPT-4 Turbo，Win Rate更排到了世界第一，此前国内模型中仅有Yi和 Qwen曾经登上此榜单的前二十。而在中文能力方面，SuperCLUE更新的四月基准表现中，Yi-Large也位列国产大模型之首，Yi-Large的综合中英双语能力皆展现了卓越的性能。

从行业落地的角度来看，理解人类指令、对齐人类偏好已成为大模型不可或缺的能力，指令遵循（Instruction Following）相关评测也越发受到全球大模型企业重视。斯坦福开源评测项目AlpacaEval和伯克利LM-SYS推出的MT-bench是两组英文指令遵循评测集，AlignBench 则是由清华大学的团队推出的中文对齐评测基准。在中外权威指令遵循评测集中，Yi-Large的表现均优于国际前五大模型。

李开复表示，零一万物已启动下一代Yi-XLarge MoE 模型训练，将冲击 GPT-5 的性能与创新性。从MMLU、GPQA、HumanEval、MATH 等权威评测集中，仍在初期训练中的Yi-XLarge MoE 已与 Claude-3-Opus、GPT4-0409等国际厂商的最新旗舰模型互有胜负，训练完成后的性能令人期待。（崔吕萍）

编辑：秦云

人民政协报客户端下载 >

首页>经济>行业

大模型赛道“终极跑”成绩， 取决于技术成本与产品市场的契合度

友情链接：

大模型赛道“终极跑”成绩，取决于技术成本与产品市场的契合度