to B要挣钱、to C要谨慎，李开复的大模型坚持

您的位置：首页 > 科技频道

to B要挣钱、to C要谨慎，李开复的大模型坚持

出处：北京商报作者：魏蔚网编：陶凤 2024-10-16

大中小
收藏
分享
打印
手机网页版

X 分享到微信朋友圈

打开微信，点击底部的“发现”，

使用“扫一扫”即可将网页分享至朋友圈。

10月15日深夜，零一万物的Yi-Lighting大模型在LMSYS盲测竞技场的投票数超过1万次，拿到了这个国际权威测试榜单的入场券，“出来的结果是，我们排在全球第六”，10月16日上午，零一万物CEO李开复向媒体宣布时一字一顿。为了强调，他还补充，“我们和马斯克（特斯拉CEO）的xAI Grok打平，并列第六，按公司算零一万物排在全球第四名。”

当天，他还向媒体公布并演示了to B战略下的行业应用产品AI 2.0数字人，这一产品聚焦零售和电商等场景。“to B就做国内，做有利润的解决方案”，李开复目标明确，面对国内C（用户）端市场，零一万物则会非常谨慎，“先不推出中国本土新的to C的应用”。

零一万物

预训练成本只是对手的1%或2%

“任何一个新的模型要有1万次投票才会进入这个榜单，昨天（10月15日）晚上，Yi-Lightning模型在LMSYS上终于达到了1万次以上的投票”，李开复邀请媒体体验LMSYS这个大模型擂台。

作为一个公益项目，LMSYS被认为是“大模型最强盲测”，援引这一榜单的科技大佬不止Open AI的CEO山姆·奥特曼和谷歌首席科学家杰夫·迪恩。

根据李开复公布的总榜单，零一万物的Yi-Lightning排在Open AI、Google和xAI的大模型之后，全球排名第六。具体到分榜，在中文分榜，Yi-Lightning与o1-mini 等模型并列排名世界第二；在多轮对话分榜，排名第三；数学、代码分榜上，Yi-Lightning分获第三、第四名；艰难提问、长提问榜，Yi-Lightning都取得第四名。

据了解，Yi-Lightning是零一万物开发的Yi系列大语言模型，支持上下文16K，是零一万物最新高性能模型。根据内部评测数据，在8xH100 算力基础下，以同样的任务规模进行测试，Yi-Lightning 的首包（从接收到任务请求到系统开始输出响应结果之间的时间）时间是Yi-Large的一半，最高生成速度提升近四成。

李开复介绍时，则向媒体重复强调了成本。

“我们知道xAI在训练Grok时是几万张的GPU（图形处理器），现在囤了10万张GPU。我们这次预训练只用2000张GPU训练一个半月，花了300多万美元，做出来的预训练模型跟Grok打平，却只花了它1%或2%的成本”，李开复表示满意。

他也再次重申，“零一万物绝不放弃预训练。做好预训练是一个技术活，要非常多有才华的人在一起慢工出细活。如果一个公司有幸拥有懂芯片的、懂推理的、懂基础架构的、懂模型的，有很多的做算法的人才能跨领域合作，我相信中国绝对可以做出世界排名前十的预训练通用模型”。

把时间差保持在6个月就很好

“但做这件事的成本比较高，以后可能做预训练的大模型公司会越来越少，”李开复话锋一转，“据我所知，大模型‘六小虎’（包括零一万物、百川智能等六家独立大模型初创公司）的融资额都是够的，我们做一次300万美元，这个钱头部公司也付得起。”

还是围绕着榜单做对比。GPT-4o是Open AI在5月14日推出的大模型，在最新的LMSYS总榜中，排在Yi-Lightning之后。“我们在10月把GPT-4o打败了，所以零一万物和美国顶尖模型的时间差只有5个月”，李开复说。

时间差是个老话题，从2023年初国内大模型扎堆上线，被一个又一个大佬回答过。这个问题重要与否见仁见智。不论得到的时间是多少，都证明了一点——差距依然存在。

“缩短时间差非常困难，毕竟人家10万张GPU，我们2000张。能达到这个效果是因为团队优秀，再加上研发有特色，用这套方法把时间差保持在6个月左右，已经是很好的结果了。如果要破局，可能需要一个前所未有的算法才有机会”，李开复同时告诉媒体，“千万不要认为落后6个月是很羞耻的事情，如果用类似零一万物的打法，我认为可能不止我们一家能把时间差控制在6个月，但难度不低。”

零一万物

0.99元/100万Tokens，不参与价格战

另一个层面的控制体现在价格上。目前，Yi-Lightning已在Yi大模型开放平台上线，0.99元/100万Tokens。

一般来说，国内大模型企业普遍用1000Tokens定价。以科技大厂阿里云为例，官网列举的通义千问系列大模型qwen-turbo相对较低，营销活动后的输入价格是0.0003元/1000Tokens、输出价格0.0006元/1000Tokens，即分别是0.3元/100万Tokens、0.6元/100万Tokens。

“这个定价确实具有显著优势，在竞争激烈的AI市场中，价格优势往往能成为吸引用户的关键因素”，北京市社会科学院副研究员王鹏向北京商报记者表示。

在和媒体沟通时，李开复三次提到这个价格，他承认这是白菜价，但也直言“零一万物还是有利润空间的，不参与价格战”。

除了性能、价格，零一万物对市场也有自己的坚持。

当天零一万物推出to B新产品AI 2.0解决方案，把Yi Lightning 实践于具体行业解决方案。基于以Yi Lightning模型为代表的Yi模型，零一万物搭建起了包含角色大模型、直播声音大模型、电商话术大模型在内的一整套专用模型基座。

在回答to B、to C选择的问题时，李开复告诉媒体，“一个大模型公司同时做to B、to C是很辛苦的，需要多元化的管理方式。选择在国内做to B，是因为我们找到了一些破局的空间，比如用数字人来做零售、餐饮等，能做一个完整的解决方案。我觉得这样的to B只能在中国做，to B就做有利润的解决方案，而不只是卖模型，不只是做项目制”。

对于to C，零一万物的主要布局在海外。在他看来，流量成本是大模型to C的很大问题，“在这样的挑战环境里我们会非常谨慎，我们先不推出中国本土新的to C的应用，已有的产品还会继续维护”。

零一万物的思路适合整个大模型行业吗？“C端用户没有很强的付费需求和意愿。想依靠他们来实现盈利，短期来看是不切实际的，”瑞达恒研究院经理王清霖告诉北京商报记者，“B端市场为了提高效率、跟上时代步伐、吸引投资人的注意力，可能有一些是相对刚需的购买意愿。如真的能够切入某一类或者某一个领域，了解他们的需求，是有可能抢占市场先机的。”

北京商报记者魏蔚

深蓝智库企业社会责任峰会智慧康养论坛十大商业品牌商业高峰论坛金融业十大品牌酒业价值榜餐饮十大品牌

@北京商报

新闻排行