您的位置: 首页 > 科技频道

大模型2023:“iPhone时刻”的将至与未至

出处:北京商报 网编:产经中心 2023-12-27

站在2023年年尾,阿尔特曼发出了一份感性十足的年终总结,他说这真是疯狂的一年,但更重要的是,“我很高兴2023年是世界开始认真对待AI的一年”。

这一年AI爆炸,凭借着ChatGPT的横空出世,OpenAI一跃成为全球科技圈最瞩目的新秀,其前所未有的智能涌现和自然语言交互能力以及衍生的巨大想象空间,不仅掀起了新一轮人工智能的热潮,也仿佛开启了下一个时代的序幕,全世界为之疯狂。

国内,没人想错过这趟时代的列车。一场轰轰烈烈的“百模大战”随即开启,大厂、小厂、互联网老将、学术派纷纷下场。

和开始时不同,神话祛魅、激情正回归理性。依然像阿尔特曼所言,虽然人们对AGI(通用人工智能)的呼声超出了他的预期,但可能让大家失望的是,2024年仍无法实现这一目标。

北京商报

追赶、分化与成型

2023年3月,英伟达的GTC大会上,CEO黄仁勋依旧一身黑色皮夹克亮相。大会上,黄仁勋说,人工智能的“iPhone时刻”已经开启。

四个月前,OpenAI推出ChatGPT。不过短短两个月,ChatGPT月活用户过亿,成为历史上用户增长速度最快的消费级应用程序。

“AIGC卷起来的那一夜”背后是人工智能在ChatGPT的引导之下全面爆发,掌握着“算力命脉”的英伟达也一并走入聚光灯下。

而这“最卷一夜”的一周前,百度大语言模型产品“文心一言”正式发布,国内浩浩荡荡的百模大战也正式画出了一个起点。

SuperCLUE是国内中文模型评测机构之一,在其发布的《SuperCLUE中文大模型基准测评报告,2023》中,国内大模型的进展大致被分为三个阶段,分别为准备期、成长期和爆发期。

ChatGPT的发布是故事的起点,也是准备期的起点。SuperCLUE联合创始人兼首席运营官朱雷对北京商报记者回忆说,那是一个又迷茫又震惊的阶段,但在那个阶段一种共识也迅速达成,就是大模型非常重要。

此后,以OpenAI发布GPT4.0、百度发布文心一言1.0、科大讯飞发布星火1.0等为代表,国内大模型进入成长期,数量和质量逐渐增长。

7月左右,各行各业开源、闭源大模型层出不穷,“百模大战”竞争态势越发明显。有数据统计,截至2023年10月,我国拥有10亿参数规模以上大模型的厂商及高校院所共计254家,分布于20多个省市/地区,国内大模型总数达238个。

12月22日,国内首个官方“大模型标准符合性评测”结果出炉。阿里云、百度、360、腾讯四家企业旗下的大模型产品首批通过测评,代表着其在通用性、智能性等维度均达到国家相关标准要求。

这一测评结果仿佛也印证了朱雷的猜测:当下国内大模型的竞争格局基本确定,主要玩家已完成不同规模模型的发布,再杀出一匹黑马的可能性越来越小。

从SuperCLUE的测评结果来看,国内大模型整体进步明显,综合能力超过GPT3.5的模型共有8个,包括百度的文心一言4.0、零一万物的Yi-34B-Chat、月之暗面的Moonshot等。

但国内外大模型依然存在差距。GPT4-Turbo以89.79分的成绩领先,国内排名第一的文心一言4.0总分则为74.02分。整体而言,国外代表性模型平均成绩为71.23分,国内代表性模型平均成绩为60.48分。

近期,著名人工智能和大数据专家、清华大学电子工程系兼职教授窦德景也表示,国内大模型目前达到GPT-3.5水平,离GPT-4还有一定差距,但差距在缩小。

不是100个大模型,而是100万应用

2023年11月初,OpenAI又放了大招。

首届开发者大会上,除了堪称王炸的GPT-4 Turbo以及“加量不加价”的好消息外,真正可能影响未来的,则是GPTs的推出。

GPTs是AI Agent初期形态产品。用户仅仅通过跟GPT Builder聊天,把想要的GPT功能描述一遍,就能生成专属GPT。

在业内,这也被认为是继ChatGPT之后的又一个“杀手级应用”。更重要的是,定制化的GPT还能上线GPT Store,实现变现。

一个新的“iPhone时代”更近。

“人类进入AI时代的标志,不是产生很多的大模型,而是产生很多的AI原生应用。”百度创始人、董事长兼首席执行官李彦宏曾如此说道。

按照李彦宏的解释,大模型本身是一个基础底座,类似操作系统,最终开发者要依赖为数不多的大模型来开发出各种各样的原生应用。“AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。”

而百万量级应用的想象空间则很可能会由多模态所填充——如果说年初的焦点属于大语言模型,那么年末的焦点就一定是多模态大模型。

12月初,谷歌携带Gemini高调杀回人工智能圈。

据悉,Gemini1.0号称具有原生多模态能力,能够处理视频、音频、图像、文本和代码等多种形式的内容,且性能优于现有的“拼接型”多模态大模型。

多模态的意义在于为AI应用带来了更多可能性。《达摩院2023十大科技趋势》显示,建立统一的、跨场景、多任务的多模态基础模型会成为人工智能发展的主流趋势之一。

“多模态确实给了我们很多惊喜,尤其是在下半年中,最大的惊喜莫过于文生视频要比预期的发展快得多。”在接受北京商报记者采访时,无界AI联合创始人马千里说道。公开资料显示,无界AI于2022年入局AI绘画赛道,目前已拥有近300万注册用户和逾百位B端商业客户。 

在马千里看来,从未来的发展前景看,大语言模型因其更基础的属性可能会走得更广,但从商业化进程来看,多模态很可能领先。

上传21张照片、花费9.9元就能拥有一个专属的AI摄影师。今年7月,妙鸭相机一夜爆火,也成为国内AIGC历史上第一个真正意义上的爆款应用。

“从妙鸭相机的走红就能感受到,多模态的呈现方式更直观、付费流程更短、对人效的替代更强、对各行各业的渗透率更高、容易上手,这些因素可能会共同推进多模态的商业化进程。”马千里进一步补充称,从参数量级上看,多模态对底层模型的要求也相对更少,因此在算力方面也更容易被满足。

朱雷预计,最快明年上半年,大厂和创业公司都会补齐多模态的能力栈。“我们认为,未来的SuperApp绝不只是一个简单的文本,它可能会与各种智能设备做结合,这其中最核心的就是多模态能力,这也决定了未来的发展方向大概率是要把模型的通用能力或在固定场景中的能力拓展到某些实体或软件上。如果明年依旧找不到场景,很可能会淘汰一大批相关企业。”

但大模型的生态构建,也有种看起来很近实际上很远的错觉。在马千里看来,造成这种情况出现的原因在于“厚度”的不同。

马千里解释称,用苹果商店来解释大模型用应用赚钱,是一个被简化过的比喻,但真正商业化起来,情况要复杂得多。其中最关键的因素在于,模型层可能很厚,而应用层很薄,这就导致模型层很可能会对很多应用层进行“替代”。

商业化距离SuperApp有多远

多模态也好,生态也好,最终的目标都是落地,都是商业化。

“当前中国的大模型领域发展很快,但同时也面临一个很大的挑战,即非常缺少已经很成功的C端应用。”不久前,网易执行副总裁周枫如此说道。

“产品经理的思路是非常开阔的,各种应用场景并不难想象,真正掣肘的是模型整体的效果还没有达到能够孕育出SuperApp的程度。”朱雷称,从测评的结果看,在一些难度较高的任务方面,目前国内的大模型仍与GPT4或GPT4-Turbo存在一定差距,限制了其落地的可能,而且即便是GPT4,在面临一些好的想法时也可能难以实现。

在to B领域,朱雷认为,主要是因为幻觉等问题的存在,导致大模型在一些较为复杂的工业流程中存在不稳定因素,影响了其大规模落地。

“整体来看,今年还处于大模型的初期发展阶段,随着不可逆的进步的迭代,一旦达到一个落地的平衡点,可能就会出现一些SuperApp,初步预计这个时间可能在明年的6-7月。”朱雷称。

事实上,国内大模型的发展可能也陷入了一定程度的误区。香颂资本董事沈萌对北京商报记者分析称,大模型真正的意义在于颠覆人与机器或者人与网络之间的互动,让科技更好地渗透到整个生产生活当中,而不是盲目地在一个大模型上加入行业数据,或是利用一些接口调用底层功能,再与外部应用进行链接。

伽利略资本合伙人郑譞则提供了一个投资的视角:今年讲大语言模型故事的人很多,也不乏一些应用的出现,但整体看来,市场化机构出手并不活跃,除了受整体大环境影响外,也因为到了后期,大模型应用的逻辑已经脱离了大模型本身。

仍以妙鸭相机为例,郑譞称,这类AIGC产品整体上沿用的还是移动互联网时期的投资思路,遵循着获客成本、留存、DAU、天花板等成熟的公式进行推导,AIGC时代应用的载体和形式没有发生本质的变化。

“妙鸭相机与之前因AI换脸出圈的Zao等软件没什么不同,C端市场的热度很难持续。尤其是在当下这个时间节点,虽然披着AIGC的外衣,但投资机构相对来讲都更保守,因此也很难在这上面做大笔的投入。”郑譞总结称。

AIGC似乎和元宇宙、区块链等热点一样,踏入了同样的河流。沈萌称,从过去一年大模型的发展情况来看,其实与过去市场中科技类热点大同小异,基本都延续着国外热点爆发,引发国内市场狂潮,相关主体纷纷入局推出自有产品,并不断进行市场营销的路线,“而当市场被充分消化之后,各方主体在大模型上的狂躁,也逐渐开始回归到正常状态”。

大模型会是下一个时代的操作系统吗?这是科技圈目前给AI描绘出的最大的一幅愿景。但回归现实,有些情况又不得不面对,比如郑譞提到的,理论上看,按照目前的趋势这种情况是一定会实现的,但从投资的角度,一旦考虑到时间的维度,这个判断就不绝对正确了。

“起码就目前的情况而言,应用的大规模推广还没有到来。”在郑譞看来,当下对于AIGC的投资已经不完全是一个烧钱的时代,但行业在哪一部分有更大的商业价值,哪一部分能更快实现商业化落地等方面还没有达成共识。

关键词一:大厂的游戏

2023年2月,ChatGPT的火烧得最旺的时候,美团原联合创始人王慧文下场,一封“英雄帖”彻底搅动了国内的AI神经。但大模型的高投入也一并引来质疑,有科技行业分析师直言:“5000万美元够干什么?大模型训练一次就花500万美元,训练10次?”

而那时候,关于“5000万美元”的争议,就已被具象化为一个更直观的讨论,烧钱的大模型究竟有没有给初创企业留机会?

经过一年的发展,这个问题似乎有了更清晰的答案。郑譞依然坚持着最初的观点:通用大模型一定不是初创企业做得来的,就目前的情况看,大厂正在不计成本地铺各种可能的潜在应用,大厂领先的格局基本已经成型。不过学术派也没有落后,以智谱AI为代表的清华系有足够的技术储备。

关键词二:“套壳”

谈及大模型的底层技术,“套壳”就像个鬼魅,让大模型厂商避之不及又挥之不去。据悉,不少企业正是基于开源模型做微调,包括二次训练等,也有企业直接基于开源模型做应用层的开发,因此研发成本更低。

大模型套壳现象,是个被吐槽已久的现象。沈萌提到,国内其实有不少企业实行“拿来主义”,就像当年的国产操作系统一样,无非是以开源的Linux为基底套上中文的外壳。这种短期的浅层次的创新,也限制了国内对底层基础核心技术的掌握。

在沈萌看来,确实有一些企业,最开始涉足这一领域的时候就是为了蹭热点,不至于落于人后,所以当热度开始消退时,他们等待的其实是下一个热点,而非掉转过头再冷静、深入地进行研究。这恰恰反映出了大模型发展需要警惕的误区:没有吃透大模型的底层技术,因而很难形成基于技术优势和创新优势的差异化,最终就会导致雷同业务越来越多,走向价格战的终局。

关键词三:超级对齐

OpenAI那场震惊全球的“五日宫斗”中,除了阿特尔曼,还有一个主角——OpenAI联合创始人和首席科学家伊利亚·苏茨克沃。他们之间最明显的分歧,也被概括为有效加速主义和超级对齐之间的博弈,苏茨克沃正是超级对齐的代表人物。

马千里说,“对齐”可以简单地理解为让模型符合人类预期。但在实现对齐的过程中,卡口却也始终存在,比如“有用性”和“无害性”有时候是矛盾的,即有用的“回答”可能有点有害,但特别无害的“回答”可能毫无用处。此外,价值观无法穷尽,且动态变化。

在马千里看来,未来我们可能需要包容一个“不够对齐”的底层大模型,因为彻底对齐就意味着大模型彻底和“你”或“我”保持了一致,“我们能看到的都是我们看到的,生活在了一个过度对齐的信息茧房里真的是我们想要的吗”?

北京商报记者 杨月涵

右侧广告

本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 媒体合作:010-64101871

商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)

网上有害信息举报  违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn

ICP备案编号:京ICP备08003726号-1  京公网安备11010502045556号  互联网新闻信息服务许可证11120220001号