“请帮我整理一份今天周会的会议纪要,再以此为基础写一篇一千字的发言稿。”任务刚一下达,一份整洁的会议纪要和一篇逻辑清晰、语句流畅的稿件,立刻出现在屏幕上。这是人工智能公司百融云创的员工,利用大模型办公的日常。
2024年政府工作报告中,“人工智能+”作为新的发展战略被正式提出。而在人工智能技术领域,大模型正以主角的姿态站在了历史舞台中央,引发了产业界“大炼模型”的狂潮。
过去两年间,大模型市场处在造锤子的阶段,当历史的时针指向了2024年,市场考验的则是钉钉子的能力。经过了市场的狂热,平复躁动的心情后,我们如何更理性和科学地认识大模型的本质?市场进入应用元年,从“大炼模型”到“大用模型”还要克服哪些挑战?
三大视角透视大模型的本质
●大模型即信息压缩器
大模型的本质是一个信息的无损压缩器,目前最好的大模型产品可以实现30倍以上的信息压缩比,这是一个非常惊人的数字。依靠强大的压缩能力,大模型几乎把所有互联网上的人类知识都压缩到了一个模型之中,让其变得无所不知。
而且这种压缩功能不是简单的信息抽象化和符号化,大模型能从海量信息里发掘潜在规律。这使得大模型拥有了类似人类思考的能力,即使面对不曾见过的情景,或者没有见过的问题,也能“举一反三”进行作答。
●大模型即操作系统
每个时代都有自己的操作系统,比如PC时代的Windows、移动互联时代的iOS和Android,人工智能时代也不例外。大模型将成为人工智能时代的底层操作系统,所有的芯片架构、算法开发等都将围绕大模型而实现重构。
●大模型即编程语言
同时,大模型还是一种新的编程语言。
有了计算机就有了编程语言。从历史来看,编程语言一直处于进化之中,从最初的二进制,到汇编语言,再到高级语言。编程语言的进化史,就是编程门槛逐步降低的进程。英伟达CEO黄仁勋认为生成式AI的发展大幅降低了学习编程的重要性,“编程语言可以普及成为人类的语言,现在世界上每个人都是程序员。这就是人工智能的奇迹”。
大模型提示词输入、模型处理和输出结果的作业模式,完全符合编程的基本流程。现在,一些科技企业开始将一部分代码交给大模型去“写”了。
这三大技术要素共同奠定了大模型的革命性和时代性,使得其成为市场的“宠儿”。当前,光是在国内就大约有200多家企业投身于大模型的研发,掀起“大炼模型”的浪潮,一些步伐矫健的企业站在了潮头。
大模型技术浪潮激荡
作为人工智能代表性企业,百融云创持续推进模型应用一体化的协同战略布局,基于深度学习Transformer框架,结合NLP(自然语言处理)、智能语音等技术,打造了大模型“全家桶”。包括适用于垂直行业场景的BR-LLM、对话大模型VoiceGPT,适用于自动编程的BR-Coder,适用于建模的ORCAGPT以及大模型的应用一站式开发平台——赛博坦。
大模型“全家桶”是在时间的淬炼中厚积薄发的,它的背后有两股力量,一个是长期主义的推力,一个是产业需求的拉力,两股力量相互交织,推动大模型产品日益丰满。
百融云创将场景需求、战略投入、技术创新和组织建设四个环节融为一体,互为促进,全面推动大模型的生产力化和生产工具化。比如,公司研发部门的同事利用BR-Coder将开发岗位中的自动生成代码渗透率提升至10%,利用ORCA-GPT协助数据分析岗位将建模时间缩短30%。
还有一些同事利用大模型打造自己的专属“助理”,实现人机协同办公。在赛博坦平台上完成角色个性、知识经验、能力范围等基础设定,打造出一个专属Bot,这一Bot可以是企业的数字员工、数字助理,也可以是行业专家,通过Bot协助完成重复枯燥的工作,员工可以将更多精力专注于更有价值的创新工作上。赛博坦平台得到了公司人力、行政、运维、客服等多个部门的积极应用,使得工作效率大大提升。
同时,百融云创还大力推动多模态大模型的发展。比如基于语音的对话大模型VoiceGPT,可以实现低于500毫秒级的响应,在多轮次对话中对于客户的语音识别准确率能达到99%以上,在意识、感情和情绪的表达上,几乎与真人无异;基于动画影像的数字人产品,能支持多国语言,胜任多区域的线上营销、线下接待等工作。
不仅仅是应用层面的探索,在破解大模型底层技术困境上,百融云创也主动出击,准确性和幻觉问题是行业共性的底层挑战。在解决大模型幻觉问题上,百融云创采用了生成式增强检索增强生成(RAG)技术方案,并对Q A场景专门做了模型能力的强化。这些工作不仅提高了大模型的准确性和可靠性,还使其能够更好地理解上下文,并将检索到的知识融入到生成过程中,从而产生更加贴合实际需求的答案。在第三方测评机构的测评中,产业大模型BR-LLM的准确性和精准性,取得了行业领先的成绩,多项指标优于ChatGPT3.5。
大模型走向产业要跨过多少高山
当深入到具体的场景中,单有技术突破还不够,还需要综合化的工程能力,这背后涉及到垂直产业的行业特性、市场规模、用户习惯等问题。
百融云创不断积累行业知识,通过实践优化模型,充分发挥技术与知识双轮驱动优势,形成飞轮效应。比如语料这种知识要素,百融云创通过在特有场景中的闭环反馈,不断优化模型,产生专属领域的语料,这些专属语料反过来训练模型,这样下一代的模型进行交互时会更精准有效。
举例来说,比如车险评估场景中,有的用户报车号时会把J读成勾,0读成圈,可能很多时候人都会听错,但是百融云创的VoiceGPT却能够准确识别。在营销的场景下,有的电销人员产品转化率第一,有的排在倒数第一。百融云创将第一名的语料进行分析和生成,将新生成的内容给到此前排名倒数第一的人员,其转化率瞬间得到大幅提升。这都得益于海量专属领域知识的训练,模型的持续迭代升级。
同时,大模型价值和作用的发挥,并非是孤立的。
比如资产运营这个场景,面对具体的复杂环节,如果企业只是接入一个大模型基本上很难发挥作用。在具体作业环境中,百融云创首先要对海量的用户进行精准分析,根据特性进行分层分类。进而构建营销响应模型,判断哪些用户响应程度高,哪些压根就不会有响应。同时,根据企业自身拥有的各类资源制定策略,确定哪些用户是需要活动触达,哪些用户是需要电话触达,针对不同的用户要搭配怎样的话术等。然后再接入大模型与客户进行多模态的交互,比如通过AIGC生成文案、图片和视频进行产品营销,通过智能语音与客户进行交互,促成交易的达成。最后,根据不同渠道用户的反馈结果进行复盘和反馈,进而优化整个流程的每一个环节。
当前,百融云创大模型已经在产业实现“落地生根”,在海量的场景中拔节生长。以某城商行客户营销场景为例,该城商行有几十万名休眠白户,百融云创首先通过数智化的手段,对用户进行洞察和分群,从而制定不同的策略去触达用户,再利用大模型与用户进行交互,最终搭配人工实现营销转化。最终,在百融云创的助力下,大量的休眠户得到了激活,每月贡献了上亿元AUM。
大模型正在成为重塑生产生活、引领时代变革的重要力量。大模型的浪潮已来,然而光有浪潮还不够,大模型还得越过“高山”,深入产业,真正用起来,与千行百业的融合发展。正如恩格斯所说:“社会一旦有技术上的需要,这种需要就会比十所大学更能把科学推向前进。”
本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 媒体合作:010-64101871
商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)
网上有害信息举报 违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn
ICP备案编号:京ICP备08003726号-1 京公网安备11010502045556号 互联网新闻信息服务许可证11120220001号