在3月29日召开的2025中关村论坛年会通用人工智能论坛上,北京通用人工智能研究院公布了最新研究成果,覆盖通用智能体+行业智能体+社会智能体三大智能体矩阵,其中全球首个通用智能人“通通”2.0升级迭代。据了解,相较于1.0版本,“通通”2.0在语言、认知、动作、学习、情绪、交互方面实现了多种核心能力的升级。
当前,国内外诸多大语言模型通过指令微调和强化学习下的人机价值对齐等技术手段,虽然能够较好地完成人机多轮对话任务,但此类对话更多是围绕用户的需求及观点进行,本质上缺乏自身相对连贯的价值观、世界观以及据此演绎出来的对话内容,很难实现价值与心智驱动的多轮对话。
“通通”2.0版本实现了一个有自身价值观、世界观的小女孩,在理解对话目标意图的基础上,遵循自身价值和人格,利用对话策略来引导对话的走向,从而达到自身的目的。在价值调控对话生成、消除模型幻觉、保持对话前后连贯性以及“言行一致”等方面取得突破。
基于交互反馈的推理和学习方面,“通通”生活在高度仿真的复杂、动态三维虚拟场景中,1.0版本的“通通”在任务执行过程中,如果周围环境时刻在发生变化,会导致它原本规划的任务无法顺利完成。但“通通”2.0可以实时响应外界场景的变化,进行反思和重新规划,对已有任务进行挂起、恢复、修改或取消等处理,同时动态生成新的任务规划,从而以更灵活、智能、多变的方式完成指令。
不仅如此,不同于当前大语言模型普遍采用的离线数据驱动的学习模式,“通通”在和场景交互(自主学)及与人类的多模态对话(他人教)过程中,能动态更新自身的知识库、价值函数和技能,使得它初步具备类人的持续反思和成长的能力。
在多智能体交互方面,研究人员为“通通”打造了幼儿园、六口之家等多智能体场景,并在场景中设置了各自独立,具备自身价值、能力、人设、状态的多个智能体,使“通通”拥有了自己的家人和朋友。
在这种多智能体场景中,“通通”不仅需要理解周围环境,还需要理解环境中其他智能体,识别它们的身份、性格和自身的关系、彼此之间的关系和物品的关系、当前动作、意图、气氛等,并在此基础之上进行自身的任务规划,包括发起和响应对话,实施帮助、捣乱等复杂行为交互。
随着“通通”的持续迭代,它的能力也在稳步提升,目前研究人员正利用认知心理学定义的5—6岁儿童应掌握的经典任务对它进行测试,“通通”已经通过了多项综合性强、复杂度高的任务考核。未来它将成为通用底座支撑各类垂直应用场景,进一步学习行业特定的知识和技能,形成千万个“通用智能人”赋能千行百业,同时与具身智能机器人相结合,为智能制造、智慧城市、养老陪护、数字助理、家用机器人等领域带来革命性的变化,更好地服务居民日常生活。
北京商报记者 魏蔚
北京通用人工智能研究院供图
本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 媒体合作:010-64101871
商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)
网上有害信息举报 违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn
ICP备案编号:京ICP备08003726号-1 京公网安备11010502045556号 互联网新闻信息服务许可证11120220001号