3月29日,在2025中关村论坛年会“人工智能主题日”未来人工智能先锋论坛上,来自政、产、研等领域的成果新鲜出炉,引发各界广泛关注。海淀“真金白银”支持人工智能创新街区建设,生数科技发布了业内首个高可控视频大模型Vidu Q1,智源研究院发布了首个跨本体具身大小脑协作框架RoboOS与开源具身大脑RoboBrain。开放、协作、共享,是人工智能生态繁荣的必经之路,未来只有各领域通力合作,才能推动区域和全球以及人类社会的创新和发展。
海淀
“真金白银”支持
人工智能创新街区建设
海淀区委常委、组织部部长肖丹与街区智能体“小海”通过别开生面的“人机对话”发布了下一步街区计划,并宣布海淀将在五方面支持各界参与人工智能创新街区建设。
在资金扶持方面,将统筹安排百亿元,用于算力支持、数据标注、平台建设和场景开放。在空间供给方面,将更新优化67万平方米人工智能特色产业园区;拓展供应东升科技园三期等50万平方米产业空间。在数据基建方面,将建设新型数据基础设施,推进数据资源开发流通,促进场景应用加快落地。在人才保障方面,将用好人工智能人才特区20条措施,营造人才创新发展新生态。在金融助力方面,将推动设立科技信贷审批绿色通道,挂牌运营一批科技金融服务驿站。
“下一步,海淀将聚焦‘AI+城市’,推动交通、应急、政务、教育和健康等五大场景拓展升级,我们向人工智能产业的创新者、建设者和投资者发出诚挚邀约,让我们携手共建海淀人工智能创新街区。”肖丹表示。
智源
实现单机智能
到群体智能跃迁
智源研究院院长王仲远发布了首个跨本体具身大小脑协作框架RoboOS与开源具身大脑Robo-Brain,可实现跨场景多任务轻量化快速部署与跨本体协作,推动单机智能迈向群体智能,为构建具身智能开源统一生态加速场景应用提供底层技术支持。
在具身场景中,长程操作任务是机器人执行复杂任务的核心能力之一。具身大脑RoboBrain融合了机器人任务规划、可操作区域感知、轨迹预测的三维能力,通过将抽象指令映射为具象动作序列,增强长程操作任务的能力。跨本体具身大小脑协作框架RoboOS,基于“大脑—小脑”分层架构,通过模块化设计、智能任务管理和跨本体协作,为机器人提供高效、灵活、可扩展的底层支持,实现从单机智能到群体智能的跃迁。
目前,智源研究院依托多模态大模型技术优势资源,正在联合北大、清华、中科院等高校院所以及银河通用、乐聚、加速进化、宇树等产业链上下游企业,积极建设具身智能创新平台,重点开展数据、模型、场景验证等研究。
生数科技
高可控视频大模型
让AI视频不再乱生成
清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军发布了高可控视频大模型Vidu Q1。Vidu Q1作为业内首个高可控AI视频大模型,其在多主体细节可控(特别是动作、布局可控)、音效同步可控、画质增强等方面均取得显著成效。以多主体细节可控为例,在语义指令的基础上,通过融入参考图的视觉指令,Vidu Q1支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步的可控,对所有动作行为(出场、退场、坐立姿态、行动路线)进行精准调整。
音效同步可控功能则确保了随着视频环境与画面转场,Vidu Q1能够输出生成相应音效,并可精准控制每段音效的长短区间,精准设置每段音频出现的时间点,如0—2s风声、3—5s雨声等。
一直以来,AI视频生成过程中的随机性为老大难问题,Vidu Q1针对AI视频生成的痛点,通过技术手段引入多元素控制,它不再是没有头绪地乱生成,让AI视频生成与当下精益求精制作逐渐趋向一致。
北京商报记者 孔文燮
主办方供图
本网站所有内容属北京商报社有限公司,未经许可不得转载。 商报总机:010-64101978 媒体合作:010-64101871
商报地址:北京市朝阳区和平里西街21号 邮编:100013 法律顾问:北京市中同律师事务所(010-82011988)
网上有害信息举报 违法和不良信息举报电话:010-84276691 举报邮箱:bjsb@bbtnews.com.cn
ICP备案编号:京ICP备08003726号-1 京公网安备11010502045556号 互联网新闻信息服务许可证11120220001号