探访北京新质生产力·走出实验室｜看不见的大模型，看得见的生产力

您的位置：首页 > 科技频道

探访北京新质生产力·走出实验室｜看不见的大模型，看得见的生产力

出处：北京商报作者：魏蔚网编：陶凤 2024-08-05

大中小
收藏
分享
打印
手机网页版

X 分享到微信朋友圈

打开微信，点击底部的“发现”，

使用“扫一扫”即可将网页分享至朋友圈。

2017年，人工智能首次被写入中国政府工作报告，上升成国家战略，2018年，北京智源人工智能研究院（以下简称“智源”）诞生于领创空间一个小小的办公室。那时的OpenAI上线的第一代GPT模型还没占领媒体头条。

2023年，智源将我国首个超大规模智能模型“悟道”升级到3.0，成为微软总裁布拉德·史密斯心中全球最前沿的三个AI机构之一。在大模型领域，智源是全球唯一没有背靠大厂的非企业研究机构，也是国内最早系统布局大模型技术研发、开源生态建设、人才培养和企业培育的新型研究机构。

“过去每次科技平权都能催生重大产业机会”，既有企业从业经验又有研究机构背景的新任智源院长王仲远，对科技赋能产业的体会更深。国家对人工智能的定义也更加具体：人工智能是发展新质生产力的重要引擎。

智源官网

功夫下在风口之前

一次两次，月之暗面CEO杨植麟在2024北京智源大会现场被参会者围了至少三次，一年前OpenAI创始人山姆·奥特曼在智源大会视频发言时，现场的躁动同样明显。

2023—2024年，AI科学家、科技大厂CEO、明星初创企业创始人聚在各种场面为大模型布道，台上的不管是不是技术咖，或多或少都听过智源的名号，不少还直接参与过智源当年的大模型研究项目。百度CTO王海峰曾担任智源理事、智谱AI创始人唐杰曾任智源副院长、杨植麟参与过悟道的研发。

这些AI弄潮儿不是当下才与智源结缘，智源也不是在大模型风起后才投身其中。

2019年，智源开始布局大模型，2020年组建悟道攻关团队、启动大模型研发。2021年3月首发悟道1.0大模型，6月又拿出了悟道2.0，智源用1.75万亿的参数创造了当时“世界最大”大模型纪录，是OpenAI彼时最先进的大模型GPT-3参数量的10倍。

科研讲究体感，要提出问题，作出判断。“人工智能大模型时代即将到来”的判断，给了智源毫无保留的勇气，就连“大模型”这个中文词汇，都是智源最先提出的。

何为大模型？智源研究院理事长黄铁军认为要具备三个条件：规模要大，参数达百亿规模以上；涌现性，能够产生预料之外的新能力；通用性，不限于专门问题或领域，能够处理多种不同的任务。

2023年大模型进入公众视野，悟道系列模型已升级到3.0版本，涵盖语言、视觉、多模态等基础大模型，并全面开源。当时斯坦福大学关于基础模型的讨论中，智源与Google、微软、Facebook（现Meta）等科技巨头并列，成为世界大模型研究的代表性机构。

“历史上多数研究成果的出现是偶然事件，没人能规划出来，所有努力都是为了提升概率——汇聚优秀的研究人员，为他们提供能够碰撞思想、发现问题、寻找协作伙伴的社区环境。”智源研究院创始理事长张宏江给图灵奖获得者Yann LeCun自传写的序言，更像智源后发先至的原因。

要做系统工程

2018年初，北京市出台《北京市支持建设世界一流新型研发机构实施办法》，进行科技体制的飞跃式改革。12月，在科技部和北京市委市政府的指导和支持下，智源正式成立。

此前，科研管理流程复杂，从立项建议到指南发布再到经费申请、评审通过，周期漫长，难以适应强竞争环境下日新月异的科研需求。按照这种体制，研究机构2020年10月提出立项建议，最快2022年才能正式展开大模型研究。智源模式从立项到推出大模型，只用了不到5个月。

这是一种介于大学和企业的新型研发机构。新在不以论文为最终评价指标，不以产品为评价指标，而是要做创新性系统；新在把清华、北大、Facebook人工智能实验室、百度等不同机构以及企业的学者聚在一起办大事；新在瞄向大问题，保持对重大科学问题的敏锐眼光，进行前瞻布局。

“高校模式已经运行了几十年，较难有组织、有规模、跨团队地做系统性研发。企业也会投入做研发，但更倾向于研发与业务强相关的。智源会做3至5年甚至更长时间才能看到成果的研究项目”，王仲远在接受北京商报记者专访时表示。

当下，智源的信心还在于国家对人工智能的笃定。2024年3月，中共中央政治局常委、国务院总理李强在北京调研时明确：人工智能是发展新质生产力的重要引擎。

新质生产力是创新起主导作用，摆脱传统经济增长方式、生产力发展路径，具有高科技、高效能、高质量特征，符合新发展理念的先进生产力质态。它由技术革命性突破、生产要素创新性配置、产业深度转型升级而催生。“过去每次科技平权都能够催生重大产业机会，大模型可以带来新的科技平权”，王仲远坚信。

打个比方，大模型是“智力”的载体，以AI为中心的浪潮是智力运营，最底层是技术软硬件系统，最上层是AI应用，大模型处于两者中间，扮演“树干”的角色。大模型的意义是将“智力”变成像水、电、网一样的公共服务，通过云计算向大量企业或个人提供AI服务。

这是一个系统工程，“需要集中投入资源、集中人力，不能很多人在做但各做一摊，而是要形成一个技术体系。”黄铁军举例，“发展人工智能就如同炼钢和发电，需要一整套技术体系来保证生产出高质量的钢、以比较低的成本稳定地发电等。”黄铁军说。

要比产业走得更超前

智源搭建的技术体系包括：大模型全家桶、大模型操作系统、数据集、训练框架、算子库等。这些成绩和智源的愿景目标等一起挂在智源大厦一楼的墙上。

愿景目标分成机制体制、产业发展等五大板块，总结起来就是创新。“智源要做最前沿的人工智能技术的研发，去引领和预判人工智能的发展，要比产业走得更超前”，王仲远详细解释，“智源会做高校做不了、企业不愿做的研发，做3至5年甚至更长时间才能看到成果的研究项目”。

在他看来，当大模型技术能力达到一定程度后，会分出两大方向，“一个方向去跟产品结合，推动应用，发挥商业化价值。另一方面，有少量的几家机构持续做最顶尖的大模型的迭代和优化。不管企业还是研究机构，应该继续去攻坚技术”。

比如多模态，国内绝大部分的企业都选择DiT架构进行研发。“这是因为DiT是已经被验证的路线，智源希望把不同模态的信息，比如文字、图像、视频、语音，从一开始就放在一个模型里训练。”王仲远用人脑比喻，“这种多模态大模型能够看到世界、理解和推理。未来，大模型跟硬件结合，也就是具身智能, 能够进入物理世界服务人类。”

企业贴近市场，向上找场景，研发机构聚焦核心技术突破，向下做加持，智源属于第二种，和应用与场景离得较远，却用开源的方式做产业界的后盾。

“人工智能不等同于大模型，它只是人工智能的一个流派”，王仲远向北京商报记者解释。当下的智源也对类脑研究、数字心脏等其他人工智能技术全力以赴，这意味着人工智能在其他产业的想象空间没有上限。

北京商报记者魏蔚

深蓝智库企业社会责任峰会智慧康养论坛十大商业品牌商业高峰论坛金融业十大品牌酒业价值榜餐饮十大品牌

@北京商报

新闻排行

探访北京新质生产力·走出实验室 ｜看不见的大模型，看得见的生产力

探访北京新质生产力·走出实验室｜看不见的大模型，看得见的生产力