Sora开放使用文生视频继续激战

您的位置：首页 > 推荐

Sora开放使用文生视频继续激战

出处：北京商报作者：赵天舒网编：武杉 2024-12-10

大中小
收藏
分享
打印
手机网页版

X 分享到微信朋友圈

打开微信，点击底部的“发现”，

使用“扫一扫”即可将网页分享至朋友圈。

在公开预览过去10个月后，在OpenAI的12天连更计划的第3天，视频生成大模型Sora终于正式登场。12月10日，OpenAI宣布正式向用户开放Sora，该系统可以根据文本提示生成逼真的视频。应用落地也来得很快。作为“视频版GPT”，OpenAI已开始向电影制片厂、媒体高管以及经纪公司示好，还允许一些艺术家、知名演员和导演试用该服务。

北京商报

巨强巨贵

今年2月，OpenAI首次向外界展示了Sora的存在。据其介绍，Sora可以直接输出长达60秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。OpenAI在官网上公布了数十个视频demo，并不断在社交平台X上放出由Sora生成的视频。这些内容被集合推送至OpenAI的TikTok账号上，短短5天内便获得了51.3万次赞，粉丝数也涨至10.6万。

Sora不仅为OpenAI带来了大量粉丝，也让其估值进一步提升。不过，当时这家公司表示，Sora在短期内不会向大众开放，因为其“技术仍存在一些缺陷，包括一些空间问题”。

在将近10个月之后，万众瞩目下，Sora终于在此次系列发布中重磅登场。OpenAI表示，2月发布Sora之后，团队开发了其新版本Sora Turbo，其性能有了显著进步，即日起该版本将作为独立产品提供给ChatGPT Plus和Pro用户。

相比初次亮相的Sora，Sora Turbo生成效率显著提升，能够通过文本直接生成最多20秒或最高分辨率1080P的视频，成为目前全球生成时长最长的视频模型之一。该模型支持文本加图片或视频的输入，可生成特定视频内容，并能够编辑生成视频，使生成效果更加可控。

此外，Sora Turbo还有多种视频编辑工具，包括替换、删除或重新构想视频中的元素；找到并隔离最佳帧，然后向任一方向延伸它们以完成场景；使用Loop剪辑并创建无缝重复的视频以及一个名为Storyboard的选项，用户可以通过它详细描述希望视频在不同时间点发生的内容，从而更好地指导一系列片段的生成。

定价方面，Sora Turbo将免费提供给ChatGPT Plus和Pro用户，月租20美元（约合人民币145元）的Plus用户，每月最多可以生成50个480P分辨率的优先视频；Pro订阅者则最多可生成500个优先视频，普通视频无限量生成，可下载无水印版视频，对应每月费用为200美元（约合1450元）。

这一定价也引发了不同的声音，有用户直呼“太贵”，有用户却认为“一分钱一分货”。虽然当前价格仍被部分用户认为偏高，但这已是OpenAI努力降低成本的结果。OpenAI还透露，他们计划针对不同用户类型开发新的定价模式，并将于明年初推出。

视频版GPT

目前，美国及其他市场的ChatGPT付费用户可以通过该网站开始使用Sora，但在欧洲大部分地区和英国还需要一段时间才能使用，中国用户依然受限。

不过，由于实在是太火爆，Sora网站一度被挤到崩溃，OpenAI CEO山姆·奥特曼（Sam Altman）表示：“由于需求超出预期，我们将不得不间歇性地关闭新用户注册，并且生成内容的速度会在一段时间内减慢。”

在技术路线上，目前，业界普遍猜测Sora的成功延续了OpenAI的Scaling law法则，即通过海量的数据、大量的算力，再加上大参数模型，最终“大力出奇迹”。OpenAI研究科学家Noam Brown在Sora Turbo发布后表示，Sora是scale（规模）力量最直观的展示。山姆·奥特曼则表示，“大家可以将Sora看作视频版的GPT-1”。OpenAI还表示，Sora是一项理解和模拟现实的基础性AI技术，是开发能够与物理世界互动模型的重要一步。

中国银河证券研究院的报告也显示，Sora对算力需求呈指数级增长。其根据Sora参数规模推演出的训练单次算力需求或可达到2.6×10^24Flops，相当于GPT-3175B的8.2倍。目前Sora还在初级阶段，伴随不断迭代调优，其训练数据集规模将进一步增大，未来算力需求也会大幅增加。

在国内，互联网大厂和大模型公司也在纷纷跟进视频大模型这一赛道，包括字节跳动、快手，今年发布视频生成模型的公司还包括阿里云、Minimax、生数科技、智谱AI等公司。就在最近，腾讯混元大模型也宣布上线视频生成能力，正式加入竞争激烈的视频生成赛道。

不过，视频生成模型领域虽然看起来火热，也面临着非常严峻的挑战。近日，百度CEO李彦宏称“百度不做Sora”的演讲被媒体曝光，李彦宏在内部讲话中称，Sora这种视频生成模型的投入周期太长，10年、20年都可能拿不到业务收益，无论多火爆，百度都不去做。

商业化空间打开

自今年2月首次预告Sora以来，OpenAI便开始与电影制片厂、媒体高管以及经纪公司展开会谈。OpenAI还允许一些艺术家、知名演员和导演试用该服务。市场预计，Sora的发布会对视频制作领域带来革命性的变化，无论是电影制作、广告、游戏开发还是社交媒体，都可以借助视频生成大模型降低视频创作的门槛，产生新的机遇。

对于企业和内容创作者而言，视频制作往往是一项繁琐且耗时的任务。借助视频生成大模型，用户只需提供简短的文本描述，即可自动生成高质量视频。“这不仅节省了大量时间，也大幅降低了对专业技能的要求，即使没有视频制作经验的用户也能轻松创建专业级内容。视频生成大模型的广泛应用有望改变广告营销、产品推广和教育辅导等多个行业的内容创作流程，推动生产力的升级。”一位视频后期制作人员对北京商报记者表示。

“国产多模态视频大模型历经一年多迭代，已逐步提升对内容制作的赋能效果，拓宽了创作边界，预计后续AI影视领域商业化空间将打开。”开源证券表示。不过，业内人士也向北京商报记者表示，视频生成大模型拥有乐观的商业化前景的同时，从可用度而言，还未到大规模商用的阶段，仍有很多技术难点需要克服，比如对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等，都是行业激战且有待提升的重要维度。

此外，从AI诞生之初，对于版权的问题就争论不休。有从事设计行业的人士对北京商报记者直言：“Sora确实厉害，但AI生成视频内容质量和版权问题怎么解决？会员免费用，那创作者收益呢？这些问题不解决，技术再牛也难长久。”

北京商报记者赵天舒

深蓝智库企业社会责任峰会智慧康养论坛十大商业品牌商业高峰论坛金融业十大品牌酒业价值榜餐饮十大品牌

@北京商报

新闻排行

Sora开放使用 文生视频继续激战

Sora开放使用文生视频继续激战