OpenAI年底憋大招，Sora正式开放！

2024-12-10 李相二艾媒网阅读 12716

艾媒咨询｜2023年中国AIGC行业发展研究报告

随着人工智能技术的不断发展，AIGC技术也日益成熟，广泛应用于更多领域，其广阔的应用前景将推动AIGC市场规模快速增长。艾媒咨询预测，预计2023年中国AIGC核心市场规模将达79.3亿元，2028年将达2767.4亿元。

全球人工智能(AI)产业运行情况与大数据研究电子学

美国人工智能产业运行状况与标杆企业数据电子学

中国人工智能软件

　　艾媒网（iimedia.cn）获悉，当地时间12月9日，OpenAI宣布正式向用户开放人工智能（AI）视频生成模型Sora，该系统可以根据文本提示生成逼真的视频。

　　OpenAI官网的Sora页面介绍了一些Sora的功能，如Remix的重新混合功能可以替换、删除或重新构想视频中的元素；Storyboard的选项允许用户通过详细描述希望视频在不同时间点发生的内容，从而更好地指导一系列片段的生成；此外，Sora让可以让用户浏览其他人创作的视频集锦。定价方面，Sora目前纳入两个套餐，每月订阅收费20美元的Plus可生成视频分辨率高达720p，最长5秒，每月收费200美元的Pro生成视频分辨率高达1080p、最长20秒，可同时生成五个视频。

图片来源：Sora官网截图

　　年末将至，Sora的正式开放是OpenAI为AI视频生成领域献上的大礼，而这距离他们今年2月首次公布Sora以来已过去了10个月的时间。OpenAI工作人员表示，Sora在早期测试中显示出明显的局限性，例如在一次测试中，Sora存在“多余肢体”的问题，并对物理现象的理解不够准确。而在Sora仍处于“期货状态”的时间里，2024年可谓是国内外视频生成模型百花齐放的一年，Runway的Gen-3、快手可灵AI、腾讯混元等视频生成模型陆续发布并开放，在保真度、一致性和运动方面实现了显著提升。应用方面，国内的快手可灵AI已尝试进入实际应用阶段，与影视行业合作制作了AI微短剧、AI电影短片等AIGC视频作品，展现了国内视频生成技术的强劲实力。面对行业内来势汹汹的竞争模型，Sora的正式开放也为OpenAI在视频生成领域及时稳住了一席之地。

　　从文生视频到图生视频，从二维视频到3D可交互视频，视频生成领域正以日新月异的速度向前发展，不断向“世界模型”的设想迈进。正式开放的Sora不仅可以通过文本提示生成视频，还能够基于静态图片和已有视频创建新的内容。与之类似的还有在12月初发布的两款视频生成模型。当地时间12月2日与12月4日，World Labs和DeepMind接连发布了用单张静态图片生成3D世界的AI工具，用户只要输入单张静态图片，便可以进入到一个3D空间，能够自由探索并任意修改空间表征。

　　“世界模型”是近年来兴起并逐步发展的人工智能新领域，旨在创建对世界运作方式的表征，具备推理行动后果、预测未来状况的能力，在AI强化学习、自动驾驶、游戏和影视制作等领域有重要的应用价值。Sora、World Labs、Genie 2等模型的诞生，不仅能促进AI技术向不断理解与模拟现实发展，还将是人类开发出能够与物理世界互动模型的重要一步。

责任编辑：竹杉

艾媒咨询｜2023年中国AIGC行业发展研究报告

全球人工智能(AI)产业运行情况与大数据研究电子学

美国人工智能产业运行状况与标杆企业数据电子学

中国人工智能软件