OpenAI年底憋大招,Sora正式开放!
艾媒网(iimedia.cn)获悉,当地时间12月9日,OpenAI宣布正式向用户开放人工智能(AI)视频生成模型Sora,该系统可以根据文本提示生成逼真的视频。
OpenAI官网的Sora页面介绍了一些Sora的功能,如Remix的重新混合功能可以替换、删除或重新构想视频中的元素;Storyboard的选项允许用户通过详细描述希望视频在不同时间点发生的内容,从而更好地指导一系列片段的生成;此外,Sora让可以让用户浏览其他人创作的视频集锦。定价方面,Sora目前纳入两个套餐,每月订阅收费20美元的Plus可生成视频分辨率高达720p,最长5秒,每月收费200美元的Pro生成视频分辨率高达1080p、最长20秒,可同时生成五个视频。
图片来源:Sora官网截图
年末将至,Sora的正式开放是OpenAI为AI视频生成领域献上的大礼,而这距离他们今年2月首次公布Sora以来已过去了10个月的时间。OpenAI工作人员表示,Sora在早期测试中显示出明显的局限性,例如在一次测试中,Sora存在“多余肢体”的问题,并对物理现象的理解不够准确。而在Sora仍处于“期货状态”的时间里,2024年可谓是国内外视频生成模型百花齐放的一年,Runway的Gen-3、快手可灵AI、腾讯混元等视频生成模型陆续发布并开放,在保真度、一致性和运动方面实现了显著提升。应用方面,国内的快手可灵AI已尝试进入实际应用阶段,与影视行业合作制作了AI微短剧、AI电影短片等AIGC视频作品,展现了国内视频生成技术的强劲实力。面对行业内来势汹汹的竞争模型,Sora的正式开放也为OpenAI在视频生成领域及时稳住了一席之地。
从文生视频到图生视频,从二维视频到3D可交互视频,视频生成领域正以日新月异的速度向前发展,不断向“世界模型”的设想迈进。正式开放的Sora不仅可以通过文本提示生成视频,还能够基于静态图片和已有视频创建新的内容。与之类似的还有在12月初发布的两款视频生成模型。当地时间12月2日与12月4日,World Labs和DeepMind接连发布了用单张静态图片生成3D世界的AI工具,用户只要输入单张静态图片,便可以进入到一个3D空间,能够自由探索并任意修改空间表征。
“世界模型”是近年来兴起并逐步发展的人工智能新领域,旨在创建对世界运作方式的表征,具备推理行动后果、预测未来状况的能力,在AI强化学习、自动驾驶、游戏和影视制作等领域有重要的应用价值。Sora、World Labs、Genie 2等模型的诞生,不仅能促进AI技术向不断理解与模拟现实发展,还将是人类开发出能够与物理世界互动模型的重要一步。