📌订阅成功后,加我微信tixiangs,并拉你进入Sora学习交流群!大家一起学习,共同进步!
Sora是一个能够根据文字指令创建逼真且富有想象力的场景的人工智能模型。
发布历程:
2024 年 2 月 16 日,Open AI 宣布推出全新的生成式人工智能模型“Sora”。据了解,通过文本指令,Sora 可以直接输出长达 60 秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。
这意味着,继文本、图像之后,OpenAI 将其先进的 AI 技术拓展到了视频领域。OpenAI 亦表示,Sora 是能够理解和模拟现实世界的模型的基础,这一能力将是实现 AGI(通用人工智能)的重要里程碑。
对于 OpenAI 视频生成模型的出现,业内其实早有预期,但仍有人评价称“比想象中来得更快”,亦有人振奋地表示“我们真的看到新工业革命来临”。
Sora的能力:
Sora可以生成长达一分钟的视频,同时保持视觉质量并符合用户的提示。
Sora能够生成具有多个角色、特定类型动作以及主题和背景的精细细节的复杂场景。
Sora不仅理解用户在提示中要求的内容,还理解这些事物在物理世界中的存在方式。
Sora具有深刻的语言理解能力,使其能够准确解释提示,并生成能够表达生动情感的引人注目的角色。
Sora还可以在单个生成的视频中创建多个镜头,准确保持角色和视觉风格。
目前 OpenAI 官网上已经更新了 48 个 Sora 生成的视频 demo,色彩艳丽,效果逼真。
Sora 官方网址:
Sora论文网址:
https://openai.com/research/video-generation-models-as-world-simulators