效果比Sora惊艳,著名AI平台大动作!文本生成超25秒视频,带背景音乐、转场等效果
2月29日,著名AI平台Lightricks在官网宣布,推出生成式AI电影制作平台—LTX Studio。据悉,用户只需要输入文本就能生成超25秒的微电影视频,同时可对镜头切换、角色、场景一致性、摄像机、灯光等进行可视化精准控制。
图片来源:Lightricks官网截图
Sora生成的视频由神经网络完成,也就是说生成的内容完全由AI决定,你除了提供文本无法进行任何内容控制。
而LTX Studio提供的可视化专业视频控制台,可以帮助用户进一步优化视频的细节达到商业级视频,并且附带语音解读而Sora目前无法提供。
目前,LTX Studio支持免费申请试用,3月27日将开启第一批测试。
图片来源:LTX Studio效果展示截图
Lightricks展示了多个由LTX Studio生成的视频,在文本语义还原、视频动作一致性、灯光、视频调色、背景语音解读等方面非常优秀。
一个孩子在森林里发现了一颗超级闪亮、又大又红的神奇草莓。吃完后,她开始变成一个红色的宇航员,飞了起来,在小镇上空快乐地飞翔。
图片来源:LTX Studio效果展示截图
同时Lightricks也展示了该视频的制作幕后花絮,从其展示的内容来看,可以对灯光、转场进行精准控制。
一只名叫鲍勃的动画企鹅无意中在一部自然纪录片中看到了自己,并对生活产生了疑问。鲍勃决定寻找自我,离开家人,环游世界,寻找奇迹。
图片来源:LTX Studio效果展示截图
一个8岁的小女孩穿越时空回到恐龙时代,发现了一个未知的先进文明。她必须修好她的时光机,并在为时已晚之前将这个文明的秘密带回到现代。
图片来源:LTX Studio效果展示截图
1927年的巡回嘉年华会上俯拍走钢丝的表演者,他在钢丝上保持平衡,下面的人群紧张地注视着他,柔和的漫射光,聚光灯打在表演者身上,戏剧性的阴影,温暖的棕褐色调,充满悬念的娱乐,复古的夜间马戏团美学。
图片来源:LTX Studio效果展示截图
近日,美国OpenAI公司正式发布文生视频模型Sora,再次在全球掀起了人工智能关注浪潮。
美国OpenAI公司发布的全新的Sora文生视频模型,可以根据用户输入的文本指令,一次生成60秒的长视频,且视频的画面精细度、流畅度超越了以往的文生视频模型。由于Sora能够模拟对世界状态产生简单影响的行为,有分析人士认为,这将文生视频能力推向了全新的高度。
在Sora发布之后,有博主对当前市场上其他主流文生视频产品做了对比评测,在对Sora、Pika、Runway和Stable Video四个模型输入了相同的提示词后,Sora在视频生成质量和时间上均对同行降维打击,其更加清晰连贯、符合描述。
在OpenAI官方的技术报告中,对Sora的定位为作为世界模拟器的视频生成模型。之前几款主流模型生成的视频时长仅在20秒以内,Sora不仅能够深入理解用户提示,还学会了物理世界的部分规律,比如:一个人吃汉堡后会留下咬痕、火车车窗上会产生逼真的倒影,Sora还可在单个视频中设计出多个镜头。华金证券计算机首席分析师方闻千说。
360集团创始人周鸿祎表示,以往文生视频软件都是在2D平面上对图形元素进行操作,可以把视频看成是多个真实图片的组合,并没有真正掌握这个世界的知识。这次OpenAI利用它的大语言模型优势,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的。
业内人士表示,虽然OpenAI表示当前Sora仍有弱点,例如难以准确模拟复杂场景中的物理现象,可能无法理解具体的因果关系,但从当前展示的效果来看,Sora显著领先于其他文生视频模型,推动AI视频生成进入了一个全新的时代。
据经济参考报29日报道,业内人士认为,从当前展示效果来看,Sora显著领先于其他文生视频模型,后续潜在的商业化有望对短视频、电影、游戏等下游领域产生深远影响,并进而传导到上游算力基础设施,算力需求有望再次迎来爆发。
时代周刊综合Lightricks官网、经济参考报
还没有评论,来说两句吧...