这个国庆,OpenAI CEO奥尔特曼(Sam Altman)被网友“玩儿坏了” ,在各类AI生成视频里,他坐在东北大炕上吃饭,出现在阿里和字节员工在会议室说着“互联网黑话 ” ,甚至成为街头的外卖骑手。
这一切,都源于10月1日OpenAI正式推出的新一代视频生成模型:Sora 2,一同上线的还有AI视频社交App “Sora” ,目前用户通过邀请码可以免费下载使用,能一次生成10s的AI视频,奥尔特曼本人成了这场全民AI创作中出场率最高的“演员” 。
第一财经记者实测Sora2发现 ,相比去年发布的初代Sora,Sora2在物理逻辑 、画面一致性、真实感上都有显著提升,一张照片加一句提示词,AI就能创作出有剧情、有文案的短片。
但“现实不存在了 ”吗?从测试来看 ,Sora2尚未完全跨越“真实”这道门槛。
至顶科技总编辑 、PEC联合发起人高飞对记者表示,Sora2比起上一代Sora是一个大版本更新,在很多场景都达到了以假乱真的程度 ,不过,相比其他AI产品Sora2的技术并没有代差领先,更值得关注的是其产品玩法 ,在打造互联网产品方面,他认为OpenAI暂时领先于其他公司 。
OpenAI在官方博客中宣称,Sora2是“迈向GPT-3.5时刻的一步”。但AIGC创作领域的KOL@尾鳍Vicky认为 ,对于创作者来说,可能这一时刻还没到来,毕竟产品还是无法彻底解决一致性和物理问题。但对于大多数普通受众来说 ,玩AI视频可能真的变成了一件很接近、且很有趣的事情 。
实测Sora 2:优缺点同样突出
毫无疑问,过去两天,OpenAI做了一场成功的产品发布营销,截至发稿 ,在美区iOS的免费应用排行榜上,Sora APP已经空降第三位,仅次于谷歌的Gemini和OpenAI自家的ChatGPT。
有人将Sora称之为“AI版抖音 ” ,应用主页是垂直视频流,用户可以上下滑动浏览不同用户发布的视频,但应用上所有的内容都是AI生成的。在生成视频时 ,用户可以选择上传图片并结合文字提示,也可以用“Cameo”(客串)功能,基于自己或朋友形象进行提示词生成 。
Sora2是Sora APP的技术底座 ,OpenAI在博客中表示,Sora2可以完成之前的视频生成模型难以完成的事情。它比之前的系统在物理上更加精准、逼真,并且在可控性方面有了巨大的飞跃 ,此外,它还配备了同步音频。
第一财经记者测试了基于Sora视频生成的效果,确实相比初代有了大幅提升,其输出的结果已经基本能满足C端用户娱乐的需求 ,较为亮眼的地方在于,AI在镜头语言上很丰富,对话有想象力 ,音频输出方面口型与发音一致。但目前一个10s的视频需等待数分钟才能生成,速度并不快,且分辨率不高 。
以奥尔特曼为主角 ,记者给AI的提示词是:@sama在工作敲代码,一只银渐层走过来生气地关掉了电脑主机电源,他们开始吵架。
在这个视频中 ,Sora精准特写了猫爪关电源的画面,伴随准确的关机音效,也展现了奥尔特曼吵架时生气的表情和姿态 ,细节和环境都很真实。在发音时,人物的口型也能对得上 。
值得一提的是,Sora还会补充给角色“加戏”,在提示词中记者只提到了“开始吵架 ” ,但AI视频对话中,猫咪会抱怨“你一下午都没陪我,而且风扇像拖拉机一样” ,主角则回复“先开回来,咱俩再谈”。 情节补充自然,配合场景非常真实。
但这一产品也并非毫无瑕疵 ,例如,录入人脸输出的视频并不完全像本人,有用户反馈是“似像非像”的效果 ,同时,Sora在事实逻辑上仍有错误,在一个用灭火器的场景中 ,灭火器喷雾的出口并不准确 。
中文支持更是“重灾区 ”。例如,有用户让奥尔特曼成为外卖员,其外卖服上出现了凭空生造的文字。
@尾鳍Vicky认为,Sora优点很明显 ,用户数字人的物理效果和唇形驱动效果很好,且在APP的使用交互上下了一些功夫,例如从注册就让用户在"验证"的过程中完成素材内容的录制 ,且是很短的音频和视频,就能输出不错的效果 。此前这样图生 、文生视频路径已经出来很久,但效果应用都没有Sora这么自然、对用户如此友好。
但另一方面 ,Sora缺点同样突出。@尾鳍Vicky提到,虽然相比初代Sora2的物理理解问题已经更好了,但涉及到多元素的物体交互时 ,还是会出现手脚和脸糊等丢失细节,动作不符合物理逻辑等问题 。从这个维度上来说,Sora2在模型能力的提升上并没有迈到可以真正解决技术问题的那一步。
GPT-3.5时刻到了吗
在官方博客中 ,OpenAI将2024年2月的初代 Sora比作“视频的GPT-1时刻”,而 Sora2则被定义为“可能直接跳到了GPT-3.5的时刻”。
博客中解释认为,之前的视频模型会变形物体和变形现实,但Sora 2可以做一些对于之前的视频生成模型来说非常困难的事情 ,如奥林匹克体操动作,在桨板上的后空翻,精确地模拟浮力和刚性的动态。模型在可控性方面也有了很大的飞跃 ,能够创建复杂的背景音、语音和具有高度真实感的声音效果 。
但问题是,AI视频的“GPT-3.5时刻 ”真的来了吗?@尾鳍Vicky认为,至少对于创作者来说还没有 ,因为Sora 2还是无法彻底解决一致性和物理问题。但对普通用户来说,AI视频的门槛已大幅降低,用户玩AI视频真的变成了一件很简单且很有趣的事。
高飞认为 ,Sora2相比其他AI产品Sora2的技术并没有代差领先,例如谷歌有Veo3,也有Nano banana以及世界模型Genie3 ,在多模态方面相当强悍 。而国内的可灵 、即梦也能与之一战。
今年5月,Veo3推出时也曾在社交网络火出圈,一些人物视频极具真实感,被认为是AI视频领域领先的水准。但彼时行业人士仍然认为 ,现阶段的AI视频对实际生产帮助仍然不算太大,并未来到真正的GPT时刻 。
相较于模型技术,高飞认为Sora2更值得关注的是产品玩法。OpenAI将它打造成了一个更类似于短视频的消费者App ,其主要机制是要求用户上传自己的脸部数据和声音信息做AI二创。“这样一方面很容易拿到了最为宝贵的消费者面部数据,其次用户基于自己的人脸创造的视频,配合邀请码机制 ,也很容易吸引亲朋好友链式传播 。”
因此,高飞的观察是,“OpenAI可能在模型不一定是最强 ,但是在打造互联网产品方面,领先于其他所有公司。”这次Sora2不追求画质和时长,也是典型的互联网打法 ,先完成再完美,后续再迭代。
@尾鳍Vicky也认为,Sora2这次的发布更侧重APP的交互设计,并不仅是模型本身的更新 。“Sora2目前的定位 ,似乎并不是以专业的AI视频创作为导向,而是更专注于如何用AI视频来完成用户社交,做寻找应用场景的新尝试。 ”
从海外市场来看 ,对于Sora2和Sora应用的发布则褒贬不一。有用户认为技术惊艳、创造力会大爆发,也有人认为这些无聊的视频毫无意义,与宏大的AGI愿景、人类福祉相悖。
有用户发帖讽刺称 ,2周前,奥尔特曼说“我们需要7万亿美元和10吉瓦来治愈癌症”,他现在表示“我们正在推出以个性化广告形式营销的 AI垃圾视频” 。
奥尔特曼转发了这一帖子 ,并回复称需要资金来继续研究AI,并且几乎所有的研究精力仍然集中在通用人工智能上。 “向人们展示很酷的新技术或者产品,让他们开心 ,并借此来赚取一些钱,这也是一件好事。 ”奥尔特曼称,当谈到公司的最佳发展轨迹时,现实情况是微妙的 。
“重要的是让人类从这些模型的开发中受益。我们认为Sora会给世界带来很多欢乐、创造力和联系。”OpenAI在博客中写道 。未来 ,随着视频模型持续进化,通用世界模拟器与机器人Agent将重塑社会,无论如何 ,Sora 2朝这一目标迈出了重要的一步。
中国十大股票软件排名:教我如何炒股票-更精准更可控 Sora 2来了!OpenAI:迈入视频领域的“GPT-3.5时刻”
手机怎么可以买股票:股票杠杆开通条件-盘中集体大涨!AI产业链突传三大消息
股票加杠杆在哪里加:顶级配资平台-法国“黑天鹅”突袭!欧洲股市全线走低
正规杠杆平台:股票配资最新招商-今起 AI生成内容必须“亮明身份”!微信、腾讯元宝已出手
股市杠杆怎么操作:网上配资平台配资门户-知名车企官宣:9月复工复产 两年后筹备IPO!新股东背后现“宝能系”身影!
实盘交易杠杆:配资最安全的三个平台-特朗普:股市创新高 随着时间的推移 股市会表现得更好
瑞和网配资-正规配资|配资平台|正规配资平台提示:文章来自网络,不代表本站观点。
美联航遭遇技术故障! 美国联合航空公司(美联航)当地时间周三表示,因技术问题,公司的主线航班在美国多个主要机场停飞...
...
据新华社周一发布消息,近日,中共中央、国务院印发《加快建设农业强国规划(2024-2035年)》(以下简称《规划》),从...
全固态锂电池被誉为“下一代能源革命”技术,但解决其循环稳定性和能量密度提升等问题,需要通过锂元素的“可视化”检测来深...
“苏超”(江苏省城市足球联赛)如今的盛况,远超赛前预期。从主办方担忧冷场大量赠票,到一票难求、二手平台票价暴涨10倍...
随着半年报放榜期的到来,多家车企陆续公布了2025年上半年的业绩预告。从已披露的11家车企数据来看,8家实现净利润增...
文丨中信证券在政治局“活跃资本市场,提振投资者信心”指引下,证监会从投资端、融资端和交易端三个维度,...
记者王珍中国国际经济交流中心副理事长、国务院发展研究中心原副主任王一鸣周一在“中国发展高层论坛2025...
【隔夜行情】•周五(2025年3月21日),A股三大指数集体下跌,截至收盘,截止收盘,沪指跌1.29%,报收33...
【隔夜行情】•周四(2025年4月11日),A股三大指数集体反弹,截至收盘,上证指数收涨1.16%,深证成指收...
3月24日,易方达国证自由现金流ETF公开发售。该产品跟踪国证自由现金流指数,这个指数是什么?有哪些优势?投资价值如何?...
国海富兰克林基金国富深化价值基金经理刘晓日前发表了对 2025 年市场的展望。刘晓指出,国内经济正处于复苏通道,市场大幅...
记者辛圆3月25日,博鳌亚洲论坛旗舰报告《亚洲经济前景及一体化进程2025年度报告》(以下简称《报告》...
2025年3月25日,倍轻松(688793.SH)公告称,公司股东宁波倍松投资有限公司(简称“宁波倍松”)拟通过大宗交易...
记者|赵阳戈年初,证监会就修改《证券发行与承销管理办法》部分条款向社会公开征求意见,市场也将注意力投向了...