当前位置: 主页 > 图文评测 >

对国内视频模型的巨大评论:我的梦想,表现最差的Zhong Bo?

发布者:bet356体育官方网站
来源:未知 日期:2025-07-05 09:33 浏览()
大型录像带可以帮助我们成为视频创建者吗?几个小时前,AI歌手Yuri在整个互联网上变得流行。许多网民感到惊讶的是,AI模型产生的视频很难分辨出它们是真实还是错误,并且唇和声音几乎完全同步。 AI创建的MV视频“超现实”似乎向我们证明,每个人都可以使用AI创建高质量的视频,但这是真的吗? “超现实”的背后是历史工作室,拥有专业的后期制作团队,而MV背后有成千上万的照片不能代表公众层面。为了验证大型视频生成模型的真正功能,Lei Technology选择了四代视频生成,尤其是Ke Ling,Ji Meng,Qingying,Qingying和Feiwo,Fam Meancth,可以使用中国。通过评论,它将显示当前国内视频生成模型的能力,并探索哪种视频生成模型最强。 (照片来源:案例案例)这四个模型,Ke Ling来自Kuaishou,曾经获得“国内Sora”的头衔,但比Sora提前推出了它。也就是说,梦想来自Bytedance,您可以扫描代码登录到Tiktok;青年起源于Zhipu AI团队,Zhipu的主要成员来自中国领先的国内大学Tsinghua University的小桶(知识工程)实验室;我最初从Aishi Technology中名为Pixverse,该技术主要用于海外市场,刚刚在今年6月推出了该应用程序的国内版本。介绍之后,我们可以谈谈四个应用程序的实力。四个模型的水平检查:所有模型都有缺陷,并且能力差距很明显。让我们先谈谈测试环境。 Ke Ling选择了Master的2.1版本,即Mengwei的视频3.0版。 Qingying尚未支持更改版本,因此使用了默认版本。该照片是v4.5版本。生成的视频是LL 16:9比率,5秒钟和720p分辨率。但是,由于图像尺寸限制,LEI技术会在产生GIF时压缩视频。为了确保公平性,未调整镜头运动,样式和其他参数,并保持默认设置。所有视频曾经形成过一次,并且拒绝了良好作品或修订后的“手动筛选”。测试分为三个曲折。 “ tian jingsha·秋天思想”的第一个转折:静态图片是完美的,而变化的新闻是完美的。如果您想使每个人都能使用视频生成模型表达您的创造力,那么最重要的是提高AI理解自然语言的能力,而不是依靠特定的单词。扩展全文 因此,第一个问题是Lei技术选择了“ Tianjingsha·秋天的思想”,我认为每个人都可以在初中书中发表圣洁。五月 - 设定概述了一个悲伤而寂寞的场景几句话。如果它可以分解想要表达的艺术概念,对于视频开发的准确性尤其重要。 Ke Ling(称为“家用Sora”)通常会击中分散的歌曲。水涟漪,悲伤的老人以及路旁的桥和草地上的栏杆的光线和阴影非常现实。举起镜头具有悲伤感。唯一的缺点是,像桥另一侧的隧道和似乎埋在地面上的上房屋的开口没有充分修理。我认为,一个简单的人只有几个家庭,以及一些烹饪中的烟雾,可以突出悲伤的美。 (图片来源:Keling世代) 也就是说,如果您不观看马匹,您将无法分辨它是由AI形成的还是有人在下午拿走它们。水上上方的涟漪,天空的变化和距离的日落接近完美。但是,步行姿势在两匹马中,这不是马里诺,这让我们告诉您,当我们观察到图片是由AI形成的。最重要的是,该视频缺乏Sanju歌曲“ Heartbreaker”的核心。 (图片来源:梦境) 清庆产生的视频非常生气。更不用说“伤心欲绝的人”的主要要素也缺乏。马在走路时漂浮在空中没有意义。透明阴影产生的整个图片非常现实,尤其是河流的细节。当水流撞到河岸时,它会形成回流。只是这匹马在空中升起,问题真的很严重。 (图片来源:Qingshadow的产生) 我创建的图片可能反映了悲伤的状态。随后的举动让我想起了左孩子的景色,将他们的杂志送去工作。但是,该视频中角色的一般元素非常现代,而举动突然有点移动相对多余。 (照片来源:我拍照) 当涉及静态场景和动态场景时,四个AI模型之间的区别并不明显,但运动幅度较小,但是当涉及到更大动作的场景时,差异很明显,即,梦想和透明阴影的运动是不自然的。总体而言,在这些试验的扭曲中,Ke Ling表现出色,随后做了一个梦和对我的射击。在清金产生的视??频中,马飞向空中,导致了严重的减少点。 “舞蹈女孩的窗帘”的第二个扭曲:面部和脚上有缺陷,坐标需要改善。这是一种精神,没有梦想的方式。 与Wensheng视频不同,使用视频视频时,用户可以限制环境和主题,这很方便地创建具有高连续性的长视频。如果构成视频的大型模型可以完美地重现环境照片的特征是测试其功能的关键。这种转折的考验标题为:舞者结束了表演,并向下面的观众鞠躬。所使用的图片是由Doubao AI模型生成的,如下所示: (照片来源:Doubao AI一代) Ke Ling扮演稳定的评估角色。角色的广泛动作是许多大型模型产生的最大视频。地板玻璃与角色裙子的实际节奏相对应,角色的一般运动是自然的。但是,当右手在最终运动中从上到下移动时,仍然会出现幽灵。 (图片来源:Keling世代) 也就是说,由视频产生的视频具有较小的宽度,并且运动相对标准,但是手指仍然存在一些分歧。从上到下移动时,手指的数量似乎不正确。但是,吉蒙的表现很棒,没有明显的缺陷。 (图片来源:DREAM生成) 在最终试验中表现不佳的清金再次出现了这个周期的问题。角色的弯腰似乎很慢,在运动期间,手臂,手指和脸部滚动和残疾,显然是基于角色图片。物理处理的运动还不够完美,因此有清晰的图片令人难以置信。 (图片来源:Qingshadow的产生) 除了描述舞者鞠躬的动力词外,我创建的视频还进行了主动性将相机拉回,展示了下面鼓掌的观众场景。问题在于,角色的掌声是非常不一致的,这使它们变得如此。 (照片来源:我拍照) 与上一个评论的结果相似,不同的静态对象模型生成的视频质量相似,并且在处理动态对象的处理中存在明显的差距。至于无关的问题n在手指上,自AI制作了照片和视频以来,它就已经存在,并且至今还没有完全解决。 尽管ke ling iSheres是幻影手臂的一个明显问题,但积极增加困难的圆圈的运动是一个加分,它仍然可以首先排名ji meng。尽管听众鼓掌时也存在讨厌的动作问题,但类似于处理电影镜头也可以为其增加积分。没有主动提高自己的难度,对他的手臂,手指和脸的脸仍然有问题,而他的动作也很慢,而且他的表现是最糟糕的。 值得一提的是,四个AI模型没有删除图片水印并尊重独创性,但是清金使用了自己的水印来阻碍图片水印,并且处理不是很好。 第三轮“ Lotus Pond In Lotus in Moonlight”:阅读比赛,即梦被称为“领先的SCO”在大学入学评论中进行。 在书籍和测试论文中,我们经常阅读著名艺术家的论文,有时我们需要根据自己的阅读理解来回答相应的问题。目前,Lei技术还为视频模型准备了阅读理解,并要求他们根据Zhu Ziqing的散文“ Lotus Pond上的Moonlight”提出视频。特定内容如下: 在圆形的莲花池塘上方,农场的叶子无处不在。叶子很高,就像高大的舞者的裙子一样。在叶子的层中,有些白花偶尔会点点斑点,有些花愉悦地开花,有些则害羞地玩那些花。像珍珠,蓝天中的星星以及不在浴缸中的美丽。微风带有香水的光线,好像在远处高大的建筑物中唱歌的寂静一样。目前,叶子和花朵也像闪电一样颤抖,然后穿过莲花池特利。叶子最初是彼此靠近的,有一个蓝色的波标记。在叶子下面流水,覆盖它,看不到任何颜色;但是叶子更具吸引力 - 吸引人。 在圆形的莲花池塘上方,农场的叶子无处不在。叶子很高,就像高大的舞者的裙子一样。在叶子的层中,有些白花零星点缀,有些愉悦地绽放,有些则害羞地玩鲜花。像珍珠一样,蓝色的星星和不在浴缸中的美丽。微风带有香水的光线,好像在远处高大的建筑物中唱歌的寂静一样。目前,叶子和花朵也像闪电一样颤抖,然后立即穿过莲花池。叶子最初是彼此靠近的,有一个蓝色的波标记。在叶子下面流水,覆盖它,看不到任何颜色;但是叶子更具吸引力 - 吸引人。 Keling创建的视频和质量一样多像以前一样,用手机或相机捕获。人们可能会认为莲花叶和荷花花很现实,水面上的反射和涟漪就像真实的图片。在此视频中,镜头的运动增加了敏捷性。唯一的缺点是,在图片开头导致闪电段的“闪电”句子可能并不令人震惊。 (图片来源:Keling世代) Dream Creation视频的质量也很稳定,荷花和莲花叶会改变空气,水的消耗也在发抖。尽管当用水颤抖时,当植物的茎和叶子令人惊讶时,视频无法正确显示,但它无法隐藏该视频的效率。 至于透明阴影形成的视频,莲花叶和莲花覆盖了水的表面,但它们与段落中的“叶子很高”不一致H,并且它们没有显示波标记和流水的特性。整个视频是静态的,只有略有变化。 (图片来源:Qingshadow的产生) 如果闪电闪烁在视频中已经充满了大量的唱片,可以用天空的雷声来解释,那么奇怪的人的头从图片中钻出我的水中,只能用笑话来解释:“莲花是精神上耕种的”。这种场景可能是因为我不理解“另一个刚从浴缸中脱颖而出”的句子。气象产生的图片是新鲜和美丽的。如果没有水外的钻探人的照片,则可以给它一个很高的标记,但这是可惜的。 (照片来源:我拍照) 随着这些试验的旋转,最好的表现就是梦想。图片显示了沿风的莲花池塘场景,没有不必要的元素。第二个是灵活的,镜头的进展适当ly,闪电最初也很容易更改。彼此之间的清庆是母马的问题,他们的表现非常困难。 与口语文本相比,散文通常更模糊和难以理解,并且可以理解,存在一些偏差。它可以显示在莲花池,莲花和莲花叶中。可以看出,许多AI模型都以识别人类语言而闻名。 摘要:Ke Ling和Ji Meng与冠军并列,而清庆和射击略低。 从三轮测试的结果中不难看出,对于大型视频模型而言,在固定镜头下具有较小动作幅度的场景是没有问题的,而且生成的视频足以是假的和真实的。当涉及更大的运动范围的场景时,Ke Linghe Jimeng的性能稍强。 其中,凯林想增加自己的困难,例如bate妇女对我的困难多得多,荷花池相机等要多得多,她理解文本说明的能力非常准确。 也就是说,梦想致力于找到稳定,在三个试验中没有重大错误。对所有三个试验都有一个严重的问题。第一个视频形成的是一匹马在空中行走,第二个视频滚动,动作速度很慢,第三次视频未能正确描述场景。 至于射击我,我在三次试验中的整体表现都很漂亮,除了最后一圈的奇怪人头。巴马的全球用户超过6000万,在国内市场的力量和受欢迎程度之间有一个空间。 几个月前,Lei Technology对许多AI模型进行了评论,但它们的性能使我失望了,而由此产生的图片则是艰难而虚假的。在短短几个月内,AI模型正在改变现实世界中的身体变化,理解已经增加到更高的水平,这几乎很难t认识到光与阴影效果的真实性,衣服的节奏等。 Keling和Jimeng的背后是领先的顶级视频平台Kuaishou和Doong,拥有大量的培训视频资源,其升级范围也是最大的。视频模型领域的战斗即将开始,凯·林(Ke Ling)和吉曼(Ji Meng)似乎有资格争夺王位。 百度(Baidu 根据接口新闻的报道,在百度局长在2024年第三季度的百度董事大会上,百度和首席执行官董事长罗宾·李(Robin Li)表示,索拉一代的一代人的投资周期很长,无法赚取任何收入。无论它多么受欢迎,百度都不会这样做。但是,百度最近在AI Day Technology开放日启动了Musteesteamer视频和绘画平台的视频生成的自发模型,并声称Musesteamer的排名在VBENCH I2V作者列表中,全球第一名的总分为89.38%。 Lei Technology进入了Huixiang一段时间,并有经验。该平台相对简单,仅提供两个功能:视频生成和数字生活的生成。数字生活的产生尚未开放,视频发电仅支持照片。 因此,雷技术还尝试了问题的问题。除了角色的面部表情不够自然并且动作稍慢外,在其他方面的表现也不如大型模型差,例如ke ling和ji meng。光和阴影的影响在该区域,尤其是脚的运动。但是,该视频也存在问题。迪亚奥似乎想删除已输入图片的水印,但它们无法完全删除它们。 (图像来源:绘画非升级形成) 百度只有一个解释即将进入视频生成模型领域的ATION,也就是说,它已经看到了视频生成模型的前景及其对百度带来的好处。 视频生成模型在专业领域取得了许多成就。除了开始时提到的“超现实”外,还有“ Sanxingdui:未来的启示录”,“神话中文”,“新世界加载”,“霜”和其他内容。 Huixiang平台提供的数字生活的功能很可能用于创建微短戏剧。数字人员的图像可以在许多视频中使用,从而使用户更容易创建内容。此外,通常从1分钟到3分钟的微型戏剧,而创作非常困难。大型AI模型可以提高视频质量,因此微短戏剧不仅可以保留在大型对话和小场景中,而且可以展示许多场景。 作为国内视频生成模型的领导者,Keling用户群EXCE在今年的第一季度,EDS 2200万,比初始阶段的阶段增加了25倍,总共形成了1.68亿次视频和3.44亿张照片。 Keling 2.0模型领导了AI基准测试机构人工分析的视频列表的人工评论。 无论是Ke Ling,电影数量中用户数量的爆炸性增长,还是Baidu进入视频生成模型的进入,它表明视频生成模型即将在爆炸性期间团结起来。但是,就视频生成模型的当前功能而言,普通人很难与他们一起创建长时间的视频,并且视频模型处理大型行为的能力仍然是相同的改进需求。专业团队有足够的技术实力和资源来优化视频,以消除AI生成的视频中的缺陷。 仅在几个月内,视频模型是从质量到缺陷和MA的质量形成的快速发展。也许几个月来,视频模型产生的内容将不再相等,但是预计生成的视频持续时间将增加。回到Sohu看看更多
分享到