9月11日狠狠干性图片,由生数科技和清华大学辩论研发的自研原创视频大模子Vidu迎来环节更新“主体参照”(Subject Consistency)功能,该功能好像已毕对大肆主体的一致性生成,让视频生成愈加踏实、可控。现时该功能面向用户免费绽开。
主体参照功能上线 责罚扮装一致性问题
现时,不管是文生图功能,已经文生视频功能,一个广受诟病的问题即是图片或视频中出现形象的主体一致性问题。雷同的教唆词,雷同的大模子,生成两次,所生成的内容并不一样,在艺术作品中,这就会导致主角的形象弗成保握一致,也成为了AI生成作品与东说念主类最大的辞别之一。
为了责罚这一问题,业界曾尝试继承“先AI生图、再图生视频”的才略,通过AI绘制器用如 Midjourney 生要素镜头画面,先在图片层面保握主体一致,然后再将这些画面摇荡为视频片断并进行编订合成。
但问题在于,AI 绘制的一致性并不好意思满,持续需要通过反复修改和局部重绘来责罚。更紧要的是狠狠干性图片,本色的视频制作过程中波及开阔场景和镜头,这种才略在处理多组分镜头的场景时,生图的责任量弘大,能占到全历程的一半以上,且最终的视频内容也会因为过分依赖分镜头画面而阑珊创造性和无邪性。
而在9月11日生数科技举办的媒体绽开日活动上,生数科技展示了“主体参照”功能,该功能允许用户上传大肆主体的一张图片,Vidu 就好像锁定该主体的形象,通过描摹词大肆切换场景,输出主体一致的视频。
该功能不局限于单一双象,而是面向“大肆主体”,不管是东说念主物、动物、商品,已经动漫扮装、编造主体,皆能确保其在视频生成中的一致性和可控性,这是视频生成鸿沟的一大改造。Vidu 亦然众人首个赞助该才调的视频大模子。
比如进行东说念主物扮装的“主体参照”,不管是确切东说念主物已经编造扮装,Vidu 皆能保握其在不同环境中、不同镜头下的形象连贯一致。如生数科技董事长、CEO唐家渝在现场展示了通过提供陈晓旭上演的林黛玉形象后,生成的不同场景、不同着装下,“林黛玉喝咖啡”镜头皆能看出是“吞并个林黛玉”。
AI视频创作连贯性将大大进步 AI完整叙事期间莅临
依据该功能,中央播送电视总台导演、AIGC艺术家石宇翔(森海荧光)创作了一条动画短片《夏季的礼物》,在共享创作历程中他示意,与基础的图生视频功能比拟,“主体参照”功能开脱了静态图片的经管,生成的画面更具感染力息争放度,让创作的连贯性大大进步。同期匡助他爽朗7成傍边的生图责任量,显耀提效,让他好像将更多元气心灵放在故事内容的打磨上,而非生成图片素材上。同期,一致性让后期编订也愈加便捷。
唐家渝示意, "主体参照"这一全新功能的上线,代表着 AI 完整叙事的启航点,AI 视频创作也将迈向更高效、更无邪的阶段。不管是制作短视频、动画作品已经告白片,在叙事的艺术中,一个完整的叙事体系是“主体一致、场景一致、作风一致”等要素的有机团结。
因此,视频模子要达到叙事的完整性,就必须在这些中枢元素上已毕全面可控。“主体参照”功能是 Vidu 在一致性方面迈出的紧要一步,但这只是是运行。夙昔,Vidu 将连续探索如何精准胁制多主体交互、作风合股、多变场景踏实切换等复杂元素,以高慢更高级次的叙事需求。
他示意,从更长久的视角来看,一朝已毕了全面的可控性,视频创作行业将资格一场颠覆性的变革。届时,扮装、场景、作风,致使镜头欺诈、光影成果等元素,皆将摇荡为可无邪调遣的参数。用户只需要动入手指、调调参数,就不错完成一部影像作品的创作,而每一部作品的背后,也将是用户基于AI构建出的私有寰宇不雅和自我抒发。
天天好逼编订:李华山狠狠干性图片