(资料图片仅供参考)
Runway Gen-2:文生视频开放公测:Runway 6 月对Gen-2 开放公测,基于用户提供的文字提示,Gen-2 生成视频。此次公测向所有用户免费提供100 秒的时长,单个视频约4 秒。Gen-2 的训练数据包括2.4 亿张图片、640万个视频剪辑片段以及数亿个学习示例。尽管在专业人士看来,Gen-2 存在较为模糊、颗粒感较重、光线穿透差、帧率不稳定、人物不自然、动物/人物动作诡异等问题,我们认为,在文生视频领域,Gen-2 已经是佼佼者。Gen-2展现了AIGC 能在相当程度上运用所训练的数据,“理解”用户文本提示中的动作,使图片的每帧画面之间能以较为有逻辑性的方式连接起来。我们注意到,其他声称具备文生视频能力的公司,如Meta Make-A-Video 和Phenaki,尚未将此功能开放公测,仅在官网放置了论文入口和部分示例。
另外值得注意的是,Runway 于6 月获得了谷歌参投的1 亿美元投资,估值达到15 亿美元,这意味着巨头的重视。如果将“文生图”“大语言模型用自然语言回复用户的自然语言提问”视作AIGC 爆发的前两波高潮,我们认为,当前AIGC 应用尚处于第三波高潮——文生视频的前夜,它是多模态赛道的一大圣杯。
Photoshop(Beta):生成式填充画面。Adobe 5 月发布的Photoshop(Beta)新增创意填充(Generative Fill)功能,该功能由Adobe FireflyAI 提供。基于文本提示,Photoshop(Beta)可以创造性地扩充用户提供的图片,新增内容致力于与用户文本提示的内容和风格对齐。
Midjourney:生成式放大与缩小画面。文生图应用Midjourney 发布ZoomOut 功能,用户可以将文字生成的图片放大或缩小,这里指的并不是简单的尺寸上的缩放,而是放大图像的画布,使其扩展到其原始边界之外,而无需更改原始图像的内容,新展开的画布将使用提示和原始图像的指导填充。使用这一思路,借助Runway 图片生成视频功能,用户可以实现将某一张图片作为关键帧,将它作为视频的核心场景,实现类似于调整焦距的功能,十分生动。
AIGC 技术更新,影视创作、游戏制作等领域降本增效进一步深化。上述AIGC 应用显然利好影视创作、游戏制作等领域,能极大提高提高生产效率、降低内容的生产成本。并且,我们认为,它们对生产力的提升,并非是通过取代人工的方式,而是辅助人工。
投资建议:我们看好后续AIGC 多模态应用“狂飙”对算力需求的拉动,建议关注:1)光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁;2)算力设备:中兴通讯、紫光股份、锐捷网络、菲菱科思、恒为科技、工业富联、寒武纪、震有科技;3)云算力:光环新网、奥飞数据、数据港、润泽科技、科华数据;4)液冷:英维克、申菱环境、高澜股份、佳力图;5)边缘算力承载平台:美格智能、广和通、移远通信、初灵信息、龙宇股份、网宿科技、佳讯飞鸿。
风险提示:伦理风险:人工智能与人交互过程中,可能出现伦理风险;市场竞争风险:开源大模型的发展一日千里,对商业公司而言,是机遇也是挑战;技术发展与商业落地进度不及预期风险。
上一篇 : 上一秒静音,下一秒爆音,这些音量按钮设计师怎么想的?
下一篇 : 最后一页