谷歌发布Veo 3.1,实现更锐利画面、真实纹理与同步音频生成,全面升级Flow平台视频创作能力。
谷歌重磅升级!Veo 3.1来了,画面更锐利、纹理更真实、音效更震撼!
2025年10月15日,谷歌DeepMind正式发布了其最新一代AI视频生成模型——Veo 3.1,如果你还在用旧版Veo 3,那你可能已经落后了一个时代。这次更新不仅让画面细节更加锐利清晰,连材质纹理都逼真到让人怀疑是不是实拍,更关键的是——它终于能生成匹配画面的高质量音频了!没错,音画同步不再是梦!
Veo 3.1现已全面接入谷歌的Flow平台、Gemini应用,以及面向企业的Vertex AI服务。据谷歌官方透露,上一代Veo 3自五个月前上线以来,已经生成了超过2.75亿条短视频,可见AI视频创作的热度有多高。而这次Veo 3.1的登场,无疑是要把这股热潮推向新高峰。
先来说说这次最让人兴奋的功能升级——音频生成!这是Flow平台首次支持AI生成声音,而且覆盖三大核心功能。第一个叫“素材转视频”(Ingredients to video),你可以上传多张参考图,比如人物、道具、场景风格,AI就能自动把这些元素融合成一段连贯视频,还能配上贴合情境的音效。想象一下,你画了个角色草图,再加个背景图,几秒钟就生成一段带对话或环境音的动画短片,是不是超酷?
第二个功能叫“图像转视频”(Images to video),它能在两张你指定的图片之间生成丝滑过渡的动态视频。你可以自由设定起始帧和结束帧,掌控节奏和镜头语言。更厉害的是,Veo 3.1会根据画面内容智能生成匹配的背景音或动作音效,比如风吹树叶、脚步声、引擎轰鸣,全都自动搞定。
第三个功能叫“视频延展”(Extend),顾名思义,就是让AI接着你现有的视频继续往下拍。比如你有一段10秒的镜头,AI能从最后一帧开始,合理延续剧情、动作和场景,并同步生成后续的音频。虽然谷歌强调这些音频功能目前还处于实验阶段,会根据用户反馈持续优化,但光是现在这个水平,已经足够让短视频创作者、广告团队甚至独立电影人眼前一亮了。
除了生成能力,Veo 3.1在视频编辑方面也大有突破。Flow平台新增了“插入”(Insert)工具,允许你在已有场景中加入新元素——不管是现实中的细节,比如一盏台灯、一只猫,还是奇幻生物,比如龙或外星人,AI都会自动调整光影、阴影和透视,让新元素无缝融入原画面,毫无违和感。更令人期待的是即将上线的“移除”(Remove)功能,它能智能擦除画面中你不想要的人物或物体,并用AI自动补全背景,真正做到“所想即所得”。
说到使用方式,Veo 3.1的访问权限按订阅等级划分。免费用户每月可获得100个AI积分;升级到“谷歌AI Pro”套餐,每月有1000积分;而顶配的“谷歌AI Ultra”则提供高达25,000积分,并包含对Veo 3系列的完整访问权限,尤其是速度最快的“Veo 3 Fast”版本,适合对生成效率要求极高的专业用户。普通用户现在就可以在Gemini应用里直接体验Veo 3.1的部分功能,开发者则可通过Gemini API调用,企业客户则能通过Vertex AI部署到自己的工作流中。
值得一提的是,本文作者马蒂亚斯·巴斯蒂安(Matthias Bastian)是知名AI媒体《解码者》(THE DECODER)的联合创始人兼出版人,长期深耕人工智能与人机交互领域,专注于探讨AI如何从根本上重塑人类与计算机的关系。他的报道以深度、前瞻性和实践导向著称,在全球AI从业者和科技爱好者中拥有广泛影响力。
总的来说,Veo 3.1不只是一个模型的迭代,它标志着AI视频生成正从“能用”迈向“好用”甚至“惊艳”。无论是画面精度、材质真实感,还是首次集成的音视频协同生成能力,都显示出谷歌在多模态AI领域的深厚积累。对于内容创作者而言,这意味着更低的制作门槛、更高的创意自由度;而对于整个行业来说,这或许预示着AI原生视频时代的真正开启。
当然,技术越强大,我们越要理性看待。AI工具终究是辅助,真正的创意和叙事灵魂,依然掌握在人类手中。但不可否认的是,像Veo 3.1这样的工具,正在把我们推向一个“人人都是导演”的未来。
Veo 3.1炸裂登场!AI视频进入音画同步新时代