model视频生成模型开源模型

基于DiT的音视频基础模型：LTX-2 已开源，19B，直接输出画面+旁白+现场音效视频

LTX-2是基于DiT的音视频生成模型，已开源，支持直接输出画面、旁白和现场音效。该模型在NVIDIA H100上比Wan 2.2-14B快约18倍，适合快速生成短视频和广告，但在多人对白时可能会出现混乱

22 浏览0 收藏3/5/2026