LTX-2是基于DiT的音视频生成模型,已开源,支持直接输出画面、旁白和现场音效。该模型在NVIDIA H100上比Wan 2.2-14B快约18倍,适合快速生成短视频和广告,但在多人对白时可能会出现混乱