PromptForge
返回列表
model视频生成模型开源模型

基于DiT的音视频基础模型:LTX-2 已开源,19B,直接输出画面+旁白+现场音效视频

LTX-2是基于DiT的音视频生成模型,已开源,支持直接输出画面、旁白和现场音效。该模型在NVIDIA H100上比Wan 2.2-14B快约18倍,适合快速生成短视频和广告,但在多人对白时可能会出现混乱

22 浏览0 收藏3/5/2026

LTX-2是基于DiT的音视频生成模型,已开源,支持直接输出画面、旁白和现场音效。该模型在NVIDIA H100上比Wan 2.2-14B快约18倍,适合快速生成短视频和广告,但在多人对白时可能会出现混乱