PromptForge
返回列表
toolASR开源

英伟达最新开源的一款ASR:Nemotron Speech ASR,专攻低延迟实时语音智能体场景,多人同时对话不爆延迟

英伟达推出的Nemotron Speech ASR专注于低延迟实时语音处理,支持多人对话,单句转录时间仅需24毫秒,整体延迟低于500毫秒。通过FastConformer架构和缓存感知机制,语音特征实现增量计算,动态配置延迟模式以满足不同应用需求

27 浏览0 收藏3/5/2026

英伟达推出的Nemotron Speech ASR专注于低延迟实时语音处理,支持多人对话,单句转录时间仅需24毫秒,整体延迟低于500毫秒。通过FastConformer架构和缓存感知机制,语音特征实现增量计算,动态配置延迟模式以满足不同应用需求