PromptForge
返回列表
tool视频转录AI

一款长视频会议纪要、访谈节目精剪、课程速览的AI神器:whisperVideo

whisperVideo是一款AI工具,能够将长视频中的语音转为文字,并自动识别说话人,将内容与画面中的人脸对应,生成带有说话人ID的字幕和可视化面板。它支持小时级素材,自动分场景和段落,适用于访谈、电影剪辑和会议纪要回顾。使用WhisperX进行文本转录,Pyannote进行说话人分离,结合SAM3进行人脸检测,最终整合所有信息生成字幕和面板视图

22 浏览0 收藏3/5/2026

whisperVideo是一款AI工具,能够将长视频中的语音转为文字,并自动识别说话人,将内容与画面中的人脸对应,生成带有说话人ID的字幕和可视化面板。它支持小时级素材,自动分场景和段落,适用于访谈、电影剪辑和会议纪要回顾。使用WhisperX进行文本转录,Pyannote进行说话人分离,结合SAM3进行人脸检测,最终整合所有信息生成字幕和面板视图