苹果新 Speech 技术出击!34分钟4K视频转录仅需45秒,速度超OpenAI 55%

作者
2025-06-19
5次阅读
人工智能
文章详情

近日,科技媒体 macstories 通过一项实测,揭示了苹果公司全新推出的 Speech API 的强大性能。通过转录一段长达34分钟、大小为7GB 的4K 视频,该技术仅用时45秒完成转录,速度之快令人惊叹。这项技术是在2025年 WWDC 上宣布的,包括 SpeechAnalyzer 和 SpeechTranscriber 模块。macstories 团队使用了基于这些模块开发的 Yap 应用工具进行测试。结果显示,Yap 在处理视频时展现出了显著的速度优势,远超目前市场上其他主流转录工具。在与竞争对手的对比中,Yap 完成转录所需时间为45秒,而 OpenAI 的 Whisper(MacWhisper V3Turbo 版本)则需要101秒,速度慢了55%。其他工具如 VidCap 和 MacWhisper V2 的转录时间分别为1分55秒和3分55秒。尽管所有工具在专有名词识别方面存在一定误差,但 Yap 的本地化运算能力使其在处理速度上具有无可比拟的优势。这意味着,如果用户每周处理多段视频,使用 Yap 将节省大量时间,提升工作效率。苹果在转录技术领域的这一创新不仅提高了效率,也为创作者、教育工作者和内容制作者带来了便利。这项新技术标志着语音转录领域的一次革命,未来的内容生产将因其而变得更加高效与智能。