Skip to main content

全网免费AI语音识别字幕工具对比 1.0

做自媒体视频的时候,或者会议演讲记录,生成字幕语音识别都是刚需。所以本次对全网类似产品亲身使用,结合实际体验,从短期优势,长期优势,短期劣势,长期劣势四个方面对产品进行分析,类似于SWOT分析法:

一 Whisper Web App

图标

使用链接: https://whisper.godlucky.net/

1.1 短期优势

  • 识别正确率90%以上
  • 免费使用
  • 仅需浏览器无需安装软件
  • 对电脑配置无要求,内存2G以上
  • 数据本地运行,保护隐私
  • 支持至少20种语言识别,包括英语,粤语,日语,法语等
  • UI比较简易,上手迅速

1.2 短期劣势

  • 因本地运行,且由CPU生成,生成速度由机器配置决定,相对较慢
  • 不适合方言和专有名词较多的语音识别
  • 不适合超过时长超过1h内容的语音识别
  • 无录音功能

1.3 长期优势

  • 由个人部署,可以一直保持免费使用

1.4 长期劣势

  • 由个人部署,功能比较简单

二 剪映

使用链接:https://www.capcut.cn/

2.1 短期优势

  • 识别正确率90%以上
  • 免费使用
  • 识别速度较快
  • 可以配合视频快速修改字幕
  • 功能丰富
  • 适合超过1h的语音识别

2.2 短期劣势

  • 需要下载软件
  • 对电脑配置有一定要求
  • 需要联网上传语音数据,有隐私问题
  • 只支持中文和英文,不支持其他语言
  • UI较为复杂,需要一定时间上手
  • 不适合方言和专有名词较多的语音识别
  • 支持实时录音,但是录音时不可实时剪辑语音内容

2.3 长期优势

  • 公司出品,功能丰富

2.4 长期劣势

  • 公司有盈利要求,未来可能收费

三 必剪

使用链接: https://bcut.bilibili.cn/

3.1 短期优势

  • 识别正确率90%以上
  • 免费使用
  • 识别速度较快
  • 可以配合视频快速修改字幕
  • 功能丰富
  • 支持实时录音,同时可以实时剪辑语音内容

3.2 短期劣势

  • 需要下载软件
  • 对电脑配置有一定要求
  • 需要联网上传语音数据,有隐私问题
  • 只支持中文和英文,不支持其他语言
  • UI较为复杂,需要一定时间上手
  • 不适合超过1h的语音识别,使用会卡顿
  • 不适合方言和专有名词较多的语音识别

3.3 长期优势

  • 公司出品,功能丰富

3.4 长期劣势

  • 公司有盈利要求,未来可能收费

四 讯飞语音识别

使用链接: https://www.iflyrec.com/

4.1 短期优势

  • 识别正确率95%以上
  • 识别速度较快
  • 仅需浏览器,无需安装软件
  • 对电脑配置无要求
  • 功能丰富,操作简单
  • 支持超过1h的语音识别
  • 支持方言和专有名词较多的语音识别,有人工识别,更加精准

4.2 短期劣势

  • 付费使用,每月98元
  • 需要联网上传语音数据,有隐私问题
  • 只支持中文和英文,不支持其他语言
  • 不支持实时录音

4.3 长期优势

  • 公司出品,功能丰富,效果更好

4.4 长期劣势

  • 需要不差钱

结论

工具适用场景使用指南推荐指数
Whisper Web App有隐私安全顾虑,有多国语言需求,需要快速上手https://whisper.godlucky.net/⭐⭐⭐⭐⭐
剪映自媒体较长配音字幕自动生成https://www.capcut.cn/⭐⭐⭐⭐⭐
必剪自媒体较短配音字幕自动生成,实时录音操作方便https://bcut.bilibili.cn/⭐⭐⭐⭐
讯飞语音识别有方言识别的需求,对识别正确率有明确要求https://www.iflyrec.com/⭐⭐⭐