Buzz是一款基于OpenAI Whisper模型构建的离线语音转文字工具,适用于Windows、macOS和Linux系统。它能将麦克风输入或音频、视频文件实时转换为文字,支持多种格式导入导出,如TXT、SRT和VTT。Buzz的转换速度快,准确率高,支持多语言识别,并能将结果翻译成英文。
功能和特点

| 功能 | |
| 实时语音转文字 | 将麦克风捕捉到的语音实时转换为文本,适用于会议记录、采访等场景。 |
| 音频和视频文件转录 | 支持多种格式的音频和视频文件转换为文字,便于后续编辑和分析。 |
| 多语言支持 | 支持多种国家的语言识别和处理,具有国际化特性。 |
| 逐句字幕或逐词字幕导出 | 支持导出逐句字幕(SRT)或逐词字幕(VTT)格式。 |
| 翻译功能 | 支持将识别结果翻译成英文。 |
| 离线操作 | 所有语音转录和翻译过程都在本地进行,无需联网,保护用户隐私。 |
使用步骤

1. 下载和安装:
访问Buzz的项目地址,根据操作系统选择相应的安装包进行下载和安装。
2. 启动Buzz:
安装完成后,启动Buzz程序。如果是命令行版本,需要在终端或命令提示符中运行。
3. 下载Whisper模型(如果需要):
第一次使用Buzz时,需要下载Whisper模型。模型大小和语言能力不同,可以根据需求选择合适的模型。
4. 导入音频或视频文件:
通过Buzz的图形用户界面选择“导入”功能,或者使用命令行参数指定文件路径。
5. 开始转换:
选择转换设置,如输出格式(TXT、SRT、VTT等),开始转换过程。
6. 获取结果:
转换完成后,检查生成的字幕或文本文件,确保时间戳和文本内容符合预期。
下载方法

从GitHub下载:
访问Buzz的GitHub页面,下载适用于您操作系统的最新版本。
使用包管理器安装(Linux):
对于Linux用户,可以使用包管理器进行安装。例如,在Ubuntu系统上,可以通过以下命令安装Buzz:
bash
sudo apt-get install libportaudio2
sudo snap install buzz
sudo snap connect buzz:password-manager-service
或者,在Ubuntu 20.04及更高版本上,可以下载并解压Buzz-x.y.z-unix.tar.gz文件进行安装。
用户评价和反馈
优点:
高准确率:基于OpenAI的Whisper模型,转换效果非常出色,即使存在口音问题,转换结果也相对准确。
转换速度快:模型离线存在本地,转换过程无需联网,适合批量转换语音。
跨平台支持:支持Windows、macOS和Linux系统,满足不同用户的需求。
本地离线转换:可以在本地离线环境下运行,保护用户隐私。
多模型支持:兼容多种语音转文字模型,包括Whisper、Whisper.cpp、Faster Whisper等,可以根据需求选择合适的模型进行转换。
缺点:
软件界面只有英文,对于非英语用户可能存在一定的语言障碍。
模型文件较大,下载时间可能较长,尤其是在网络条件不好的情况下。
在一些配置较低的电脑上,转换速度可能会受到影响。
中文输出默认为繁体字,需要手动转换为简体字。