1 环境准备
- Python安装:
- 【Python】Windows搭建Python环境
- 注意: 目前需python版本 3.9 以上,具体可看官方文档

2 faster-whisper安装
- (1)前往 faster-whisper ,选择 tags ,下载对应的版本,这边以最新版本 v1.2.1 为例


- (2)解压并打开文件夹,地址栏输入
cmd,打开命令行,输入命令pip install faster-whisper进行安装

3 模型下载
- (1)前往 【Hugging Face】 下载模型,推荐下载 faster-whisper-large-v3 ,效果最好

- (2)将 .bin ,.json 文件下载,放到同一个文件夹下,文件夹路径随意


4 GPU推理加速(可选)
需安装 CUDA 12 , cuDNN 9
注意:
- CUDA安装需要看电脑支持的版本,若不支持安装12或11,只能放弃GPU加速
- CUDA版本为11,或cuDNN版本为8,需对
ctranslate2降级,使用指令pip install --force-reinstall ctranslate2==4.4.0- CUDA11 + cuDNN8 降级至 3.24.0
- CUDA12 + cuDNN8 降级至 4.4.0
4.1 CUDA安装
- 具体看 【推理加速】
4.2 cuDNN安装
- (1)前往 【cuDNN Archive】,选择版本

- (2)按照自己电脑实际情况,下载安装包

- (3)安装默认下一步即可
5 运行
- (1)新建后缀名 .py 的文件,复制下面内容进去,并按实际情况修改
|
|
- (2)运行命令
python xxx.py,来执行上面创建的py文件
6 效果演示
- (1)歌曲转歌词
- 有不准确的地方,但整体的准确率挺高,不准确的地方后期靠手动修正即可
| 歌曲信息 | 音频 |
|---|---|
| 徐洁儿 - 错误的相遇 |
|
|

