【笔记】WhisperDesktop学习笔记

前言

Const-me/Whisper学习笔记

准备工作

  • 大模型
    • ggml-model-whisper-base.bin:基本模型
    • ggml-model-whisper-large.bin:最大模型
    • ggml-model-whisper-medium.bin:中等模型
    • ggml-model-whisper-small.bin:小模型
    • ggml-model-whisper-tiny.bin:极小模型

命令行工具

下载依赖

1
2
3
certutil -urlcache -split -f https://github.com/Const-me/Whisper/releases/download/1.11.0/cli.zip
"C:\Program Files\7-Zip\7z.exe" x cli.zip -ocli
cd cli

查看支持被调用的GPU

1
.\main.exe --list-adapters

语音转文本

-l zh:指定识别的语言为中文
-osrt:指定输出的字幕格式为.srt
-m <file>.bin:指定大模型文件
-f <file>.mp4:指定输入的音频或视频文件

1
.\main.exe -l zh -osrt -m .\ggml-model-whisper-medium.bin -f <file>.mp4

GUI工具

下载依赖

1
2
certutil -urlcache -split -f https://github.com/Const-me/Whisper/releases/download/1.12.0/WhisperDesktop.zip
"C:\Program Files\7-Zip\7z.exe" x WhisperDesktop.zip -oWhisperDesktop

语音转文本

  • 载入大模型

  • Language设置为Chinese->Transcribe File指定输入的视频文件->Output Format设置为SubRip subtitles指定字幕格式,并指定输出的文件路径和文件名

完成

参考文献

哔哩哔哩——痕继痕迹