【笔记】WhisperDesktop学习笔记
前言
Const-me/Whisper学习笔记
准备工作
- 大模型
ggml-model-whisper-base.bin:基本模型ggml-model-whisper-large.bin:最大模型ggml-model-whisper-medium.bin:中等模型ggml-model-whisper-small.bin:小模型ggml-model-whisper-tiny.bin:极小模型
命令行工具
下载依赖
1 | certutil -urlcache -split -f https://github.com/Const-me/Whisper/releases/download/1.11.0/cli.zip |
查看支持被调用的GPU
1 | .\main.exe --list-adapters |
语音转文本
-l zh:指定识别的语言为中文-osrt:指定输出的字幕格式为.srt-m <file>.bin:指定大模型文件-f <file>.mp4:指定输入的音频或视频文件
1 | .\main.exe -l zh -osrt -m .\ggml-model-whisper-medium.bin -f <file>.mp4 |
GUI工具
下载依赖
1 | certutil -urlcache -split -f https://github.com/Const-me/Whisper/releases/download/1.12.0/WhisperDesktop.zip |
语音转文本
- 载入大模型

Language设置为Chinese->Transcribe File指定输入的视频文件->Output Format设置为SubRip subtitles指定字幕格式,并指定输出的文件路径和文件名
