「Buzz」修訂間的差異
跳至導覽
跳至搜尋
行 11: | 行 11: | ||
[https://github.com/chidiwilliams/buzz/releases/download/v1.2.0/Buzz-1.2.0-windows.exe Buzz-1.2.0-windows.exe] (1.51 GB) | [https://github.com/chidiwilliams/buzz/releases/download/v1.2.0/Buzz-1.2.0-windows.exe Buzz-1.2.0-windows.exe] (1.51 GB) | ||
+ | ==使用(語音轉文字)== | ||
+ | * 匯入影片或音訊檔有兩種方式,一個是按 + 符號,另一個則是點擊 File 選單中的 Import | ||
# 使用的運算模型大小,模型愈大,正確度愈高,但需要的電腦硬體也愈高,運算時間也會增加: | # 使用的運算模型大小,模型愈大,正確度愈高,但需要的電腦硬體也愈高,運算時間也會增加: | ||
#* 預設是 tiny ,但起碼要 small 以上大小,才有讓人很滿意的文字轉換效果。 | #* 預設是 tiny ,但起碼要 small 以上大小,才有讓人很滿意的文字轉換效果。 | ||
+ | #* Whisper 模型部分,如果你是要轉錄中文,那建議用 Large,英文的話是可以選小一點。 | ||
# 轉換方式如果是單純的語音轉文字,就選擇 Transcribe(錄製) 即可。 | # 轉換方式如果是單純的語音轉文字,就選擇 Transcribe(錄製) 即可。 | ||
# 最後設定要轉換出來的檔案格式。 | # 最後設定要轉換出來的檔案格式。 | ||
# 按下「 Run 」。 | # 按下「 Run 」。 | ||
+ | * 要麥克風錄音即時錄製的話,就點擊左上角麥克風圖示 | ||
+ | # 設定你要的模型、麥克風輸入來源,Language 部分基本上用預設的 Detect Language 自動偵測就好,偵測準度還蠻高的 | ||
+ | # 模型部分支援 Whisper、Faster Whisper 和 Hugging Face。 | ||
+ | #*Whisper 部分有 Tiny、Base、Small、Medium、Large 五種。 |
於 2025年8月7日 (四) 08:12 的最新修訂
目前開源、免費用 AI 分析影片檔案、錄音檔案,把語音轉成逐字稿。應用於製作影片字幕、會議逐字稿。
同時可用於三種作業系統:
- Windows 11 / Windows 10
- Mac
- Linux
可平衡各種轉換效果(取決於你使用的 Whisper 模型大小)與速度(取決於你的電腦硬體)。
下載 (github)
Buzz-1.2.0-windows.exe (1.51 GB)
使用(語音轉文字)
- 匯入影片或音訊檔有兩種方式,一個是按 + 符號,另一個則是點擊 File 選單中的 Import
- 使用的運算模型大小,模型愈大,正確度愈高,但需要的電腦硬體也愈高,運算時間也會增加:
- 預設是 tiny ,但起碼要 small 以上大小,才有讓人很滿意的文字轉換效果。
- Whisper 模型部分,如果你是要轉錄中文,那建議用 Large,英文的話是可以選小一點。
- 轉換方式如果是單純的語音轉文字,就選擇 Transcribe(錄製) 即可。
- 最後設定要轉換出來的檔案格式。
- 按下「 Run 」。
- 要麥克風錄音即時錄製的話,就點擊左上角麥克風圖示
- 設定你要的模型、麥克風輸入來源,Language 部分基本上用預設的 Detect Language 自動偵測就好,偵測準度還蠻高的
- 模型部分支援 Whisper、Faster Whisper 和 Hugging Face。
- Whisper 部分有 Tiny、Base、Small、Medium、Large 五種。