「Buzz」修訂間的差異

出自跨校選修
跳至導覽 跳至搜尋
(建立內容為「分類:AI 目前'''開源'''、'''免費'''用 AI 分析影片檔案、錄音檔案,把語音轉成逐字稿。應用於製作影片字幕、會議逐字稿…」的新頁面)
 
 
(未顯示同一使用者於中間所作的 1 次修訂)
行 10: 行 10:
 
==下載 ([https://github.com/chidiwilliams/buzz/releases github])==
 
==下載 ([https://github.com/chidiwilliams/buzz/releases github])==
 
[https://github.com/chidiwilliams/buzz/releases/download/v1.2.0/Buzz-1.2.0-windows.exe  Buzz-1.2.0-windows.exe] (1.51 GB)
 
[https://github.com/chidiwilliams/buzz/releases/download/v1.2.0/Buzz-1.2.0-windows.exe  Buzz-1.2.0-windows.exe] (1.51 GB)
 +
 +
==使用(語音轉文字)==
 +
* 匯入影片或音訊檔有兩種方式,一個是按 + 符號,另一個則是點擊 File 選單中的 Import
 +
# 使用的運算模型大小,模型愈大,正確度愈高,但需要的電腦硬體也愈高,運算時間也會增加:
 +
#* 預設是 tiny ,但起碼要 small 以上大小,才有讓人很滿意的文字轉換效果。
 +
#* Whisper 模型部分,如果你是要轉錄中文,那建議用 Large,英文的話是可以選小一點。
 +
# 轉換方式如果是單純的語音轉文字,就選擇 Transcribe(錄製) 即可。
 +
# 最後設定要轉換出來的檔案格式。
 +
# 按下「 Run 」。
 +
* 要麥克風錄音即時錄製的話,就點擊左上角麥克風圖示
 +
# 設定你要的模型、麥克風輸入來源,Language 部分基本上用預設的 Detect Language 自動偵測就好,偵測準度還蠻高的
 +
# 模型部分支援 Whisper、Faster Whisper 和 Hugging Face。
 +
#*Whisper 部分有 Tiny、Base、Small、Medium、Large 五種。

於 2025年8月7日 (四) 08:12 的最新修訂

目前開源免費用 AI 分析影片檔案、錄音檔案,把語音轉成逐字稿。應用於製作影片字幕、會議逐字稿。

同時可用於三種作業系統:

  1. Windows 11 / Windows 10
  2. Mac
  3. Linux

可平衡各種轉換效果(取決於你使用的 Whisper 模型大小)與速度(取決於你的電腦硬體)。

下載 (github)

Buzz-1.2.0-windows.exe (1.51 GB)

使用(語音轉文字)

  • 匯入影片或音訊檔有兩種方式,一個是按 + 符號,另一個則是點擊 File 選單中的 Import
  1. 使用的運算模型大小,模型愈大,正確度愈高,但需要的電腦硬體也愈高,運算時間也會增加:
    • 預設是 tiny ,但起碼要 small 以上大小,才有讓人很滿意的文字轉換效果。
    • Whisper 模型部分,如果你是要轉錄中文,那建議用 Large,英文的話是可以選小一點。
  2. 轉換方式如果是單純的語音轉文字,就選擇 Transcribe(錄製) 即可。
  3. 最後設定要轉換出來的檔案格式。
  4. 按下「 Run 」。
  • 要麥克風錄音即時錄製的話,就點擊左上角麥克風圖示
  1. 設定你要的模型、麥克風輸入來源,Language 部分基本上用預設的 Detect Language 自動偵測就好,偵測準度還蠻高的
  2. 模型部分支援 Whisper、Faster Whisper 和 Hugging Face。
    • Whisper 部分有 Tiny、Base、Small、Medium、Large 五種。