Buzz語音識別轉(zhuǎn)文字工具,一款神級軟件,能自動識別歌曲或者視頻里的語音內(nèi)容,并將其提取轉(zhuǎn)換為可編輯的文本格式,方便進(jìn)行字幕添加,文字導(dǎo)入等操作。Buzz軟件支持90多種語言,自帶翻譯功能,識別率高,并且自身為單文件程序,使用方便,支持官方中文。本站帶來最新Buzz 0.8版本資源下載,有需要的朋友們快來體驗(yàn)吧!
Buzz最新版功能
導(dǎo)入音頻和視頻文件并導(dǎo)出文本到 TXT、SRT 和 VTT
從你計(jì)算機(jī)的麥克風(fēng)轉(zhuǎn)錄和翻譯成文本(資源密集型且可能不是實(shí)時(shí)的)
支持Whisper、 Whisper.cpp、Faster Whisper、 與Whisper 兼容的 Hugging Face 模型和OpenAI Whisper API
適用于 Mac、Windows 和 Linux
軟件特點(diǎn)
- 導(dǎo)入音頻和視頻文件,并將轉(zhuǎn)錄導(dǎo)出為 CSV、SRT、TXT 和 VTT 格式。
- 支持通過計(jì)算機(jī)麥克風(fēng)進(jìn)行實(shí)時(shí)語音轉(zhuǎn)錄和翻譯(請注意,使用 Whisper 進(jìn)行音頻轉(zhuǎn)錄可能會消耗較多的系統(tǒng)資源,轉(zhuǎn)錄的實(shí)時(shí)性取決于系統(tǒng)資源和所選的語言和模型大小)。
- 支持超過90種語言的音頻轉(zhuǎn)錄,包括從 X 語言到英文文本和從 X 語言到 X 語言的轉(zhuǎn)錄。
- 支持 Whisper、Whisper.cpp、Faster Whisper、Whisper 兼容的 Hugging FaCE 模型以及 OpenAI Whisper API。
- 提供命令行界面。
- 可在 Mac、Windows 和 Linux 系統(tǒng)上使用。
軟件說明
1. 下載和安裝:從 Buzz 的官方網(wǎng)站或開源代碼倉庫下載適用于您操作系統(tǒng)的版本,并按照安裝說明進(jìn)行安裝。
2. 配置語音輸入:連接麥克風(fēng),確保系統(tǒng)正確識別麥克風(fēng)設(shè)備。
3. 啟動 Buzz:打開 Buzz 應(yīng)用程序或在終端中運(yùn)行 Buzz 命令。
4. 選擇輸入方式:根據(jù)需求選擇實(shí)時(shí)語音輸入或?qū)胍纛l、視頻文件。
5. 開始轉(zhuǎn)換:根據(jù)界面提示或命令行參數(shù)設(shè)置,開始進(jìn)行語音轉(zhuǎn)文字操作。
6. 導(dǎo)出結(jié)果:轉(zhuǎn)換完成后,將結(jié)果導(dǎo)出為文本文件、字幕文件或其他合適的格式。
操作方法
文件導(dǎo)入
要導(dǎo)入文件:
單擊文件菜單上的導(dǎo)入媒體文件(或工具欄上的“+”圖標(biāo),或 Command/Ctrl + O)。
選擇音頻或視頻文件。
選擇任務(wù)、語言和模型設(shè)置。
單擊運(yùn)行。
當(dāng)轉(zhuǎn)錄狀態(tài)顯示“已完成”時(shí),雙擊該行(或選擇該行并單擊“⤢”圖標(biāo))以打開轉(zhuǎn)錄。
字段選項(xiàng)默認(rèn)說明
導(dǎo)出為“TXT”、“SRT”、“VTT” “TXT”導(dǎo)出文件格式
Word-Level Timings Off / On Off 如果選中,轉(zhuǎn)錄將為音頻中的每個(gè)單詞生成單獨(dú)的字幕行。 僅當(dāng)“導(dǎo)出為”設(shè)置為“SRT”或“VTT”時(shí)啟用。
(有關(guān)任務(wù)、語言和質(zhì)量設(shè)置的更多信息,請參閱現(xiàn)場錄制部分。)
Buzz 上的媒體文件導(dǎo)入
現(xiàn)場錄音
要開始現(xiàn)場錄制:
選擇錄音任務(wù)、語言、質(zhì)量和麥克風(fēng)。
單擊記錄。
注意:使用默認(rèn)的 Whisper 模型轉(zhuǎn)錄音頻會占用大量資源。 考慮使用 Whisper.cpp Tiny 模型來獲得實(shí)時(shí)性能。
字段選項(xiàng)默認(rèn)說明
任務(wù)“轉(zhuǎn)錄”、“翻譯”、“轉(zhuǎn)錄”、“轉(zhuǎn)錄”將輸入的音頻轉(zhuǎn)換為所選語言的文本,而“翻譯”則將其轉(zhuǎn)換為英文文本。
語言 有關(guān)受支持語言的完整列表,請參閱 Whisper 的文檔 “檢測語言” “檢測語言”將嘗試根據(jù)前幾秒檢測音頻中的口頭語言。 但是,建議選擇一種語言(如果已知),因?yàn)樵谠S多情況下它會提高轉(zhuǎn)錄質(zhì)量。
質(zhì)量“非常低”、“低”、“中”、“高” “非常低” 轉(zhuǎn)錄質(zhì)量決定了用于轉(zhuǎn)錄的 Whisper 模型。 “Very Low”使用“tiny”模型; “Low”使用“base”模型; “中”使用“小”模型; 而“高”使用“中”模型。 更大的模型產(chǎn)生更高質(zhì)量的轉(zhuǎn)錄,但需要更多的系統(tǒng)資源。 有關(guān)模型的更多信息,請參閱 Whisper 的文檔。
麥克風(fēng) [可用系統(tǒng)麥克風(fēng)] [默認(rèn)系統(tǒng)麥克風(fēng)] 用于錄制輸入音頻的麥克風(fēng)。