Buzz語(yǔ)音識(shí)別轉(zhuǎn)文字工具,一款神級(jí)軟件,能自動(dòng)識(shí)別歌曲或者視頻里的語(yǔ)音內(nèi)容,并將其提取轉(zhuǎn)換為可編輯的文本格式,方便進(jìn)行字幕添加,文字導(dǎo)入等操作。Buzz軟件支持90多種語(yǔ)言,自帶翻譯功能,識(shí)別率高,并且自身為單文件程序,使用方便,支持官方中文。本站帶來(lái)最新Buzz 0.8版本資源下載,有需要的朋友們快來(lái)體驗(yàn)吧!
Buzz最新版功能
導(dǎo)入音頻和視頻文件并導(dǎo)出文本到 TXT、SRT 和 VTT
從你計(jì)算機(jī)的麥克風(fēng)轉(zhuǎn)錄和翻譯成文本(資源密集型且可能不是實(shí)時(shí)的)
支持Whisper、 Whisper.cpp、Faster Whisper、 與Whisper 兼容的 Hugging Face 模型和OpenAI Whisper API
適用于 Mac、Windows 和 Linux
軟件特點(diǎn)
- 導(dǎo)入音頻和視頻文件,并將轉(zhuǎn)錄導(dǎo)出為 CSV、SRT、TXT 和 VTT 格式。
- 支持通過(guò)計(jì)算機(jī)麥克風(fēng)進(jìn)行實(shí)時(shí)語(yǔ)音轉(zhuǎn)錄和翻譯(請(qǐng)注意,使用 Whisper 進(jìn)行音頻轉(zhuǎn)錄可能會(huì)消耗較多的系統(tǒng)資源,轉(zhuǎn)錄的實(shí)時(shí)性取決于系統(tǒng)資源和所選的語(yǔ)言和模型大小)。
- 支持超過(guò)90種語(yǔ)言的音頻轉(zhuǎn)錄,包括從 X 語(yǔ)言到英文文本和從 X 語(yǔ)言到 X 語(yǔ)言的轉(zhuǎn)錄。
- 支持 Whisper、Whisper.cpp、Faster Whisper、Whisper 兼容的 Hugging FaCE 模型以及 OpenAI Whisper API。
- 提供命令行界面。
- 可在 Mac、Windows 和 Linux 系統(tǒng)上使用。
軟件說(shuō)明
1. 下載和安裝:從 Buzz 的官方網(wǎng)站或開(kāi)源代碼倉(cāng)庫(kù)下載適用于您操作系統(tǒng)的版本,并按照安裝說(shuō)明進(jìn)行安裝。
2. 配置語(yǔ)音輸入:連接麥克風(fēng),確保系統(tǒng)正確識(shí)別麥克風(fēng)設(shè)備。
3. 啟動(dòng) Buzz:打開(kāi) Buzz 應(yīng)用程序或在終端中運(yùn)行 Buzz 命令。
4. 選擇輸入方式:根據(jù)需求選擇實(shí)時(shí)語(yǔ)音輸入或?qū)胍纛l、視頻文件。
5. 開(kāi)始轉(zhuǎn)換:根據(jù)界面提示或命令行參數(shù)設(shè)置,開(kāi)始進(jìn)行語(yǔ)音轉(zhuǎn)文字操作。
6. 導(dǎo)出結(jié)果:轉(zhuǎn)換完成后,將結(jié)果導(dǎo)出為文本文件、字幕文件或其他合適的格式。
操作方法
文件導(dǎo)入
要導(dǎo)入文件:
單擊文件菜單上的導(dǎo)入媒體文件(或工具欄上的“+”圖標(biāo),或 Command/Ctrl + O)。
選擇音頻或視頻文件。
選擇任務(wù)、語(yǔ)言和模型設(shè)置。
單擊運(yùn)行。
當(dāng)轉(zhuǎn)錄狀態(tài)顯示“已完成”時(shí),雙擊該行(或選擇該行并單擊“⤢”圖標(biāo))以打開(kāi)轉(zhuǎn)錄。
字段選項(xiàng)默認(rèn)說(shuō)明
導(dǎo)出為“TXT”、“SRT”、“VTT” “TXT”導(dǎo)出文件格式
Word-Level Timings Off / On Off 如果選中,轉(zhuǎn)錄將為音頻中的每個(gè)單詞生成單獨(dú)的字幕行。 僅當(dāng)“導(dǎo)出為”設(shè)置為“SRT”或“VTT”時(shí)啟用。
(有關(guān)任務(wù)、語(yǔ)言和質(zhì)量設(shè)置的更多信息,請(qǐng)參閱現(xiàn)場(chǎng)錄制部分。)
Buzz 上的媒體文件導(dǎo)入
現(xiàn)場(chǎng)錄音
要開(kāi)始現(xiàn)場(chǎng)錄制:
選擇錄音任務(wù)、語(yǔ)言、質(zhì)量和麥克風(fēng)。
單擊記錄。
注意:使用默認(rèn)的 Whisper 模型轉(zhuǎn)錄音頻會(huì)占用大量資源。 考慮使用 Whisper.cpp Tiny 模型來(lái)獲得實(shí)時(shí)性能。
字段選項(xiàng)默認(rèn)說(shuō)明
任務(wù)“轉(zhuǎn)錄”、“翻譯”、“轉(zhuǎn)錄”、“轉(zhuǎn)錄”將輸入的音頻轉(zhuǎn)換為所選語(yǔ)言的文本,而“翻譯”則將其轉(zhuǎn)換為英文文本。
語(yǔ)言 有關(guān)受支持語(yǔ)言的完整列表,請(qǐng)參閱 Whisper 的文檔 “檢測(cè)語(yǔ)言” “檢測(cè)語(yǔ)言”將嘗試根據(jù)前幾秒檢測(cè)音頻中的口頭語(yǔ)言。 但是,建議選擇一種語(yǔ)言(如果已知),因?yàn)樵谠S多情況下它會(huì)提高轉(zhuǎn)錄質(zhì)量。
質(zhì)量“非常低”、“低”、“中”、“高” “非常低” 轉(zhuǎn)錄質(zhì)量決定了用于轉(zhuǎn)錄的 Whisper 模型。 “Very Low”使用“tiny”模型; “Low”使用“base”模型; “中”使用“小”模型; 而“高”使用“中”模型。 更大的模型產(chǎn)生更高質(zhì)量的轉(zhuǎn)錄,但需要更多的系統(tǒng)資源。 有關(guān)模型的更多信息,請(qǐng)參閱 Whisper 的文檔。
麥克風(fēng) [可用系統(tǒng)麥克風(fēng)] [默認(rèn)系統(tǒng)麥克風(fēng)] 用于錄制輸入音頻的麥克風(fēng)。