pyVideoTrans視頻翻譯配音是一款開源免費(fèi)視頻音頻翻譯軟件,基于ChatTTS的UI軟件,ChatTTS 可用于大型語言模型助手的對話任務(wù)、對話語音生成、視頻介紹、教育和培訓(xùn)內(nèi)容的語音合成等。通過大量和多樣化的數(shù)據(jù)集訓(xùn)練,ChatTTS確保了合成語音的自然度。
軟件說明
Pyvideotrans是一款卓著的智能化視頻處理系統(tǒng),專精于視頻翻譯與配音藝術(shù),以其卓越的技術(shù)實(shí)力實(shí)現(xiàn)對原始視頻中音頻信息的精準(zhǔn)捕捉、智能翻譯,以及與背景音樂等多元原視頻元素的無縫融合,從而匠心獨(dú)運(yùn)地創(chuàng)造出搭載全新語言配音與字幕的再創(chuàng)作視頻作品。
語音識別:借力先進(jìn)且高效的離線模型,諸如Whisper(由OpenAI研發(fā))或同類高速迭代版本,該系統(tǒng)能以極高精度將視頻中的言語聲波瞬時解碼為可視化的文字劇本。
多源翻譯:廣泛兼容各類在線及離線翻譯服務(wù)資源,涵蓋國際科技巨頭如Microsoft、Google、Baidu、Tencent的翻譯平臺,新興AI力量如ChatGPT、Azure、Gemini、DeepL乃至DeepLX等,乃至特設(shè)的離線翻譯解決方案。此多元化策略確保了翻譯質(zhì)量的權(quán)威性、全面性和時效性,滿足不同場景下的精準(zhǔn)翻譯需求。
文本轉(zhuǎn)語音(TTS):整合業(yè)界領(lǐng)先的文本到語音轉(zhuǎn)換技術(shù)矩陣,囊括Microsoft Edge TTS、Openai TTS-1、Elevenlabs TTS等翹楚,并獨(dú)具開放性,支持用戶根據(jù)個性化需求對接其他TTS API接口,甚至接納如GPT-SoVITS這類前沿的克隆人聲模型。
多語言支持:跨越地理文化的邊界,該系統(tǒng)深度涵蓋了全球主流及眾多特色語系,無論是東方的漢語簡繁體、韓語、日語,西方的英語、俄語、法語、德語、意大利語、西班牙語、葡萄牙語,還是南亞的越南語、泰語,中東的阿拉伯語,歐亞交界的土耳其語,東歐的匈牙利語,南亞次大陸的印度語等,均在支持之列。
ChatTTS是一個為對話場景優(yōu)化的文本到語音轉(zhuǎn)換工具,它專門設(shè)計用于處理大型語言模型(LLM)助手的對話任務(wù),以及對話式音頻和視頻介紹等應(yīng)用。這個工具支持中文和英文,通過大約10萬小時的中英文數(shù)據(jù)訓(xùn)練,ChatTTS 在語音合成方面展現(xiàn)出高質(zhì)量和自然度。
備用下載:https://pan.baidu.com/share/init?surl=uj5hiRE6lZ0lLhhWRZl6-A&pwd=h496
軟件特色
一鍵實(shí)現(xiàn)語音識別->字幕翻譯->配音 = 帶字幕和配音的新視頻
自動視頻翻譯
集成faster-whisper模型/并支持自定義huggingface模型
同時集成批量語音轉(zhuǎn)字幕、批量字幕翻譯、批量配音小工具
多種配音和翻譯渠道
配音:edgeTTS|AzureTTS|OpenAiTTS|Elevenlabs|clone-voice|GPT-SoVITS
翻譯:Google|ChatGPT|DeepL|Gemini|Mircosoft|百度|騰訊|本地模型
可完全離線
翻譯渠道替換為本地模型,配音渠道替換為clone-voice,即可實(shí)現(xiàn)完全本地離線視頻翻譯
免費(fèi)+開源
代碼GitHub公開可審查,免費(fèi)無功能限制,無隱藏收費(fèi)
開源協(xié)議GPL-v3
主要功能
視頻翻譯
PyVideoTrans支持將視頻中的語音識別為文字,并使用先進(jìn)的機(jī)器翻譯技術(shù)將其翻譯成目標(biāo)語言。用戶只需選擇原始視頻和目標(biāo)語言,即可快速獲得翻譯后的視頻。
配音功能
對于已翻譯的視頻,PyVideoTrans還提供配音服務(wù)。用戶可以選擇不同的配音類型和角色,為視頻添加生動的聲音效果,使觀眾更容易理解和接受。
音視頻識別文字
PyVideoTrans還具備音視頻識別文字功能,可以將視頻或音頻中的語音識別為文字,并導(dǎo)出為SRT字幕格式,方便用戶后期編輯和分享。
更新說明
修復(fù) ChatTTS 支持
修復(fù) Google 翻譯
提高AzureTTS默認(rèn)音頻質(zhì)量