Spleeter基于TensorFlow 開發(fā),本身運行速度非常快。分離過程可以在GPU或CPU上執(zhí)行。在GPU上運行,如果它將音頻文件分成四個音軌,可以比實時速度快 100 倍。主要功能就是只需輸入一段命令就可以將音樂的人聲和各種樂器聲分離,支持mp3、wav、ogg等常見音頻格式。
軟件簡介:
經(jīng)常玩音樂的人,一定會用到伴奏和人聲分離,比如Audition或者RX7,但是面對復雜的樂器分離,這兩款軟件就束手無策了。
Spleeter是由法國的音樂流媒體公司Deezer開源,需向Spleeter提供一個音頻文件,它就會將其分成兩個、四個、五個等多個獨立的音軌,它支持mp3、wav、ogg等常見音頻格式。一在Github上線便獲超高好評和瀏覽。
軟件特征:
Spleeter基于TensorFlow開發(fā),本身運行速度非?臁7蛛x過程可以在GPU或CPU上執(zhí)行。在GPU上運行,如果它將音頻文件分成四個音軌,可以比實時速度快100倍。安裝Spleeter并不難,只需克隆存儲庫并選擇用 Conda 環(huán)境安裝即可開始分離音頻文件。由于操作還是很復雜的,需要有一定的python基礎(chǔ),所以國外大神做了個可視化版本
使用說明:
用戶可以根據(jù)自己的需求來訓練模型,Deezer 還給出了在 musdb 數(shù)據(jù)集上的預訓練模型,因此能直接拿來使用。
在官方提供的預訓練模型里,spleeter 可將人聲和樂器聲分為 2 個音軌,已經(jīng)能滿足基本的要求。此外它還能把樂器聲進一步分離為鼓、貝斯、鋼琴及其他樂曲,加上人聲,spleeter 最多可以分離出 5 個音軌。
使用方法:
1、一定先安裝python環(huán)境(3.7.X 或者3.6.X版本)并添加path到系統(tǒng)環(huán)境變量。
2、直接解壓并管理員身份運行SpleetGUI.exe(第一次啟動的時候會慢,要在后臺安裝ffmpeg環(huán)境)
注意,理論上支持所有的音頻格式,選擇文件時,下拉菜單中選擇文件類型即可,否則默認MP3。
3、過程中軟件會假死,這是正常操作的過程,不必擔心。稍后在第一步選擇的路徑下會出現(xiàn)和您選擇音頻文件同名的文件夾
4、打開文件夾,會發(fā)現(xiàn)已經(jīng)分離成了你選擇的軌道數(shù)。
報錯提示:
ystem.ComponentModel.Win32Exception (0x80004005): 系統(tǒng)找不到指定的文件。
在 System.Diagnostics.Process.StartWithShellExecuteEx(ProcessStartInfo startInfo)
在 System.Diagnostics.Process.Start()
在 System.Diagnostics.Process.Start(ProcessStartInfo startInfo)
在 spleetGUI.Form1.run_cmd_arg(String arg)
在 spleetGUI.Form1.button1_Click(Object sender, EventArgs e)
在 System.Windows.Forms.Control.OnClick(EventArgs e)
在 System.Windows.Forms.Button.OnClick(EventArgs e)
在 System.Windows.Forms.Button.OnMouseUp(MouseEventArgs mevent)
在 System.Windows.Forms.Control.WmMouseUp(Message& m, MouseButtons button, Int32 clicks)
在 System.Windows.Forms.Control.WndProc(Message& m)
在 System.Windows.Forms.ButtonBase.WndProc(Message& m)
在 System.Windows.Forms.Button.WndProc(Message& m)
在 System.Windows.Forms.Control.ControlNativeWindow.OnMessage(Message& m)
在 System.Windows.Forms.Control.ControlNativeWindow.WndProc(Message& m)
在 System.Windows.Forms.NativeWindow.Callback(IntPtr hWnd, Int32 msg, IntPtr wparam, IntPtr lparam)