視頻分割是指對(duì)圖像或視頻序列按一定的標(biāo)準(zhǔn)分割成區(qū)域,目的是為了從視頻序列中分離出有一定意義的實(shí)體。視頻分割軟件可以幫助您很簡單的完成視頻分割步驟,西西軟件園提供最好用的視頻分割軟件下載大全!
視頻分割軟件哪個(gè)好?
西西自己使用的是Ultra Video Splitter 這款軟件,在視頻分割的過程中又很好地表現(xiàn),并且分割后不會(huì)損壞原視頻。另外Boilsoft Video Splitter等視頻分割軟件也不錯(cuò)!
視頻分割原理:(文章較長,想了解的可以認(rèn)真看看)
1.基于內(nèi)容檢索索引方法
在基于內(nèi)容檢索系統(tǒng)中,快速索引技術(shù)是影響系統(tǒng)速度的關(guān)鍵。由于媒體對(duì)象的特征描述一般都是高維的,而特征空間中的相近意味著較大的相似度,因此問題的 關(guān)鍵就在于如何在高維空間點(diǎn)集中尋找與給定點(diǎn)距離最近的一組點(diǎn)。在計(jì)算機(jī)科學(xué)中,在點(diǎn)集中尋找與給定點(diǎn)距離最近的點(diǎn)的問題叫做最近鄰搜索(nearest -neighbor-search)問題,記作NN-Search問題。基于內(nèi)容檢索的索引問題要求尋找與給定點(diǎn)距離最近的一組點(diǎn)(不妨設(shè)為k個(gè)),常記 作k-NN-Search問題。
在一維空間下,最近鄰搜索可采用對(duì)順序表進(jìn)行簡單的折半查找來完成,但在高維空間這種算法就難以直接應(yīng)用了。 最早的最近鄰查找算法是所謂的桶算法(bucketing algo-rithm)。這種算法將數(shù)據(jù)集空間進(jìn)行規(guī)則劃分(如成格狀),每個(gè)劃分中的數(shù)據(jù)點(diǎn)存于一個(gè)桶中(bucket)。這樣,最近鄰搜索就轉(zhuǎn)化為在 所有的桶中尋找與給定點(diǎn)最近的桶。由于桶算法對(duì)數(shù)據(jù)集空間進(jìn)行規(guī)則劃分,因此其對(duì)于均勻分布的數(shù)據(jù)集十分有效。
對(duì)于主存中的最近鄰搜索來說, 一種比較實(shí)用的索引方法是k-d-樹方法,其思想是按照一定的準(zhǔn)則選擇某一坐標(biāo)軸方向作為切分方向,將數(shù)據(jù)集切分為兩個(gè)子數(shù)據(jù)集,再對(duì)此兩個(gè)子數(shù)據(jù)集遞歸 切分,形成一棵檢索樹。優(yōu)先k-d樹(priority k-d tree),這種索引結(jié)構(gòu)不僅檢索速度快,適用于k-NN-Search問題,而且其空間復(fù)雜度與數(shù)據(jù)集的維數(shù)成線性關(guān)系,且與二級(jí)存儲(chǔ)器實(shí)現(xiàn)相容,因此 是目前解決k-NN-Search問題最有效的一種索引算法。近似最近鄰搜索(approximate nearest neighbor search)也是基于內(nèi)容檢索索引研究的一個(gè)熱點(diǎn)。由于在多數(shù)應(yīng)用中,用戶只要求檢索結(jié)果中有一個(gè)或幾個(gè)滿意媒體對(duì)象即可,而并不要求查詢結(jié)果一定是信 息庫中滿足相似度和檢索結(jié)果集合大小限制的所有對(duì)象。相反地,在多數(shù)情況下用戶希望犧牲檢索的精確度以換取更高的檢索速度,這就導(dǎo)致了近似最近鄰搜索技術(shù) 的產(chǎn)生。而大量的實(shí)驗(yàn)表明,對(duì)于高維數(shù)據(jù)集來說,即使允許極小的近似(檢索誤差),也會(huì)對(duì)檢索速度帶來很大的提高。
在基于內(nèi)容檢索系統(tǒng) 中,為加快檢索速度而經(jīng)常使用的另一個(gè)技術(shù)是分層索引技術(shù)。對(duì)于許多檢索操作(如二次型距離的直方圖匹配)而言,特征間距離的計(jì)算往往需要很大的計(jì)算量。 在這種情況下,可采用一種計(jì)算量較小(cheap)的距離度量先對(duì)信息庫進(jìn)行檢索,得到一組候選的媒體對(duì)象集,再對(duì)此候選媒體對(duì)象集采用原距離度量,以此 來降低計(jì)算量。
2.內(nèi)容描述技術(shù)
媒體分割和 特征提取用來在基于內(nèi)容檢索系統(tǒng)中建立媒體對(duì)象的內(nèi)容描述,其方法和技術(shù)直接來源于圖像處理與理解和計(jì)算機(jī)視覺等媒體理解研究的成果。由于目前的媒體理解 技術(shù)尚難建立通用的系統(tǒng),因此在基于內(nèi)容檢索系統(tǒng)的實(shí)現(xiàn)中引入與領(lǐng)域有關(guān)的高層知識(shí)將是有益的(即圖像/視頻庫涉及的內(nèi)容),這將直接影響到系統(tǒng)所采用的 媒體理解技術(shù)。以靜止圖像庫為例,對(duì)于醫(yī)療圖像庫的檢索,無疑需要結(jié)合專門領(lǐng)域的醫(yī)學(xué)圖像理解技術(shù)來進(jìn)行圖像的描述和組織。而面孔圖像庫或新聞人物照片的 檢索,結(jié)合面孔識(shí)別技術(shù)無疑可大大提高檢索的準(zhǔn)確率。像這樣的專用基于內(nèi)容檢索系統(tǒng),往往都需要針對(duì)系統(tǒng)的要求,專門設(shè)計(jì)用于檢索和描述的特征。
也 有一些圖像檢索系統(tǒng)由于其包含內(nèi)容十分廣泛(如QBIC系統(tǒng)和Virage系統(tǒng)),促使其選擇更為普遍的特征來進(jìn)行內(nèi)容的描述、組織和檢索。目前,對(duì)于通 用的靜止圖像檢索,用于檢索的特征主要有顏色(color)、紋理(texture)、草圖(sketch)、形狀(shape)等,其中顏色、形狀、紋 理應(yīng)用得尤為普遍。
對(duì)于視頻信息檢索,一般說來,領(lǐng)域知識(shí)的作用更為明顯。除了底層的片段檢測(shotdetection)、圖像拼接 (mosaicing)等不需要語義信息的技術(shù)外,要進(jìn)一步對(duì)視頻片斷進(jìn)行組織,則需要充分利用領(lǐng)域的知識(shí)。如對(duì)于新聞節(jié)目的檢索來說,利用視頻信號(hào)的某 些特點(diǎn)(電視臺(tái)的臺(tái)標(biāo))可有效地進(jìn)行信號(hào)區(qū)分,從而大大簡化檢索難度。而利用先驗(yàn)知識(shí),可更有效地完成對(duì)監(jiān)控系統(tǒng)視頻信號(hào)中被觸動(dòng)過物體的檢索。
盡管由于不同的應(yīng)用背景,不同的基于內(nèi)容檢索系統(tǒng)在底層描述中采用的技術(shù)也各有側(cè)重,但一般都能在傳統(tǒng)的計(jì)算機(jī)視覺和圖像處理技術(shù)中找到其出處?梢哉f,媒體分割和特征抽取所使用的技術(shù)是圖像處理和計(jì)算機(jī)視覺各種技術(shù)應(yīng)用的綜合。
(1)圖像的特征描述
對(duì)于通用圖像庫的檢索來說,最常用的特征就是顏色、形狀和紋理。
①顏色特征的提取
在傳統(tǒng)的注重幾何特征的計(jì)算機(jī)視覺研究中,顏色未得到充分的重視,人們普遍認(rèn)為顏色不是刻劃一個(gè)物體的關(guān)鍵特征。然而,相對(duì)于幾何特征而言,顏色具有一 定的穩(wěn)定性,其對(duì)大小、方向都不敏感,表現(xiàn)出相當(dāng)強(qiáng)的魯棒性。同時(shí),在許多情況下(特別是對(duì)于自然景物來說),顏色是描述一幅圖像最簡便而有效的特征。例 如;在需要檢索海濱景物圖像時(shí),指定圖像中的主要顏色(如藍(lán)色,對(duì)應(yīng)海水;黃色,對(duì)應(yīng)海灘)的大致比例后即可以此為依據(jù)查找與此顏色分布類似的圖像,而此 時(shí)其他檢索特征往往難以奏效。所有這些,都促使顏色成為基于內(nèi)容檢所采用的主要手段之一。在QBIC和Virage系統(tǒng)中,顏色分別是最有效和權(quán)重最大的 檢索特征。
一種常用的顏色特征是圖像的顏色直方圖。在顏色檢索算法中,采用了互補(bǔ)顏色(opponent color)空間直方圖來描述物體,并通過定義在直方圖的相交(intersection)及反投影算法(backprojection algorithm)來完成物體的識(shí)別(檢索)和在圖像中的定位。通過直方圖相交算法,給定圖像直方圖后,顏色檢索就變?yōu)樵谀P蛶熘胁檎揖哂凶畲笃ヅ涠鹊?圖像。
顏色直方圖反映的是圖像的整體特征,而在許多情況下我們希望在檢索中只對(duì)圖像中的部分顏色加以指定(如檢索出現(xiàn)藍(lán)天的圖像,而不管圖像中出 現(xiàn)的其他景物)。在這種情況下,若把顏色直方圖作為特征直接進(jìn)行比較難以滿足檢索的要求,而描述圖像主要顏色組成的主顏色(dominant color)卻十分有效。一般情況下,可通過圖像分割或在顏色直方圖空間聚類來對(duì)主顏色加以計(jì)算。
②形狀特征的提取
形狀是傳統(tǒng)計(jì) 算機(jī)視覺刻劃物體的本質(zhì)特征之一,但對(duì)于通用圖像庫的檢索而言,利用形狀特征進(jìn)行檢索存在一定的困難。這是因?yàn)閷?shí)際場景中物體的形狀會(huì)發(fā)生很大的變化,而 且從復(fù)雜場景中提取物體形狀本身也并不是一件簡單的事情。但針對(duì)某些特定應(yīng)用(如QBIC中針對(duì)可明顯分割為背景和前景的圖像),利用形狀可以提高檢索的 準(zhǔn)確性和效率。
對(duì)于基于形狀的檢索來說,形狀的表示和匹配無疑是需要解決的重要問題。傳統(tǒng)的計(jì)算機(jī)視覺中,曾先后用Freeman鏈碼、Y-s曲線、Fourier描述子、二次曲線及B樣條等來描述平面曲線。
對(duì)于形狀匹配來說,Hough變換是最經(jīng)典的方法,而且對(duì)于噪聲和遮擋具有良好的抗干擾性。但Hough變換僅能解決形狀的平移、旋轉(zhuǎn)和縮放所帶來的匹配問題,而對(duì)實(shí)際應(yīng)用中廣泛的變形匹配問題無能為力。
在實(shí)際應(yīng)用中,出于對(duì)算法時(shí)間和空間復(fù)雜性的考慮,形狀的表達(dá)和匹配往往采用更為簡單的方法,如形狀參數(shù)(shape factor)--關(guān)于形狀的一些定量測度(如面積、周長等)常用來描述形狀并進(jìn)行形狀的匹配。
③紋理特征的提取
作為物體的一個(gè)重要特征,紋理也是基于內(nèi)容檢索的一條主要線索。紋理檢索和紋理分類技術(shù)有著密不可分的關(guān)系,針對(duì)不同系統(tǒng)的應(yīng)用要求在紋理檢索的實(shí)現(xiàn)中往往采用不同的紋理識(shí)別技術(shù)。
早期的紋理識(shí)別技術(shù)可分為三類:統(tǒng)計(jì)方法、結(jié)構(gòu)方法和頻譜分析方法。結(jié)構(gòu)方法主要對(duì)規(guī)則的結(jié)構(gòu)紋理,采用句法分析方法識(shí)別。從20世紀(jì)70年代開始,基于二階灰度統(tǒng)計(jì)特征的統(tǒng)計(jì)方法得到了廣泛的研究。
進(jìn)入80年代后,隨機(jī)場模型也用于紋理的分類和識(shí)別。采用了高斯馬爾可夫隨機(jī)場GMRF(Gaussian Markov Random Field)模型后,對(duì) 9種自然紋理的識(shí)別正確率達(dá)到了99%~100%。
3.視頻檢索
與圖像檢索相比較,視頻檢索含有更豐富的內(nèi)容,但與圖像數(shù)據(jù)一樣,原始的視頻數(shù)據(jù)也是非結(jié)構(gòu)化的,在檢索前要對(duì)其結(jié)構(gòu)化。為此,首要工作是將此連續(xù)的視 頻流劃分為具有特定語義的視頻片段來作為檢索的基本單元,在此基礎(chǔ)上才能作進(jìn)一步的描述和組織。這樣,視頻檢索就包括視頻分割和描述建立兩部分內(nèi)容。
①視頻信號(hào)的結(jié)構(gòu)化
視頻信號(hào)的結(jié)構(gòu)化主要包括視頻分割和鏡頭組織兩部分,其中前者用于將連續(xù)的視頻流分割為可供檢索的視頻基元(鏡頭),而后者則用于對(duì)分割產(chǎn)生的大量鏡頭建立更高層的組織結(jié)構(gòu),以便于瀏覽檢索。
a.視頻分割
如上所述,視頻分割即將連續(xù)的視頻流分割為相對(duì)獨(dú)立的視頻片段。根據(jù)應(yīng)用背景的不同,對(duì)視頻流的分割可以采用不同的標(biāo)準(zhǔn),比如可以把某一物體在圖像中的 出現(xiàn)和消失定義為片段的頭和尾。但根據(jù)視頻信號(hào)的產(chǎn)生原理,我們知道一般的視頻信號(hào)本身是由多段鏡頭(攝像機(jī)上從記錄 RECORD到停止 STOP期間所獲得的一段連續(xù)視頻信號(hào))通過拼接編輯而成,而每個(gè)鏡頭本身具有一定的獨(dú)立性和完整性。因此,在實(shí)際應(yīng)用中多是以視頻流中的自然分界--鏡 頭場景的切換作為視頻流的分割依據(jù)。從這個(gè)意義上說,視頻分割即對(duì)視頻流中幀圖像內(nèi)容連續(xù)性中斷的檢測。
根據(jù)視頻編輯特性的不同,鏡頭切 換可分為不同的類型。對(duì)最簡單的直接切換來說,由于視頻流由兩鏡頭不加編輯直接拼接而成,幀圖像特性在拼接發(fā)生突變,因此可通過幀間特性的比較進(jìn)行檢測。 通過對(duì)不同圖像度量的比較得出,采用子窗口直方圖比較的方法對(duì)于切換檢測性能最佳。窗口的選擇是影響性能的一個(gè)主要因素,大窗口算法對(duì)運(yùn)動(dòng)具有較好的魯棒 性,但在景物改變且具有類似顏色或灰度分布時(shí)可能漏檢,而小窗口算法則對(duì)于運(yùn)動(dòng)過于敏感,因此在實(shí)現(xiàn)中往往需要將二者結(jié)合使用。
另一種常見的 較為復(fù)雜的鏡頭切換是漸變(dissolves),即使一段視頻鏡頭在鏡頭轉(zhuǎn)換處在一段時(shí)間內(nèi)漸漸轉(zhuǎn)變?yōu)楹罄m(xù)視頻鏡頭。淡入(fade-In)淡出 (fade-out)可視為漸變的特殊情況。對(duì)于漸變,由于幀圖像特性逐漸改變,相鄰幀變化很小,就不能僅依靠相鄰幀特性的比較,而需要在更大的窗口范圍 內(nèi)進(jìn)行檢測。
由于大量視頻信號(hào)都以壓縮形式存儲(chǔ),對(duì)壓縮視頻流的直接片段檢測也是人們感興趣的研究內(nèi)容。通過對(duì)視頻編碼中DCT變換系數(shù)性質(zhì)的分析,可以對(duì)壓縮視頻信號(hào)直接進(jìn)行片段檢測的算法。以此為基礎(chǔ),人們對(duì)MPEG視頻流又提出了許多改進(jìn)的算法。
b.鏡頭組織
通過視頻分割,連續(xù)的視頻流被切分為可供檢索的鏡頭。但對(duì)于許多視頻信號(hào)來說,其所含的鏡頭數(shù)可多到上百上千,使得用戶難于直接檢索。以電影為例,有多 于500鏡頭的影片并不少見,而現(xiàn)代動(dòng)作片中鏡頭數(shù)則更多(如在"終結(jié)者II"中,15分鐘的影片就有300個(gè)片段)。在電視節(jié)目的新聞報(bào)導(dǎo)中,也有大量 的關(guān)于同一報(bào)導(dǎo)內(nèi)容的鏡頭。在這種情況下,就需要對(duì)鏡頭進(jìn)行組織,生成一種更高級(jí)、更具有語義性的結(jié)構(gòu)(如場景scene或幕act),以便于用戶的檢 索。
場景轉(zhuǎn)換圖 STG(scene transition graph)是一種常用的鏡頭組織方法。該方法根據(jù)語義信息對(duì)鏡頭進(jìn)行組織,從而對(duì)整個(gè)視頻流進(jìn)行建立一種層次化的表示。首先根據(jù)鏡頭間的相似性(主要利 用顏色、形狀及圖像間相關(guān)等)對(duì)在內(nèi)容描述空間對(duì)鏡頭進(jìn)行聚類,再根據(jù)聚類結(jié)果利用時(shí)間軸上的約束生成場景轉(zhuǎn)換圖。
②描述建立
與 圖像檢索有所不同,視頻檢索的描述建立除了特征提取外,還包括鏡頭的代表幀生成。特征提取用于對(duì)分割得到的鏡頭建立描述,常用的鏡頭特征是鏡頭的主運(yùn)動(dòng), 這個(gè)特征適用于景物中有一個(gè)大背景的鏡頭。在此條件下不能得到滿足(如景物中存在多個(gè)較大運(yùn)動(dòng)物體的情況)時(shí),就需要對(duì)鏡頭根據(jù)運(yùn)動(dòng)特性對(duì)不同景物分層并 對(duì)分層建立描述。代表幀生成用于對(duì)鏡頭生成一個(gè)或多個(gè)可代表內(nèi)容的圖像,可在瀏覽檢索用來代表鏡頭的內(nèi)容。
a.主運(yùn)動(dòng)估計(jì)(dominant motion estimation)
在多數(shù)視頻圖像中,往往有一個(gè)相對(duì)固定的背景,背景前面是運(yùn)動(dòng)的物體。此背景占據(jù)了大部分圖像,其在圖像平面中的變化是攝像機(jī)操作和運(yùn)動(dòng)(如聚焦、平移、追蹤等)的結(jié)果。在這種情況下,主運(yùn)動(dòng)(即此背景的運(yùn)動(dòng))估計(jì)無疑對(duì)圖像的對(duì)準(zhǔn)和拼接效果起著重要的作用。
不同算法所依據(jù)的運(yùn)動(dòng)模型不同。在背景景深變化不大的情況下,可以把整個(gè)背景作為二維平面來考慮,這樣就得到了攝像機(jī)的二維運(yùn)動(dòng)模型。
對(duì)于背景景深變化較大的情況,此時(shí)單個(gè)二維運(yùn)動(dòng)模型已不能描述背景的運(yùn)動(dòng),而必須考慮景深的影響。針對(duì)校準(zhǔn)過的攝像機(jī),提出了三維運(yùn)動(dòng)結(jié)構(gòu)模型。
在模型參數(shù)的計(jì)算方面,為了去除前景運(yùn)動(dòng)的影響,在參數(shù)估計(jì)時(shí)一般不采用最小均方差(least squares)方法。而采用了 M估計(jì)(M-Estimation)方法。
b.層描述(layered representation)
在許多情況下,景物由多個(gè)具有不同運(yùn)動(dòng)特性的較大物體組成,很難指定哪一個(gè)運(yùn)動(dòng)是主運(yùn)動(dòng)。在這種情況下,就需要采用層描述方法,根據(jù)運(yùn)動(dòng)特性的不同對(duì)景 物進(jìn)行分割,將其劃分為不同的"層",并分別對(duì)每層建立相應(yīng)的描述。層描述一般包括三個(gè)部分:a一個(gè)運(yùn)動(dòng)描述符的集合;b對(duì)每個(gè)運(yùn)動(dòng)描述符在圖像序列中與 之對(duì)應(yīng)即滿足其約束關(guān)系的"層";c根據(jù)a和b及原始視頻圖像建立的對(duì)每個(gè)"層"建立的描述。
層描述所要解決的問題是:a需要多少個(gè)運(yùn)動(dòng)模型來描述景物中的運(yùn)動(dòng);b運(yùn)動(dòng)模型參數(shù)的計(jì)算;c每個(gè)運(yùn)動(dòng)模型支撐"層"的計(jì)算。為了對(duì)運(yùn)動(dòng)模型的數(shù)目加以限制,算法一般都采用 MDL(minimum discription length)準(zhǔn)則來進(jìn)行計(jì)算。
在QBIC的實(shí)現(xiàn)中,就是根據(jù)2D運(yùn)動(dòng)模型,通過不同物體(由于在景物中遠(yuǎn)近不同所引起)的仿射變換的參數(shù)的不同,將景物劃分為不同的層 (layer),每一層具有自己的2D仿射運(yùn)動(dòng)參數(shù)以及在每一幀中的對(duì)應(yīng)區(qū)域,這樣,就對(duì)整個(gè)片段建立了一個(gè)運(yùn)動(dòng)的分層表述(layerd representation),供檢索時(shí)使用。
c.鏡頭代表幀生成
在許多視頻檢索應(yīng)用中,瀏覽檢索是一種十分重要的檢索手段。 在這種檢索方式中,鏡頭的內(nèi)容用一幅或多幅能夠代表鏡頭內(nèi)容的圖像(稱為代表幀representative frame,簡記為r-frame)來表示。系統(tǒng)通過在檢索界面上提供各鏡頭的代表幀,使得用戶可通過瀏覽來選擇相應(yīng)的鏡頭。這樣,如何生成代表幀,使其 更好地表現(xiàn)鏡頭的內(nèi)容,就成為一個(gè)需要解決的問題。
最簡單的辦法是直接從鏡頭的幀序列選擇一幅或多幅圖像作為代表幀。常用的方法是選擇圖像的首幀、中間幀或末幀,但這種方法的缺點(diǎn)是缺乏靈活性,不能根據(jù)鏡頭的內(nèi)容變化選擇代表幀,還可以采用根據(jù)對(duì)幀相關(guān)差(對(duì)應(yīng)像素差)設(shè)閾值來選擇代表幀的方法。
另一種常用的代表幀生成方法是圖像拼接(mosaicing),即對(duì)分割得到的鏡頭融合鏡頭中多幀的背景信息生成一個(gè)全景的拼接圖像(mosaic)來代表鏡頭內(nèi)容。
Ultra Video Splitter 是一款視頻分割工具。Ultra Video Splitter最近又更新了,版本號(hào)升級(jí)到了6.0.0801,相信廣大的視頻愛好者肯定對(duì)它不會(huì)陌生,可以說這個(gè)工具拾起來相當(dāng)順手,幾乎包攬了很多視頻格式的分割,最讓我興奮的是它的無損分割,即視頻源文件是什么格..
立即下載PC電腦版
安卓版
蘋果版
相關(guān)文章
精選合集
網(wǎng)友評(píng)論
聲明:西西軟件園為非贏利性網(wǎng)站 不接受任何贊助和廣告