WPS mac版2022最新版V5.0.0 官方正式版中文 / 469M
騰訊會(huì)議mac版v3.10.7.413 官方版中文 / 175M
Outlook mac版15.8最新版中文 / 337.8M
iWork for mac2015官方免費(fèi)版中文 / 914.4M
微信企業(yè)版mac版v4.0.16.90619 官方最新版中文 / 443M
紛享逍客Mac版v2.0.12 官方最新版中文 / 78.3M
蘋(píng)果思維導(dǎo)圖軟件(Mind Vector)v1.1 官方最中文 / 7M
mac PDF文檔編輯器(Wondershare PDF Editor英文 / 24.3M
iText是一款免費(fèi)的ocr文字識(shí)別軟件,這款軟件可以直接選取圖片上的文字并識(shí)別保存為文檔內(nèi)容,軟件還支持翻譯功能,可以直接截圖選取想要翻譯的內(nèi)容,軟件會(huì)自動(dòng)轉(zhuǎn)換翻譯。每月可免費(fèi)識(shí)別 20 次,訂閱 iText 高級(jí)版即可無(wú)限次識(shí)別。
使用場(chǎng)景:
- 從掃描版 PDF 中提取文字
- 從朋友發(fā)來(lái)的圖片中識(shí)別文字
- 從任意圖片中識(shí)字
取圖方便:
- 自帶截圖功能,截圖即識(shí)字
- 拖拽圖片至菜單欄圖標(biāo)識(shí)字
- 選擇圖片文件識(shí)字
- 連續(xù)識(shí)別時(shí),自動(dòng)拼接文字
識(shí)別精準(zhǔn):
- 騰訊、百度、Google 三引擎,文字識(shí)別精準(zhǔn)可靠
- 自動(dòng)識(shí)別段落,優(yōu)化排版
- 亦可預(yù)覽原圖,方便校對(duì)
自動(dòng)翻譯:
- Google、百度雙引擎
- 支持 100+ 種語(yǔ)言
簡(jiǎn)潔高效:
- 不占用 Dock、僅存在于菜單欄
- 多種快捷鍵,操作方便
1. 選取圖片方便
iText 支持多種方式選擇圖片,操作非常便利。
1.1 截圖即識(shí)字
iText 自帶截圖功能,只需按下 ⇧⌘1 快捷鍵、截取屏幕任意位置,即可提取該圖片中的文字。
小提示:識(shí)別后的文字已經(jīng)復(fù)制到系統(tǒng)剪貼板,直接粘貼即可。
1.2 拖拽圖片至菜單欄圖標(biāo)識(shí)字
比如,當(dāng)你在電腦上使用微信、QQ 時(shí),好友發(fā)了張圖片(比如手機(jī)拍攝的快遞單),你想識(shí)別其中的文字(比如快遞單號(hào)),只需將該圖片拖拽至 iText 菜單欄圖標(biāo)即可。
1.3 選擇圖片文件識(shí)字
當(dāng)然,也可以在對(duì)話框中選擇圖片文件。不過(guò),個(gè)人還是建議你直接把該圖片文件拖拽至 iText 菜單欄圖標(biāo),操作直觀高效。
1.4 支持連續(xù)識(shí)別
比如,連續(xù)截取 PDF 不同位置的圖片,iText 將依次識(shí)別其中的文本,并自動(dòng)將結(jié)果拼接在一起。
2. 文字識(shí)別精準(zhǔn)
你有沒(méi)有這種經(jīng)歷:你想從一張圖片中提取文字,結(jié)果發(fā)現(xiàn)識(shí)別的文字中有一些錯(cuò)誤。結(jié)果,手動(dòng)修改這些錯(cuò)誤的時(shí)間,比自己直接在電腦上碼字的時(shí)間還要長(zhǎng)。是不是很尷尬?
可見(jiàn),識(shí)別的準(zhǔn)確性非常重要,也是我非常在意的一點(diǎn)。
2.1 騰訊、百度、Google 三引擎
首先,我排除了離線的識(shí)別庫(kù),因?yàn)殡x線注定了這些庫(kù)的識(shí)別能力是死的,不會(huì)自己增強(qiáng)。接下來(lái),在一票在線 OCR 服務(wù)中,我對(duì)比了百度、騰訊、微軟、Google 這些四家大廠的產(chǎn)品,最后選擇了國(guó)內(nèi)使用騰訊及百度、國(guó)外使用 Google 的組合。
如果你有 Google 信仰、或者需要識(shí)別日文等其他語(yǔ)言,可以右擊 iText 菜單欄圖標(biāo),手動(dòng)選擇使用騰訊、百度或 Google OCR 服務(wù)。不過(guò),從實(shí)測(cè)和目前優(yōu)化的情況來(lái)看,中文還是建議使用騰訊;大家可以自行測(cè)試。
那么,到底識(shí)別準(zhǔn)不準(zhǔn)呢?這么說(shuō)吧:
對(duì)于一般的自然語(yǔ)言,比如書(shū)中的一段話、新聞稿,識(shí)別效果是驚人的準(zhǔn)確,甚至可以達(dá)到 100%
對(duì)于排版復(fù)雜、尤其有特殊字符的文字,比如程序代碼、選擇題,識(shí)別效果就不太理想,需要手動(dòng)對(duì)識(shí)別后的結(jié)果進(jìn)行修正
比如,單純地給一個(gè)豎線,機(jī)器是無(wú)法區(qū)分到底是小寫(xiě)的 l、還是大寫(xiě)的 I(順便問(wèn)一下,你看出二者的區(qū)別了嗎?);與之相對(duì),機(jī)器是需要根據(jù)上下文進(jìn)行判斷和優(yōu)化的。而像程序代碼這種非自然語(yǔ)言,機(jī)器目前是很難進(jìn)行語(yǔ)義識(shí)別的
到底準(zhǔn)不準(zhǔn)?歡迎你來(lái)試試。
2.2 獨(dú)創(chuàng)算法,進(jìn)一步優(yōu)化識(shí)別結(jié)果
OCR 服務(wù)完成最好的是字符的識(shí)別;但更進(jìn)一步的識(shí)別,目前還不是很好,比如段落的識(shí)別、全角半角符號(hào)等等,這就需要程序后期進(jìn)行優(yōu)化。
目前,iText 主要完成了這些部分的優(yōu)化:
自動(dòng)識(shí)別段落
中文環(huán)境使用全角標(biāo)點(diǎn)符號(hào)
中文與英文字母、數(shù)字間增加空格
刪除中文字符間、英文字符與標(biāo)點(diǎn)符號(hào)間的多余空格
英文首字母大寫(xiě)
如果你發(fā)現(xiàn)優(yōu)化的不好的地方,歡迎把圖發(fā)給我,我會(huì)相應(yīng)地優(yōu)化算法,先謝。
2.3 預(yù)覽原圖,方便校對(duì)
在目前 OCR 技術(shù)不能始終達(dá)到 100% 的情況下,預(yù)覽原圖、并進(jìn)行修正,還是有必要的。在 iText 中,你可以這樣:
將識(shí)別后的窗口拖到圖片附近
調(diào)用 iText 識(shí)別結(jié)果的 雙欄模式:左側(cè)展示圖片、右側(cè)展示識(shí)別后的文字
可使用快捷鍵 ⇧⌘R 快速調(diào)出識(shí)別結(jié)果窗口
這樣,就可以很方便地對(duì)照原圖進(jìn)行手動(dòng)優(yōu)化識(shí)別后的文字。
2.4 自動(dòng)隱藏識(shí)別結(jié)果
由于 iText 的識(shí)別結(jié)果已經(jīng)非常準(zhǔn)確,且已經(jīng)復(fù)制到剪貼板,因此識(shí)別后并不需要編輯或復(fù)制文本。此時(shí),你可以如上圖所示,開(kāi)啟「自動(dòng)隱藏」選項(xiàng),識(shí)別結(jié)果窗口將會(huì)在 3s 后自動(dòng)隱藏,非常方便。
并且,如果臨時(shí)需要編輯某次識(shí)別結(jié)果,只要將鼠標(biāo)移至結(jié)果窗口,則會(huì)暫時(shí)忽略自動(dòng)隱藏功能。另外,開(kāi)啟「總在最前」選項(xiàng)后,窗口將不會(huì)自動(dòng)隱藏。
3. 識(shí)別后自動(dòng)翻譯
比如,對(duì)于英文版的 PDF、未翻譯的字幕、未漢化的游戲,直接用 iText 截圖,自動(dòng)翻譯為中文。
集成 Google、百度雙引擎(優(yōu)先選用 Google,當(dāng)無(wú)法訪問(wèn) Google 時(shí)使用百度),支持 100+ 種語(yǔ)言。
特別說(shuō)明
聲明:西西軟件園為非贏利性網(wǎng)站 不接受任何贊助和廣告