Text-R可以識(shí)別PDF文件和圖像中的文本,并立即將其轉(zhuǎn)換為任何用戶級(jí)別的可編輯文檔。文本可以保存在新的可編輯PDF或RTF文檔(Word)中。格式保持接近原始格式,因此在大多數(shù)情況下,不需要后期處理。有需要的小伙伴歡迎來西西下載體驗(yàn)。
軟件簡(jiǎn)介:
Text-R能夠用于識(shí)別PDF文檔中的文本和識(shí)別圖像文件中的文本!從掃描的紙質(zhì)文檔制成的PDF文件和圖像包含無法復(fù)制或編輯的文本。 但是,由于文檔數(shù)量大,以及相關(guān)的高時(shí)間花費(fèi),省去了手動(dòng)重新鍵入內(nèi)容。該軟件還可以識(shí)別PDF文件和圖片中的文本,即使對(duì)于外行也是如此。 文本可以保存在新的可編輯PDF或RTF文檔(Word)中。 格式保持接近原始格式,因此在大多數(shù)情況下,不需要后處理。集成的詞典和專業(yè)的OCR過濾器可確保文本識(shí)別的高精度。 因此,也可以識(shí)別偏斜的文本和旋轉(zhuǎn)的文檔。
使用幫助:
一、檢測(cè)PDF文檔中的文本
如果要識(shí)別和提取PDF文檔中的文本,請(qǐng)單擊“檢測(cè)PDF文檔中的文本”按鈕。
步驟1:選擇PDF文件
有兩種選擇PDF文檔進(jìn)行文本識(shí)別的選項(xiàng):
1、拖放
通過在Windows資源管理器中單擊鼠標(biāo)左鍵并按住不放,然后將其拖到Text-R窗口中,將PDF文檔從Windows資源管理器中拖到Text-R的灰色拖放區(qū)域中。
如果操作成功,則將PDF文檔加載并顯示在Text-R中。
2、選擇文件
使用Windows已知的“文件打開”對(duì)話框來手動(dòng)選擇PDF文檔。 選擇所需的文檔,然后單擊“打開”。
如果要從Text-R刪除加載的PDF文檔,請(qǐng)單擊“重置”。
二、檢測(cè)圖像文件中的文本
如果要從圖像文件中識(shí)別和提取文本,請(qǐng)單擊“在圖像文件中檢測(cè)文本”按鈕。
步驟1:選擇圖片文件
選擇圖片文件進(jìn)行文本識(shí)別有兩個(gè)選項(xiàng):
1、拖放
通過在Windows資源管理器中單擊鼠標(biāo)左鍵并按住不放并將其拖到Text-R窗口中,將圖像文件從Windows資源管理器拖到Text-R的灰色拖放區(qū)域中。
如果操作成功,則將圖像文件加載并顯示在Text-R中。
2、選擇文件
使用Windows打開文件對(duì)話框手動(dòng)選擇圖像文件。 選擇所需的文件,然后單擊“打開”。
回報(bào)
如果要從Text-R刪除加載的圖像文件,請(qǐng)單擊“重置”。
三、定義設(shè)置
在第二步中,指定用于文本識(shí)別的設(shè)置。
OCR選項(xiàng)
Text-R提供了各種OCR選項(xiàng),以增加和提高文本識(shí)別的識(shí)別率。
掃描條碼
如果要讀取條形碼的內(nèi)容(文本和鏈接)并以純文本顯示,請(qǐng)激活“掃描條形碼”按鈕。
識(shí)別/校正歪斜圖像
如果Text-R還應(yīng)該檢測(cè)并糾正歪斜的文本段落(例如由于掃描不準(zhǔn)確),則激活“檢測(cè)/糾正歪斜的圖像”復(fù)選框。
識(shí)別旋轉(zhuǎn)(90°/ 180°/ 270°)
如果Text-R應(yīng)該識(shí)別旋轉(zhuǎn)的文檔并且應(yīng)閱讀其內(nèi)容,請(qǐng)選中旋轉(zhuǎn)(90°/ 180°/ 270°)。
使用干涉濾光片
如果Text-R應(yīng)該優(yōu)化臟的掃描文檔和圖像并讀取其內(nèi)容,請(qǐng)激活選項(xiàng)“應(yīng)用噪聲過濾器”。
檢測(cè)/刪除線
激活“檢測(cè)/刪除行”選項(xiàng)以檢測(cè)和刪除行。
注意:建議您在保存后手動(dòng)添加行。
正確的混合字符
如果您希望Text-R刪除/更正掃描單詞中發(fā)現(xiàn)的數(shù)字,請(qǐng)選中“更正混合字符”選項(xiàng)。同樣,將刪除找到的數(shù)字中包含的字母/字符,這不符合數(shù)字格式。
使用字典
如果要檢查詞典中是否存在已識(shí)別的單詞,請(qǐng)激活“使用詞典”選項(xiàng),并在必要時(shí)進(jìn)行更正。
文字語言
為了使識(shí)別過程盡可能準(zhǔn)確,您應(yīng)該指定源文檔的文本語言。 例如,Text-R可以使用集成到所選語言中的詞典來檢查已識(shí)別單詞在詞典中是否存在。
四、文字識(shí)別
在第三步中,檢查源文檔,并在未格式化的預(yù)覽中顯示已識(shí)別的文本。
源
在“源”區(qū)域中,可能會(huì)顯示源文件的經(jīng)過OCR優(yōu)化的變體?s小和放大圖標(biāo)允許調(diào)整源的大小。
如果文檔由多頁組成,則可以通過頁面選擇元素選擇要顯示的頁面。
預(yù)覽(未格式化)
預(yù)覽顯示源文檔所選頁面的識(shí)別文本。您可以比較源和預(yù)覽,如果對(duì)文本識(shí)別的結(jié)果不滿意,則可以根據(jù)需要更正上一頁的CRC選項(xiàng)。
注意:預(yù)覽未格式化,僅顯示可識(shí)別的文本。它僅用于測(cè)試不同的OCR條件。
保存文件
要將檢測(cè)到的文本保存在新文檔中,請(qǐng)單擊“保存文檔”按鈕。
目標(biāo)文檔可以保存為PDF,PDF / A,RTF,TXT和XML格式。我們建議保存為PDF格式,因?yàn)槲谋镜母袷胶臀恢脩?yīng)盡可能與原始文檔的格式和位置相對(duì)應(yīng)。
更新日志:
版本:1.1
新功能:
+多國(guó)語言支持