Umi OCR是一款離線的文字識別工具,不同于現(xiàn)在的各種文字識別的工具它更加適合于一些批量的文字識別的場景,并且用戶可以自己來下載各種個訓(xùn)練模型,以本地的方式來完成文字識別的內(nèi)容,從而滿足用戶對于文字識別上面的需求,快來下載這款離線批量文字OCR識別Umi OCR!
離線批量文字OCR識別Umi OCR
本軟件是本地圖片文件處理工具,沒有實(shí)時屏幕截圖識別的功能。
使用說明
快速開始
打開主程序,將任意 圖片/文件夾 拖入窗口中的白色背景表格區(qū)域,或點(diǎn)擊左上方的 瀏覽 選擇圖片。
若拖入文件夾,則加載文件夾下所有 符合后綴(見后) 的圖片文件。
點(diǎn)擊右上方 開始任務(wù) ,等待進(jìn)度條走完。
任務(wù)進(jìn)行中,可隨時點(diǎn)擊 終止任務(wù)(原開始任務(wù)按鈕)來停止,但下次開始時依然會從頭開始。
點(diǎn)擊 識別內(nèi)容 選項(xiàng)卡查看輸出文字,或者前往 第一張圖片的目錄 查看識別結(jié)果txt文件。
識別內(nèi)容選項(xiàng)卡中,可一鍵將全部文本 復(fù)制到剪貼板 。
基礎(chǔ)設(shè)置
點(diǎn)擊 設(shè)置 選項(xiàng)卡,配置參數(shù)。大部分設(shè)置項(xiàng)(除去輸出目錄、文件名,忽略區(qū)域參數(shù))會自動保存,下次打開還是這個樣。
忽略圖片中某些區(qū)域內(nèi)的文字:
點(diǎn)擊 添加區(qū)域 展開配置忽略區(qū)的新窗口。具體配置方式見后。
點(diǎn)擊 清空區(qū)域 清空已配置的所有忽略區(qū)域參數(shù)。
已添加區(qū)域后,上方標(biāo)題文字提示當(dāng)前忽略區(qū)域的 生效分辨率 。
輸出設(shè)置:
將 識別內(nèi)容寫入本地文件 取消勾選后,不會再生成本地文件,只能在 識別內(nèi)容 選項(xiàng)卡中查看輸出信息。
輸出調(diào)試信息 若勾選,則會額外輸出程序工作狀態(tài)的內(nèi)容。
忽略無文字的圖片 若勾選,則不含文字(或文字全被忽略區(qū)域屏蔽掉)的圖片名稱不會出現(xiàn)在輸出信息中。
若想生成一份用于瀏覽的markdown文件,則建議取消勾選。
v1.2版本新功能 生成文件可選擇兩種風(fēng)格:純文本.txt文件 和 Markdown風(fēng)格.md文件 。前者可用于查找等一般用途。后者在編輯器或?yàn)g覽器中渲染為圖文并茂的頁面,可用于瀏覽和欣賞圖集。
v1.2.2版本新功能 可勾選任務(wù)完成后用系統(tǒng)默認(rèn)編輯器打開輸出文件或輸出文件夾(不生成本地文件時無效)。
輸出目錄 和 輸出文件名 設(shè)置生成的文件的位置和名稱。
當(dāng)拖入第一張圖片且這兩項(xiàng)設(shè)置為空時,自動設(shè)置輸出路徑為第一張圖片的父目錄,輸出文件名為 [轉(zhuǎn)文字]_{父目錄}.txt。除非要自定目錄和名稱,否則這兩項(xiàng)默認(rèn)留空即可。
軟件 處理列表 標(biāo)簽頁的 清空表格 按鈕,除了會清空已導(dǎo)入的圖片列表,還會清空 輸出目錄 和 輸出文件名 設(shè)置。這樣下次拖入新圖片時,就能在新的位置存放輸出文件。
識別器設(shè)置:
識別器路徑 配置當(dāng)前使用的識別器exe程序。
圖片后綴 配置軟件允許載入的圖片后綴,不同后綴以空格分隔,必須全為小寫。
正常情況下無需改動。
忽略區(qū)域功能
忽略區(qū)域是本軟件特色功能。可用于批量識別視頻截圖時排除右上角水印的干擾,批量識別游戲截圖時排除UI與按鈕的干擾,讓識別結(jié)果只留下干凈的臺詞文本。
“忽略區(qū)域”是指圖片上指定位置與大小的矩形區(qū)域,完全處于這些區(qū)域內(nèi)的文字塊,將被排除。
點(diǎn)擊 設(shè)置 選項(xiàng)卡中的 添加忽略區(qū)域 ,進(jìn)入忽略區(qū)域選擇窗口。
將任意圖片 拖入 該窗口,可預(yù)覽該圖片。將新圖片拖入窗口可切換預(yù)覽,但已繪制的忽略區(qū)域不會消失;可切換不同圖片來仔細(xì)調(diào)整忽略區(qū)域。
繪制 忽略區(qū)域 :拖入圖片后,點(diǎn)擊選中左起第一按鈕 +忽略區(qū)域 1 ,然后在圖片上按住左鍵拖拽,繪制矩形區(qū)域? 撤銷 步驟。
繪制完后,點(diǎn)擊 完成 返回軟件主窗口。若不想應(yīng)用此次繪制,則右上角X,取消。
簡單案例見下。
簡單排除視頻截圖中的水印:
打開忽略區(qū)域設(shè)置窗口,拖入任一張截圖。 稍等約1秒,面板上會顯示出圖片,識別到的文字區(qū)域會被虛線框起來。發(fā)現(xiàn)右上角的水印也被識別到了。
點(diǎn)擊選擇 +忽略區(qū)域 1 ,鼠標(biāo)按住,繪制矩形完全包裹住水印區(qū)域,范圍可以大一些。
點(diǎn)擊 完成 。返回主窗口, 開始任務(wù) 。
排除游戲截圖中的兩種UI:
假設(shè)有一組游戲截圖,主要分為兩類圖片,這兩類圖片的文字位置和UI位置不太相同:
A類(上圖左)為對話模式,字?jǐn)?shù)少,要保留的臺詞文本在畫面下方,要排除的UI分布于底端。
B類(上圖右)為歷史文本模式,字?jǐn)?shù)多,從上到下都有要保留的文本(與A類UI位置有重合),要排除的UI分布在兩側(cè)。
拖入一張A類圖片。選擇 +忽略區(qū)域 1 ,繪制矩形包裹住要排除的 底端UI 。
拖入一張B類圖片。選擇 +識別區(qū)域 ,繪制矩形包裹住 小部分要保留的文本 。注意只要該區(qū)域內(nèi)含有任意保留文本即可,不需要畫得很大,不需要包裹住所有保留文本;不能與A類圖中 可能存在的任何文本 重合。
然后選擇 +忽略區(qū)域 2 ,繪制矩形包裹住B類圖要排除的 兩側(cè)UI 。
點(diǎn)擊 完成 。返回主窗口, 開始任務(wù) 。