西西軟件園多重安全檢測(cè)下載網(wǎng)站、值得信賴的軟件下載站!
西西首頁(yè) 電腦軟件 安卓軟件 電腦游戲 安卓游戲 排行榜 專題合集

Umi-OCR文字識(shí)別工具軟件

v2.1.2 綠色版
  • Umi-OCR文字識(shí)別工具軟件v2.1.2 綠色版
  • 軟件大小:95.1M
  • 更新時(shí)間:2023-11-07 08:54
  • 軟件語(yǔ)言:中文
  • 軟件廠商:
  • 軟件類別:國(guó)產(chǎn)軟件 / 免費(fèi)軟件 / 圖像轉(zhuǎn)換
  • 軟件等級(jí):3級(jí)
  • 應(yīng)用平臺(tái):WinAll
  • 官方網(wǎng)站:暫無(wú)
  • 應(yīng)用備案:
好評(píng):50%
壞評(píng):50%

軟件介紹

Umi-OCR文字識(shí)別工具軟件是一款免費(fèi)開(kāi)源可批量的離線OCR軟件,解壓即用,離線運(yùn)行,無(wú)需網(wǎng)絡(luò)。采用 PaddleOCR-json C++ 識(shí)別引擎。只要電腦性能足夠,通常比在線OCR服務(wù)更快。默認(rèn)使用PPOCR-v3模型庫(kù)。除了能準(zhǔn)確辨認(rèn)常規(guī)文字,對(duì)手寫(xiě)、方向不正、雜亂背景等情景也有不錯(cuò)的識(shí)別率?稍O(shè)置忽略區(qū)域排除水印、設(shè)置文塊后處理合并排版段落,得到規(guī)整的文本。

Umi-OCR文字識(shí)別工具軟件

軟件說(shuō)明

全新升級(jí):版本重構(gòu)了絕大部分代碼,提供煥然一新的界面和更強(qiáng)大的功能。

免費(fèi):本項(xiàng)目所有代碼開(kāi)源,完全免費(fèi)。

方便:解壓即用,離線運(yùn)行,無(wú)需網(wǎng)絡(luò)。

高效:自帶高效率離線OCR引擎。只要電腦性能足夠,可以比在線OCR服務(wù)更快。

靈活:支持定制界面,支持命令行、HTTP接口等多種調(diào)用方式。

軟件特色

標(biāo)簽頁(yè)

由一系列靈活好用的標(biāo)簽頁(yè)組成。您可按照自己的喜好,打開(kāi)需要的標(biāo)簽頁(yè),并鎖定標(biāo)簽欄。

截圖OCR

截圖OCR:打開(kāi)這一頁(yè)后,就可以用快捷鍵喚起截圖,識(shí)別圖中的文字。

左側(cè)的圖片預(yù)覽欄,可直接用鼠標(biāo)劃選復(fù)制。

右側(cè)的識(shí)別記錄欄,可以編輯文字,允許劃選多個(gè)記錄復(fù)制。

也支持在別處復(fù)制圖片,粘貼到Umi-OCR進(jìn)行識(shí)別。

批量OCR

批量OCR:這一頁(yè)支持批量導(dǎo)入本地圖片并識(shí)別。

識(shí)別內(nèi)容可以保存為 txt / jsonl / md / csv(Excel) 等多種格式。

支持文本后處理技術(shù),能識(shí)別屬于同一自然段的文字,并將其合并。還支持代碼段、豎排文本等多種處理方案。

沒(méi)有數(shù)量上限,可一次性導(dǎo)入幾百?gòu)垐D片進(jìn)行任務(wù)。

支持任務(wù)完成后自動(dòng)關(guān)機(jī)/待機(jī)。

忽略區(qū)域:一種特殊功能,適用于排除圖片中的不想要的文字。

在批量識(shí)別頁(yè)的右欄設(shè)置中可進(jìn)入忽略區(qū)域編輯器。

如上方樣例,圖片頂部和右下角存在多個(gè)水印 / LOGO。如果批量識(shí)別這類圖片,水印會(huì)對(duì)識(shí)別結(jié)果造成干擾。

按住右鍵,繪制多個(gè)矩形框。這些區(qū)域內(nèi)的文字將在任務(wù)中被忽略。

請(qǐng)盡量將矩形框畫(huà)得大一些,完全包裹住水印所有可能出現(xiàn)的位置。

二維碼

二維碼:這里可以掃碼。

支持多種格式的二維碼、條形碼。

支持一圖多碼。

可截圖/粘貼/拖入本地圖片。

全局設(shè)置

全局設(shè)置:在這里可以調(diào)整軟件的全局參數(shù)。

支持更改界面語(yǔ)言。(翻譯校對(duì)工作將在第一個(gè)正式版發(fā)布后進(jìn)行)

支持切換界面主題。Umi-OCR擁有多個(gè)亮/暗主題。

可以調(diào)整界面文字大小、文字字體。

切換OCR插件。

輔助功能說(shuō)明:

多國(guó)語(yǔ)言界面:軟件界面支持多國(guó)語(yǔ)言。目前預(yù)覽階段為AI翻譯生成,可能詞義和排版不好,或者有錯(cuò)漏的情況。正式發(fā)布時(shí)會(huì)進(jìn)行人工校對(duì)。

渲染器:軟件界面默認(rèn)支持顯卡加速渲染。但是如果在你的機(jī)器上出現(xiàn)截屏閃爍、UI錯(cuò)位的情況,請(qǐng)調(diào)整全局設(shè)置→界面和外觀→渲染器。

文本塊后處理(段落合并)可以整理OCR結(jié)果的排版和順序,使文本更適合閱讀和使用。預(yù)設(shè)方案如下:

單行:合并同一行的文字,適合絕大部分情景。

多行-自然段:智能識(shí)別、合并屬于同一段落的文字,適合絕大部分情景。

多行-代碼段:盡可能還原原始排版的縮進(jìn)與空格。適合識(shí)別代碼片段,或需要保留空格的場(chǎng)景。

豎排:適合豎排排版。需要與同樣支持豎排識(shí)別的模型庫(kù)配合使用。

簡(jiǎn)單上手

準(zhǔn)備

下載壓縮包并解壓全部文件即可。

截圖識(shí)別

點(diǎn)擊截圖按鈕或自定義快捷鍵,喚起截圖識(shí)別。

粘貼圖片到軟件

在任何地方(如文件管理器,網(wǎng)頁(yè),微信)復(fù)制圖片,軟件上點(diǎn)擊粘貼按鈕,自動(dòng)識(shí)別。

批量識(shí)別本地圖片文件

將圖片或文件夾拖進(jìn)軟件,批量轉(zhuǎn)換文字。也可以點(diǎn)擊按鈕打開(kāi)瀏覽窗口導(dǎo)入。

識(shí)別結(jié)果將保存到本地。可選生成純文本txt文件、帶鏈接Markdown文件、原始信息jsonl文件等不同格式。可配置任務(wù)完成后執(zhí)行關(guān)機(jī)/待機(jī)。

文本塊后處理(排版優(yōu)化)

OCR識(shí)別出的文本是按“塊”劃分的,通常一行文字分為一塊,有時(shí)還會(huì)將一行誤劃分為多塊,這給閱讀帶來(lái)了不便。文本塊后處理就是對(duì)文本塊進(jìn)行再加工的過(guò)程,合并同一行或同一段落內(nèi)的文字,按正確的順序排序。

下圖表示不同排版應(yīng)該選用何種處理方案:

所有方案一覽:

橫排-優(yōu)化單行

將誤劃分為多塊的同一行文字合并到一行。

橫排-合并多行-左對(duì)齊

將多個(gè)左對(duì)齊的行視為同一段落,合并文字。左側(cè)未對(duì)齊或行距過(guò)大的行視為下一段落。

橫排-合并多行-自然段

將多個(gè)左對(duì)齊的行視為同一段落,且第一行的開(kāi)頭允許多空出兩個(gè)全角空格的寬度。

橫排-合并多行-模糊匹配

只要垂直投影有重疊,行高一致,距離較近的文本塊,視為同一段落。

豎排-從左到右-單行 / 豎排-從右至左-單行

優(yōu)化豎排識(shí)別,合并同一行文字,按從左到右或從右到左的順序輸出每一行。 注意,必須搭配支持豎排識(shí)別的模型庫(kù)(識(shí)別語(yǔ)言)一起使用。

可視化預(yù)覽:

可以在忽略區(qū)域編輯器內(nèi)預(yù)覽文本塊后處理的效果。編輯器中以虛線框標(biāo)出識(shí)別到、經(jīng)過(guò)后處理的文字塊。

這里僅僅是借用了編輯器來(lái)展示后處理的效果,實(shí)際運(yùn)行任務(wù)時(shí) 忽略區(qū)域機(jī)制 早于 后處理機(jī)制 執(zhí)行,不受后處理的影響。

忽略區(qū)域功能

忽略區(qū)域是本軟件特色功能,可用于排除圖片中水印的干擾,讓識(shí)別結(jié)果只留下所需的文本。

更新日志

新增:記憶窗口位置。 

新增:批量識(shí)圖頁(yè)增加圖片預(yù)覽窗口,單擊圖片條目打開(kāi)。 

新增:檢查軟件是否有權(quán)限讀寫(xiě)配置文件。

新增:報(bào)錯(cuò)彈窗提供一鍵復(fù)制及打開(kāi)issues的功能。

新增:全局設(shè)置頁(yè)添加左側(cè)目錄欄。

新增:插件的多國(guó)語(yǔ)言UI機(jī)制。

優(yōu)化:截圖預(yù)覽面板中,文本框的位置更準(zhǔn)確。

優(yōu)化:調(diào)整部分UI布置。

修復(fù):掃碼模塊添加導(dǎo)入異常檢查。

修復(fù):補(bǔ)充掃碼頁(yè)的拖入圖片功能。 

修復(fù):輸出到單獨(dú)文件txt時(shí),文件名去除原后綴。

修復(fù):一些小Bug。

其他版本下載

發(fā)表評(píng)論

昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
查看所有(0)條評(píng)論 > 字?jǐn)?shù): 0/500

TOP
軟件下載