PaddleOCR GitHub源碼,PaddleOCR是一款簡單方便的開源OCR文字識別工具,提供于GitHub上面,可以在這里查看源碼數據,可以自行編輯使用。本站帶來最新的PaddleOCR源碼數據資源下載,下面給出了詳細特性說明,感興趣的朋友們可以下載體驗。
PaddleOCR介紹
PaddleOCR旨在打造一套豐富、領先、且實用的OCR工具庫,助力使用者訓練出更好的模型,并應用落地。
PP-OCR是一個實用的超輕量OCR系統(tǒng)。主要由DB文本檢測、檢測框矯正和CRNN文本識別三部分組成。該系統(tǒng)從骨干網絡選擇和調整、預測頭部的設計、數據增強、學習率變換策略、正則化參數選擇、預訓練模型使用以及模型自動裁剪量化8個方面,采用19個有效策略,對各個模塊的模型進行效果調優(yōu)和瘦身,最終得到整體大小為3.5M的超輕量中英文OCR和2.8M的英文數字OCR。
PaddleOCR特性
1、PPOCR系列高質量預訓練模型,準確的識別效果
超輕量ppocr_mobile移動端系列:檢測(2.6M)+方向分類器(0.9M)+ 識別(4.6M)= 8.1M
通用ppocr_server系列:檢測(47.2M)+方向分類器(0.9M)+ 識別(107M)= 155.1M
超輕量壓縮ppocr_mobile_slim系列:檢測(1.4M)+方向分類器(0.5M)+ 識別(1.6M)= 3.5M
2、支持中英文數字組合識別、豎排文本識別、長文本識別
3、支持多語言識別:韓語、日語、德語、法語
4、支持用戶自定義訓練,提供豐富的預測推理部署方案
5、支持PIP快速安裝使用
6、可運行于Linux、Windows、MacOS等多種系統(tǒng)