【強烈推薦】C#.NET開源的OCR文字識別工具
當前位置:點晴教程→知識管理交流
→『 技術文檔交流 』
導讀 現如今,大家對OCR的需求與日俱增,但是對我們.NET開發人員來說,卻基本并沒有什么趁手的工具,大部分都是基于Python去調用的,習慣了.NET優秀的語法,如果不是必要,其實是很不想去適應其他語言的。 這套源碼我是從去年開始接觸的,不過到最后因為沒有實際應用,所以最近沒有太多的關注,但是作者還是在不停的更新中,交流群也是非常活躍。 項目描述 PaddleOCRSharp 是一個基于百度飛槳PaddleOCR的.NET版本OCR工具類庫。項目核心組件PaddleOCR.dll,由C++編寫,根據百度飛槳PaddleOCR的C++代碼修改并優化而成。目前已經支持C++、.NET、Python、Golang、Rust等開發語言的直接API接口調用。項目包含文本識別、文本檢測、表格識別功能。本項目針對小圖識別不準的情況下做了優化,比飛槳原代碼識別準確率有所提高。包含總模型僅8.6M的超輕量級中文OCR,單模型支持中英文數字組合識別、豎排文本識別、長文本識別。同時支持中英文、純英文以及多種語言文本檢測識別。 PaddleOCRSharp封裝極其簡化,實際調用僅幾行代碼,極大的方便了中下游開發者的使用和降低了PaddleOCR的使用入門級別,同時提供不同的.NET框架使用,方便各個行業應用開發與部署。Nuget包即裝即用,可以離線部署,不需要網絡就可以識別的高精度中英文OCR。 本項目支持官方所有公開的通用OCR模型,PPOCRV2、PPOCRV3、PPOCRV4。如果使用v2模型,請設置OCR識別參數OCRParameter對象的屬性rec_img_h=32,本項目默認使用V3模型,默認rec_img_h=48: 本項目只能在X64的CPU上編譯和使用,只能在avx指令集上的CPU上使用。 本項目目前支持以下.NET框架: net35;net40;net45;net451;net452;net46;net461;net462;net47;net471;net472;net48;net481; netstandard2.0;netcoreapp3.1; net5.0;net6.0;net7.0;net8.0 本項目提供了兩個SDK,一個是C++版本,一個是.net版本,.net版本是對C++版本的二次封裝,其他語言開發亦是調用C++版本。同時也提供了Go、Python、C++的調用示例代碼
支持的模型 OCR識別模型庫支持官方所有的模型,也支持自己訓練的模型。完全按照飛槳OCR接口搭橋。本項目部署自帶的一種輕量版8.6M模型庫、服務器版模型庫(更準確,需要自行下載),可以自行更改模型庫適用實際需求。
代碼預覽
效果預覽
該文章在 2023/9/4 12:27:21 編輯過
|
關鍵字查詢
相關文章
正在查詢... |