× 關閉
關於南訊
Home   /   關於南訊   /   技術科普   /   OCR 光學字元辨識 - RPA 結合人工智慧的第一步
2022/10/31

OCR 光學字元辨識 - RPA 結合人工智慧的第一步

RPA 結合人工智慧的第一步 - 光學字元辨識 (OCR)

 

你可能聽過紙本掃描筆,體驗過停車場車牌辨識,甚至被身份證件辨識的技術驚艷,這類型的生活應用源於一項近百年歷史的技術 - 「光學字元辨識」(OCR, Optical Character Recognition)。所謂的光學字元辨識,是種將圖片或掃描檔轉換為文字資料的技術,在現今資訊爆炸的時代,傳統的紙本處理早已不敷使用,故此技術也是企業與公部門在「數位轉型」不可或缺的一環。

 

 

圖片來源:https://medium.com/@quangnhatnguyenle/detect-and-recognize-vehicles-license-plate-with-machine-learning-and-python-part-1-detection-795fda47e922

 

電腦是如何解讀圖片?

  與肉眼不同的是,電腦會將圖像解讀為一連串的 ''數值'',以 CNN(卷積神經網路)演算法為例,其處理過程會將圖像轉換為二維陣列,套上濾鏡來提取圖片特徵(與修圖軟體的濾鏡相似,用以強化圖片特徵),並逐像素、區塊進行特徵擷取,最後再轉換為一維陣列運算判讀結果。

  不同的資料類型,會有各別合適的圖像算法及處理程序,例如:物件偵測選擇 YOLO、人臉辨識選擇 FaceNet。本文探討的 OCR則適合以 CNN + RNN(循環神經網路),分別進行文字內容識別和文本分析、辭意歸類。

 

 

圖片來源:https://medium.com/apache-mxnet/handwriting-ocr-handwriting-recognition-and-language-modeling-with-mxnet-gluon-4c7165788c67

 

# OCR 圖像前置處理

  在不同應用領域,會有各自特定的圖像前置處理程序,例如數位相機所拍攝的照片會需要經過「降噪」處理,來減少圖像中噪點的干擾,增強後續特徵捕捉的準確性;掃描器產出的文件會需要經過「傾斜校正」,來導正拍攝時產生的傾斜。

  而為了降低圖片顏色的干預、提升運算速度,並更好的擷取圖像中的關鍵特徵,通常會對圖像進行「灰階」處理,使圖像中的色彩統一以不同程度的灰色來表現,接著透過「二值化」來將其轉換為只有黑、白兩種顏色的影像,藉以區分影像中的背景、文字。

 

 

# OCR 字元辨識

  圖片經前置處理並將文字分離後,下一步即可開始比對文字。過去的 OCR 通常是透過所謂的「模板匹配」技術來進行,顧名思義是將影像中抽離的文字,去比對既有的模板並計算最大的可能性。既然是比對預先準備好的模板,欲辨識目標字體就必須盡量工整、一致,因此這類型的算法在印刷字體的應用就可以達到很好的效果。

  隨著字體種類的不斷增長,開發者發現模板匹配的靈活性漸漸不足以應付此趨勢,也造就了「特徵擷取」技術的萌發。相較於模板匹配,此算法更側重於尋找各個文字的具體特徵,即便在不同字體的情況下,各特徵只要維持在一定的水準範圍內也能被準確識別,這差異不僅賦予了 OCR 更大的靈活性,也降低了圖片品質低落所造成的影響。

  然而當應用領域涉及到表單、簽名,關鍵資訊通常是手寫字體,其辨識複雜度又會受字體變化、書寫工具、紙張材質等影響。因此現代 OCR 技術開始結合機器學習來訓練電腦,基於機器學習的 OCR 可以在大量的圖像資料中自動學習有用的特徵,使其具備等同人類的閱讀文字能力。相較於傳統的 OCR 模式,基於機器學習的 OCR 除了更善於應付多種複雜的情境,亦得利於現代 GPU 的運算輔助,帶來了傳統模式無可比擬的處理速度,被現今大多數的 OCR 套裝軟體所應用著。

 

各產業結合 OCR 技術

  舉凡金融業、食品業、製造業等涉及大量圖像或文件處理的產業,由其處理方式就可以快速看出該組織數位化水平或企業管理效率。

  如單單只有將文字由圖檔中取出,還不算一個完整的「數位轉型」,畢竟後續還有繁瑣的輸入、計算、審核等動作,更不論人工操作下產生的失誤,而這一系列重複性極高又耗費大量工時的作業,即適合交辦予「RPA 流程機器人」。

  RPA 流程機器人是近年來全球企業最積極導入的技術,雖然叫做機器人,但他本身沒有人工智慧的概念,僅能依循既定步驟一步一步地處理。結合 OCR 技術的 RPA 流程機器人,宛若賦予「視覺」的智能於其中,使其具備解讀非結構性圖像、文件的能力,在各領域的應用範例如下:

1)   網路銀行餘額抓取自動化,透過 OCR 技術辨識登入驗證碼

2)  保單資訊輸入自動化,透過 OCR 技術辨識保單掃描檔內容

3)  發票資訊擷取自動化,透過 OCR 技術辨識發票掃描檔內容

 

 

 

 

# RPA 結合人工智能的第一步

  「數位轉型」已然是眾企業、公部門所關注的熱門議題,也是生存於資訊化潮流下的關鍵趨勢。導入 RPA 流程機器人雖然可以優化人力資源、汰除繁冗作業流程,但其背後仍有龐大的「數位優化」空間,透過整合人工智能的產品,方能使這位虛擬員工具備更加廣泛的業務處理範圍、更加多元的應用服務渠道、更加靈活的作業處理形式。

  如您正面臨大量的文件轉換業務需求,也煩惱著人力資源使用效率的最佳化,【導入結合 OCR 的 RPA 流程機器人】就是您執行數位優化的關鍵一步,也會是您邁向數位轉型所必須採取的下一步。