相信很多人應該都有一個經驗,在傳送或收到一些文字圖片後,可以使用Line中的OCR(Optical Character Recognition;光學字元辨識),輕鬆的將文字辨識出來再貼到訊息中,使用起來很方便,不用再一個個字打.
由於Gen AI(Generative Artificial Intelligence ; 生成式 AI)的興起,大家開始意識到Office Automation(辦公室自動化)的方便性與必要性,尤其是許多文件需要轉錄到其他的系統或文件上,過往都需要手工複製貼上,有了AI的輔助就可以事半功倍.
但是如果要建立這樣IDP(Intelligent Document Processing;智慧文件處理)應用服務,需要複雜的IT技術與環境或是昂貴的機器,另外就是一般的文字辨識就是將所有文字辨識出來,自己還要手工選取貼上,那有沒有一個更便利的方式?
因此韜睿軟體推出Swift OCR Portal ,透過眼睛(OCR)加上大腦(NLP/LLM)讓使用者快速提取想要的資訊,以簡單且節省成本的方式,讓使用者快速提取常見的文件,並且提供結構化的格式,快速應用在實際的業務流程上.
一、目前痛點
坊間OCR存在幾個問題:
- 實用性:多為全文識別無法擷取所需要的內容.
- 易用性:訓練複雜或需要很多樣本進行.
- 複雜性:前期需要建立複雜的環境或是較昂貴的成本.
二、韜睿提供
旨在讓使用者無需訓練,隨選即用OCR服務,以量計費,輕鬆無負擔
- 根據常用的文件已經具備格式化的結果,無需再進行加工處理.
- 開箱即用,可以把Swift OCR Portal 想像成一個OCR市集,提供已經訓練好的模型,讓使用者可以直接使用,無需再行訓練.
- 免建置複雜且昂貴的硬體環境,依據自身場景選擇適合的辨識服務直接API取用,即可用在生產環境上.
三、展示
- 各式OCR模型可以選擇

- 詳盡的操作說明
- 每個API介紹

- API呼叫方式說明

- API回應資訊說明

四、應用
透過Swift OCR Portal您可以做什麼樣的應用:
- 各式IDP(Intelligent Document Processing;智慧文件處理)應用
- 圖片或PDF文字轉譯
- 智慧報銷應用(參閱:重塑報銷流程、減少環境負擔:OCR技術與碳排統計的綜效)
- 財務文件快速錄入應用(參閱:藝術科技共舞:OCR在文創娛樂業中的奇妙啟發)
- 自動化理賠應用(參閱:從圖片到結構化數據:醫療收據內容提取技術)
- 自動化徵審應用
- AML與訊息、法規收集歸納應用
- 紙本文件快速數位化,文件分類與偵測應用…etc
五、總結
一個好的AI OCR Portal應該要具備以下幾點:
- 高精準度辨識,且具備抗破壞能力.
- 快速的辨識效果,不限定任何裝置.
- 結構化相對應的欄位,方便使用者使用.
- 簡潔易懂的JSON回傳格式與API操作.
- 背後需要有專注且專業的技術團隊,深耕電腦視覺(Computer Vison)、自然語言處理(NLP)與人工智能(AI)領域領域與時俱進提供更先進的眼睛與大腦讓使用者應用.