你是否也曾經遇過這樣的狀況?OCR 雖然能幫你把支票轉成文字內容,但轉出來的結果還是得靠人眼一欄一欄去看、去整理,才能填進後續系統裡。這類資料輸入的工作不難,但非常耗時。尤其是文件格式固定、欄位重複性高的情況,其實是最適合交給 AI 模型處理的場景。
韜睿軟體實作了一個微調(fine-tuning)任務:讓語言模型讀懂 AI OCR 後的支票內容,並自動輸出成 JSON 結構,直接可供系統使用。
文字辨識與自然語言處理的專家
你是否也曾經遇過這樣的狀況?OCR 雖然能幫你把支票轉成文字內容,但轉出來的結果還是得靠人眼一欄一欄去看、去整理,才能填進後續系統裡。這類資料輸入的工作不難,但非常耗時。尤其是文件格式固定、欄位重複性高的情況,其實是最適合交給 AI 模型處理的場景。
韜睿軟體實作了一個微調(fine-tuning)任務:讓語言模型讀懂 AI OCR 後的支票內容,並自動輸出成 JSON 結構,直接可供系統使用。
相信大家都已經很熟悉LLM (Large Language Model, 大語言模型),不過其實現今的大模型已經可以做到多模態(MutilModel)的應用,也就是LLM不在只是可以看懂文字,甚至可以看懂圖片、描述圖片等等,在這個「看」的領域中除了過往的電腦視覺(Computer Vision;CV),因應大模型開始有了VLM(Vision Language Models, 視覺語言模型 ).
本篇文章說明VLM、Computer Vision、OCR差異
企業內部有許多的作業可以做流程自動化,但牽涉的範圍很廣,韜睿透過模擬人的感官方式,Smart Detector代表人的眼睛,可以幫你處理掉重複的登打作業,而韜睿研發的LLM搭配Smart Detector更可以像是人類的大腦與眼睛的結合,讓各式紙本、圖片可以快速錄入,進行後面的自動化流程.
Smart Detector具備先進LLM技術,也具備輕量化的AI表單抽取技術,讓使用者可以依據場景自行選擇要用的方式,完成企業內文件自動擷取,可進行不同作業如:
自動化: 透過辨識完成,可以抓出關鍵資訊進行分類歸檔.
結構化: 將複雜紙本文件轉換成結構化資訊.
數據化: 將這些資料更有效收集分析與決策判斷.
相信每個企業都有自己的差旅報銷流程,但可曾想過這樣的報銷可以進行數位化?又或怎樣優化報銷流程可以讓同仁快速報銷?
更近一步思考…這樣的報銷數據可否能拿來應用呢?很高興韜睿軟體幫您解決的這樣的問題,透過我們的OCR技術,可以精準抽取出報銷單據的內容,讓同仁隨時隨地的填寫,更重要的是這些數據,我們已經提前幫您想到,ESG透過交通票據的辨識,幫您計算出碳排放,讓中小企業除了數位轉型外,可以低成本的加入ESG的行列.
通常在撰寫一些報告做研究時,會參考一些外部資料,或是在做自然語言處理時,總需要把一些檔案格式進行轉換成純文字進行使用,但PDF又分為可以編輯與不可以編輯的格式,所以時常在解析的時候發生很多問題,透過此工具可以快速分離PDF內文、圖片、表格,另外對於無法解析的內容也可以透過OCR進行解析.