今年初(2025)開春,AI圈的震撼就是DeepSeek開源以及釋出應用,讓使用這可以用更低的成本運算,撇開其他爭議不看,我們來探討百發花齊放的LLM(Large Language Model;大語言模型 ),用於自動化流程可以增加多少的幫助.
雖然現今也有很多模態的模型(MultiModal),不過使用起來成本還是相當的高,再加上速度的問題,現在DeepSeek將成本在省下來,相信會有越來越多類似的研究與應用出現,不過還是存在一些如幻覺、資安、解析正確率不高、使用難度的問題.
而韜睿就是專注於文字下游任務的處理,把文字辨識交給韜睿,您只需專注於應用即可,來看看韜睿怎麼解決這些問題吧!
一、過往要透過OCR進行辨識,有幾種方式:
- 廠商專案進行.
- 複雜的定義過程,且表單要固定.
- 有了AI後,提升精準度,但要大量資料的訓練.
- 有了LLM多模態模型,可以做多任務;不過整體效果要看模型與後處理狀況.
而韜睿透過自有技術結合LLM模型與OCR讓使用者可以快速設定想要辨識的資料,免去複雜的設定與訓練,讓不懂資訊的人也可以快速使用.
二、Smart Detector
- 採用先進的AI技術.
- 透過簡易的UI介面方便設定.
- 搭配LLM運作,讓抽取更多元.
- 自動產生API快速介接運作.
- 當OCR表單異動,可快速調整,透過LLM更具備泛化能力.
- 同時支援雲端與地端.
三、展示
- 簡單易設定的UI

- 可搭配LLM,快速準確的辨識結果

- 設定完成免訓練,自動產生API

- 詳細的DashBoard


四、結語
企業內部有許多的作業可以做流程自動化,但牽涉的範圍很廣,韜睿透過模擬人的感官方式,Smart Detector代表人的眼睛,可以幫你處理掉重複的登打作業,而韜睿研發的LLM搭配Smart Detector更可以像是人類的大腦與眼睛的結合,讓各式紙本、圖片可以快速錄入,進行後面的自動化流程.
Smart Detector具備先進LLM技術,也具備輕量化的AI表單抽取技術,讓使用者可以依據場景自行選擇要用的方式,完成企業內文件自動擷取,可進行不同作業如:
- 自動化: 透過辨識完成,可以抓出關鍵資訊進行分類歸檔.
- 結構化: 將複雜紙本文件轉換成結構化資訊.
- 數據化: 將這些資料更有效收集分析與決策判斷.