言語安全護航:利用敏感關鍵字偵測,維護企業聲譽,提升企業風險管理的新方法

敏感關鍵字偵測系統

在企業內部,常會有NAS或是共享的資料夾,方便同仁分享,企業每天產出這麼多文件資料該如何管理?這些文件資料是要提供給客戶的或是同仁內部觀看,如果內容有錯誤資訊該如何察覺?本次將介紹如何透過文字技術偵測文件中是否有敏感性字眼,進而提醒管理者進行處置.

一、痛點

由於出版業在進行撰寫時,會有大量的作者或委外處理的機會,當這些文件回到企業本身需要有人進行人工審核跟校對,效對者需要Control+F一個個下關鍵字尋找,再加上現行AI技術興起,難保採用ChatGPT等生成式AI會產生出敏感性字眼的文字,或是翻譯錯誤的時候,如果將這樣的資料發佈反而會引起企業不必要的損失.

實務上企業還會面對另一個問題,就是有些檔案是採用圖片或是PDF進行編輯與儲存,這時候就可以借助AI OCR運用先進的文字辨識技術,將內文辨識出來,近一步進行解析,加速檢核流程,避免不必要的錯誤導致企業聲譽受損.

在此先以出版業為例,後面T編再與各位分享可以用在其他面向的案例.

二、解決方式

1.透過先進AI OCR技術,可以解析到一般軟體無法解析到的內容.
2.自動偵測資料夾內的變化,進而通知管理者.
3.可依據設定的關鍵字,去偵測每個資料夾變化,當新增文件偵測到關鍵字即觸發.

為了讓讀者好理解,這邊T編製作了一個簡易供參考

三、展示

以下以一個公開的 ‘營業稅電子資料申報繳稅作業要點.pdf‘ 進行展示,透過將此份文件放入偵測的資料夾中(tmp),當此資料夾有變動立即偵測,發現有預設敏感關鍵字時發送Email通知.

四、結論

這樣的系統可以用在:
A. 外發郵件偵測,除了針對檔案屬性之外還可以過濾檔案的內容.
B. 共享資料夾,避免企業敏感資料外流.
C. 出版業著作使用.
D. 文案上稿.
E. 文字/語音客服偵測使用.
F. Log分析.
以上這些都是簡單的應用案例,其實不一定是發送Email通知,可以是偵測到關鍵資訊後,通過Line、簡訊等通訊系統進行通知,或是直接擋下相關資料,不讓他外發…端看企業的流程應用,透過這樣的機制減少人為介入,避免人工疲勞而遺漏,且採用先進的NLP更可以做到如同義字、類似語句等的檢核.

Loading

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *