文件內實體命名(Named Entity Recognition;NER),又可稱為專有名詞識別、命名實體,用來識別文字內具有意義的文字,如人名、地名、專由名詞、機構名…等,也包含對詞性的標注(Part of Speech tag;POS-tag),好讓機器可以理解文章內容.
與過往採用的Rule Based不同的是,Rule Based需要知道規則,但文章中或是大量網路爬文下來的資訊無法透過Rule Based窮舉,且通常這些資訊都是非結構化的文件,這時就可以利用AI與NLP技術進行實體命名取出關鍵字句.
在金融業可以分析黑名單嫌疑人在RegTech應用、而客服部分依據客戶留言進行情緒分析,協助客服人員進行客戶關懷,以及法律業的LegalTech應用協助律師與法官分析法律文件.