Analiza comparativă a principalilor algoritmi SaaS pentru recunoașterea automată de entități în limba română

Bogdan IANCU
Academia de Studii Economice, Piața Romană Nr. 6, Sector 1, București, 010374, România
bogdan.iancu@ie.ase.ro

Rezumat: Lucrarea de față își propune analiza comparativă a principalilor algoritmi de Named Entity Recognition disponibili în cloud, aplicați pentru texte scrise în limba română. Contextul în care acești algoritmi sunt analizați este cel al web-ului semantic, în cadrul căruia încă persistă problema identificării de noi entități ce pot fi legate la ontologii existente. Sunt definite procese prin care textul este tradus într-una din limbile suportate de algoritmii furnizați de DBpedia (DBpedia Spotlight), Google (Google Cloud Natural Language API), Microsoft (modulul NER din Azure Machine Learning Studio) și IBM (IBM Watson Natural Language Understanding), pentru ca mai apoi să fie utilizat scorul F1 pentru a determina procesul optim. Articolul se încheie cu o comparație între rezultatele obținute și performanța altor algoritmi NER specializați pe limba engleză sau independenți de limbă.

Cuvinte cheie: Web semantic, NER, LOD, SaaS.

Vizualizează articolul complet