marți , 20 octombrie 2020
roen

Extragerea unui sentiment uman dintr-un text folosind o rețea neuronală recurentă și
biblioteca Keras

Paul TEODORESCU
Institutul Național de Cercetare-Dezvoltare în Informatică – ICI București
paul.teodorescu@ici.ro

Rezumat: În acest articol se propune înțelegerea modului în care computerul poate să extragă un sentiment uman simplu (de exemplu: „mi-a plăcut”/„nu mi-a plăcut”), dintr-un text. Practic, computerul învață să includă corect o recenzie de film într-una din cele două categorii (pozitiv/negativ). Așadar, obiectivul propus este estimarea sentimentului uman (interpretat binar 0 sau 1). În acest exercițiu a fost utilizat API-ul Keras construit pe TensorFlow, o mulțime de recenzii de filme luate de pe IMDB și o rețea neuronală recurentă RNN (Recurent Neuronal Network) cu celule LSTM (Long-Short Term Memory) cu care se memorează cuvintele ce au fost deja întâlnite. Biblioteca Keras furnizează 50.000 de recenzii de filme care sunt deja pre-procesate. Prin hrănirea rețelei neuronale cu aceste texte (25.000 de texte pentru instruire, urmate de alte 25.000 de texte pentru testare), modelul construit de Keras (utilizând relațiile dintre cuvinte) reușește să determine cu exactitate sentimentul uman pozitiv sau negativ, altfel spus polaritatea textului. Utilitatea acestor cercetări de extragere a sentimentului uman este aproape fără sfârșit, de la monitorizarea social-media, măsurarea parametrului numit Vocea Clientului, analiza tweet-urilor și a postărilor Facebook, până la analize de business prin analize de texte.

Cuvinte cheie: bibliotecă, vector, tensor, matrice, celule LSTM, variabile, etichete, propagare (înainte și înapoi).

Vizualizează articolul complet

COORDONATELE PENTRU CITAREA ACESTUI ARTICOL SUNT URMĂTOARELE:
Paul TEODORESCU, Extragerea unui sentiment uman dintr-un text folosind o rețea neuronală recurentă și biblioteca Keras, Revista Română de Informatică şi Automatică (Romanian Journal of Information Technology and Automatic Control), ISSN 1220-1758, vol. 30(3), pp. 119-132, 2020. https://doi.org/10.33436/v30i3y202009