sâmbătă , 7 decembrie 2019
roen

Recunoașterea unei cifre scrise de mână folosind o rețea neuronală convoluțională și biblioteca TensorFlow

Paul TEODORESCU
Institutul Naţional de Cercetare-Dezvoltare în Informatică – ICI Bucureşti
paul.teodorescu@ici.ro

Rezumat: În această lucrare se propune rezolvarea unei probleme vizuale de recunoaștere, cu ajutorul unui instrument software, a unei cifre scrise de mână. A fost utilizată o tehnică de învățare automată în care se produce un rezultat bazat pe o experiență anterioară. Se arată cum, având la început valori de intrare și valori de ieșire numite etichete sau labels, computerul începe să învețe să recunoască corect valoarea de ieșire (în acest caz o cifră), prin modelul construit în tehnica numită învățare supervizată. Așadar obiectivul este de a ghici valoarea de ieșire la o valoare nouă a intrării, odată ce a fost cunoscut modelul. Cheia alegerii unui algoritm corect în rezolvarea unei probleme prin tehnologia de învățare supervizată este identificarea corectă a metodologiei, adică răspunsul la întrebarea: „este o problemă de regresie sau de clasificare?”. În cazul prezentat, se dorește ghicirea categoriei sau a clasei (ce are un număr fix de posibile valori, numite și valori discrete) din care fac parte acele date de intrare (practic cifrele scrise de mână). O rețea neuronală convoluțională cu 4 straturi, împreună cu instrumentul numit TensorFlow ce aduce o întreagă bibliotecă de inteligență artificială a fost folosită de computer la rezolvarea problemei de clasificare a unor cifre scrise manual (a fost stabilit că se va lucra cu 10 clase, care reprezintă cifrele de la 0 la 9). Întrucât înțelegerea tehnologiei TensorFlow cere un extra efort pentru că are o logică puțin mai ciudată, lucrarea oferă explicații printr-un exemplu care are ca punct de plecare o bază de date numită MNIST (Modified National Institute of Standards and Technology) ce cuprinde o sumedenie de imagini reprezentând cifrele de la 0 la 9 scrise de mână, în caligrafie variată. Prin hrănirea rețelei neuronale cu aceste zeci de mii de imagini, modelul construit de TensorFlow reușește să ghicească în bună măsură numărul reprezentat în acea imagine.

Cuvinte cheie: bibliotecă, vector, tensor, variabile, matrice, optimizator, propagare (înainte și înapoi).

Vizualizează articolul complet

COORDONATELE PENTRU CITAREA ACESTUI ARTICOL SUNT URMĂTOARELE:
Paul TEODORESCU, Recunoașterea unei cifre scrise de mână folosind o rețea neuronală convoluțională și biblioteca TensorFlow, Revista Română de Informatică şi Automatică (Romanian Journal of Information Technology and Automatic Control), ISSN 1220-1758, vol. 29(4), pp. 47-62, 2019. https://doi.org/10.33436/v29i4y201904