Arhivă

Revista Română de Informatică și Automatică / Vol. 30, Nr. 2, 2020


Tehnici bazate pe Machine Learning pentru îmbunătățirea depistării cancerului de sân

Elena-Anca PARASCHIV, Elena OVREIU

Rezumat:

Cancerul de sân este unul dintre cele mai frecvente tipuri de cancer diagnosticat la femei și ocupă locul al doilea ca și cauză a mortalității provocate de cancer, după cel de plămâni. Atât diagnosticul cât și predicția dezvoltării cancerului de sân sunt realizate, în zilele noastre, folosind diferite tehnici bazate pe metode avansate cum ar fi învățarea automată (Machine Learning). Articolul de față urmărește prezentarea rezultatelor cercetărilor în domeniul Machine Learning aplicate în scopul clasificării datelor medicale. Prin folosirea unui set de algoritmi diferiți s-a urmărit clasificarea bazei de date Breast Cancer Wisconsin pentru diagnostic. Criteriile de selecție ale algoritmilor au fost alese astfel încât să evidențieze performanțele tehnicilor de tip Machine Learning din punctul de vedere al acurateței și al preciziei. Pentru implementare s-au folosit tehnici precum: Mașini cu Vectori Suport (SVM – Support Vector Machines), k-Nearest Neighbor (kNN), Perceptron Multistrat (MLP – Multilayer Perceptron), Arbore Decizional (Decision Tree), Gaussian Naïve Bayes și Random Forest. A fost selectat un set de imagini de diagnostic ale unei tehnici de puncție aspirativă cu ac fin (FNA), din care au fost identificate cele mai reprezentative caracteristici. S-a stabilit că cea mai mare acuratețe a fost obținută în cazul algoritmului Random Forest, în speță 97.90% ceea ce permite conturarea unei perspective de rafinare a clasificării realizate.

Cuvinte cheie:
cancer de sân, învățare automată, acuratețe, SVM, kNN, MLP, Arbore Decizional, Random Forest, Gaussian Naïve Bayes.

Vizualizează articolul complet:

CITAREA ACESTUI ARTICOL SUNT URMĂTOARELE:
Elena-Anca PARASCHIV, Elena OVREIU, „Tehnici bazate pe Machine Learning pentru îmbunătățirea depistării cancerului de sân”, Revista Română de Informatică și Automatică, ISSN 1220-1758, vol. 30(2), pp. 67-80, 2020. https://doi.org/10.33436/v30i2y202006