miercuri , 22 august 2018
roen

Art. 02 – Vol. 21 – Nr. 3 – 2011

PROCESAREA SEMNALELOR ÎN REŢELE
NEURONALE LINIARE

Nicoleta Liviana Tudor
ltudor@upg-ploiesti.ro
Departamentul Tehnologia Informaţiei, Matematică, Fizică, Universitatea Petrol-Gaze din Ploieşti, România

Rezumat: Articolul tratează problema procesării semnalelor în reţele neuronale cu unităţi de calcul liniare şi include o analiză a metodelor de reprezentare a funcţiilor booleene.

ADALINE (Adaptive Linear Neuron or later Adaptive Linear Element) reprezintă un tmodel de reţea neuronală liniară cu un strat de neuroni, dezvoltat de Bernard Widrow şi Ted Hoff la Universitatea Stanford, în 1960. Modelul foloseşte neuroni McCulloch–Pitts şi include ponderi, valori pentru polarizare şi funcţie de calcul al sumei ponderate a intrărilor. Diferenţa dintre Adaline şi perceptronul standard, al lui McCulloch-Pitts constă în modul de realizare a învăţării, în care ponderile sunt ajustate conform sumei ponderate a intrărilor. Există, de asemenea, o extensie a reţelelor neuronale liniare, şi anume reţeaua Madaline.

În timpul antrenării, parametrii pondere şi polarizare ai unei reţele neuronale sunt actualizaţi într-un proces continuu de simulare a mediului în care reţeaua este generată.

O unitate de calcul generică conţine două părţi: o funcţie de procesare care reduce argumentele la o singură valoare şi ieşirea unităţii dată de funcţia de activare, având un singur argument de intrare.

Cuvinte cheie: procesarea semnalelor, reţea neuronală, unităţi liniare, reprezentarea funcţiilor booleene.

Introducere: Reţelele neuronale liniare sunt asemănătoare cu reţelele de perceptroni, diferenţa fiind dată de funcţia de activare, care este liniară. Acest fapt permite ca ieşirile unei reţele liniare să poată lua orice valoare, în timp ce ieşirea unui perceptron este limitată la două valori: 0 sau 1 [1].

Principalele diferenţe între reţelele liniare şi perceptroni constau în modul de interpretare a ieşirii reţelei şi în algoritmul de învăţare. Perceptronii pot rezolva probleme de decizie (de exemplu probleme de clasificare), iar reţelele liniare sunt destinate în special rezolvării problemelor de aproximare [2].

O funcţie f : R → R: este liniară dacă:

x = a * x1 + b * x2   Þ f ( x ) = a * f ( x1) + b * f ( x2 ), pentru orice x, x1, x2.

Reţelele neuronale liniare pot rezolva numai probleme liniar separabile.

În categoria reţelelor uninivel, cu funcţii de transfer liniare, se încadrează reţelele ADALINE (ADAptive LINear Element), respectiv MADALINE (Multiple ADAptive LINear Element), introduse de Widrow şi Hoff. Astfel de reţele pot fi utilizate pentru rezolvarea problemelor de algebră booleană, pentru reprezentarea funcţiilor liniare continue, principalele aplicaţii fiind regresia liniară şi filtrarea liniară a semnalelor, etc.

Reţelele liniare cu un singur nivel au aplicabilitate limitată deoarece [3]:

– pot rezolva doar probleme simple de clasificare (probleme liniar separabile);

–  pot aproxima doar dependenţe simple.

Aceste limitări, ale reţelelor liniare, pot fi depăşite prin includerea nivelelor ascunse, care trebuie să aibă funcţii neliniare de transfer.

Funcţiile de activare liniare sunt utile la implementarea reţelelor cu un strat şi, în special, la implementarea reţelelor feed-forward, pentru procesarea semnalelor de activare ale ultimului strat.

În reţele liniare, se foloseşte regula de învăţare LMS (Least Mean Squares), care este mai puternică decât regula de învăţare a perceptronului. Regula Widrow-Hoff se poate aplica numai reţelelor liniare cu un singur strat, fiind o metodă de optimizare locală.

Modelul reţelelor neuronale artificiale presupune existenţa a două procese importante:

  1. formarea unui semnal de activare a reţelei, prin procesarea valorilor semnalelor de intrare;
  2. transformarea semnalului de activare într-un semnal de ieşire, folosind funcţii de transfer liniare.

Să considerăm că pentru o unitate singulară, semnalele de intrare şi ponderile sunt reprezentate prin vectorul coloană  de dimensiune , respectiv vectorul ponderilor notat . Procesarea semnalelor într-o reţea neuronală cu o unitate singulară este ilustrată în figura 1.

Vizualizează articolul complet

Concluzii: Acest articol prezintă modul de procesare a semnalelor într-o reţea neuronală liniară şi un studiu de caz pentru rezolvarea problemelor de algebră booleană.

Este prezentat modelul unităţilor McCulloch-Pitts, conform căruia intrările neuronilor pot fi inhibitoare şi excitatoare. Procesarea semnalelor în reţele neuronale liniare presupune existenţa a două procese importante: formarea unui semnal de activare a reţelei şi transformarea semnalului de activare într-un semnal de ieşire, folosind funcţii de transfer liniare.

Studiul de caz prezintă modul de reprezentare a funcţiilor booleene folosind reţele neuronale liniare şi antrenate cu regula de învăţare Widrow-Hoff.

BIBLIOGRAFIE:

  1. ANDERSON, JAMES: Neural models with cognitive implications. In LaBerge & Samuels, Basic Processes in Reading Perception and Comprehension Models. Hillsdale. Erlbaum, 1977, pp. 27-90.
  2. DUMITRESCU, HARITON COSTIN: Reţele neuronale. Teorie şi aplicaţii. Editura Teora, Bucureşti, 1996, 460 p.
  3. KRÖSE, BEN; PATRICK VAN DER SMAGT: An introduction to Neural Networks. University of Amsterdam. Netherlands, 1996, 135 p.
  4. MOISE, ADRIAN: Reţele neuronale pentru recunoaşterea formelor. Editura MATRIX ROM, Bucureşti, 2005, 309 p.
  5. MATLAB Online Help, version 7.1. 2005
  6. ROJAS, RAÚL: Neural Networks A Systematic Introduction. Springer-Verlag, Berlin, 199
  7. SCHALKOFF, ROBERT: Pattern Recognition Statistical. Structural and Neural Approaches. John Wiley & Sons, New York, 1992.
  8. WIDROW; STERNS:Adaptive Signal Processing. New York, Prentice-Hall, 1985.
  9. WIDROW; WINTER: Neural Nets for Adaptive Filtering and Adaptive Pattern Recognition. Computer 21, 1988, pp. 25-39.
  10. YU HEN HU; JENQ-NENG HWANG: Handbook of Neural Network Signal Processing. Electrical Engineering & Applied Signal Processing Series. CRC Press. 2001, 408 p.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.