CARACTERISTICI PARADIGMATICE, TEHNOLOGICE ȘI ECONOMICE ALE HPC, GRID, HSC, CLOUD ȘI VOLUNTEER COMPUTING – DELIMITATOARE ȘI DETERMINANTE ALE VOLUNTEER CLOUD COMPUTING
Bogdan Enciu
enciu@ici.ro
Institutul Naţional de Cercetare-Dezvoltare în Informatică – ICI Bucureşti
Rezumat: Articolul prezintă caracteristici, de diverse naturi, specifice tipurilor de tehnologii de calcul menţionate. Sunt descrise, la un nivel general, aspecte definitorii ale acestor tehnologii şi sunt evidenţiate diferenţele dintre acestea. Descrierea relevează şi evoluţia dezvoltării tehnologiilor şi legăturile dintre ele. De asemenea, prezentarea acestor caracteristici urmăreşte şi lămurirea unor aspecte care pot genera confuzii, în special, determinate de diferitele posibilităţi de utilizare ale tehnologiilor, acesta fiind principalul motiv pentru care s-a intenţionat demararea acestui demers după încheierea proiectului de dezvoltare a ‘site’-ului Grid din ICI Bucureşti, demers realizat acum. Este descrisă problematica virtualizării, cu accent pe calculul voluntar, aceasta constituind un aspect determinant al evoluţiei acestei tehnologii de calcul către Volunteer Cloud.
Cuvinte cheie: HPC, Grid, HSC, Cloud, Volunteer Computing, Volunteer Cloud, virtualizare.
Tehnologiile Grid, Cloud, Volunteer Computing – definiţii şi deziderate
În contextul în care a avut loc o continuă dezvoltare atât a tehnologiilor de reţea cât şi a cerinţelor în acest sens, a apărut ca naturală şi cerinţa de adaptare a implementărilor bazate pe calculul de înaltă performanţă de la tehnologia ‘mainframe’-urilor la cea a ‘cluster’-elor interconectate şi, ulterior, la cea a scalabilităţii ‘cluster’-elor. Această tendinţă, bazată şi pe dezvoltarea capacităţii de calcul a sistemelor personale, a condus orientarea rezolvării unor probleme complexe de calcul de la tehnologia bazată pe supercalculatoare la tehnologia calculului voluntar.
Tehnologia Grid implică partajarea coordonată a resurselor şi rezolvarea de probleme în cadrul unor organizaţii virtuale multi-instituţionale şi dinamice [9]. Iniţial, resursele erau doar fişiere dar, ulterior, resursele au fost extinse până la accesul direct al calculatoarelor, datelor, programelor şi al altor tipuri de resurse. Tehnologia Grid furnizează o infrastructură globală de ‘cluster’-e interconectate constând din resurse de calcul dispersate în cadrul Internet. Dezideratul calculului Grid a fost acela de a transforma calculul într-o utilitate obişnuită, precum energia electrică, gazele, apa. Calculul Grid ridică probleme privind securitatea, eterogenitatea şi portabilitatea.
Calculul Cloud este o paradigmă considerată ca marcantă în calcul şi poate fi definit în mai multe moduri. Este considerat ca un model pentru permiterea accesului în reţea pretutindeni, în mod convenabil, la cerere, la o masă de resurse de calcul configurabile (reţele, ‘server’-e, unităţi de stocare, aplicaţii şi servicii) care pot fi rapid aprovizionate şi furnizate cu minim efort de gestionare sau interacţiune cu furnizorul de servicii [3]. Altă definiţie este aceea că acest tip de calcul se referă atât la aplicaţiile furnizate ca servicii în cadrul Internet cât şi la ‘hardware’-ul şi ‘software’-ul de sistem din centrele de date care furnizează acele servicii. Cloud are o muţime de caracteristici prin care se pot aborda probleme de calcul. De asemenea, Cloud este definit [3] ca o formă de calcul Grid în care resursele virtuale sunt în mod dinamic alocate. În definiţia NIST (the US National Institute of Standards and Technology) [11] se referă la: cinci caracteristici (auto-service la cerere, acces în reţea de bandă largă, interogare de resurse, elasticitate rapidă, serviciu măsurat), patru modele de utilizare (cloud privat, în care datele şi procesele sunt gestionate din interiorul unei organizaţii; cloud comunitar, în care infrastructura este partajată între câteva organizaţii; cloud public, în care infrastructura este disponibilă public şi poate fi accesată prin ‘Web’; cloud hibrid, o combinaţie a primelor două, cu scopul portabilităţii cu tehnologia standardizată), trei modele de servicii (‘software’-ul ca serviciu – SasS), platforma ca serviciu – PasS, infrastructura ca serviciu – IasS).
Concluzii
Modelele de calculul paralel şi distribuit constituie baza acestor tehnologii. Calculul scalabil este diferit de calculul optimizat pentru performanţă. Cloud poate suporta încărcări de lucru Grid şi HPC dar nu este în sine un Grid în sens “clasic”. Infrastructurile de tip Cloud (precum cele ale Amazon.com şi Google) nu s-au realizat în spiritul concepţiei Grid. Mai mult, o zonă a Grid-ului, EPP impune cerinţe presante să fie acceptat de cloud-uri precum EC2. În plus faţă de suportarea încărcărilor de lucru de tip EPP care rulează pe cloud-uri obişnuite, unele cloud-uri pot, de asemenea, dezvolta o zonă proiectată specific pentru încărcari de lucru de tip HPC. Rezultă că tehnologia HSC a fost gândită şi proiectată ca să permită HPC.
Deci, deşi grid nu este cloud, există o inter-relaţionare. În plus, din punct de vedere comercial, a existat şi o mare oportunitate pentru furnizorii de cloud de a accepta acest segment de piaţă, un exemplu fiind Amazon care a investit sume foarte mari în acest sens. Cloud Computing este un calcul orientat-serviciu care oferă servicii prin intermediul virtualizării.
Volunteer Computing nu este Cloud Computing dar pentru depăşirea unor probleme generate de mediul eterogen al Volunteer Computing, s-au iniţiat proiecte de virtualizare pentru “ascunderea” resurselor fizice. Procesul de virtualizare a condus la rezolvarea unor probleme şi a creat un mediu de execuţie mai sigur, prin virtualizare fiind depăşită problema dependenţei de platformă a aplicaţiilor şi fiind sporit gradul de securitate.
Ideea de a aplica virtualizarea în cadrul Volunteer Computing, realizându-se infrastructuri ‘cloud-like’ pe baza resurselor voluntare, a condus la apariţia unei noi paradigme de calcul: Volunteer Cloud Computing. Această tehnologie se confruntă cu o serie de probleme majore (în principal, disponibilitatea resurselor de calcul şi convingerea voluntarilor de a oferi resurse la alt nivel de accesibilitate) deoarece are ca scop şi aspecte comerciale pe lângă cele legate de rezolvarea unor probleme ştiinţifice masiv computaţionale.
Trebuie remarcată evoluţia tehnicilor de virtualizare prin intermediul căreia s-au dezvoltat tehnologiile de calcul, devenind posibilă şi apariţia Volunteer Cloud. Sistemele de operare paravirtualizate care sunt instalate în fişiere în format disc standard şi care rulează fie nativ fie pe hipervizoare compatibile şi interschimbabile care uzează de gestiunea asistată ‘hardware’ a unităţilor centrale de prelucrare, a memoriei şi a dispozitivelor de intrare/ieşire par a contura viitorul virtualizării.
BIBLIOGRAFIE
- ANDERSON, D.; NOV, O.; ARAZY, O.: Volunteer Computing: A Model of the Factors Determining Contribution to Community-based Scientific Research. International World Wide Web Conference, 2010.
- ANDERSON, D. P.: Volunteer Computing Vs Cloud Vs Grid Vs HPC. http://www.volunteer-computing.org/EN/.
- ANJOMSHOA, M.; SALLEH, M.: Overview on Clouds@home: Virtualization Mechanism for Volunteer Computing. International Conference on Parallel and Distributed Computing Systems (PDCS), 2014.
- ANJOMSHOA, M.; SALLEH, M.; KERMANI, M. P.: The Cost of Virtualization Implementation in Volunteer Computing. International Conference on Computer, Communications, and Control Technology (I4CT). 2014
- ANJOMSHOA, M.; SALLEH, M.; KERMANI, M. P.: A Taxonomy and Survey of Distributed Computing Systems. Journal of Applied Sciences, 2015.
- BIAS, R.: Grid, Cloud, HPC… What’s the Diff? http://cloudscaling.com/blog/cloud-computing/. 2010
- DISTEFANO, S.; CUNSOLO, V. D.; PULIAFITO, A.: A Taxonomic Specification of Cloud@Home. Advanced Intelligent Computing Theories and Applications, With Aspects of Artificial Intelligence, 2010.
- DORNEANU, D.: Volunteer Computing at CERN – Sustainability Model Proposal. CERN Openlab, 2011.
- FOSTER, I.; KESSELMAN, C.; TUECKE, S.: The Anatomy of the Grid: Enabling Scalable Virtual Organizations. International Journal of High Performance Computing Applications, 15(3), 2001.
- HAFEEZ, M.; ASGHAR, S.; MALIK, U. A.; REHMAN, A.; RIAZ, N.: Message Passing Framework for Globally Interconnected Clusters. Journal of Physics: Conference Series 331, 2011.
- MELL, P.; GRANCE, T.: The NIST Definition of Cloud Computing. National Institute of Standards and Technology, Information technology laboratory, 2009.
- MUNTEAN, T.: Parallel Operating System Architecture for Message Passing Parallel Computers. OSF’93, 1993.
- RITEAU, P.: An Overview of Virtualization Technologies. University of Rennes 1, 2011.
- SHENG, D.; KONDO, D.; CIRNE, W.: Characterization and Comparison of Cloud versus Grid Workloads. IEEE International Conference on Cluster Computing (CLUSTER), 2012.
This work is licensed under a Creative Commons Attribution 4.0 International License.