IDENTIFICAREA ORIGINALITĂȚII UNEI LUCRĂRI DE SPECIALITATE FOLOSIND ANALIZA INTRINSECĂ A PLAGIATULUI
Mădălina ZURINI
madalina.zurini@csie.ase.ro
Academia de Studii Economice
Rezumat: În cadrul articolului se prezintă conceptul de proprietate intelectuală în contextul publicării articolelor de specialitate. Nivelul de originalitate derivă din analiza dreptului de proprietate, fiind o componentă definitorie şi prezentată în antiteză cu conceptul de plagiat. Făcând o trecere la tipurile de analiză a plagiatului, analiza intrinsecă este exemplificată prin propunerea unei metrici de evaluare a stilului de scriere al unui autor din punct de vedere al bogăţiei vocabularului folosit în concordanţă cu nivelul semantic abordat. Metrica propusă este testată folosind o bază de test formată din 17 lucrări de specialitate realizate de un autor pe parcursul a 13 ani. Interpretarea rezultatelor evidenţiază avantajele aduse de completarea analizei cu evaluarea nivelului semantic.
Cuvinte cheie: stilometrie, plagiat, metrici, originalitate.
Nivelul de originalitate şi dreptul de proprietate intelectuală
Cercetările privind dreptul de proprietate intelectuală se confruntă cu stabilirea nivelului de originalitate, în antiteză cu acţiunea de plagiat care este definită ca fiind însuşirea integrală sau parţială a ideilor, expresiilor, metodelor sau procedurilor altor autori şi prezentarea lor drept creaţie personală. În legile anglo-americane, argumentele de ordin economic şi cele care ţin de politicile publice prevalează în elaborarea şi dezvoltarea legilor dreptului de proprietate intelectuală, în timp ce în spaţiul european argumentele de ordin moral şi cele de drept civil fundamentează elaborarea aceloraşi legi.
Cadrul legislativ prezent nu rezolvă identificarea plagiatului şi a nivelului de originalitate al lucrărilor ştiinţifice. Prezentul proiect îşi propune aplicarea legislativă a drepturilor de proprietate intelectuală în contextul publicării lucrărilor de specialitate.
În practică, există diferite tipuri de plagiat, cele mai des întâlnite fiind: plagiatul copy-paste, parafrazarea, plagiatul prin traducere din alte limbi, plagiatul artistic, al ideilor, al codului sursă şi nefolosirea corespunzătoare a citărilor. În [1], se prezintă faptul că plagiatul prin parafrazare este analizat, realizând o clasificare a tipurilor întâlnite, precum şi testarea produselor software de detectare a plagiatului la nivelul procentului de corectitudine a identificării parafrazării în cadrul unui document text.
Creativitatea, văzută ca o formă de originalitate, reprezintă capacitatea de a aduce ceva nou, original şi adecvat realităţii, definitorii pentru creativitate fiind noutatea şi originalitatea. Astfel, pentru a putea analiza nivelul de originalitate al unei lucrări ştiinţifice, este nevoie de a crea o antiteză între această componentă de creativitate şi componenta de plagiat.
Pornind de la obiectele cu care se operează în cadrul prezentei cercetări, lucrări de specialitate realizate de autori străini şi români, se defineşte componenta de frază semantică ca acea componentă compactă din cadrul unei lucrări, formată din una sau mai multe fraze alăturate, care este semnificativ diferită de frazele semantice imediat anterioară şi ulterioară. A spune că o lucrare este originală este echivalent cu rezultatul evaluării acelei lucrări din punct de vedere al plagiatului.
Concluzii
Metrica propusă, pornind de la metricile de tip Concept unic – Cuvinte şi ponderată cu distanţele semantice extrase pe baza ontologiei WordNet adaugă, pe lângă transformarea din cuvinte în concepte WordNet, şi distanţele semantice maximale dintre cuvinte, generând o componentă semantică neintrodusă în cercetările privind evaluarea, măsurarea şi interpretarea bogăţiei vocabularului folosit de un autor în cadrul unui text sau fragment de text redactat în limba engleză.
Avantajele aduse de prezenta metodă propusă constau în faptul că metrica de evaluare a bogăţiei vocabularului nu depinde de domeniile care sunt tratate în documentele analizate, ci doar de distanţele semantice dintre conceptele unice identificate în cadrul documentelor respective. Adăugând şi componenta timp în analiză, se întrevede o posibilă estimare a viitoarelor lucrări redactate de autori despre care se cunosc lucrări redactate anterior din punct de vedere al timpului.
* * *
Această lucrare a beneficiat de suport financiar prin proiectul “Rute de excelenţă academică în cercetarea doctorală şi post-doctorală – READ” cofinanţat din Fondul Social European, prin Programul Operaţional Sectorial Dezvoltarea Resurselor Umane 2007-2013, contract nr. POSDRU/159/1.5/S/137926.
BIBLIOGRAFIE
- CEDENO, A. B.; VILA, M.; MARTI M. A.; ROSSO, P.: Plagiarism Meets Paraphrasing: Insights for the Next Generation in Automatic Plagiarism Detection, Computational Linguistics, 39(4), pp. 917-947.
- LANCASTER, T.; CULWIN, F.: Classifications of Plagiarism Detection Engines, Available at: http://www-new2.heacademy.ac.uk/assets/documents/subjects/ics/may2005_vol.4_1_classification_plagiarism_detection_engines.pdf
- OBERREUTER, G.; L’HUILLER, G.; RIOS, S. A.; VELASQUEZ J. D.: Approaches for Intrinsic and External Plagiarism Detection, Notebook for PAN at CLEF, Available at: http://ceur-ws.org/Vol-1177/CLEF2011wn-PAN-OberreuterEt2011.pdf
- STAMATATOS, E.; KOPPEL, M.: Plagiarism and authorship analysis: introduction to the special issue, Lang Resources & Evaluation, 45(1), 2011, pp. 1-4.
- CARNAHAN, N.; HUDERLE, M.; JONES, N.; STEPHAN, C.; TRAN, T.; WOOD-DOUGHTY Z.: Plagiarism Detection, 2014. Available at: http://www.cs.carleton.edu/cs_comps/1314/dlibenno/final-results/plagcomps.pdf
- ALZAHRANI, S. M.; SALIM, N.; ABRAHAM, A.: Understanding Plagiarism Linguistic Patterns, Textual Features and Detection Methods, IEEE Transaction on Systems, Man and Cybernetics – Part C: Applications and Reviews, 42(2), 2012, pp. 133-149.
- SALUNKHE, S. D.; GAWALI, S. Z.: A Plagiarism Detection Mechanism using Reinforcement Learning, International Journal of Advance Research in Computer Science and Management Studies, 1(6), 2013, pp. 125-129.
- EISSEN, S. M.; STEIN, B.; KULIG, M.: Plagiarism Detection Without Reference Collections, Advances in Data Analysis Studies in Classification, Data Analysis and Knowledge Organization, 2007, pp. 359-366.
- STEIN, B.; LIPKA, N.; PRETTENHOFER, P.: Intrinsic plagiarism analysis, Language Resources & Evaluation, 45(1), 2010, pp. 63-82.
- SEDDING, J.; KAZAKOV, D.: WordNet-based Text Document Clustering, ROMAND 2004, Workshop on Robust Methods in Analysis of Natural Language Data, Geneva, August, 2004, pp. 104-113.
- OSICEANU, M-E.: Consideraţii privind drepturile de proprietate intelectuală în ştiinţă, tehnică şi artă sau între creaţie şi plagiat, Available at: http://api.ning.com/files/uPa7BpseSwF6lqvQmgiaPdijUqzZEL9nHLQzkOJht94wzdjkfubWxs5cGMbkITg3agVjj0s2dOhxhjn88Hy*72*M4OH2MIVb/Osiceanu_MEConsideraiiprivinddrepturiledeproprietateintelectuala_final.pdf
This work is licensed under a Creative Commons Attribution 4.0 International License.