Art. 07 – Vol. 24 – Nr. 1 – 2014

GRADUL DE UTILIZARE AL CARACTERELOR
ÎN CADRUL MESAJELOR SMS

Alin Zamfiroiu
zamfiroiu@ici.ro 
Institutul Naţional de Cercetare-Dezvoltare în Informatică – ICI Bucureşti
Academia de Studii Economice Bucureşti

Carmen Rotună
carmen.rotuna@rotld.ro
Institutul Naţional de Cercetare-Dezvoltare în Informatică – ICI Bucureşti

Rezumat: Articolul abordează serviciul de mesaje text, devenit cel mai accesibil mod de comunicare printre aproximativ 6 miliarde de utilizatori de telefonie la nivel mondial şi are ca scop obţinerea unor date statistice privind frecvenţa de utilizare a caracterelor. Multitudinea soluţiilor software precum Nokia PC Suite, Nokia OVI, Microsoft ActiveSync, Apple iTunes, MyPhoneExplorer, AirDroid, face posibilă conexiunea între telefonul mobil şi calculator având ca scop interschimbarea de fişiere, urmând ca acestea să fie supuse unei analize pentru determinarea anumitor caracteristici. Solutia propusă în cadrul studiului respectă criteriul interoperabilităţii prin utilizarea unui sistem portabil de fişiere (CSV). Rezultatele obţinute pe baza analizei unui eşantion de mesaje trimise într-o perioadă de 3 ani (perioada de timp prestabilită) evidenţiază media caracterelor dintr-un mesaj precum şi gradul de utilizare al fiecărui caracter în parte.

Cuvinte cheie: mobil, short message service, conexiune, sincronizare, interoperabilitate, export date, caractere, eşantion.

Introducere

Abreviat ca SMS, serviciul de mesaje scurte presupune transmiterea de mesaje de la şi către un telefon mobil. Un mesaj scurt nu poate conţine mai mult de 160 de caractere. În [1] este prezentată arhitectura serviciului de mesaje scurte, prezentat şi în figura 1.

Primul SMS a fost trimis pe 3 Decembrie 1992 de către Neil Papworth [2]. Iniţial SMS-urile nu erau foarte utilizate. În anul 1995 erau trimise 0,4 SMS-uri per utilizator.

Astăzi mesajele de tipul SMS sunt uşor de scris în timpul conferinţelor, în timpul prezentărilor sau în timp ce utilizatorii vizionează un film [9]. Astfel, fiecare încearcă să realizeze cât mai multe lucruri în acelaşi timp: să vizioneze un film, să asculte prezentarea din cadrul conferinţei şi să comunice cu altcineva în acelaşi timp prin intermediul mesajelor.

Utilizatorii s-au obişnuit cu tastatura telefonului astfel încât scriu fără a se uita la taste atunci când tastează. Astfel,  în timp ce scriu mesaje SMS pot fi atenţi la alte activităţi.

Mesajele SMS sunt de asemenea folosite pentru ca informaţiile furnizate să rămână salvate. În cazul în care o persoana este sunată şi i se spune o adresă la care trebuie să ajungă, aceasta trebuie să memoreze adresa sau să o noteze în timp ce îi este furnizată prin telefon. În schimb dacă adresa îi este furnizată printr-un mesaj SMS, informaţia rămâne salvată în telefon până la ştergerea mesajului. În plus, utilizatorul are posibilitatea de a introduce adresa într-o aplicaţie GPS care prezintă proprietatea de interoperabilitate cu aplicaţia de mesaje. Aplicaţia GPS preia adresa din mesaj şi furnizează utilizatorului informaţii despre ruta pe care să o urmeze pentru a ajunge la destinaţie.

În [3] este prezentată o statistică privind utilizarea mesajelor SMS prin mai multe aspecte precum tipul cuvintelor utilizate şi frecvenţa acestora.

Cel mai utilizat cuvânt în cadrul mesajelor analizate a fost Du (traducere din limba norvegiana: tu). Al doilea cuvânt cel mai utilizat a fost jeg (traducere din limba norvegiană: eu). Acestea au fost urmate de prepoziţiile pa (la) şi i (în).

Vizualizează articolul complet

O alta dimensiune avută în vedere este lungimea cuvintelor şi mesajelor. Datele analizate arată că femeile trimit în medie mesaje cu 6,95 cuvinte pe mesaj, iar barbaţii cu 5,54 cuvinte pe mesaj. Analiza prezentată în [3] arată că doar 6% dintre mesaje conţin abrevieri ale cuvintelor. Aproximativ 82% din mesaje nu conţin litere capitalizate, 11% conţin doar prima literă din mesaj capitalizat, iar 7% au litere capitalizate pentru fiecare frază.

Concluzii

Mesajele text au devenit una dintre cele mai populare  metode de comunicare, acest aspect fiind datorat necesităţii utilizatorilor de a transmite într-un timp cât mai scurt şi folosind minimum de resurse date şi informaţii. Traiectoria actuală a acestui serviciu pare să evidenţieze faptul că acest tip de comunicare  va continua să se extindă prin implentarea unor noi facilităţi şi dezvoltarea celor deja existente. Formatul de date actual pentru mesaje include informaţii precum: lungimea mesajului, data şi ora, numărul de telefon de destinaţie, formatul, etc.

În cadrul acestui studiu, Nokia PC Suite este folosită pentru exportul datelor de pe telefonul mobil pe calculator într-un format portabil şi aplicaţia LetterCounter implementată în Microsoft Visual Studio 2010 C#, pentru determinarea anumitor caracteristici ale unui text primit ca parametru input. Având în vedere faptul că aceasta este o aplicaţie nou implementată, s-a tinut cont de caracteristica interoperabilităţii cu alte aplicaţii. De asemenea, pentru fişierele importate s-a ales formatul csv sau txt ce permite operaţii de analiză mai complexe pentru textele de dimensiuni mari.

Textul primit ca parametru este modificat astfel încât să conţină doar caractere mici, deoarece nu se face distincţie între caracterele mari şi caracterele mici. Datele de intrare sunt consistente dat fiind faptul că sunt supuse analizei 13386 de mesaje SMS în care au fost identificate 639575 de caractere, înregistrate pe o perioada de 3 ani. În urma analizei sunt evidenţiate date cantitative privind caracterele folosite cel mai frecvent precum media caracterelor dintr-un mesaj şi gradul de utilizare al fiecărui caracter în parte.

Datele cantitative obţinute vor fi folosite în direcţiile viitoare de cercetare pentru stabilirea modului de construcţie a tastaturilor virtuale, astfel încât tastele să fie dispuse în funcţie de frecvenţa de utilizare a caracterelor respective.

BIBLIOGRAFIE

  1. http://otelecom.net/SMSC.html
  2. http://neilpapworth.com/
  3. LING, R.: The socio-linguistics of SMS: An analysis of SMS use by a random sample of Norwegians, Mobile communications, pp. 335 – 349, 2005.
  4. http://www.businessinsider.com/these-are-the-three-most-popular-keys-on-a-keyboard-2013-7
  5. http://www.imf.org/external/help/csv.htm
  6. http://nds1.nokia.com/files/support/nam/phones/guides/6370pcsuiteguide.pdf
  7. http://www.wisegeek.com
  8. http://www.anuragbhandari.com/2008/12/use-sms-english-to-make-monoalphabetic-cipher-more-secure/
  9. MENG, X.; ZERFOS, P.; VIDYUT, S.; WONG, S.H.Y.; LU, S.: Analysis of the Reliability of a Nationwide Short Message Service, INFOCOM, pp. 1811-1819. IEEE, (2007)
  10. OLIVER, E.: Characterizing the Transport Behaviour of the Short Message Service, Proceedings of the 8th international conference on Mobile systems, applications, and services, pp. 223-238 ACM New York, NY, USA 2010.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.