Art. 07 – Vol. 21 – Nr. 4 – 2011

Sistem integrat pentru dezvoltarea arhivelor cu conţinut îmbogăţit semantic

Mihaela Dinşoreanu
Mihaela.Dinsoreanu@cs.utcluj.ro
Ioan Salomie
Ioan.Salomie@cs.utcluj.ro
Cristina Bianca Pop
Cristina.Pop@cs.utcluj.ro
Technical University of Cluj-Napoca, Department of Computer Science, Cluj-Napoca, România

Rezumat: Lucrarea abordează problema procesării cunoaşterii din documentele istorice disponibile în arhive. Astfel, se propune o soluţie integrată care efectuează extragerea de informaţii şi dobândirea de cunoştinţe pe de o parte şi regăsirea de informaţii şi cunoştinţe pe de altă parte. Se prezintă o metodă care adaptează cadrul text2Onto pentru a extrage semiautomat informaţiile relevante din conţinutul documentelor prin adnotarea textului din punct de vedere lexical şi semantic. Adnotările semantice vor popula ontologia unui domeniu care este utilizat în regăsirea de informaţii şi cunoştinţe. De asemenea, se prezintă o metodă pentru interogare în baza digitală de cunoştinţe a documentelor istorice în limbaj natural. Metoda este argumentată cu sugestii şi explicaţii semantice corespunzătoare fiecărui cuvânt. Soluţia integrată a fost testată şi validată pe un set de documente referitoare la istoria Transilvaniei.

Cuvinte cheie: dobândirea de cunoştinţe, adnotări semantice, regăsirea cunoştinţelor, interogarea limbajului natural.

Vizualizează articolul complet

BIBLIOGRAFIE:

  1. CIMIANO, P.; VÖLKER, J.: Text2Onto–A Framework for ontology Learning and Data-Driven Change Discovery. Proc. of the 10th International Conference on Applications of Natural Language to Information Systems, Vol. 3513 of LNCS, 2005, pp. 227-238.
  2. CUNNINGHAM, H. et al.: Developing Language Processing Components with GATE. Available online at: http://gate.ac.uk/.
  3. AMARDEILH, F.: OntoPop or how to annotate documents and populate ontologies from texts. Proceedings of the ESWC 2006 Workshop on Mastering the Gap: From Information Extraction to Semantic Representation, 2006.
  4. LACLAVIK, M.; CIGLAN, M.; SELENG, M.; KRAJEI, S.: Ontea: Semi-automatic Pattern based Text Annotation empowered with Information Retrieval Methods. Tools for acquisition, organisation and presenting of information and knowledge: Proceedings in Informatics and Information Technologies, Kosice, Vydavatelstvo STU, Bratislava, part 2, (2007), ISBN 978-80-227-2716-7, 2007, pp. 119-129.
  5. BUITELAAR, P.; CIMIANO, P.; RACIOPPA, S.; SIEGEL, M.: Ontology-based Information Extraction with SOBA. Proceedings of the International Conference on Language Resources and Evaluation, 2006, pp. 2321-2324.
  6. BERNSTEIN, A.; KAUFMANN, E.; KAISER, C.; KIEFER, C.: Ginseng: A Guided Input Natural Language Search Engine for Querying Ontologies. Jena User Conference, 2006.
  7. BERNSTEIN, A.; KAUFMANN, E.: GINO – A Guided Input Natural Language Ontology Editor. Proceedings of the 5th International Semantic Web Conference (ISWC 2006), Athens, Georgia, 2006, pp. 144-157.
  8. LOPEZ, V.; MOTTA, E.; UREN, V.; PASIN, M.: AquaLog: An Ontology-driven Question Answering System for Organizational Semantic Intranets. Journal of Web Semantics: Science, Services and Agents on the World Wide Web, 5(2), 2007, pp. 72-105.
  9. The Pellet OWL-DL Reasoner. Available: http://clarkparsia.com/pellet.
  10. Cluj County National Archives, http://www.clujnapoca.ro/arhivelenationale/.

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.