Abstrakt
Każda dziedzina wiedzy czy forma komunikacji posiada własne, charakterystyczne dla niej, słownictwo. Słowniki zawierające słowa i wielowyrazowe terminy dziedzinowe służące identyfikacji istotnych pojęć i ich leksykalnych odpowiedników w tradycyjnym podejściu tworzone były przez zajmujących się tą dziedziną specjalistów. Metoda ta jest jednak bardzo czasochłonna, a zatem, zwłaszcza dla szybko zmieniających się dziedzin, niewystarczająca. W artykule zaprezentowany został program pozwalający na automatyczną identyfikację fraz rzeczownikowych będących potencjalnymi terminami dziedzinowymi oraz ich uporządkowanie według miary przybliżającej stopień ich istotności.
Bibliografia
Basili R., Moschitti A., Pazienza M.T., Zanzotto F.M. 2001: A contrastive approach to term extraction, [w:] Terminologie et intelligence artificielle. Rencontres, Inist-CNRS, Vandoeuvre lès Nancy, France, s. 119–128.
Zobacz w Google Scholar
Bonin F., Dell’Orletta F., Venturi G., Montemagni S. 2010: A contrastive approach to multi-word term extraction from domain corpora, [w:] Proceedings of the 7th International Conference on Language Resources and Evaluation, Malta, s. 19–21.
Zobacz w Google Scholar
Bouma G. 2009: Normalized (pointwise) mutual information in collocation extraction, [w:] Proceedings of the Biennial GSC Conference, Gunter Narr Verlag, Tübingen, s. 31–40.
Zobacz w Google Scholar
Drabik L., Kubiak-Sokół A., Sobol E. 2012: Słownik języka polskiego, Wydawnictwo Naukowe PWN, Warszawa.
Zobacz w Google Scholar
Frantzi K., Ananiadou S., Mima H. 2000: Automatic recognition of multi-word terms: the C-value/NC-value method,„International Journal on Digital” 3 (2), s. 115–130.
Zobacz w Google Scholar
Gęsicki Ł., Gęsicki M. 1996: Słownik terminów ekonomiczno-prawnych, InterFart, Łódź.
Zobacz w Google Scholar
Głowiński M., Kostkiewiczowa T., Okopień-Słowińska A. 2010: Słownik terminów literackich, Zakład Narodowy im. Ossolińskich, Wrocław.
Zobacz w Google Scholar
Justeson J.S., Katz S.M. 1995: Technical terminology. Some linguistic properties and an algorithm for identification in text, „Natural Language Engineering” 1, s. 9–27.
Zobacz w Google Scholar
Korkontzelos I., Klapaftis I.P., Manandhar S. 2008: Reviewing and evaluating automatic term recognition techniques, Advances in natural language processing, Lecture Notes in Artificial Intelligence, vol. 5221, s. 248–259.
Zobacz w Google Scholar
Kozankiewicz S. (red.) 1976: Słownik terminologiczny sztuk pięknych, Państwowe Wydawnictwo Naukowe, Warszawa.
Zobacz w Google Scholar
Marciniak M., Mykowiecka A. 2015: Nested term recognition driven by word connection strength, „Terminology” 21 (2), s. 180–204.
Zobacz w Google Scholar
Pazienza M.T., Pennacchiotti M., Zanzotto F.M. 2004: Terminology extraction. An analysis of linguistic and statistical approaches, [w:] Knowledge Mining, Proceedings of the NEMIS 2004 Final Conference, Studies in Fuzziness and Soft Computing, vol. 185, Springer, Berlin, s. 255–279.
Zobacz w Google Scholar
Przepiórkowski A., Bańko M., Górski R.L., Lewandowska-Tomaszczyk B. (red.) 2012: Narodowy Korpus Języka Polskiego, Wydawnictwo Naukowe PWN, Warszawa.
Zobacz w Google Scholar
Rayson P., Garside R. 2000: Comparing corpora using frequency profiling, [w:] Proceedings of the Workshop on Comparing Corpora, vol. 9, Association for Computational Linguistics, Stroudsburg, PA, s. 1–6.
Zobacz w Google Scholar
Sager J.C. 1990: A practical course in terminology processing, John Benjamins, Amsterdam, Philadelphia.
Zobacz w Google Scholar
Savova G.K., Harris M., Johnson T., Pakhomov S.V., Chute C.G. 2003: A data-driven approach for extracting „the most specific term” for ontology development, [w:] Proceedings of AMIA, Annual Symposium, American Medical Informatics Association, Bethesda, MD, s. 579–583.
Zobacz w Google Scholar
SJPDor: Słownik języka polskiego, red. W. Doroszewski, t. 1–4, Państwowe Wydawnictwo „Wiedza Powszechna”, Warszawa 1958–1962, t. 5–11, Państwowe Wydawnictwo Naukowe, Warszawa 1963–1969.
Zobacz w Google Scholar
Wermter J., Hahn U. 2005: Massive biomedical term discovery, Lecture Notes in Computer Science, vol. 3735, s. 281–293.
Zobacz w Google Scholar