Automatyczne wydobywanie terminologii dziedzinowej z korpusów tekstowych
PDF

Słowa kluczowe

terminologia dziedzinowa
korpusy tekstowe

Jak cytować

Marciniak, M., Mykowiecka, A., & Rychlik, P. (2017). Automatyczne wydobywanie terminologii dziedzinowej z korpusów tekstowych. Język Polski, 97(1), 64–74. https://doi.org/10.31286/JP.97.1.6

Abstrakt

Każda dziedzina wiedzy czy forma komunikacji posiada własne, charakterystyczne dla niej, słownictwo. Słowniki zawierające słowa i wielowyrazowe terminy dziedzinowe służące identyfikacji istotnych pojęć i ich leksykalnych odpowiedników w tradycyjnym podejściu tworzone były przez zajmujących się tą dziedziną specjalistów. Metoda ta jest jednak bardzo czasochłonna, a zatem, zwłaszcza dla szybko zmieniających się dziedzin, niewystarczająca. W artykule zaprezentowany został program pozwalający na automatyczną identyfikację fraz rzeczownikowych będących potencjalnymi terminami dziedzinowymi oraz ich uporządkowanie według miary przybliżającej stopień ich istotności.

https://doi.org/10.31286/JP.97.1.6
PDF

Bibliografia

Basili R., Moschitti A., Pazienza M.T., Zanzotto F.M. 2001: A contrastive approach to term extraction, [w:] Terminologie et intelligence artificielle. Rencontres, Inist-CNRS, Vandoeuvre lès Nancy, France, s. 119–128.
Zobacz w Google Scholar

Bonin F., Dell’Orletta F., Venturi G., Montemagni S. 2010: A contrastive approach to multi-word term extraction from domain corpora, [w:] Proceedings of the 7th International Conference on Language Resources and Evaluation, Malta, s. 19–21.
Zobacz w Google Scholar

Bouma G. 2009: Normalized (pointwise) mutual information in collocation extraction, [w:] Proceedings of the Biennial GSC Conference, Gunter Narr Verlag, Tübingen, s. 31–40.
Zobacz w Google Scholar

Drabik L., Kubiak-Sokół A., Sobol E. 2012: Słownik języka polskiego, Wydawnictwo Naukowe PWN, Warszawa.
Zobacz w Google Scholar

Frantzi K., Ananiadou S., Mima H. 2000: Automatic recognition of multi-word terms: the C-value/NC-value method,„International Journal on Digital” 3 (2), s. 115–130.
Zobacz w Google Scholar

Gęsicki Ł., Gęsicki M. 1996: Słownik terminów ekonomiczno-prawnych, InterFart, Łódź.
Zobacz w Google Scholar

Głowiński M., Kostkiewiczowa T., Okopień-Słowińska A. 2010: Słownik terminów literackich, Zakład Narodowy im. Ossolińskich, Wrocław.
Zobacz w Google Scholar

Justeson J.S., Katz S.M. 1995: Technical terminology. Some linguistic properties and an algorithm for identification in text, „Natural Language Engineering” 1, s. 9–27.
Zobacz w Google Scholar

Korkontzelos I., Klapaftis I.P., Manandhar S. 2008: Reviewing and evaluating automatic term recognition techniques, Advances in natural language processing, Lecture Notes in Artificial Intelligence, vol. 5221, s. 248–259.
Zobacz w Google Scholar

Kozankiewicz S. (red.) 1976: Słownik terminologiczny sztuk pięknych, Państwowe Wydawnictwo Naukowe, Warszawa.
Zobacz w Google Scholar

Marciniak M., Mykowiecka A. 2015: Nested term recognition driven by word connection strength, „Terminology” 21 (2), s. 180–204.
Zobacz w Google Scholar

Pazienza M.T., Pennacchiotti M., Zanzotto F.M. 2004: Terminology extraction. An analysis of linguistic and statistical approaches, [w:] Knowledge Mining, Proceedings of the NEMIS 2004 Final Conference, Studies in Fuzziness and Soft Computing, vol. 185, Springer, Berlin, s. 255–279.
Zobacz w Google Scholar

Przepiórkowski A., Bańko M., Górski R.L., Lewandowska-Tomaszczyk B. (red.) 2012: Narodowy Korpus Języka Polskiego, Wydawnictwo Naukowe PWN, Warszawa.
Zobacz w Google Scholar

Rayson P., Garside R. 2000: Comparing corpora using frequency profiling, [w:] Proceedings of the Workshop on Comparing Corpora, vol. 9, Association for Computational Linguistics, Stroudsburg, PA, s. 1–6.
Zobacz w Google Scholar

Sager J.C. 1990: A practical course in terminology processing, John Benjamins, Amsterdam, Philadelphia.
Zobacz w Google Scholar

Savova G.K., Harris M., Johnson T., Pakhomov S.V., Chute C.G. 2003: A data-driven approach for extracting „the most specific term” for ontology development, [w:] Proceedings of AMIA, Annual Symposium, American Medical Informatics Association, Bethesda, MD, s. 579–583.
Zobacz w Google Scholar

SJPDor: Słownik języka polskiego, red. W. Doroszewski, t. 1–4, Państwowe Wydawnictwo „Wiedza Powszechna”, Warszawa 1958–1962, t. 5–11, Państwowe Wydawnictwo Naukowe, Warszawa 1963–1969.
Zobacz w Google Scholar

Wermter J., Hahn U. 2005: Massive biomedical term discovery, Lecture Notes in Computer Science, vol. 3735, s. 281–293.
Zobacz w Google Scholar

Skip to content