Lingwistyka komputerowa dla języka polskiego: dziś i jutro
PDF

Słowa kluczowe

lingwistyka komputerowa
lingwistyka informatyczna
przetwarzanie języka naturalnego
technologie językowe
narzędzia i zasoby językowe dla polszczyzny

Jak cytować

Ogrodniczuk, M. (2017). Lingwistyka komputerowa dla języka polskiego: dziś i jutro. Język Polski, 97(1), 18–28. https://doi.org/10.31286/JP.97.1.3

Abstrakt

Tekst jest publicystyczną próbą nakreślenia dalszych kierunków prac nad komputerowym przetwarzaniem polszczyzny w obliczu intensywnego rozwoju cyfrowych narzędzi i zasobów dla języka polskiego oraz zacieśniającej się współpracy między polskimi ośrodkami badawczymi zajmującymi się lingwistyką komputerową. Za najważniejszy temat autor uważa wznowienie prac nad korpusem narodowym, który jako zasób podstawowy dla językoznawstwa polskiego wymaga stałego poszerzania bazy materiałowej i opisu lingwistycznego, włączenia podkorpusów diachronicznych, gwarowych i równoległych. W sferze technologii językowej autor postuluje wzbogacenie formalnego opisu polszczyzny o głęboki poziom składniowy, semantykę i dyskurs oraz zwraca uwagę na konieczność stałego poprawiania jakości dostępnych narzędzi i zasobów metodą współpracy środowiska językoznawczego z informatycznym.

https://doi.org/10.31286/JP.97.1.3
PDF

Bibliografia

Bień J.S. 1988: Komputery a język naturalny, „Biuletyn Polskiego Towarzystwa Informatycznego” VI (2–3), s. 6–7.
Zobacz w Google Scholar

Jaworski W., Przepiórkowski A. 2014: Syntactic approximation of semantic roles, [w:] A. Przepiórkowski, M. Ogrodniczuk (red.), Advances in Natural Language Processing, Lecture Notes in Artificial Intelligence, vol. 8686, Springer, Heidelberg, s. 193–201.
Zobacz w Google Scholar

Miłkowski M. 2012: Język polski w erze cyfrowej, Springer, Berlin–Heidelberg (online: http://doi.org/10.1007/978-3-642-30811-6).
Zobacz w Google Scholar

Ogrodniczuk M., Przepiórkowski A. 2013: CLIP – portal internetowy łączący projekty, narzędzia, zespoły związane z komputerowym przetwarzaniem języka polskiego, „Język Polski” XCIII, s. 242.
Zobacz w Google Scholar

Patejuk A., Przepiórkowski A. 2012: Towards an LFG parser for Polish. An exercise in parasitic grammar development, [w:] N. Calzolari, K. Choukri, T. Declerck, M.U. Doğan, B. Maegaard, J. Mariani, A. Moreno, J. Odijk, S. Piperidis (red.), Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC 2012), ELRA, Stambuł, s. 3849–3852.
Zobacz w Google Scholar

Pęzik P. 2015: Spokes – a search and exploration service for conversational corpus data, [w:] Selected Papers from CLARIN 2014, Linköping University Electronic Press, Linköpings universitet, Linköping, s. 99–109.
Zobacz w Google Scholar

Pęzik P. 2016: Exploring phraseological equivalence with paralela, [w:] E. Gruszczyńska, A. Leńko-Szymańska (red.), Polskojęzyczne korpusy równoległe. Polish-language Parallel Corpora, Instytut Lingwistyki Stosowanej Uniwersytetu Warszawskiego, Warszawa, s. 67–81.
Zobacz w Google Scholar

Piasecki M. 2008: Cele i zadania lingwistyki informatycznej, [w:] P. Stalmaszczyk (red.), Metodologie językoznawstwa. Współczesne tendencje i kontrowersje, Lexis, Kraków.
Zobacz w Google Scholar

Piasecki M., Maziarz M., Szpakowicz S., Rudnicka E. 2014: PlWordNet as the Cornerstone of a Toolkit of Lexico-semantic Resources, [w:] H. Orav, C. Fellbaum, P. Vossen (red.), Proceedings of the Seventh International Global Wordnet Conference (GWC 2014), University of Tartu Press, Tartu, s. 304–312.
Zobacz w Google Scholar

Przepiórkowski A. 2015: Inżynieria lingwistyczna a obecna sytuacja językoznawstwa polskiego, „LingVaria” X, nr 2, s. 135–145.
Zobacz w Google Scholar

Przepiórkowski A., Bańko M., Górski R.L., Lewandowska-Tomaszczyk B. (red.) 2012: Narodowy Korpus Języka Polskiego, Wydawnictwo Naukowe PWN, Warszawa.
Zobacz w Google Scholar

Przepiórkowski A., Skwarski F., Hajnicz E., Patejuk A., Świdziński M., Woliński M. 2014: Modelowanie własności składniowych czasowników w nowym słowniku walencyjnym języka polskiego, „Polonica” XXXIII, s. 159–178.
Zobacz w Google Scholar

Saloni Z., Woliński M., Wołosz R., Gruszczyński W., Skowrońska D. 2007/2015: Słownik gramatyczny języka polskiego, wyd. 1: Warszawa 2007 (dokument elektroniczny), wyd. 2: Warszawa 2012 (dokument elektroniczny), wyd. 3: 2015 (online: http:// sgjp.pl).
Zobacz w Google Scholar

Strik H., Daelemans W., Binnenpoorte D., Sturm J., de Vriend F., Cucchiarini C. 2002: Dutch HLT resources. From BLARK to priority lists, [w:] J. Hansen, B. Pellom (red.), Proceedings of the Seventh International Conference on Spoken Language Processing (ICLSP 2002), Denver, USA, s. 1549–1552.
Zobacz w Google Scholar

Świdziński M. 2006: Lingwistyka korpusowa w Polsce – źródła, stan, perspektywy, „LingVaria” I, nr 1, s. 23–32.
Zobacz w Google Scholar

Webber B.L. 2001: Computational perspectives on discourse and dialogue, [w:] D. Schirin, D. Tannen, H. Hamilton (red.), The Handbook of Discourse Analysis, Blackwell Publishers Ltd.
Zobacz w Google Scholar

Woliński M. 2015: Deploying the new valency dictionary Walenty in a DCG parser of Polish, [w:] M. Dickinson, E. Hinrichs, A. Patejuk, A. Przepiórkowski (red.), Proceedings of the Fourteenth International Workshop on Treebanks and Linguistic Theories (TLT14), Instytut Podstaw Informatyki PAN, Warszawa, s. 221–229.
Zobacz w Google Scholar

Żmigrodzki P. 2015a: Wielki słownik języka polskiego PAN a obecna sytuacja językoznawstwa polskiego, „LingVaria” X, nr 1, s. 109–119.
Zobacz w Google Scholar

Żmigrodzki P. 2015b: Wielki słownik języka polskiego PAN – historia, stan obecny i perspektywy rozwoju po 2018 roku, „Biuletyn Polskiego Towarzystwa Językoznawczego” LXXI, s. 177–187.
Zobacz w Google Scholar

Skip to content