Abstrakt
Tekst jest publicystyczną próbą nakreślenia dalszych kierunków prac nad komputerowym przetwarzaniem polszczyzny w obliczu intensywnego rozwoju cyfrowych narzędzi i zasobów dla języka polskiego oraz zacieśniającej się współpracy między polskimi ośrodkami badawczymi zajmującymi się lingwistyką komputerową. Za najważniejszy temat autor uważa wznowienie prac nad korpusem narodowym, który jako zasób podstawowy dla językoznawstwa polskiego wymaga stałego poszerzania bazy materiałowej i opisu lingwistycznego, włączenia podkorpusów diachronicznych, gwarowych i równoległych. W sferze technologii językowej autor postuluje wzbogacenie formalnego opisu polszczyzny o głęboki poziom składniowy, semantykę i dyskurs oraz zwraca uwagę na konieczność stałego poprawiania jakości dostępnych narzędzi i zasobów metodą współpracy środowiska językoznawczego z informatycznym.
Bibliografia
Bień J.S. 1988: Komputery a język naturalny, „Biuletyn Polskiego Towarzystwa Informatycznego” VI (2–3), s. 6–7.
Zobacz w Google Scholar
Jaworski W., Przepiórkowski A. 2014: Syntactic approximation of semantic roles, [w:] A. Przepiórkowski, M. Ogrodniczuk (red.), Advances in Natural Language Processing, Lecture Notes in Artificial Intelligence, vol. 8686, Springer, Heidelberg, s. 193–201.
Zobacz w Google Scholar
Miłkowski M. 2012: Język polski w erze cyfrowej, Springer, Berlin–Heidelberg (online: http://doi.org/10.1007/978-3-642-30811-6).
Zobacz w Google Scholar
Ogrodniczuk M., Przepiórkowski A. 2013: CLIP – portal internetowy łączący projekty, narzędzia, zespoły związane z komputerowym przetwarzaniem języka polskiego, „Język Polski” XCIII, s. 242.
Zobacz w Google Scholar
Patejuk A., Przepiórkowski A. 2012: Towards an LFG parser for Polish. An exercise in parasitic grammar development, [w:] N. Calzolari, K. Choukri, T. Declerck, M.U. Doğan, B. Maegaard, J. Mariani, A. Moreno, J. Odijk, S. Piperidis (red.), Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC 2012), ELRA, Stambuł, s. 3849–3852.
Zobacz w Google Scholar
Pęzik P. 2015: Spokes – a search and exploration service for conversational corpus data, [w:] Selected Papers from CLARIN 2014, Linköping University Electronic Press, Linköpings universitet, Linköping, s. 99–109.
Zobacz w Google Scholar
Pęzik P. 2016: Exploring phraseological equivalence with paralela, [w:] E. Gruszczyńska, A. Leńko-Szymańska (red.), Polskojęzyczne korpusy równoległe. Polish-language Parallel Corpora, Instytut Lingwistyki Stosowanej Uniwersytetu Warszawskiego, Warszawa, s. 67–81.
Zobacz w Google Scholar
Piasecki M. 2008: Cele i zadania lingwistyki informatycznej, [w:] P. Stalmaszczyk (red.), Metodologie językoznawstwa. Współczesne tendencje i kontrowersje, Lexis, Kraków.
Zobacz w Google Scholar
Piasecki M., Maziarz M., Szpakowicz S., Rudnicka E. 2014: PlWordNet as the Cornerstone of a Toolkit of Lexico-semantic Resources, [w:] H. Orav, C. Fellbaum, P. Vossen (red.), Proceedings of the Seventh International Global Wordnet Conference (GWC 2014), University of Tartu Press, Tartu, s. 304–312.
Zobacz w Google Scholar
Przepiórkowski A. 2015: Inżynieria lingwistyczna a obecna sytuacja językoznawstwa polskiego, „LingVaria” X, nr 2, s. 135–145.
Zobacz w Google Scholar
Przepiórkowski A., Bańko M., Górski R.L., Lewandowska-Tomaszczyk B. (red.) 2012: Narodowy Korpus Języka Polskiego, Wydawnictwo Naukowe PWN, Warszawa.
Zobacz w Google Scholar
Przepiórkowski A., Skwarski F., Hajnicz E., Patejuk A., Świdziński M., Woliński M. 2014: Modelowanie własności składniowych czasowników w nowym słowniku walencyjnym języka polskiego, „Polonica” XXXIII, s. 159–178.
Zobacz w Google Scholar
Saloni Z., Woliński M., Wołosz R., Gruszczyński W., Skowrońska D. 2007/2015: Słownik gramatyczny języka polskiego, wyd. 1: Warszawa 2007 (dokument elektroniczny), wyd. 2: Warszawa 2012 (dokument elektroniczny), wyd. 3: 2015 (online: http:// sgjp.pl).
Zobacz w Google Scholar
Strik H., Daelemans W., Binnenpoorte D., Sturm J., de Vriend F., Cucchiarini C. 2002: Dutch HLT resources. From BLARK to priority lists, [w:] J. Hansen, B. Pellom (red.), Proceedings of the Seventh International Conference on Spoken Language Processing (ICLSP 2002), Denver, USA, s. 1549–1552.
Zobacz w Google Scholar
Świdziński M. 2006: Lingwistyka korpusowa w Polsce – źródła, stan, perspektywy, „LingVaria” I, nr 1, s. 23–32.
Zobacz w Google Scholar
Webber B.L. 2001: Computational perspectives on discourse and dialogue, [w:] D. Schirin, D. Tannen, H. Hamilton (red.), The Handbook of Discourse Analysis, Blackwell Publishers Ltd.
Zobacz w Google Scholar
Woliński M. 2015: Deploying the new valency dictionary Walenty in a DCG parser of Polish, [w:] M. Dickinson, E. Hinrichs, A. Patejuk, A. Przepiórkowski (red.), Proceedings of the Fourteenth International Workshop on Treebanks and Linguistic Theories (TLT14), Instytut Podstaw Informatyki PAN, Warszawa, s. 221–229.
Zobacz w Google Scholar
Żmigrodzki P. 2015a: Wielki słownik języka polskiego PAN a obecna sytuacja językoznawstwa polskiego, „LingVaria” X, nr 1, s. 109–119.
Zobacz w Google Scholar
Żmigrodzki P. 2015b: Wielki słownik języka polskiego PAN – historia, stan obecny i perspektywy rozwoju po 2018 roku, „Biuletyn Polskiego Towarzystwa Językoznawczego” LXXI, s. 177–187.
Zobacz w Google Scholar