Abstrakt
W artykule omawiana jest dynamika wybranych zmian fleksyjnych i ortograficznych w latach 1830–1918, zbadanych na materiale mikrokorpusu powstałego w ramach grantu Automatyczna analiza fleksyjna tekstów polskich z lat 1830–1918 z uwzględnieniem zmian w odmianie i pisowni, realizowanego ze wsparciem Narodowego Centrum Nauki (DEC-2012/07/B/HS2/00570). Przykładowe procesy zostały wybrane spośród listy najważniejszych zmian fleksyjnych i ortograficznych, podanej w opracowaniu I. Bajerowej (1986a;b). Musiały być one możliwe do zweryfikowania na stosunkowo niewielkim (1 milion segmentów) materiale. Uzyskane wyniki zostały porównane z ustaleniami I. Bajerowej i uzupełnione o obliczenia bardziej szczegółowe (np. podwojonego ss, poszczególnych liczebników, zaimków dzierżawczych).
Bibliografia
Acedański S. 2010: A morphosyntactic brill tagger for inflectional languages, [w:] Advances in Natural Language Processing. 7th International Conference on NLP, IceTAL 2010, Reykjavik, Iceland, August 16–18, 2010, red. H. Loftsson, E. Rögnvaldsson, S. Helgadóttir, Springer, Berlin.
Zobacz w Google Scholar
Bajerowa I. 1986: Polski język ogólny XIX wieku: stan i ewolucja, t. 1: Ortografia, fonologia z fonetyką, morfonologia, „Prace Naukowe Uniwersytetu Śląskiego w Katowicach”, Uniwersytet Śląski, Katowice.
Zobacz w Google Scholar
Bajerowa I. 1992: Polski język ogólny XIX wieku: stan i ewolucja, t. 2: Fleksja, „Prace Naukowe Uniwersytetu Śląskiego w Katowicach”, Uniwersytet Śląski, Katowice.
Zobacz w Google Scholar
Bień J.S. 2011: Efficient search in hidden text of large DjVu documents, [w:] Advanced Language Technologies for Digital Libraries. Lecture Notes in Computer Science (Theoretical Computer Science and General Issues), 6699, Springer, Berlin, s. 1–14.
Zobacz w Google Scholar
Bień J.S. 2012: Skanowane teksty jako korpusy, „Prace Filologiczne” LXIII, s. 25–36.
Zobacz w Google Scholar
Bień J.S. 2014: Elektroniczny indeks haseł do słownika Lindego (wersja wstępna), https://bitbucket.org/jsbien/ilindecsv/wiki/, dostęp: czerwiec 2015.
Zobacz w Google Scholar
Derwojedowa M. 2011: O pewnym braku (?) gramatyk zależnościowych, [w:] Różne formy, różne treści. Prace poświęcone Profesorowi Markowi Świdzińskiemu z okazji 40-lecia pracy zawodowej, red. M. Bańko, D. Kopcińska, Wydawnictwo Wydziału Polonistyki Uniwersytetu Warszawskiego, Warszawa.
Zobacz w Google Scholar
Derwojedowa M., Kieraś W., Skowrońska D., Wołosz R. 2014a: Współczesne narzędzia leksykograficzne a analiza tekstów dawniejszych, „Polonica” XXXIV, s. 21–27.
Zobacz w Google Scholar
Derwojedowa M., Kieraś W., Skowrońska D., Wołosz R. 2014b: Zasób leksykalny polszczyzny II poł. XIX wieku a możliwość automatycznej analizy morfologicznej tekstów z tego okresu, [w:] Leksyka języków słowiańskich w badaniach synchronicznych i diachronicznych, red. M. Gębka-Wolak, J. Kamper-Warejko, A. Moroz, Wydawnictwo Uniwersytetu Mikołaja Kopernika, Toruń, s. 183–195.
Zobacz w Google Scholar
Grzegorczykowa R., Kurzowa Z., Puzynina J. 1965: Indeks a tergo do „Słownika języka polskiego” S.B. Lindego, Wydawnictwo Uniwersytetu Warszawskiego, Warszawa.
Zobacz w Google Scholar
Kopczyński O. 1780: Grammatyka dla szkół narodowych, Drukarnia XX. Pijarów, Warszawa.
Zobacz w Google Scholar
Kopczyński O. 1817: Gramatyka języka polskiego, Drukarnia XX. Pijarów, Warszawa.
Zobacz w Google Scholar
Kučera K. 2007: Hyperlemma. A concept emerging from lemmatizing diachronic corpora, [w:] Computer treatment of Slavic and East European languages, red. J. Levická, R. Gambík, Veda, Bratislava, s. 121–125.
Zobacz w Google Scholar
Kučera K., Stlukab M. 2013: Reducing language obstacles to students’ use of historical digital libraries, „Procedia – Social and Behavioral Sciences”, t. 10, s. 2217–2221 (online: http://www.sciencedirect.com/science/article/pii/S1877042813048751, dostęp: 28 kwietnia 2014).
Zobacz w Google Scholar
Piasecki M. 2007: Polish tagger TaKIPI. Rule based construction and optimisation, „Task Quarterly”, t. 11 (1–2), s. 151–167.
Zobacz w Google Scholar
Stąpor I. 2008: Kształtowanie się normy dotyczącej fleksji liczebników polskich od XVI do XIX wieku, Wydawnictwo Wydziału Polonistyki Uniwersytetu Warszawskiego, Warszawa.
Zobacz w Google Scholar
Świdziński M. 1990: Przecinek jako jednostka składniowa, „Poradnik Językowy”, z. 4, s. 578–588.
Zobacz w Google Scholar
Tognini-Bonelli E. 2001: Corpus linguistics at work, „Studies in Corpus Linguistics”, John Benjamins, Amsterdam.
Zobacz w Google Scholar