Typologia tekstów oparta na miarach kwantytatywnych: studium korpusowe o zróżnicowaniu polszczyzny
PDF

Słowa kluczowe

stylistyka
genologia językoznawcza
językoznawstwo korpusowe
metody wielowymiarowe

Jak cytować

Eder, M., & Górski, R. L. (2019). Typologia tekstów oparta na miarach kwantytatywnych: studium korpusowe o zróżnicowaniu polszczyzny. Język Polski, 99(3), 5–17. https://doi.org/10.31286/JP.99.3.1

Abstrakt

Artykuł stara się odpowiedzieć na pytanie, czy możliwe jest ustalenie typologii polskich tekstów wyłącznie na podstawie ich cech gramatycznych. Dodatkowym celem było ustalenie, czy typologia przyjęta w Narodowym Korpusie Języka Polskiego, oparta na kryteriach pozajęzykowych, rzeczywiście grupuje teksty, które są do siebie gramatycznie podobne. Badanie przeprowadzono na korpusie 1190 tekstów wybranych losowo z Narodowego Korpusu Polskiego. W każdym z tekstów zbadano frekwencję ok. 60 cech gramatycznych, takich jak liczba słów należących do poszczególnych części mowy bądź występujących w konkretnym przypadku, osobie lub czasie gramatycznym itp. Na podstawie tych danych przeprowadzono analizę Bootstrap Consensus Network, a także skalowanie wielowymiarowe. Rezultaty potwierdzają, że większość tekstów przynależnych w NKJP do danego typu rzeczywiście wykazuje wzajemne podobieństwo pod względem frekwencji poszczególnych kategorii gramatycznych.

https://doi.org/10.31286/JP.99.3.1
PDF

Bibliografia

Baayen H. 2008: Analysing linguistic data: a practical introduction to statistics using R, Cambridge University Press, Cambridge.
Zobacz w Google Scholar

Biber D. 1988: Variation across speech and writing, Cambridge University Press, Cambridge.
Zobacz w Google Scholar

Cranenburgh van A. 2012: Literary authorship attribution with phrase-structure fragments, [w:] Proceedings of the NAACL-HLT 2012 Workshop on Computational Linguistics for Literature, June, 2012, Montréal, Canada, Association for Computational Linguistics, s. 59–63 (online: https://www.aclweb.org/anthology/W12-2508, dostęp: 1 czerwca 2019).
Zobacz w Google Scholar

Cranenburgh van A. 2016: Rich statistical parsing and literary language, University of Amsterdam, Amsterdam.
Zobacz w Google Scholar

Eder M. 2014: Metody ścisłe w literaturoznawstwie i pułapki pozornego obiektywizmu – przykład stylometrii, „Teksty Drugie”, nr 2, s. 90–105.
Zobacz w Google Scholar

Eder M. 2017: Visualization in stylometry: cluster analysis using networks, „Digital Scholarship in the Humanities”, Vol. 32(1), s. 50–64 (online: https://doi.org/10.1093/llc/fqv061, dostęp: 1 czerwca 2019).
Zobacz w Google Scholar

Gajda S. (red.) 1995: Przewodnik po stylistyce polskiej, Uniwersytet Opolski, Instytut Filologii Polskiej, Opole.
Zobacz w Google Scholar

Górski R.L. 2008: Diateza nacechowana w polszczyźnie. Studium korpusowe, Lexis, Kraków.
Zobacz w Google Scholar

Górski R.L., Łaziński M. 2010: Wzór stylu i wzór na styl. Zróżnicowanie stylistyczne tekstów Narodowego Korpusu Języka Polskiego, [w:] M. Milewska-Stawiany, E. Rogowska-Cybulska (red.), Polskie języki. O językach zawodowych i środowiskowych. Materiały VII Forum Kultury Słowa, Wydawnictwo Uniwersytetu Gdańskiego, Gdańsk, s. 41–55.
Zobacz w Google Scholar

Górski R.L., Łaziński M. 2012: Typologia tekstów w NKJP, [w:] A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Wydawnictwo Naukowe PWN, Warszawa, s. 13–23.
Zobacz w Google Scholar

Hirst G., Feiguina O. 2007: Bigrams of syntactic labels for authorship discrimination of short texts, „Literary and Linguistic Computing”, Vol. 22(4), s. 405–417.
Zobacz w Google Scholar

Jockers M.L. 2013: Macroanalysis: digital methods and literary history, University of Illinois Press, Urbana.
Zobacz w Google Scholar

Le X., Lancashire I., Hirst G., Jokel R. 2011: Longitudinal detection of dementia through lexical and syntactic changes in writing: a case study of three British novelists, „Literary and Linguistic Computing”, Vol. 26(4), s. 435–461.
Zobacz w Google Scholar

Malinowska E., Nocoń J., Żydek-Bednarczuk U. (red.) 2013: Style współczesnej polszczyzny. Przewodnik po stylistyce polskiej, Towarzystwo Autorów i Wydawców Prac Naukowych „Universitas”, Kraków.
Zobacz w Google Scholar

Mikołajczak S. 1990: Składnia tekstów naukowych. Dyscypliny humanistyczne, Wydawnictwo Naukowe Uniwersytetu im. Adama Mickiewicza w Poznaniu, Poznań.
Zobacz w Google Scholar

Pennebaker J.W. 2011: The secret life of pronouns: what our words say about us, Bloomsbury Press, New York.
Zobacz w Google Scholar

Przepiórkowski A., Bańko M., Górski R.L., Lewandowska-Tomaszczyk B. (red.) 2012: Narodowy Korpus Języka Polskiego, Wydawnictwo Naukowe PWN, Warszawa, s. 13–23.
Zobacz w Google Scholar

Ruszkowski M. 1997: Główne tendencje syntaktyczne w polskiej prozie artystycznej dwudziestolecia międzywojennego, Wyższa Szkoła Pedagogiczna im. Jana Kochanowskiego w Kielcach, Kielce.
Zobacz w Google Scholar

Rybicki J., Heydel M. 2013:. The stylistics and stylometry of collaborative translation: Woolf ’s ‘Night and Day’ in Polish, „Literary and Linguistic Computing”, Vol. 28(4), s. 708–717.
Zobacz w Google Scholar

Waldenfels von R., Eder M. 2016: A stylometric approach to the study of differences between standard variants of Bosnian/Croatian/Serbian, or: is the Hobbit in Serbian more Hobbit or more Serbian?, „Russian Linguistics”, Vol. 40(1), s. 11–31.
Zobacz w Google Scholar

Weidman S.G., O’Sullivan J. 2017: The limits of distinctive words: Re-evaluating literature’s gender marker debate, „Digital Scholarship in the Humanities”, Vol. 33(2), s. 374–390.
Zobacz w Google Scholar

Woliński M. 2003: System znaczników morfosyntaktycznych w korpusie IPI PAN, „Polonica” XXII–XXIII, s. 39–55.
Zobacz w Google Scholar

Skip to content