Statistiche linguistiche

Le statistiche linguistiche possono essere intese in due modi: da un lato come statistiche delle lingue - in questo senso anche chiamate statistiche linguistiche - dall'altro come qualsiasi tipo di indagine statistica su qualsiasi proprietà o oggetto linguistico e sui loro cambiamenti . Nel secondo senso, è anche noto come linguistica statistica o Linguostatistik noto. La linguistica quantitativa persegue obiettivi ancora più ambiziosi , ovvero sviluppare una teoria del linguaggio a cui appartengono , ad esempio, la legge di Menzerath e la legge di Zipf .

Compiti e obiettivi delle statistiche linguistiche

In molti casi, le indagini statistiche sulla lingua servono a scopi pratici o scientifici. Ad esempio, se sai quanto spesso le lettere appaiono in una lingua, puoi rendere leggibili i testi crittografati. Gli studi stilistici ( stilistica quantitativa ) riguardano la caratterizzazione delle particolarità dell'uso della lingua dei singoli autori, classi di testo, epoche o diverse aree di comunicazione (come lo stile della stampa e del giornalismo o il linguaggio quotidiano). Se si applicano metodi statistici ai testi letterari, si perseguono studi letterari quantitativi secondo un suggerimento di Fucks (1968: 77, 88) . David Crystal (1993: 67) delinea le possibilità della statistica negli studi sullo stile . Anche le statistiche linguistiche possono essere di grande aiuto per determinare quanto sia difficile un testo. Gli indici di leggibilità vengono utilizzati per misurare la leggibilità , ovvero il grado di difficoltà, dei testi. Il vocabolario delle lingue è anche oggetto di statistiche linguistiche in vari modi sotto il termine lessicostatistica : tra le altre cose, ciò comporta la creazione di dizionari di frequenza e le velocità di decadimento a cui è soggetto il vocabolario ( glottocronologia ). La rilevazione della frequenza delle parole è anche un prerequisito essenziale per la creazione del vocabolario di base e quindi per la didattica del linguaggio . L' analisi del contenuto utilizza metodi quantitativi ( analisi quantitativa del contenuto ) per scoprire quali argomenti ricevono quanta attenzione.

Scopi molto pratici, la stichometria servita nei tempi antichi: ad esempio, le lunghezze dei testi erano determinate per avere una base per il pagamento dello stipendio dell'impiegato.

Quindi ci sono molti usi per le statistiche linguistiche. Spesso, però, si tratta solo della soddisfazione della curiosità: vuoi solo sapere cosa succede con quale frequenza o come le sue frequenze cambiano nel tempo, senza che ulteriori obiettivi vengano perseguiti direttamente. In questo contesto, si può fare riferimento alla domanda che è stata posta più e più volte, quanto è vasto il vocabolario del tedesco o quello di altre lingue, ed esattamente quanto è ampio il vocabolario di alcuni autori.

Sulla storia

Gli studi di frequenza dei fenomeni linguistici risalgono all'antichità indiana e greca, dove, tra le altre cose, si facevano considerazioni combinatorie sulla formazione delle unità linguistiche, una tradizione che è stata conservata per molti secoli. Una delle domande che Leibniz, tra le altre, ha affrontato qui era quante parole possono essere formate da un alfabeto con un certo numero di lettere. Seguirono parole e anche in seguito statistiche solide e molte altre cose. Oltre a questo lavoro incentrato sull'indagine della lingua / lingue, è seguito anche il lavoro al servizio delle discipline limitrofe. Nel XIX secolo, sin dagli anni '30 sono state compilate statistiche solide per ottimizzare la stenografia . Una varietà di approcci viene utilizzata negli studi letterari, ad esempio studi che utilizzano la stilometria per identificare autori anonimi. Da menzionare anche il lavoro sulla qualità estetica delle opere letterarie: lo psicologo Karl Groos pubblicò “ Die Acoustic Phenomena in Schiller Lyrik ” (1910), opera in cui presentava uno studio sulla statistica del linguaggio.

Statistiche linguistiche del tedesco

Sulle statistiche della lingua tedesca: varie rassegne delle statistiche della lingua tedesca (frequenze di lettere e suoni, grammatica, vocabolario) possono essere trovate in Meier (1967). I lavori corrispondenti di Braun (1998) e Sommerfeldt (1988) contengono molti dati sul tedesco e sulle sue tendenze evolutive. Anche König (2005) e Duden forniscono alcuni dati . L'ortografia tedesca (2017) insieme. Su molti argomenti (frequenza di morph, frasi, sillabe e lunghezza delle parole; cambiamento delle frequenze nell'individuo e nella storia della lingua; frequenza delle parti del discorso e molti altri aspetti), si possono trovare anche dati statistici, soprattutto sul tedesco in studi sulla linguistica quantitativa, ma anche in numerose altre lingue.

Nozioni di base statistiche

La base statistica si trova nei manuali delle numerose discipline scientifiche (psicologia, sociologia, economia, ...), che nelle loro ricerche si basano anche sulla statistica. Ma ci sono anche lavori scritti appositamente per linguisti o almeno incentrati su argomenti linguistici. Altmann (1995), von Essen (1979), Hoffmann & Piotrowski (1979), Nikitopoulos (1973), Schlobinski (1996) e Wimmer & Altmann (1999) forniscono basi statistiche (e in parte epistemologiche) per affermazioni linguistiche differenti.

Guarda anche

letteratura

  • Pavel M. Alekseev, VM Kalinin, Rajmund G. Piotrowski: Statistiche linguistiche: con numerose tabelle e schemi nel testo , tradotti da un collettivo sotto la direzione di Lothar Hoffmann. Fink, Monaco / Berlino 1973 / Akademie-Verlag Berlino 1973.
  • Gabriel Altmann : Statistiche per linguisti . Casa editrice scientifica Trier, Trier 1995, ISBN 3-88476-176-5 .
  • Karl-Heinz Best : Quantitative Linguistics. Un'approssimazione . 3a edizione, pesantemente rivista e ampliata. Peust & Gutschmidt, Gottinga 2006, ISBN 3-933043-17-4 .
  • Peter Braun: Tendenze nel tedesco contemporaneo. Varietà linguistiche. 4a edizione. Kohlhammer, Stoccarda / Berlino / Colonia 1998, ISBN 3-17-015415-X , p. 103 (Il libro contiene informazioni statistiche su molte caratteristiche linguistiche del tedesco)
  • David Crystal : The Cambridge Encyclopedia of Language. Traduzione e revisione dell'edizione tedesca di Stefan Röhrich, Ariane Böckler e Manfred Jansen. Campus Verlag, Francoforte / New York 1993, ISBN 3-593-34824-1 . Capitolo: La struttura statistica del linguaggio. Pp. 86-87.
  • Otto von Essen : fonetica generale e applicata. 5a edizione rivista e ampliata. Akademie-Verlag, Berlino 1979.
  • Wilhelm Fucks : Secondo tutte le regole dell'arte. Diagnosi di letteratura, musica, arti visive - le opere, i loro autori e creatori. Deutsche Verlags-Anstalt, Stoccarda 1968.
  • Lothar Hoffmann, Rajmund G. Piotrowski: contributi alle statistiche linguistiche. VEB Verlag Enzyklopädie, Lipsia 1979.
  • Emmerich Kelih: Storia dell'applicazione dei metodi quantitativi nella linguistica russa e negli studi letterari. Kovač, Amburgo 2008, ISBN 978-3-8300-3575-6 . (Allo stesso tempo dissertazione Graz, 2007. Descrizione dettagliata del contributo della linguistica russa e degli studi letterari dalla metà del XIX secolo, che è particolarmente importante per lo sviluppo della linguistica quantitativa / statistica e degli studi letterari.)
  • Sebastian Kempgen : statistiche in lingua russa. Panoramica sistematica e bibliografia. Sagner, Monaco di Baviera 1995, ISBN 3-87690-617-2 .
  • Reinhard Köhler : Bibliografia della linguistica quantitativa. John Benjamin, Amsterdam 1995, ISBN 90-272-3751-4 .
  • Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (a cura di): Quantitative Linguistics - Quantitative Linguistics. Un manuale internazionale. de Gruyter, Berlino / New York 2005, ISBN 3-11-015578-8 .
  • Helmut Kreuzer (a cura di), Rul Gunzenhäuser (a cura di): Matematica e poesia. Tentativi alla questione di uno studio letterario esatto. , Nymphenburger, Monaco 1965, 1967, 1969, 4a, edizione rivista 1971, ISBN 3-485-03303-0 .
  • Helmut Meier : statistiche in lingua tedesca . 2a edizione, ampliata e migliorata. Olms, Hildesheim 1967, 1978, ISBN 3-487-00735-5 . (1a edizione 1964)
  • Charles Muller : Introduzione alle statistiche linguistiche . Hueber, Monaco di Baviera 1972.
  • Pantelis Nikitopoulos: statistiche linguistiche. In: Hans Peter Althaus, Helmut Henne, Herbert Ernst Wiegand (a cura di): Lessico della linguistica tedesca. 2a edizione, completamente rivista e ampliata. Niemeyer, Tubinga 1980, ISBN 3-484-10392-2 , pagg. 792-797.
  • Pantelis Nikitopoulos: Statistiche per linguisti. Un contributo metodico . Narr, Tubinga 1973.
  • Peter Schlobinski : Linguistica empirica . Westdeutscher Verlag, Opladen 1996, ISBN 3-531-22174-4 .
  • Gejza Wimmer, Gabriel Altmann: Thesaurus di distribuzioni di probabilità discrete univariate . Stamm, Essen 1999, ISBN 3-87773-025-6 .

rivista

  • Metodi statistici in linguistica (SMIL), Språkförlaget Scriptor, Stoccolma, 1961–1978.

link internet

Wikizionario: statistiche linguistiche  - spiegazioni di significati, origini delle parole, sinonimi, traduzioni

Prove individuali

  1. Il termine statistica linguistica può essere trovato tra l'altro in: Emil Brix: Le lingue colloquiali nell'Austria antica tra agitazione e assimilazione. Le statistiche linguistiche nei censimenti Zisleithan dal 1880 al 1910. Böhlau, Vienna 1982, ISBN 3-205-08745-3 . (Contestualmente dissertazione Vienna 1979)
  2. ^ Klaus Merten: analisi del contenuto. Introduzione alla teoria, metodo e pratica. 2a edizione migliorata. Westdeutscher Verlag, Opladen 1993, ISBN 3-531-11442-5 .
  3. Gero von Wilpert : Dizionario della letteratura in soggetto (= edizione tascabile di Kröner . Volume 231). 8a edizione, migliorata e ampliata. Kröner, Stoccarda 2001, ISBN 3-520-23108-5 .
  4. ^ Karl-Heinz Best : Quantitative Linguistics. Un'approssimazione . 3a edizione, pesantemente rivista e ampliata. Peust & Gutschmidt, Göttingen 2006, ISBN 3-933043-17-4 , capitolo: Considerazioni statistiche sul vocabolario, p. 13ss.
  5. ^ NL Biggs: Le radici della combinatoria. In: Historia Mathematica. 6, 1979, pagg. 109-136.
  6. Su Leibniz, Dissertatio de arte combinatoria. (1666) vedi: Karl-Heinz Best: Gottfried Wilhelm Leibniz (1646–1716). In: Glottometria. 9, 2005, pagg. 79–82 ( testo completo in PDF ); Eberhard Knobloch: studi matematici di GW Leibniz sulla combinatoria. Basato su appunti quasi esclusivamente scritti a mano, presentati e commentati. Franz Steiner Verlag, Wiesbaden 1973.
  7. ^ Karl-Heinz Best: Quantitative Linguistics. Un'approssimazione . 3a edizione, pesantemente rivista e ampliata. Peust & Gutschmidt, Göttingen 2006, ISBN 3-933043-17-4 , Capitolo: Development of Quantitative Linguistics (QL), p. 7ff.
  8. Peter Braun: Tendenze nella lingua tedesca contemporanea. Varietà linguistiche. 4a edizione. Kohlhammer, Stoccarda / Berlino / Colonia 1998, ISBN 3-17-015415-X , passim .
  9. Karl-Ernst Sommerfeldt (a cura di): Tendenze di sviluppo nel tedesco contemporaneo. VEB Bibliographisches Institut, Lipsia 1988, ISBN 3-323-00169-9 , pp. 193–243.
  10. ^ Werner König: dtv-Atlas in lingua tedesca. 15a edizione rivista e aggiornata. dtv, Monaco 2005, ISBN 3-423-03025-9 , pagg. 114–119.
  11. Duden. L'ortografia tedesca. 27a edizione, completamente rivista e ampliata. Dudenverlag, Berlino 2017, ISBN 978-3-411-04017-9 , capitolo: La lingua in numeri , pagine 148–159.
  12. Vedi http://wwwuser.gwdg.de/~kbest/einfueh.htm