Tulpe L2 – Lexikalische Dichte (MTLD)

Nachdem ich die Weiterentwicklung der Profilanalyse-Software Tulpe L2 nun wieder unter neuer Adresse aufnehme, werde ich hier nach und nach genauer auf einzelne Analysekriterien eingehen. Die Posts zu dem Thema sind nicht sinnlogisch geordnet. Weder die Relevanz noch ein irgendwie gearteter zeitlicher Kontext ist ausschlaggebend dafür, welchen Teilaspekt der Analyse ich in einzelnen Posts aufgreife. Eine kurze Komplettübersicht über alle aktuell in die Analyse einbezogenen Kriterien kann hier gefunden werden.

Measure of Textual Lexical Diversity

Der MTLD für einen Text kann mit diesem einfachen Tool schnell online berechnet werden. 

Der Bereich der Computerlinguistik beschäftigt sich seit geraumer Zeit mit neuen Verfahren zur Messung der Lexikalischen Dichte (LD). Diese Verfahren wurden entwickelt, um die Abhängigkeit von der Textlänge bei der Bestimmung der Lexikalischen Dichte zu eliminieren, ohne Daten zu verwerfen.

Das Maß für die textuelle lexikalische Vielfalt (Measure of Textual Lexical Diversity – kurz MTLD; McCarthy, 2005) verwendet eine sequentielle Analyse einer Stichprobe, um einen LD-Score abzuschätzen. Konzeptionell spiegelt MTLD die durchschnittliche Anzahl von Wörtern in einer Reihe wider, für die eine bestimmte Type-Token-Relation (TTR) beibehalten wird. Um einen Score zu generieren, berechnet MTLD die TTR für immer längere Teile der Stichprobe. Jedes Mal, wenn die TTR einen vorgegebenen Wert unterschreitet, erhöht sich ein Zählerstand (Faktorenzähler genannt) um 1 und die nächste Sequenz wird analysiert. Der Algorithmus wird an der Stelle fortgesetzt, an der er gestoppt wurde, und derselbe Vorgang wird wiederholt, bis das letzte Token der Sprachprobe hinzugefügt und die TTR geschätzt wurde. Dann wird die Gesamtzahl der Wörter im Text durch die Gesamtzahl der gefundenen Sequenzen (Faktoren) dividiert. Anschließend wird der gesamte betrachtete Text umgekehrt und der Algorithmus rückwärts wiederholt. Die beiden Werte vorwärts und rückwärts werden gemittelt, um den endgültigen Wert für die Measure of Textual Lexical Diversity zu bestimmen.

(vgl. McCarthy, P.M., & Jarvis, S. 2010). MTLD, vocd-D, and HD-D: A validation study of sophisticated approaches to lexical diversity assessment, Behavior Research Methods, 42(2): 381-392

Recent Posts

Recent Comments

Archives

abcxyz Written by:

Be First to Comment

Leave a Reply

Your email address will not be published.