Allgemeines darüber, wie überhaupt eine Stichprobe zusammengestellt wird, befindet sich an anderem Ort.

Die allgemein-vergleichende Sprachwissenschaft will Aussagen über die menschlichen Sprachen machen. Wie ist diese Menge eigentlich bestimmt? Sie umfaßt offensichtlich nicht bloß die derzeit gesprochenen, sondern auch die ausgestorbenen Sprachen. Dies sind aber nicht bloß die untergegangenen Sprachen der Antike, des Mittelalters und der Neuzeit, von denen wir Kunde haben, sondern überhaupt alle Sprachen seit Adam und Eva, von denen wir niemals etwas werden wissen können. Hinzu kommen alle Sprachen, die jemals in der Zukunft bis zum Untergang der Menschheit noch gesprochen werden. (Tatsächlich hat es schon allgemein-vergleichende Grammatik gegeben, die Generalisierungen über mögliche und unmögliche Sprachen gemacht hat.)

Zur typologischen Untersuchung stehen uns natürlich nur die derzeit gesprochenen und eine Handvoll ausgestorbene, aber hinreichend linguistisch beschriebene Sprachen zur Verfügung. Typologen hoffen, wenn sie über diese etwa 6.000 bis 7.000 Sprachen gültige Aussagen machen, damit etwas Wesentliches über die menschlichen Sprachen gesagt zu haben. Aber ist eigentlich die Menge der derzeit gesprochenen Sprachen eine repräsentative Stichprobe der möglichen Sprachen? Dies ist natürlich unmöglich zu wissen; aber man kann die Wahrscheinlichkeit davon abschätzen. Sie ist nicht sehr hoch, denn wir wissen, daß die mögliche Variation durch die Ausbreitung einiger weniger Sprachen und Sprachfamilien zuungunsten zahlreicher kleinerer Sprachen bereits stark zurückgegangen ist. Wenn man die derzeitige Entwicklung auf das Jahr 2.100 hochrechnet, so ist abzusehen, daß nur ein paar Sprachfamilien wie Indogermanisch (Englisch, Spanisch, Hindi), Afro-Asiatisch (Arabisch), Dravidisch (Tamil), Altaisch (Türkisch), Sinotibetisch (Mandarin), Bantu (Swahili) überleben werden. So wie diese Menge sicher nicht repräsentativ für die Möglichkeit der typologischen Variation ist, so dürfte es auch die Menge der heute noch gesprochenen Sprachen kaum sein.

Einige vergleichende Sprachwissenschaftler schreiben der prozentualen Verteilung bestimmter Merkmale über die Sprachen der Welt erhebliche Bedeutung zu. Z.B. haben etwa 90% der Sprachen akkusativischen, 9% ergativischen und 1% aktivischen Satzbau. Es sind schon weitreichende Theorien gemacht worden, um die besondere Natürlichkeit des akkusativischen Satzbaus funktional zu erklären. Ob aber für solche Theorien überhaupt die statistischen Voraussetzungen erfüllt sind, darf bezweifelt werden.

Wie stellt man nun eine repräsentative Stichprobe von Sprachen für eine typologische Untersuchung zusammen? Sie muß erstens eine zureichende Größe haben und zweitens ausgewogen zusammengesetzt sein. Kommen wir zu den beiden Anforderungen:

Die allerersten Typologen kümmerten sich überhaupt nicht um die Frage der Stichprobe. Wilhelm von Humboldt hat die Frage auch nie gestellt, aber er hat es als selbstverständlich angesehen, daß ein vergleichender Sprachwissenschaftler eine möglichst breite empirische Basis haben, also möglichst viele und weit verstreute Sprachen untersuchen müßte. In seinen Werken werden Dutzende von Sprachen analysiert und verglichen. Im 19. Jahrhundert ist nur Hans Conon von der Gabelentz weiter gegangen, der seiner vergleichenden Untersuchung des Passivs (1861) 90 Sprachen zugrundelegte. Die Typologen des 19. Jh. waren freilich nicht in der Lage, eine ausgewogene Stichprobe zu bilden, denn dafür fehlten die deskriptiven Voraussetzungen.

Die erste universalistische Untersuchung, die in dieser Hinsicht methodenbewußt vorgeht, ist Greenberg 1963. Er stellt eine Stichprobe von 30 möglichst verschiedenen Sprachen zusammen und macht auf dieser Basis quantifizierte Aussagen. Dies war nach langer Zeit der Enthaltsamkeit die mit Abstand größte Stichprobe. Das Vorgehen fand – in dieser wie in anderen Beziehungen – Nachahmer, und Ende des 20. Jh. erschienen zahlreiche typologische Untersuchungen, die auf Stichproben von Hunderten von Sprachen basierten. Mithilfe von Datenbanken ist es auch kein Problem mehr, über solchen Mengen signifikante Korrelationen festzustellen. Eine solche Stichprobe erfüllt ohne Zweifel die statistischen Anforderungen an die notwendige Größe.

Schwieriger ist die Frage nach der Zusammensetzung der Stichprobe. Man kann keine Zufallsstichprobe entnehmen, weil man davon abhängt, für welche Sprachen brauchbare Beschreibungen vorliegen. Die dadurch bestimmte Teilmenge der Sprachen ist mit Sicherheit nicht repräsentativ, weil bestimmte Sprachfamilien, insbesondere die soeben genannten, in den verfügbaren Beschreibungen stark überrepräsentiert sind. Wenn man also keine Zufallsstichprobe entnehmen kann, kann man versuchen, eine gewichtete Stichprobe zu bilden. Welche Kriterien hier aber zu berücksichtigen sind, darüber fehlt noch theoretische Reflexion. Es wird allgemein für selbstverständlich gehalten, daß es jedenfalls keine strukturellen – mithin potentiell typologisch relevanten – Kriterien sein sollen. Stattdessen versucht man, eine Stichprobe zusammenzustellen, in der die Sprachfamilien entsprechend ihrer Mitgliederzahl anteilig vertreten sind. Die Sprachfamilien sind aber strukturell sehr verschieden homogen. Z.B. gleichen die etwa 300 Bantusprachen sich wie ein Ei dem anderen, während es z.B. zwischen indogermanischen Sprachen starke Unterschiede gibt. Und manche isolierte Sprache ist die einzige überlebende einer ehemals größeren Familie. Welchen Sinn hat es da, die Sprachfamilien proportional zu ihrer Mitgliederzahl in der Stichprobe zu repräsentieren?

Neben der genetischen Vielfalt in der Stichprobe ist auch die areale Verteilung wichtig. In den letzten Jahrzehnten ist immer deutlicher geworden, daß Struktureigenschaften nicht gleichmäßig über die Welt verteilt sind, sondern Ballungsräume bilden. Man möchte aber Entlehnung als Faktor der weltweiten Prominenz eines Merkmals möglichst draußen halten; und andererseits möchte man solche arealen Ballungen feststellen können. Zu diesem Zweck kann eine gleichmäßige Verteilung der Stichprobe über den Globus wichtiger sein als genetische Ausgewogenheit.

Die Frage nach der Repräsentativität der Stichprobe verliert im Laufe der Zeit ihre Brisanz und wird sich irgendwann erledigen. Schon heute gibt es typologische Untersuchungen, denen i.w. alle für die jeweilige Fragestellung hinreichend gut beschriebenen Sprachen zugrundeliegen. Die typologischen Datenbanken werden schneller gefüllt, als neue Sprachen beschrieben werden.

Freilich ist es bei begrenzten Mitteln nicht immer möglich, Hunderte von Sprachen zu untersuchen. Eine alternative Methode besteht darin, gezielt Sprachen zu vergleichen, welche sich in der jeweils interessierenden Hinsicht möglichst stark unterscheiden. Natürlich setzt das Vorwissen voraus. Dies läßt sich aber mit einiger typologischer Erfahrung relativ leicht gewinnen. Interessiert man sich z.B. für die Frage, wovon es abhängt, ob ein Possessor adnominal (Linda washed the boy's head) oder adverbal (Linda wusch dem Jungen den Kopf) konstruiert wird, so kann es genügen, eine relativ kleine Stichprobe von Sprachen zusammenzustellen, die in diesem Punkte die Bandbreite der Möglichkeiten abdecken, um in diesen dann die syntaktischen Zusammenhänge im Detail zu untersuchen. Hat man für die Verteilung der relevanten Strukturen eine innere Ordnung und Notwendigkeit festgestellt, so kann man ziemlich sicher sein, daß weitere zu untersuchende Sprachen sich in dieselbe Ordnung einfügen werden.