Methodische Vorbemerkungen

Ursprung und Evolution der menschlichen Sprache sind vergleichbar der Erfindung des Feuers oder dem Beginn des Werkzeuggebrauchs in der Evolution des Menschen. Solche Fragen werden von Wissenschaften wie der Paläoanthropologie sowie der Ur- und Frühgeschichte auf der Basis von Daten mit empirischen Methoden angegangen. Im Falle der Sprache ist der empirische Zugang nur in höchst eingeschränktem Maße verfügbar. An Daten sind nur einerseits Skelettfunde und andererseits materielle Erzeugnisse des Menschen verfügbar. Aus den Skelettfunden kann man versuchen, die Fähigkeiten des Menschen zur Nutzung der diversen perzeptiven Kommunikationsmedien (vgl. Kap. 3.3.1) zu rekonstruieren. Aus den materiellen Erzeugnissen (Feuer, Werkzeug, Gräber usw.) kann man versuchen, seine kognitiven Fähigkeiten zu rekonstruieren. Beides ist der sprachlichen Substanz näher als der sprachlichen Form, die den Linguisten eigentlich interessiert.

‘Evolution’1 ist von ‘Geschichte’ zu unterscheiden:

Evolution vs. Geschichte

Der Unterschied zwischen Evolution und Geschichte läßt sich überhaupt nur in bezug auf die Entwicklung des Menschen machen; die Geschichte der Saurier, falls es das denn gäbe, wäre notwendigerweise dasselbe wie die Evolution der Saurier. In bezug auf den Menschen ist der Unterschied jedoch ein mehrfacher:

Im Sinne des letzten Merkmals von Evolution wäre also bei der Evolution der Sprache zu fragen, welche Veränderungen im Laufe der Zeit eintraten, die etwas kategorial Anderes herbeiführten. Seit der letzten dieser revolutionären Veränderungen würde dann nicht mehr Evolution, sondern nur noch gewöhnlicher Sprachwandel stattfinden, der Gegenstand eines anderen Kapitels ist.

Die menschliche Sprache ist, wie man sagt, ‘speziesspezifisch’, will sagen, sie hat kein gleichartiges Gegenstück außerhalb der Spezies humana. Unserer Definition “Sprache ist das unbeschränkte Schaffen von interindividuell verfügbaren Bedeutungen” genügt kein nicht-menschliches Kommunikationssystem. Zwischen bestehenden tierischen Kommunikationssystemen und der menschlichen Sprache gibt es kein Kontinuum, sondern einen qualitativen Sprung. Man nimmt deshalb im allgemeinen an, daß die Spezifizität der menschlichen Sprache ebenso wie die anderen Unterschiede zwischen dem Menschen und den anderen Primaten zur genetischen Ausstattung des Menschen gehört, m.a.W. daß die menschliche Sprachfähigkeit angeboren ist. Was das freilich im einzelnen bedeutet, ist seit langem strittig.

In der linguistischen Literatur ist der Ausdruck Ursprung der Sprache wohl etabliert; aber es ist nicht ganz klar, was damit gemeint ist.

  1. Sicherlich nicht gemeint sein kann der Beginn des Einsatzes von Kommunikationssystemen in der Evolution des Tierreiches überhaupt, denn dieser Beginn liegt lange vor Entstehung der Primaten. Pfauen z.B. kommunizieren u.a. durch Kollern und durch Radschlagen.
  2. Es kann der Punkt gemeint sein, an dem alle Vorbedingungen für die Entwicklung von Sprachen wie den modernen erfüllt waren;
  3. es kann aber auch der Punkt sein, an dem die letzte kategoriale Veränderung stattfand, von der an alle menschlichen Sprachen von derselben Art wie die heutigen sind.

Zwischen Punkt 2 und 3 liegt i.w. die Herausbildung der Systemkomplexität moderner Sprachen, also u.a. die Strukturierung des Lexikons und die Herausbildung einer Grammatik mit verschiedenen primären und sekundären Kategorien. Dieser Zeitraum umfaßt bestimmt Jahrhunderttausende.

Da zwischen den Kommunikationssystemen der anderen Primaten und der menschlichen Sprache der erwähnte Bruch besteht, hat man früher meist angenommen, die menschliche Sprache sei mit einem Schlage “erfunden” worden. Wir wissen aber mittlerweile, daß von den nichtmenschlichen Primaten zum Homo sapiens eine kontinuierliche Entwicklung führt, daß der letzte gemeinsame Vorfahr des modernen Menschen und der anderen modernen Primaten vor über 6 Mio. Jahren lebte und daß die Zwischenstufen der Evolution von ihm bis zum ersten modernen Menschen alle ausgestorben sind. Der Eindruck eines Bruchs zwischen der menschlichen Sprache und den tierischen Kommunikationssystemen ist insofern eine optische Täuschung. Auch die menschliche Sprache muß sich kontinuierlich entwickelt haben. Dann aber ist der Ursprung der Sprache von ihrer Evolution nicht mehr zu unterscheiden. Anders ausgedrückt, eine wissenschaftliche Fassung des Problems des Ursprungs der Sprache ist seine Konzeption als Evolution der Sprache. Wir werden daher den Ausdruck ‘Ursprung der Sprache’ im folgenden nur in diesem Sinne verwenden.

Um der Evolution der Sprache als semiotisches System auf die Spur zu kommen, stehen der Linguistik im Prinzip drei Arten von methodischen Zugängen offen:

  1. der konstruktive Ansatz: man setzt den Stand der Primatenkommunikation als Ausgangspunkt voraus, vergleicht damit den Zustand heutiger menschlicher Sprachen und konstruiert auf Basis der ersteren den letzteren deduktiv in schrittweiser Progression;
  2. der rekonstruktive Ansatz: man vergleicht frühe bzw. primitive belegte Sprachstufen, rekonstruiert daraus Ursprachen und verlängert diese Linie bis zum Sprachursprung zurück;
  3. der analogische Ansatz: man beobachtet die Entwicklung beim Mutterspracherwerb des Kindes und schließt von der Ontogenese auf die Phylogenese, oder man beobachtet die Entstehung von Pidgin- und Kreolsprachen und überträgt diese Entwicklung analogisch auf die Entstehung der menschlichen Sprache.

Wir werden im übernächsten Abschnitt alle drei Ansätze Revue passieren lassen.

Entstehung von Homo sapiens

Die Entwicklung der menschlichen Sprache verlief nicht isoliert, sondern Hand in Hand mit der anatomischen Entwicklung des Menschen, der Ausbildung seines Gehirns und mithin seiner kognitiven und kulturellen Fähigkeiten. Gelegentlich wird angegeben, die anatomische Ausrüstung sei weder notwendige noch hinreichende Bedingung für Sprache. Notwendig sei sie nicht, denn auch Taubstumme sind zu menschlicher Sprache (z.B. Gebärdensprache) fähig. Hinreichend ist sie scheinbar auch nicht, denn Papageien haben offensichtlich die anatomischen Voraussetzungen zum Sprechen, verfügen aber nicht über Sprache.

Dieses Argument vereinfacht jedoch zu stark. Was die Gebärdensprachen angeht, so funktionieren sie in wesentlichen Punkten anders als Lautsprachen. Sie sind evolutiv fundamentaler (s.u.) und können übrigens auch besser als Lautsprachen von nicht-menschlichen Primaten gelernt werden. Auch sie machen selbstverständlich bestimmte anatomische Voraussetzungen; aber es kann ohne weiteres sein, daß diese allgemeinerer Natur sind als diejenigen der Lautsprachen. Und was die relevante physiologische Ausstattung angeht, so reduziert sie sich nicht auf Zungenfertigkeit. Den Papageien fehlen selbstverständlich wesentliche physische und neurale Voraussetzungen für die Sprachfähigkeit, z.B. ein propositionales Gedächtnis.

Es bleibt also dabei, daß die Sprachfähigkeit nicht von den anderen kognitiven und sozialen Fähigkeiten des Menschen abgetrennt werden kann. Daher soll nun kurz die Evolution von Homo sapiens dargestellt werden. Die folgende Zeittafel gibt einen schematischen Überblick.

Hauptstufen der Entstehung von Homo sapiens
Zeit v. Ch. PeriodeEntwicklungsstufeKultur
7.000.000 Sahelanthropus Tchadensiskeine
3.250.000Australopithecusgelegentlicher Gang auf den Hinterbeinen
2.400.000Prä-Paläolithikum Homo rudolfensis und habilis (Gattung daneben: Paranthropus)einfache Steinwerkzeuge
1.800.000Alt-Paläolithikum Homo erectus: Ur- oder Frühmensch (70.000 ausgestorben)aufrechter Gang, Faustkeil, Feuer (500.000), Jagd
400.000 Archaischer Homo sapiens: Altmensch
(Art daneben: Homo Neanderthalensis; 28.000 ausgestorben)
Werkzeuge aus Steinabschlägen
150.000 Mittel-Paläolithikum Homo sapiens: Jetztmensch* angepaßt an Kälte; Bestattung.
90.000: Beginn der Abwanderung aus Afrika
50.000Jung-PaläolithikumHomo sapiens wandert nach Asien, Europa, Australien; Kunst; Pfeil und Bogen (20.000)
8.000NeolithikumSeßhaftigkeit, Ackerbau, komplexe Gesellschaften

* Bis 1990: Homo sapiens sapiens

Der älteste Vormensch, der die Hominidenlinie vom afrikanischen Menschenaffen abtrennt, ist Sahelanthropus tchadensis. Über seine Fähigkeiten ist nichts bekannt. Die weiteren Stufen der Entwicklung implizieren ein immer größeres Schädelvolumen und im Zusammenhang damit die Herstellung einfacher Werkzeuge. Einen Meilenstein in der Evolution des Menschen stellt der Homo erectus dar. Er geht im Gegensatz zu seinen Vorfahren aufrecht. Dies ist die Voraussetzung für eine Reihe weiterer wesentlicher Neuerungen. Bei Tieren korreliert der Atemrhytmus sehr eng mit somatischen Aktivitäten wie Gehen und Lachen (der Schimpanse atmet beim Lachen einmal pro "Ha"). Mit dem aufrechten Gang wird eine freiere Atmung möglich, die Voraussetzung für mündliche Sprache ist. Ferner hat Homo erectus die Hände zum Handeln frei. Seit etwa zwei Millionen Jahren gibt es sichere Anzeichen für die Herstellung von Artefakten (i.w. Faustkeilen), seit einer halben Million Jahren Indizien für den Gebrauch von Feuer. Gleichzeitig ist die Zerebralisierung, also die Umfangserweiterung des Gehirns zu verfolgen, die besonders seit der Entstehung des Altmenschen mit Riesenschritten weitergeht. Die Lateralisierung sorgt beim Menschen dafür, daß die beiden Hirnhälften einander bei der Lösung von Problemen ergänzen, während sie bei nicht lateralisierten Tieren parallel laufen. Allerdings scheinen auch viele Tiere über Lateralisierung zu verfügen, so daß deren Stellung in der Evolution nicht ganz klar ist. Jedenfalls aber bilden sich erst im modernen Menschen das Broca- und das Wernickezentrum im Gehirn heraus, die für einen wesentlicher Teil der Sprachfunktionen verantwortlich sind.

Seit dem Mittelpaläolithikum sind Kulthandlungen, insbesondere Bestattung, sowie Kleidung nachweisbar. Ab -150.000 stellt der Homo sapiens feinere Werkzeuge und Schmuck her, treibt Handel, hat also Kultur. Er bleibt zunächst in Afrika und wandert um -50.000 nach Europa und Asien. Um -40.000 tritt der Cromagnon-Mensch in Erscheinung und verdrängt den Neandertaler. Er baut bereits Häuser und ist, abgesehen vom Zivilisationsstand, ein Mensch wie wir. Nach der letzten Eiszeit, etwa -8.000, beginnt dann das Mesolithikum und somit die Vorstufen der modernen Zivilisation. Entsprechend der Fundlage ist daher -150.000 ein Terminus post quem und -40.000 ein Terminus ante quem für die Entstehung des modernen Menschen, also den Punkt 3 in der Liste von Abschnitt 1.

Erkenntnismöglichkeiten

Der konstruktive Ansatz

Die an das Vorangehende anschließende Frage ist, ob sich aus dieser anthropologischen Entwicklung Fixpunkte für die Evolution der Sprache ergeben. Dazu läßt sich mindestens folgendes sagen:

Was die Konfiguration des Sprechapparates angeht, so sind Menschenaffen anders gebaut als Menschen. Bei ihnen liegt der Kehlkopf – und somit die Gabelung von Luft- und Speiseröhre – unmittelbar unter der Zungenwurzel. Daher ist der Rachenraum, der beim Menschen als größter Resonanzraum dient, viel zu klein. Ein wesentlicher Aspekt der anatomischen Entwicklung besteht im Herabwandern des Kehlkopfes und der damit einhergehenden Vergrößerung des Rachenraums. Ob diese Entwicklung beim Neandertaler vollzogen war, ist strittig; bei Homo sapiens ist sie es jedenfalls.

Eine naheliegende These wäre, daß Sprache Denken voraussetzt und daß man hinsichtlich der vorliegenden Frage versuchen sollte, das erste Auftreten von Denken in der Evolution zu lokalisieren. Dies hilft jedoch in Wahrheit nicht weiter. Denn erstens ist das Voraussetzungsverhältnis zwischen Sprache und Denken ein wechselseitiges (Näheres in dem betreffenden Kapitel). Und zweitens ist das Vorhandensein der Denkfähigkeit nicht eine Ja-oder-Nein-Frage. Bekanntlich können auch Schimpansen Werkzeuge einsetzen und bis zu einem gewissen Grade sogar herstellen. Insofern Homo erectus in der Werkzeugentwicklung deutlich weiter als Tiere war und ab etwa -500.000 sogar gezielt das Feuer einsetzte, konnte er also sicher denken. Er hat vermutlich in holophrastischen Äußerungen geredet.

Die Evolutionsstufe des Homo erectus dauert über 1 Mio. Jahre, in denen kaum eine Entwicklung erkennbar ist. Homo sapiens dagegen liefert seit -150.000 Anzeichen dafür, daß er in jeder Hinsicht ein Mensch wie wir ist. Die letzten dieser Anzeichen treten freilich erst beim Cromagnon auf. Man darf schließen, daß er spätestens seitdem Sprache im modernen Sinne hat. Der letzte wesentliche Schritt zur Herausbildung eines Sprachzustandes, der sich nicht mehr vom heutigen unterscheidet, muß spätestens um -40.000 vollzogen gewesen sein.

Wenn wir die Evolution der Sprache mit der von Homo sapiens in Parallele setzen, müssen wir also annehmen, daß Sprache im heutigen Sinne seit höchstens 150.000 und seit mindestens 40.000 Jahren besteht. Anders gesagt, für die erste Phase der Evolution der Sprache, nämlich ihre Herausbildung, können eine Million Jahre angesetzt werden. Die zweite Phase, die die Weiterentwicklung und den historischen Wandel der Sprachen umfaßt, dauert dagegen "erst" um die 100.000 Jahre.

Der konstruktive Ansatz beruht auf einem Vergleich von Kommunikationssystemen, wie sie bei verschiedenen Menschenaffenarten vorkommen, mit menschlicher Sprache. Man darf annehmen, daß die semiotischen Eigenschaften, die den ersteren gemeinsam sind, auch für die Kommunikation von Sahelanthropus und Australopithecus galten. Die wichtigsten Unterschiede sind mit einiger Sicherheit angebbar:

Diese beiden Unterschiede hängen miteinander zusammen, da unbeschränkte Produktivität die zweifache Gliederung voraussetzt (vgl. Kap. 6.5).

Der rekonstruktive Ansatz

Bei rekonstruktivem Vorgehen eröffnen sich eine Reihe methodischer Möglichkeiten. Da ist zunächst der Ansatz der historischen Sprachwissenschaft. Hier berücksichtigt man von allen Sprachen die jeweils ältesten dokumentierten Stadien. Das führt im äußersten Falle auf etwa 3.500 v.Ch., den Zeitpunkt, von dem an Tontafeln in sumerischer Schrift vorliegen. Ferner kann man mit den anerkannten Mitteln der historisch-vergleichenden Sprachwissenschaft aus verwandten Sprachen Ursprachen rekonstruieren und deren geschichtliche Realität für einen vernünftigen Zeitpunkt vor der ältesten verglichenen Sprache postulieren. Für das Urindogermanische reicht man damit in eine Zeit zurück, die von der Zeit der ältesten sumerischem Texte nicht wesentlich verschieden ist. Diese Methode reduziert gleichzeitig die Anzahl der Sprachen, mit denen man zu tun hat, von derzeit etwa 6.500 auf die Ursprachen von ein paar Hundert Familien oder Stämmen, und reduziert außerdem ihre Verschiedenheit. Die rekonstruierten Ursprachen sind jedoch, was ihren Bau angeht, Extrapolationen aus historisch vorfindlichen Sprachen, weisen also nicht in das kategorial Andere. Im übrigen sind an diesem Punkt, also höchstens nach einem Zehntel des insgesamt zu überbrückenden zeitlichen Abstands, die wissenschaftlich akzeptierten Methoden der historischen Linguistik am Ende. Jeglicher Vergleich von Wurzeln über nicht nachweislich historisch verwandte Sprachen hinweg, wie er auch heute gelegentlich noch vorkommt, hat mit Wissenschaft nichts zu tun.

Versuche, das Arsenal der wissenschaftlichen Methoden zum Erweis genetischer Sprachverwandtschaft so zu erweitern, daß sie größere Zeiträume überbrücken können, beruhen auf zwei Voraussetzungen:

  1. Die methodisch für den Nachweis nötige Arbitrarietät der betrachteten sprachlichen Eigenschaften schließt nicht nur die Zuordnung von Significans und Significatum einfacher Zeichen ein, sondern umfaßt auch bestimmte Züge der Sprachstruktur wie arbiträre Beschränkungen und Alternationen.
  2. Züge der letzteren Art sind diachron stabiler, d.h. längerlebig als Vokabeln, lassen also auf ältere Verwandtschaft schließen.

Derzeit sind allerdings weder die theoretischen Grundlagen solcher Ansätze gesichert, noch sind die diesbezüglichen Vergleichs- und Rekonstruktionsmethoden so gut ausgearbeitet wie die traditionelle historisch-vergleichende Methode. Es ist auch durchaus nicht klar, um wie weit sie gegebenenfalls weiter in die Vergangenheit zurückreichen würden als letztere; mit Sicherheit jedenfalls nicht bis zum Ursprung der Sprache. Näheres hierzu in Lehmann 2005.

Ein anderer möglicher rekonstruktiver Zugang wäre der über die Sprachen von Völkern, deren materielle Kultur im Vergleich zu der unseren auf primitivem Niveau steht, die also, technologisch betrachtet, in der Steinzeit leben. Die Sprachen der Stämme Neuguineas, Amazoniens und der Ureinwohner Australiens sind mittlerweile wenigstens so weit erforscht, daß man mit Sicherheit – wenn auch mit der unten gemachten Einschränkung bzgl. des Ausbaus von Komplexität – sagen kann, daß sie in keinem linguistisch verantwortbaren Sinne primitiv sind (so bereits Humboldt 1820:2). Alle für die uns näherliegenden Sprachen wichtigen Eigenschaften haben diese Sprachen entweder auch, oder sie haben stattdessen etwas anderes, was ebenfalls innerhalb der Bandbreite der sonst aus den Sprachen der Welt bekannten Variation verbleibt. Die Rede von primitiven Sprachen, die sich auch heute noch in der Öffentlichkeit findet, hat (mit der unten behandelten Ausnahme der Pidginsprachen) überhaupt keine Stütze in der Wissenschaft und dürfte, soweit sie nicht Ansichten der Linguistik vergangener Jahrhunderte kolportiert, auf einer Übertragung vom anschaulich faßlichen technologischen Entwicklungsstand auf den außerhalb der Linguistik natürlich völlig unbekannten Sprachzustand beruhen.

Es wäre auch denkbar, den ersten und zweiten Ansatz in folgenden Sinne miteinander zu kombinieren: Da die Geschichte einer Sprache innig mit der des betreffenden Volkes zusammenhängt, erscheint die Annahme plausibel, daß in einer Gesellschaft, die keinem raschen äußeren Wandel unterliegt, auch der Sprachwandel langsamer vonstatten geht. M.a.W., wenn auch die Sprachen der Völker auf niedrigem materiellen Zivilisationsstand nicht selbst primitiv sein mögen, so sollte doch die Annahme erlaubt sein, daß sie sich nur wenig gewandelt haben und also deswegen der Ursprache noch näher sind als Sprachen höher zivilisierter Völker. Die Annahme eines langsameren Sprachwandels in Gesellschaften niedriger materieller Entwicklungsstufe ist jedoch empirisch widerlegbar. Schon Humboldt (1827-9:236f) berichtet von dem in Ozeanien und Amerika verbreiteten Gebrauch, in einer Sprache Wörter auszutauschen, wenn dem Träger eines Namens, der aus diesen Wörtern gebildet ist, etwas Einmaliges (Regierungsantritt, Tod) widerfährt. Folglich unterliegt der Wortschatz und alles, was mit ihm zusammenhängt, beständiger Umwälzung. Überdies kommen nomadische Völker in ständig wechselnden Kontakt mit Völkern anderer Sprache und entlehnen von diesen. Da man also über die Geschwindigkeit des Sprachwandels zu vorgeschichtlicher Zeit keine spezifischen Annahmen machen kann, muß man aus historisch bekannten Wandelraten extrapolieren, mit dem schon zuvor genannten Ergebnis.

Einen letzten rekonstruktiven Zugang zur menschlichen Ursprache könnte die Sprachtypologie bieten. Es wäre denkbar, daß die von ihr aufgestellten Typen in eine Ordnung gebracht werden können, die evolutiv interpretierbar ist, so daß nachgeordnete Typen in der Stufenfolge sich nur aus vorgeordneten entwickeln können, nicht aber umgekehrt. Der erste Typ einer solchen Rangfolge könnte dann als der Typ der ursprünglichen Sprache angesehen werden. Dies hat bereits W. v. Humboldt versucht, indem er die Typologie des isolierenden, agglutinierenden und flektierenden Sprachbaus als evolutive interpretierte. Die evolutive Abfolge dieser Strukturtypen ist auch mit den Ergebnissen moderner Grammatikalisierungsforschung noch vereinbar. Allerdings läßt sich zu historischer Zeit beobachten, daß Sprachen auch isolierende Züge annehmen; das Paradebeispiel ist das Englische. Folglich hat man anzunehmen, daß nicht alle heute isolierenden Sprachen seit dem Ursprung der Sprache isolierend gewesen sind, sondern daß sie erst isolierend geworden sind. Der zur Verfügung stehende Zeitraum reicht für mehrere “spiralförmige” Durchläufe eines Zyklus ‘isolierend → agglutinierend → flektierend (→ isolierend)’ aus.

Ähnlich ist es mit dem Versuch, die Typologie des akkusativischen, ergativischen und aktivischen Sprachbaus evolutiv zu interpretieren (vgl. Klimov 1980). Wohl trifft es zu, daß viele ergativische und aktivische Sprachen in historischer Zeit akkusativisch werden. Aber erstens geschieht dies normalerweise unter dem Einfluß einer akkusativischen Kontaktsprache und beweist insofern keine intrinsische Evolution; und zweitens ist auch die Entwicklung zum ergativischen Bau (z.B. in den indo-arischen Sprachen) historisch belegt.

Der analogische Ansatz

Der konstruktive und der rekonstruktive Zugang zum Problem der Ursprache haben gemeinsam, daß sie sich auf empirisch vorfindliche Kommunikationssysteme stützen und von ihnen aus Entwicklungslinien vorwärts oder rückwärts extrapolieren. Daneben gibt es noch einen Zugang über die Analogie. Hier ist in erster Linie die Übertragung von der Ontogenese auf die Phylogenese zu nennen. So ähnlich, wie sich die Sprache des Kindes von einer primitiven Form zur voll ausgebildeten Erwachsenensprache entwickelt, so ähnlich könnte auch die Ursprache des Menschen entstanden sein. Hier muß man aber sehen, daß der Parallelismus zwischen Ontogenese und Phylogenese nicht aus biologischen Gründen besteht. Urmenschen sind nicht wie Säuglinge, sie erwerben die Sprache auch nicht wie Kleinkinder. Der Parallelismus folgt vielmehr aus der immanenten Logik des Systems: die Entfaltung von Komplexität aus kompakter Einfachheit kann nicht sehr viele verschiedene Wege gehen. Wegen der Unterschiede zwischen Urmenschen und Kleinkindern ist also der Analogieschluß unsicher; und soweit der Parallelismus wirklich besteht, kann man auf den Analogieschluß ebensogut verzichten und gleich die konstruktive Methode wählen.

Ein zweiter analogischer Zugang zur menschlichen Ursprache wäre der über die in der Neuzeit beobachtbaren Pidginsprachen. Diese entstehen als notdürftiges Verständigungsmittel zwischen Menschen, die sich mit den ihnen zu Gebote stehenden Sprachen nicht verständigen können, und sind in der Tat primitiv (vgl. Labov 1971). Man hat geschlossen, daß die allen Pidginsprachen gemeinsamen Merkmale die der menschlichen Ursprache sein müßten (vgl. Bickerton 1981). Nur zwei aus der Fülle von Problemen, auf die dieser Ansatz stößt, seien genannt:

Wenn also dieser methodische Ansatz auch neuartige Perspektiven eröffnet, erlaubt er doch ebensowenig wie die vorigen eine direkte Extrapolation der Ursprache aus vorfindlichen menschlichen Sprachen.

Exkurs zur kognitiven Entwicklung

Der Leitsatz des Empirismus war “nihil est in intellectu quod non prius fuerit in sensu”. Der Satz ist, bezogen auf den modernen Menschen, in mehrfacher Hinsicht falsch, bietet aber einen nützlichen Ausgangspunkt zum Verständnis der Evolution des menschlichen Geistes. Denn er gilt, soweit wir wissen, jedenfalls für niedere Tiere. Was sie denken, kann man z.B. feststellen, wenn sie kommunizieren. Eine Biene unterrichtet ihre Artgenossinnen durch ihren Tanz von einer Futterquelle. Sie reagiert durch den Tanz unmittelbar auf das, was sie soeben wahrgenommen hat. Man hat noch keine Biene gesehen, die durch ihren Tanz ihre Artgenossinnen belogen hätte. Menschliche Sprache dagegen hat jedenfalls die Möglichkeit, welche Prävarikation genannt worden ist (Hockett 1963). Die Fähigkeit zum Lügen ist nur eine markante Ausprägung der viel allgemeineren Fähigkeit, sich die Inhalte des Denkens autonom zu konstruieren (s. Smith 2004 sowie das Kapitel über Sprache und Denken), anstatt sie ausschließlich über die Sinne zu beziehen.

So betrachtet, liegt ein wesentlicher Zug der kognitiven Entwicklung von den niederen Tieren bis zum Homo sapiens in einer schrittweisen Emanzipation des Geistes von den Sinneseindrücken. Eine frühe Stufe dieses Prozesses mag man sich so vorstellen, daß ein Wesen zunächst eine interne Repräsentation des Wahrgenommenen ableitet und in einem weiteren Schritt dann Abwandlungen davon erzeugt, insbesondere Versionen, die dem Wahrgenommenen widersprechen, die aber z.B. zur Irreführung anderer Wesen nützlich sein können. Auf der längst erreichten Endstufe der Entwicklung ist es normalerweise umgekehrt: Der Mensch unterhält im Geiste eine selbstkonstruierte Welt, über die er durch Kommunikation auch seine Mitmenschen auf dem laufenden hält. In bestimmten Fällen wird von ihm Wahrhaftigkeit erwartet. Und in einem Teil dieser Fälle wiederum wird diese als Wahrheit seiner Aussagesätze und schließlich als deren unmittelbarer Bezug auf eine von ihnen unabhängig bestehende und beobachtbare Wirklichkeit interpretiert. Dieser Sonderfall spielt eine unleugbare Rolle in der Ethik, tritt aber im täglichen Leben nur unter bestimmten Bedingungen auf.2

Diese Entwicklung spiegelt sich auch in der Natur der vorherrschenden Zeichen. Tierische Zeichen tragen typischerweise eine indexikalische Beziehung zum bezeichneten Gegenstand, auf einer höheren Stufe auch eine ikonische Beziehung (vgl. Keller 1995). In beiden Fällen wird eine unabhängige, vorgängige Existenz des Bezeichneten vorausgesetzt. Erst das arbiträre Symbol, das in zeitgenössischen natürlichen Sprachen vorherrscht (s.u.), kann etwas bezeichnen, was mit seiner Hilfe erst konstruiert wird.

Theorie der Sprachevolution

Lautliches Medium

Der Mensch hat - als Primat - mit nicht-lautlichen Medien wie insbesondere Gestik und Mimik kommuniziert lange, bevor er die Lautsprache entwickelte. Und er kommuniziert bis heute durch solche Medien, anstelle von oder in Begleitung zu lautsprachlicher Kommunikation (s.a. das Kapitel zur Sprache in ihrem Umfeld). Allerdings hat sich beim Menschen die lautsprachliche Kommunikation verselbständigt in dem Sinne, dass sie auch ohne para- und nichtsprachliche Begleitung funktioniert. Daher setzen wir im folgenden diese letzteren Kommunikationsformen voraus und beschränken uns auf die Evolution der Lautsprache.

Insoweit sich die menschliche Sprache primär als Lautsprache entwickelt hat, ist die Entwicklung der sprachlichen Form von Anfang an an die Entwicklung der Substanz, also des lautlichen Mediums, gekoppelt. Insbesondere die Entwicklung der zweiten Gliederung, auf die im folgenden Abschnitt zurückgekommen wird, beruht auf den anatomischen und physiologischen Fähigkeiten in Phonation, Artikulation und Audition, die eben in der Lautsprache eingesetzt werden.

Was das Senden lautlicher Nachrichten betrifft, so können nichtmenschliche Primaten zwar sowohl den Kehlkopf zur Phonation benutzen, also Schreie ausstoßen, als auch die Artikulationsorgane in Konstellationen bringen, wie sie zur Artikulation benutzt werden. Aber sie können die Phonation, also das Zu- und Abschalten der Stimme und deren Eigenschaften, nicht (neural)) kontrollieren und also auch nicht erlernen. Kontrollieren und also auch erlernen können sie wohl ein paar Artikulationsbewegungen, z.B. bilabialen Verschluß. Aber diese können zur Erzeugung von Lautsprache fungieren nur dann, wenn sie als Artikulation mit der Schallerzeugung kombiniert werden; und das eben können Affen nicht. Die Entwicklung der menschlichen Lautsprache involviert in dieser Hinsicht also

Was den Empfang lautlicher Nachrichten betrifft, so ist die dafür nötige Audition eine zusätzliche Fähigkeit gegenüber dem Hören nichtsprachlicher Geräusche. Sie involviert die Kategorisierung akustischer Eigenschaften und einen Grad von deren simultaner und sequentieller Differenzierung (s. a.a.O.), den Tiere offenbar nicht erreichen. Auch diese Fähigkeit wurde also auf dem Weg zur Entwicklung der Lautsprache erworben. Und zwar entwickelten sich diese auditiven Fähigkeiten in Abstimmung mit den artikulatorischen Fähigkeiten: die Feinheit der lautlichen Kategorisierung und Differenzierung ist in Artikulation und Audition die gleiche.

Sprachstruktur

Zweifache Gliederung

Die wichtigste Leistung in der Entwicklung der Sprache, die der Vormensch auf dem Weg vom Homo erectus zum Homo sapiens vollbrachte, war die Herausbildung ihrer zweifachen Gliederung (vgl. Hockett & Ascher 1964, Hoijer 1969). Diese war vermutlich um -150.000 abgeschlossen. Wie das geschah, darüber kann man derzeit nur spekulieren. Wie wir in Kap. 6.5 gesehen hatten, besteht zwischen den beiden Gliederungen kein Voraussetzungsverhältnis, so daß sich aus der Systematik kein Anhaltspunkt dafür ergibt, welche der beiden Gliederungen zuerst da war.

Eine Möglichkeit besteht in folgendem Lauf der Dinge bei der Evolution der Lautsprache:

Evolution der zweifachen Gliederung
StufePeriodeEvolutionsschritt
1.vor Homo erectusEs gibt keine Gliederung, so wie bei den Primaten.
2.Homo erectusDie erste Gliederung in signifikative Einheiten wird eingeführt.
3.archaischer Homo sapiensDie zweite Gliederung in distinktive Einheiten wird eingeführt.

Der dritte Schritt wird dadurch vollzogen, daß Ausdruckseinheiten, welche zunächst bedeutungstragend sind, schrittweise sinnentleert werden. Es besteht nämlich ein Übergang zwischen Signifikativität und Distinktivität derart, daß distinktive Einheiten nichts Spezifisches mehr, sondern nur noch die bloße Verschiedenheit bezeichnen (R. Jakobson; vgl. das Kapitel über das Sprachzeichen). Überbleibsel daraus, daß dieser Prozeß unvollständig vollzogen wurde, wären onomatopoetische, lautsymbolische und expressive Funktionen lautlicher Einheiten in heutigen Sprachen.

Die Benutzung distinktiver Einheiten setzt die Fähigkeit voraus, diese zu kategorisieren und zu differenzieren. Die im vorigen Abschnitt dargestellte Entwicklung des lautlichen Mediums und die hier in Rede stehende Entwicklung der zweiten Gliederung verliefen also Hand in Hand.

Menschliche Gebärdensprachen verfügen ebenfalls über die zweifache Gliederung.3 Gesten stehen als Kommunikationsmittel auch Tieren zur Verfügung, wurden folglich von Menschen bereits vor Herausbildung der Lautsprache benutzt und sind bis auf den heutigen Tag, wenn sie anstatt oder neben der Lautsprache genutzt werden, fundamentaler als diese. Wann sich jedoch auf der Basis von Gestik die Gebärdensprache mit ihrer zweifachen Gliederung entwickelte und ob auch dieser Schritt der Entwicklung der zweifachen Gliederung in der Lautsprache voranging, steht dahin.

Wie auch immer der Erwerb der zweifachen Gliederung im einzelnen ablief, es handelt sich jedenfalls um eine revolutionäre kognitive Leistung, die nicht leicht mehrmals unabhängig vollbracht worden sein dürfte. Es ist also wahrscheinlich, bis zu Stufe 3 einschließlich Monogenese der menschlichen Sprache anzunehmen.

Strukturelle Komplexität

Nachdem die zweifache Gliederung eingeführt war, konnten Sprachen im heutigen Sinne entstehen. Diese Entwicklung besteht i.w. in der Schaffung grammatischer Struktur und in der Herausbildung von Komplexität. Dabei muß man freilich vorausschicken, daß strukturelle Komplexität einer Sprache kein Selbstzweck ist. Jede Sprache gehört in eine Sprachgemeinschaft mit ihrer Lebensweise, ihrer Kultur und ihren Ansprüchen an Kognition und Kommunikation in verschiedenen Lebenslagen und auf den verschiedenen Kommunikationskanälen. Und neben der Möglichkeit, einen gegebenen Inhalt (vollständig) in Lautsprache zu kodieren, gibt es immer die Alternative, andere Medien zu nutzen oder sich überhaupt auf die Sprechsituation, auf Weltwissen und Inferenzen zu verlassen. Jede Sprachgemeinschaft regelt das auf ihre Weise. Wir verstehen Sprachevolution i.a. als schrittweise Zunahme an struktureller Komplexität. Es kann aber eine Gemeinschaft sich mit einem geringeren Maß an struktureller Komplexität begnügen.4

Für die Schaffung grammatischer Struktur und die Herausbildung von Komplexität verfügt die Linguistik über Theorien, nämlich die Grammatikalisierungstheorie und die Markiertheitstheorie. Beide sind in vorangehenden Kapiteln ausführlich behandelt worden. Die Basis für solche allgemeinen Gesetze dieser Theorien, welche empirische Fakten betreffen, wird von der vergleichenden Sprachwissenschaft, insbesondere der Universalienforschung beigesteuert. Dazu gehören auch speziellere Theoreme wie die Empathiehierarchie, welche u.a. den Ausbau von Komplexität beschränkt.

Das wesentliche auf die Evolution anzuwendende Prinzip der Grammatikalisierungstheorie ist, daß grammatische Formative aus lexikalischen Einheiten und daß grammatische Konstruktionen aus freien Kombinationen entstehen. So spekulativ und teilweise abstrus existente Theorien über den Ursprung der menschlichen Sprache auch seien mögen, in diesem Punkte stimmen doch alle überein: Die Ursprache hatte noch keine Grammatik (war also insofern noch keine Sprache im heutigen Sinne). Das kann man in der Tat sicher annehmen, denn ein Voraussetzungsverhältnis zwischen Grammatik und Lexikon folgt nicht nur aus der Grammatikalisierungstheorie. Auch die Alltagserfahrung lehrt, daß man sich auf Pidginniveau in einer Fremdsprache verständigen kann, ohne deren Grammatik zu kennen, wenn man nur ein paar Vokabeln kann. Es ist also möglich, Lexeme ohne Grammatik zu haben; es ist aber unmöglich, Grammatik zu haben ohne Lexeme, auf die sie angewandt wird.

Urmenschliche Sprache bestand also in der Reihung von Ausdrücken, welche für Individuen und Begriffe standen, nach kommunikativen Gesichtspunkten. Hier walteten überwiegend Ikonizitätsprinzipien, also Komplexitätsikonismus, Reihenfolgeikonismus, Distanzikonismus usw. Dann bildet sich sprachliche Struktur durch Einführung von Beschränkungen. Auf diese Weise entstehen grammatische Kategorien, insbesondere Wortarten, und grammatische Konstruktionen.

Ikonismus waltet zu Beginn auch noch in der Assoziation von Significans und Significatum des einfachen Sprachzeichens. Solange keine zweite Gliederung vorhanden war, konnte diese Assoziation i.w. nur onomatopoetisch und lautsymbolisch sein (auch das ein Topos in allen Sprachursprungstheorien). Ist die zweite Gliederung etabliert, beginnt auch auf dieser Ebene die Einführung von Struktur, und das heißt in erster Linie arbiträrer Struktur. Die Arbitrarietät des Sprachzeichens ist also – in dem Maße, in dem sie überhaupt vollzogen ist (vgl. Kap. 6.6) – eine der ersten Errungenschaften der Herausbildung der vollgültigen Sprache nach Erreichen der obigen Stufe 3. Nun kann man auch komplexe Begriffe durch Kombination (lexikalischer) Morpheme bezeichnen. Dazu braucht man Komposition. Und wenn die so gebildeten komplexen Zeichen das Inventar bereichern sollen, müssen sie der Lexikalisierung unterworfen werden. Bald nach Entstehung der zweifachen Gliederung hat also das bis heute bestehende Wechselverhältnis von Grammatikalisierung und Lexikalisierung gewaltet.

Das wesentliche auf die Evolution anzuwendende Prinzip der Markiertheitstheorie ist, daß das Markierte das Unmarkierte voraussetzt. Der Ausbau der Komplexität geht anhand der implikativen Universalien vonstatten. In allen paradigmatischen Verhältnissen, in welchen ein markiertes einem unmarkierten Glied gegenübersteht, muß also das letztere zuerst vorhanden gewesen sein. Dies gilt auf allen sprachlichen Ebenen. Die erste Silbe hat die Gestalt ‘KV’; erst dann sind Komplikationen wie ‘KKV’ usw. möglich. Mit der ersten Silbe ist auch die Opposition zwischen Konsonant und Vokal eingeführt. Die weitere Differenzierung dieser beiden Klassen folgt dem Prinzip der einseitigen Fundierung, so wie in Jakobson 1941 dargestellt. Zuerst also gibt es nur Okklusive, dann auch Frikative; zuerst gibt es nur offene, dann auch geschlossene Vokale; usw. Ebenso gilt auf morphologischer Ebene, daß die Substantive zuerst alle transnumeral sind, dann wird ein Plural eingeführt und dem Singular gegenübergestellt, und erst danach der Dual.

Auf syntaktischer Ebene wird die holophrastische Phase durch Einführung der Zweigliedrigkeit überwunden. Sie führt zur separaten Manifestation der Referenz und der Prädikation und zu deren kontrastiver Gegenüberstellung, vergleichbar der Unterscheidung von Konsonant und Vokal und deren kontrastiver Gegenüberstellung in der Silbe. Sodann hat man einfache Sätze, auf deren Basis man komplexe Sätze bauen kann. Nach derselben Logik kann man einen großen Teil des Sprachsystems entwickeln.

Das bis hierhin Gesagte läßt sich wie folgt zusammenfassen:

Stufen der Sprachevolution
BeginnHominideSprachstrukturZeichenGrammatik/Komplexität
2.400.000Homo (rudolfensis) Gestik (Zeigen, Winken usw.) (kein Code)
Lautliche Äußerungen begleiten zunächst Gesten; sind holophrastisch, haben keine Gliederung. großenteils indexikalisch
Laute bekommen die Bedeutung der Gesten, erübrigen somit die Gesten.
1.800.000Homo erectus erste Gliederung in signifikative Einheiten
Situationsentbundene Äußerungen werden möglich.
großenteils ikonisch, also i.w. onomatopoetisch und lautsymbolischMehrere Zeichen werden zu einer Äußerung kombiniert.
400.000Archaischer Homo sapiens zweite Gliederung in distinktive Einheiten überwiegend symbolisch, also konventionell und arbiträr einfache syntaktische Konstruktionen
150.000Homo sapiens Monogenese der menschlichen Ursprache Morphologisierung phonologischer Alternationen
Grammatikalisierung (Morphologisierung) syntaktischer Konstruktionen
50.000 vollentwickelte Sprachen;
volle Effabilität wird erreicht
Ausbau von Phonologie und Morphologie gemäß der Markiertheitstheorie
volle syntaktische Komplexität (zusammengesetzte Sätze)

Die nähere Ausgestaltung einer solchen Theorie ist dann i.w. Aufgabe der Universalienforschung. Sie verschafft uns Sicherheit über einzelne Grammatikalisierungskanäle wie etwa die Entstehung lokaler Adpositionen aus Körperteilsubstantiven, und über einzelne Markiertheitsverhältnisse wie etwa die Markiertheit von Nominalklassen am Substantiv gegenüber ihrem Auftreten am Pronomen.

Ein Zeitraum, in dem dieser Ausbau vonstatten ging, ist sehr schwer anzugeben. Mit einem gehörigen Maß an Spekulation kann man die Hypothese vertreten, daß dieser Ausbau nach vollständiger Etablierung der zweifachen Gliederung, also etwa -150.000 begann. Der weitere strukturelle Ausbau geht aber in den Sprachen verschiedener Typen in unterschiedliche Richtungen. Er war sicher, solange die Menschen – übrigens eine relativ kleine Gruppe – in Afrika beisammen blieben, noch nicht sehr weit gediehen.

Sobald die Menschen eine funktionsfähige, wenn auch noch nicht grammatisch voll ausgebaute Sprache hatten, wanderten sie aus Afrika ab. Diese Phase läuft mit der Diversifikation der menschlichen Sprache parallel. D.h. es entstand in diesem Zeitraum nicht eine einzige voll ausgebildete menschliche Sprache, die sich erst hernach aufspaltete, sondern die Sapientes zerstreuten sich in alle Winde, und jede Gruppe entwickelte ihre Sprache. Insoweit folgt also auf die Phase der Monogenese eine Phase der Polygenese. So kann man sich erklären, daß manche sprachlichen Kategorien auf bestimmte Erdteile beschränkt sind. Z.B. gibt es Klicklaute nur in Südafrika, Modalkasus nur in Australien, Possessivklassifikatoren jedoch nur um den Pazifik herum und nicht in Australien. Andererseits haben sich in demselben Zeitraum auch immer wieder nomadische Gruppen getroffen, vermischt und miteinander kommuniziert. Man kann also nicht erwarten, viele sprachliche Kategorien zu finden, die in diesem Sinne areal beschränkt sind.

Spätestens seit dem Cromagnon gibt es Sprachen von der Beschaffenheit des modernen Deutschen oder Japanischen. Wenn man die Rate in Rechnung stellt, in der Sprachen sich nachweislich über historische Zeit gewandelt haben, kann man ganz sicher sagen, daß keine der heutigen Sprachen noch von demselben Strukturtyp ist, dem sie zu jener Zeit angehörte. Aber dasselbe Potential an Sprachtypen ist seitdem vorhanden. Seitdem evoluieren Sprachen nicht mehr, sondern wandeln sich nur in dem einmal gesteckten Rahmen.

Ein einziges Ereignis ist noch zu nennen, das zu einem nennenswerten Qualitätssprung führte: die Erfindung der Schrift (ca. -3.200). Schriftlichkeit bedeutet einen enormen Schub für einige wesentliche Eigenschaften menschlicher Sprache, insbesondere Situationsentbundenheit und Komplexität. Ihre Auswirkungen auf die Kultur sind allerdings noch stärker als ihre Auswirkungen auf die Sprachstruktur. Es ist wichtig daran festzuhalten, daß Sprachen lange vor bzw. auch ohne die Einführung der Schrift situationsentbunden und beliebig komplex waren und sind.

Literatur

Aitchison, Jean 1996, The seeds of speech. Language origin and evolution. Cambridge etc.: Cambridge University Press.

Beyer, Christian 2004, "Fiktionale Rede." Siebel, Mark & Textor, Mark (eds.), Semantik und Ontologie. Frankfurt & Lancaster: ontos; 169-184.

Bickerton, Derek 1981, Roots of language. Ann Arbor: Karoma (Paperback ed.: 1985).

Everett, Daniel L. 2005, “Cultural constraints on grammar and cognition in Pirahã”. Current Anthropology 46: 621-634.

Hockett, Charles F. & Ascher, Robert 1964, "The human revolution." Current Anthropology 5(3):135-168.

Hoijer, Harry 1969, "The origin of language." Hill, Archibald A. (ed.), Linguistics today. New York & London: Basic Books; 50-58.

Humboldt, Wilhelm von 1820, "Uber das vergleichende Sprachstudium in Beziehung auf die verschiedenen Epochen der Sprachentwickelung. [Berliner Akademie der Wissenschaften, 29.6.1820]." Humboldt, Wilhelm von, Schriften zur Sprachphilosophie. [= Werke in funf Banden, hrsg. v. A. Flitner und K. Giel, Bd.III]. Darmstadt: Wissenschaftliche Buchgesellschaft; 1-25.

Jakobson, Roman 1941, Kindersprache, Aphasie und allgemeine Lautgesetze. Uppsala: Almqvist & Wiksell (Neuaufl.: Frankfurt: Suhrkamp, 1969.

Keller, Rudi 1995, Zeichentheorie. Zu einer Theorie semiotischen Wissens Tübingen: Francke (UTB, 1849).

Klimov, Georgij A. 1980, "K vzaimootnošeniju genealogičeskoj, tipologičeskoj i areal'noj klassifikacii jazykov." Jarceva, Viktorija N. (ed.), Teoretičeskie osnovy klassifikacii jazykov mira. Moskva: Nauka; 6-23.

Labov, William 1971, On the adequacy of natural languages: I. The development of tense. (Trier: LAUT, B23, 1977).

Lehmann, Christian 2005, "On the methodological bases of genetic language comparison." Language Research 41:379-404. (online PDF)

Lieberman, Philip 1984, The biology and evolution of language. Cambridge, Mass. & London: Harvard University Press.

Marquardt, Beate 1984, Die Sprache des Menschen und ihre biologischen Voraussetzungen. Tübingen: G. Narr (TBL, 236).

Smith, David L. 2004, Why we lie. The evolutionary roots of deception and the unconscious mind. New York: St. Martin's Press.

Stokoe, Willian C. 1960, „Sign language structure: an outline of the visual communication system of the American deaf.“ Studies in Linguistics: Occasional Papers. Buffalo: University of Buffalo.


1 Das lateinische Fremdwort Evolution entspricht wörtlich dem deutschen Entwicklung. Das letztere Wort existierte allerdings schon, als es (um 1800) ex post als Lehnübersetzung von Evolution etabliert wurde.

2 Manche Philosophen (z.B. Beyer 2004) machen bis auf den heutigen Tag Theorien “fiktionaler Rede”, welche realitätsbezogene Sätze als den Normalfall voraussetzen. Solche Theorien sind ihrerseits ein Fall von fiktionaler Rede und bieten insofern Evidenz für den Konstruktivismus.

3 Eine Gebärde als Zeichen einer Gebärdensprache ist durch Ausdruckseigenschaften auf drei Parametern gekennzeichnet (Stokoe 1960): Konfiguration, Position und Bewegung der Hand. Der Wert auf einem der drei Parameter kann ceteris paribus variieren, steht also in Opposition zu anderen Werten desselben Parameters. Ein solcher Wert bedeutet für sich nichts, ist also lediglich distinktiv. Die Kombination solcher Werte ergibt eine Gebärde; und diese ist signifikativ.

4 Everett (2005) behauptet für das amazonische Pirahã, daß es mehrere Struktureigenschaften, die i.a. für universal gehalten werden, nicht habe.