Bereits die ersten morphologischen Typologien (Schlegel 1808, 1818, Humboldt 1836) rechneten mit der graduellen Zugehörigkeit einer Sprache zu einem Typ. Sapir (1921) präzisierte die formalen Kriterien, quantifizierte sie aber noch nicht. Das tat Joseph Greenberg in dem wegweisenden Aufsatz “A quantitative approach to the morphological typology of language” (1954; abgedr. IJAL 1960; vergleichbare frühere Arbeiten aus Osteuropa waren nicht bekannt geworden). Das Ziel des Aufsatzes ist es, die Parameter der morphologischen Typologie, so wie von Sapir definiert, meßbar zu machen. Dazu bildet Greenberg eine Sprachenstichprobe (in diesem Fall eine Konvenienzstichprobe von vier indogermanischen und vier nicht-indogermanischen Sprachen, da es ihm nur darauf ankommt, seine Methode vorzuführen). Aus jeder Sprache legt er eine Textperikope im Umfang von 100 laufenden Wörtern zugrunde. Alle untersuchten Systemeigenschaften definiert er als ihre durchschnittliche Ausprägung im untersuchten Text.
Die Merkmale der morphologischen Typologie in der Formulierung von Greenberg 1954 und Krupa 1965 sind die folgenden:
Mit den ersten beiden Indizes quantifiziert Greenberg also Sapirs ‘synthesis’ und ‘technique’. Mit den nächsten drei Indizes versucht er, Sapirs begriffliche Typologie auf formale und somit meßbare Eigenschaften zu beziehen. Mit den letzten drei Parametern will er syntaktische Techniken quantifizieren.
Mit diesem Aufsatz begründet Greenberg die quantitative Typologie. Krupa (1965) konstruiert die typologischen Indizes von Greenberg 1954 derart um, daß das Intervall für alle zwischen 0 und 1 liegt. Für 20 ausgewählte Sprachen ergeben sich folgende Werte:
Die Größe der einzelnen Stichprobe ist mit 100 laufenden Wörtern ziemlich klein. Nachfolgende statistische Untersuchungen (Pierce 1963, 1966) erbringen, daß dieser Umfang dennoch ausreicht. Dagegen kann eine Sprache nicht durch eine Stichprobe aus einem einzigen Text angemessen repräsentiert werden; man muß die Gesamtstichprobe einer Sprache aus Perikopen von Texten verschiedener Genres zusammensetzen.
Mit einem Distanzmaß kann man die Ähnlichkeit der verglichenen Sprachen in bezug auf die 10 Indizes berechnen und diese dann nach dem Grade ihrer Ähnlichkeit gruppieren (vgl. Altmann & Lehfeldt 1973:349ff).
Bis hierhin liegt nur eine quantifizierte Klassifikation von Sprachen nach ausgewählten Kriterien vor. Typologie soll aber Korrelationen zwischen solchen klassifikatorischen Parametern aufspüren (vgl. Krupa & Altmann 1966). Hier sind zwei Arten der Abhängigkeit zu unterscheiden:
Diese logischen Abhängigkeiten muß man also zunächst herausrechnen, da sie für die Typologie nichts lehren. Sodann können – um Abhängigkeiten der zweiten Art festzustellen – Korrelationen zwischen Greenbergs Indizes berechnet werden (s. Altmann & Lehfeldt 1973:44-46). Dabei stellt sich z.B. eine positive Korrelation zwischen S/M und Pi/M heraus; m.a.W., je mehr Suffixe die Wörter einer Sprache haben, desto wahrscheinlicher werden syntaktische Konstruktionen durch reine Flexion markiert. Das ist zwar plausibel, aber mathematisch nicht notwendig, weil die Suffixe ja allesamt Derivationssuffixe sein könnten.
Die quantitative Typologie kann sowohl typologische Ähnlichkeit zwischen Sprachen als auch die wechselseitige Abhängigkeit von Merkmalen messen und somit präzisieren. Was jedoch den Abhängigkeiten zugrundeliegt, bleibt einer qualitativen Analyse vorbehalten.