Weitere
Skripte und mehr findet ihr auf meiner Homepage. Bitte wählt
eine Kategorie! |
Vorüberlegung: Die Merkmale x und y sind unabhängig voneinander.
èBeispiel: Der Anteil der guten Zahlungsmoral bei jeder einzelnen Kreditart muß gleich dem Anteil der guten Zahlungsmoral aller Kredite gemeinsam sein.
Es muß gelten:
Dies ist die theoretische (erwartete) Häufigkeit von (xi; yj) unter der Annahme der Unabhängigkeit von x und y.
èBeispiel:
èDie Anzahl derer, die einen PKW-Kredit schlecht zurückgezahlt haben, müsste 85,2 betragen (tatsächlicher Wert: 75).
Erwartete Häufigkeiten (absolut) im Beispiel:
Verwendungszweck |
Rückzahlung Schlecht Gut |
insgesamt |
|
PKW |
85,2 |
198,8 |
284 |
Möbel, Haushalt |
94,2 |
219,8 |
314 |
Umschulung |
29,1 |
67,9 |
97 |
Sonstiges |
91,4 |
213,5 |
305 |
Ingesamt |
300 |
700 |
1000 |
Chi:
Problem: Bei einer Verdopplung der Beobachtungswerte und gleichen Verhältnissen verdoppelt sich auch Chi.
Im Beispiel beträgt Chi 19,26.
V ist im Beispiel die Abhängigkeit der Zahlungsmoral vom Verwendungswert. Er ergibt im Beispiel 0,1399. Diese Größe ist besonders geeignet, wenn mehrere V´s vorliegen, da dann verglichen werden kann, wo der Zusammenhang am größten ist (je größer V, desto größer der Zusammenhang).
Liegt eine vollkommene Unabhängigkeit der Merkmale vor, ist V˜0.
Grundsätzlich bewegt sich V zwischen 0 und 1.
Eine Veränderung der Reihenfolge der Merkmale hat bei nominal und ordinal skalierten Merkmalen keine Auswirkung. Chi und V sind nur geeignet, wenn mindestens ein Merkmal nominal oder ordinal skaliert ist.
Ziel ist es, nicht nur festzustellen, ob es Unterschiede gibt, sondern wie sich die Unterschiede zwischen den Gruppen verteilen.
Vergleich zweier Objekte:
(O1;O2) mit O1=(x1;y1) und O2=(x2;y2)
Konkordanz:
Mit einem steigenden Merkmal, steigt das zweite ebenfalls
x1>x2 und y1>y2 oder x2>x1
und y2>y1
Diskordanz:
Mit einem steigenden Merkmal sinkt das zweite
x1>x2 und y1<y2 oder x2>x1
und y2<y1
P= Anzahl aller konkordanten Objektpaare
Q= Anzahl aller diskordanten Objektpaare
Eine Gebundenheit zweier Merkmale liegt vor, wenn x1=x2 oder y1=y2.
Eigenschaften für die Merkmale:
èje weiter sich G von 0 entfernt (betragsmäßig), desto enger ist der Zusammenhang
Feststellung von Kausalzusammenhängen èUrsache àWirkung
Beispiel: Nettogeldvermögen in Rentnerhaushalten in 1000DM
Zweipersonenhaushalte (k=2) |
Einpersonenhaushalte (k=1) |
||
Früheres Bundesgebiet |
Neue Länder |
Früheres Bundesgebiet |
Neue Länder |
4 |
10 |
17 |
8 |
220 |
18 |
38 |
24 |
12 |
9 |
45 |
2 |
32 |
27 |
3 |
14 |
52 |
31 |
92 |
9 |
46 |
2 |
118 |
46 |
23 |
73 |
5 |
4 |
90 |
42 |
57 |
6 |
60 |
|
4 |
13 |
131 |
|
9 |
|
|
|
21 |
|
|
|
23 |
|
Abhängige Variable: y = Nettogeldvermögen = kardinal skaliert (Abstand ist messbar)
Faktoren (nominal / ordinal skaliert) k:
Betrachtung des Faktors Haushaltsgröße:
Modell der Abhängigkeit: (k=Faktorstufe; i=Beobachtungswert)
Schätzung des Effektes der beiden Faktorstufen:
Ein Vergleich der einzelnen Werte mit dem Gesamtdurchschnitt ergibt die Höhe des Einflusses.
SQ= Summe der Abweichungsquadrate
SQI= Streuung innerhalb einer Faktorstufe (mglst. klein für großen Zusammenhang)
SQZ= Streuung zwischen den Faktorstufen (mglst. groß für engen Zusammenhang)
SQ=SQZ+SQI
Für das Beispiel zu den Nettovermögen ergibt sich somit ein Eta2 von 0,0662 (SQ=73671).
Interpretation dieses Wertes:
Die Varianz / Die Unterschiede im Geldvermögen wird mit 6,62% durch die unterschiedliche Haushaltsgröße erklärt.
Falsch wäre hingegen:
Die Höhe der Nettogeldvermögen ist zu 6,62% von der Haushaltsgröße abhängig.
Durch Vergleich der Werte für mehrer Faktoren, kann man erkennen, welcher Faktor die größte Wirkung auf die abhängige Variable (hier das Nettogeldvermögen) hat.
SQ ist für alle Faktoren gleich. Es gilt somit: SQI = SQ-SQZ
Je kleiner die Höhe des Boxplot ist, desto größer ist die Einfluß des Faktors.
Zusammenwirken mehrerer Faktoren
ykji= µ + ak + ßj + ukj
k=Faktorstufe des ersten Faktors
j=Faktorstufe des zweiten Faktors
µ= Gesamtdurchschnitt von y
a, ß= Einfluß des Faktors in der jeweiligen Faktorstufe
Bei Betrachtung aller Einzelfaktoren, kann Eta in der Summe größer als 1 werden, bedingt durch Wechselwirkungen zwischen den Faktoren.
Bei vielen Gruppen eines Faktors erhöht sich Eta. Um den Einfluß mehrere Gruppen zu neutralisieren, dividiert man SQI für den Faktor durch die Anzahl der Gruppen minus 1 (df).
Beispiel für ein Ergebnis einer mehrfaktoriellen Faktoranalyse:
Bruttomonatsverdienst in DM:
Quelle |
Summe der Abweichungsquadrate |
Freiheitsgrade df |
Mittel der Quadrate èMQ |
Gesamtes Modell èSQZ |
1508713736 |
29 |
52024612 |
Tätigkeit èSQZTätigkeit |
230202080 |
1 |
230202080 |
Geschlecht |
272647090 |
1 |
272647090 |
Bildung |
240445815 |
4 |
60111454 |
Unternehmensgröße |
84096459 |
7 |
12013780 |
Betriebszugehörigkeit |
55084679 |
8 |
6885585 |
Altersgrad |
43594107 |
8 |
5449263 |
Fehler èSQI |
1477563867 |
836 |
1767421 |
Gesamtvariation èSQ |
2986277603 |
865 |
|
SQZ = Der Teil der Varianz, der mit den darunter liegenden 6 Faktoren erklärt wird
SQI = Teil der Varianz, der durch das Modell nicht erklärt werden kann
SQ = Gesamtes Modell
Eta kann wieder nach o.g. Formel berechnet werden.
Um den Einfluß eines einzelnen Faktors in diesem Modell zu erklären, dividiert man SQZFaktor durch SQ. Dieser Wert ist genau der Wert, der diesem speziellen Faktor zugeschrieben werden kann. Durch Addition aller dieser Werte erhält man jedoch nicht den Wert für das gesamte Modell, da hier auch noch die Wechselwirkungen zwischen den Faktoren einen Rolle spielen.
Ein besseren Vergleich zwischen den Einzelfaktoren bietet der Vergleich der jeweiligen Werte von MQ, da diese bereits um die unterschiedliche Zahl der Freiheitsgrade bereinigt sind. Mit diesen Werten lässt sich jedoch kein MQ ermitteln.
|