Weitere Skripte und mehr findet ihr auf meiner Homepage. Bitte wählt eine Kategorie!


Maßzahl der Enge des Zusammenhangs für nominal skalierte Merkmale

Vorüberlegung: Die Merkmale x und y sind unabhängig voneinander.

èBeispiel: Der Anteil der guten Zahlungsmoral bei jeder einzelnen Kreditart muß gleich dem Anteil der guten Zahlungsmoral aller Kredite gemeinsam sein.

 Es muß gelten:

Dies ist die theoretische (erwartete) Häufigkeit von (xi; yj) unter der Annahme der Unabhängigkeit von x und y.

 

èBeispiel:

èDie Anzahl derer, die einen PKW-Kredit schlecht zurückgezahlt haben, müsste 85,2 betragen (tatsächlicher Wert: 75).

 

Erwartete Häufigkeiten (absolut) im Beispiel:

Verwendungszweck

Rückzahlung

Schlecht                                                      Gut

insgesamt

PKW

85,2

198,8

284

Möbel, Haushalt

94,2

219,8

314

Umschulung

29,1

67,9

97

Sonstiges

91,4

213,5

305

Ingesamt

300

700

1000

Maßzahl Chi

Chi:

Problem: Bei einer Verdopplung der Beobachtungswerte und gleichen Verhältnissen verdoppelt sich auch Chi.

 

Im Beispiel beträgt Chi 19,26.

Assoziationsmaß von Cramer

V ist im Beispiel die Abhängigkeit der Zahlungsmoral vom Verwendungswert. Er ergibt im Beispiel 0,1399. Diese Größe ist besonders geeignet, wenn mehrere V´s vorliegen, da dann verglichen werden kann, wo der Zusammenhang am größten ist (je größer V, desto größer der Zusammenhang).

 

Liegt eine vollkommene Unabhängigkeit der Merkmale vor, ist V˜0.

Grundsätzlich bewegt sich V zwischen 0 und 1.

Eine Veränderung der Reihenfolge der Merkmale hat bei nominal und ordinal skalierten Merkmalen keine Auswirkung. Chi und V sind nur geeignet, wenn mindestens ein Merkmal nominal oder ordinal skaliert ist.


Maßzahl der Enge des Zusammenhanges für (zwei) ordinal skalierte Merkmale

Ziel ist es, nicht nur festzustellen, ob es Unterschiede gibt, sondern wie sich die Unterschiede zwischen den Gruppen verteilen.

 

Vergleich zweier Objekte:

(O1;O2) mit O1=(x1;y1) und O2=(x2;y2)

 

Konkordanz: Mit einem steigenden Merkmal, steigt das zweite ebenfalls
x1>x2 und y1>y2 oder x2>x1 und y2>y1

Diskordanz: Mit einem steigenden Merkmal sinkt das zweite
x1>x2 und y1<y2 oder x2>x1 und y2<y1

P= Anzahl aller konkordanten Objektpaare

Q= Anzahl aller diskordanten Objektpaare

Eine Gebundenheit zweier Merkmale liegt vor, wenn x1=x2 oder y1=y2.

Gamma von Goodman und Kruskals

Eigenschaften für die Merkmale:

èje weiter sich G von 0 entfernt (betragsmäßig), desto enger ist der Zusammenhang

Varianzanalyse

Feststellung von Kausalzusammenhängen èUrsache àWirkung

 

Beispiel: Nettogeldvermögen in Rentnerhaushalten in 1000DM

Zweipersonenhaushalte (k=2)

Einpersonenhaushalte (k=1)

Früheres Bundesgebiet

Neue Länder

Früheres Bundesgebiet

Neue Länder

4

10

17

8

220

18

38

24

12

9

45

2

32

27

3

14

52

31

92

9

46

2

118

46

23

73

5

4

90

42

57

6

60

 

4

13

131

 

9

 

 

 

21

 

 

 

23

 

 

Abhängige Variable: y = Nettogeldvermögen = kardinal skaliert (Abstand ist messbar)

Faktoren (nominal / ordinal skaliert) k:

 

Betrachtung des Faktors Haushaltsgröße:

Modell der Abhängigkeit:  (k=Faktorstufe; i=Beobachtungswert)

 

 

Schätzung des Effektes der beiden Faktorstufen:

Ein Vergleich der einzelnen Werte mit dem Gesamtdurchschnitt ergibt die Höhe des Einflusses.

Maßzahl für die enge des Zusammenhanges

SQ= Summe der Abweichungsquadrate

SQI= Streuung innerhalb einer Faktorstufe (mglst. klein für großen Zusammenhang)

SQZ= Streuung zwischen den Faktorstufen (mglst. groß für engen Zusammenhang)

 

SQ=SQZ+SQI

 

Für das Beispiel zu den Nettovermögen ergibt sich somit ein Eta2 von 0,0662 (SQ=73671).

 

Interpretation dieses Wertes:

Die Varianz / Die Unterschiede im Geldvermögen wird mit 6,62% durch die unterschiedliche Haushaltsgröße erklärt.

Falsch wäre hingegen:

Die Höhe der Nettogeldvermögen ist zu 6,62% von der Haushaltsgröße abhängig.

 

Durch Vergleich der Werte für mehrer Faktoren, kann man erkennen, welcher Faktor die größte Wirkung auf die abhängige Variable (hier das Nettogeldvermögen) hat.

 

SQ ist für alle Faktoren gleich. Es gilt somit: SQI = SQ-SQZ

 

Je kleiner die Höhe des Boxplot ist, desto größer ist die Einfluß des Faktors.

Modellgleichung für ein 2-faktorielles Modell

Zusammenwirken mehrerer Faktoren

ykji= µ + ak + ßj + ukj

 

k=Faktorstufe des ersten Faktors

j=Faktorstufe des zweiten Faktors

µ= Gesamtdurchschnitt von y

a, ß= Einfluß des Faktors in der jeweiligen Faktorstufe

 

Bei Betrachtung aller Einzelfaktoren, kann Eta in der Summe größer als 1 werden, bedingt durch Wechselwirkungen zwischen den Faktoren.

Bei vielen Gruppen eines Faktors erhöht sich Eta. Um den Einfluß mehrere Gruppen zu neutralisieren, dividiert man SQI für den Faktor durch die Anzahl der Gruppen minus 1 (df).

 

Beispiel für ein Ergebnis einer mehrfaktoriellen Faktoranalyse:

Bruttomonatsverdienst in DM:

Quelle

Summe der Abweichungsquadrate

Freiheitsgrade

df

Mittel der Quadrate èMQ

Gesamtes Modell èSQZ

1508713736

29

52024612

       Tätigkeit èSQZTätigkeit

230202080

1

230202080

       Geschlecht

272647090

1

272647090

       Bildung

240445815

4

60111454

       Unternehmensgröße

84096459

7

12013780

       Betriebszugehörigkeit

55084679

8

6885585

       Altersgrad

43594107

8

5449263

       Fehler èSQI

1477563867

836

1767421

Gesamtvariation èSQ

2986277603

865

 

SQZ = Der Teil der Varianz, der mit den darunter liegenden 6 Faktoren erklärt wird

SQI = Teil der Varianz, der durch das Modell nicht erklärt werden kann

SQ = Gesamtes Modell

Eta kann wieder nach o.g. Formel berechnet werden.

Um den Einfluß eines einzelnen Faktors in diesem Modell zu erklären, dividiert man SQZFaktor  durch SQ. Dieser Wert ist genau der Wert, der diesem speziellen Faktor zugeschrieben werden kann. Durch Addition aller dieser Werte erhält man jedoch nicht den Wert für das gesamte Modell, da hier auch noch die Wechselwirkungen zwischen den Faktoren einen Rolle spielen.

Ein besseren Vergleich zwischen den Einzelfaktoren bietet der Vergleich der jeweiligen Werte von MQ, da diese bereits um die unterschiedliche Zahl der Freiheitsgrade bereinigt sind. Mit diesen Werten lässt sich jedoch kein MQ ermitteln.