Verteilung inner. Klass. Daten < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Hallo,
Ich habe diese Frage auch in folgendem Forum gepostet: http://www.statistik-forum.de/allgemeine-fragen-f5/hilfe-bei-umgang-mit-klassierten-daten-t2172.html
Ich stehe im Rahmen meiner Bachelorarbeit vor dem folgenden Problem und weiß momentan nicht mehr weiter. Insgesamt geht es um folgendes: mich interessiert das Bankkreditvolumen kleiner und mittlerer Unternehmen bestimmter Wirtschaftszweige. In einer Datenbank konnte ich mir die prozentualen Aufteilungen der Bilanzen ansehen, d.h. ich weiß, dass das Bankkreditvolumen von Kleinstunternehmen im Wirtschaftszweig x etwa 20% der Bilanzsumme ausmacht. Ich habe mir dann angesehen, wieviele Unternehmen welche Bilanzsumme haben, allerdings ist hier das Problem:
Ich weiß, dass:
1,5 Mio Unternehmen eine Bilanzsumme zwischen 0 und 2 Mio € haben
500.000 Unternehmen eine Bilanzsumme zwischen 2 und 10 Mio € haben
60.000 Unternehmen eine Bilanzsumme zwischen 10 und 43 Mio € haben.
Ich dachte zunächst, dass ich folgendermaßen Vorgehen kann:
Ich berechne die Quantile im Abstand von je 0,1 Prozentpunkten, dann weiß ich, dass beispielsweise 2,1% der unternehmen eine Bilanzsumme von x unterschreiten, 2,2% der Unternehmen unterschreiten eine Bilanzsumme von x+c, usw. Wenn ich dann die Differenzen berechne, dann kenne ich die Bilanzsumme von je 0,1% der unternehmen dieser Klasse. Das große Problem hierbei ist, dass ich so unterstelle, dass die Werte innerhalb der Klasse gleichverteilt sind, aber das ist wohl falsch, insb. wenn man sich die dritte (sehr Breite) Klasse mit den wenigen Beobachtungen ansieht. Ich glaube weiterhin, dass die Bilanzsummen lognormalverteilt sind. Man sieht ja, dass viele unternehmen eine kleine Bilanzsumme haben und nur wenige eine große, die Verteilung sieht also auf jedenfall sehr rechtsschief aus. Ich habe außerdem gelesen, dass z.B. Einkommen auch lognormalverteilt sind, da viele Menschen ein verhältnismäßig niedriges Einkommen haben und nur sehr wenige ein hohes. Wenn ich jetzt annehme, dass die Bilanzsummen lognormalverteilt sind, muss ich das doch mit einem Test "nachweisen", oder? Geht das überhaupt mit nur den drei großen Klassen? Und wenn ich nun wüsste, dass die Bilanzsummen lognormalverteilt sind, wie kann ich dann die Quantile bestimmen? Ist das überhaupt sinnvoll? Ist die Lösung evtl. auch viel einfacher und ich mache es mir zu kompliziert?
Es ist nicht wichtig, dass ich das Kreditvolumen haargenau bestimmen kann, ich würde es nur gern so schätzen, dass es möglichst realitätsnah ist.
Vielen herzlichen Dank für jeden Tipp!
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 21:20 Do 29.11.2012 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|