Statistische Auswertung < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Hallo,
ich hoffe das ihr mit helfen könnt. Ich habe keinen wirklichen mathematischen Background, mein Abi ist 20 Jahre her. Ich bin IT-Admin und muß programmiertechnisch Sätze von Messwerten statistisch auswerten:
Ausgangswerte: pro Satz etwa 1500 - 1600 Werte, jeder Wert liegt zwischen 0 und 15
Die Werte sind ungleichmässig verteilt, z.B. so:
16 x 1
3 x 2
3 x 3
24 x 4
90 x 5
265 x 6
407 x 7
375 x 8
218 x 9
109 x 10
34 x 11
12 x 12
4 x 13
1 x 15
Meine Aufgabe ist es nun eine Formel zu finden um automatisch einen Bereich von "normalen" Werten festzulegen, also irgendwie mathematisch festzulegen in welchem Bereich die Zahlen des jeweiligen Datensatzes üblicherweise angesiedelt sind.
Oben also z.b alle Werte die zwischen 5 und 10 liegen. Dieser Bereich ändert sich allerdings bei jedem Satz, daher kann ich das nicht statisch festlegen.
Geht das? Ich würde gerne einen eigenen Lösungsansatz anbieten, aber ich habe nicht den blassesten Schimmer wie man sowas berechnet.
Wäre toll wenn mir das jemand erklären könnte, wenn möglich so simpel wie möglich. :)
Danke und viele Grüße,
Robert
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt
|
|
|
|
Das hört sich gut an und wie mach ich das?
Danke +Grüße, Robert
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 21:54 Mo 06.02.2012 | Autor: | chrisno |
Du zählst, wie viele Datensätze Du hast. Dann teilst Du die Zahl durch vier.
Sortiere die Datensätze nach dem Merkmal. Nach dem ersten Viertel (Quartil) der Datensätze entnimmst Du den Wert des Merkmals. Dies ist die untere Grenze. Nach der Hälfte kommt der Median, nach dem nächsten Viertel kommt die obere Grenze.
In Deinem Beispiel
Häufigkeit des Auftretens Merkmal (Messwert)
16 x 1
3 x 2
3 x 3
24 x 4
90 x 5
265 x 6
407 x 7
375 x 8
218 x 9
109 x 10
34 x 11
12 x 12
4 x 13
1 x 15
Summe = 1561
Ein Viertel davon = 390
16 + 3 + 3+ 24 + 9 + 265 = 401
Da musst Du nun entscheiden, ob Du lieber weiter oder enger fassen willst
Ich leg mich mal fest, es gibt da sicher noch genauere Definitionen:
Die Datensätze mit den Messwerten 1 bis 6 liegen unterhalb des typischen Bereichs.
1 + 4 + 12 + 34 + 109 + 218 = 378
Das sind zwar noch nicht ganz 390, aber nahe genug dran.
Die Datensätze mit den Messwerten 9 bis 15 liegen oberhalb des typischen Bereichs.
Es gibt also ein Problem, wie die Grenze zu ziehen ist. Ich würde pragmatisch schauen, welcher Wert am nächsten dran liegt. Also
bei der unteren Grenze:
16 + 3 + 3+ 24 + 90 = 136 390 - 136 = 254
16 + 3 + 3+ 24 + 9 + 265 = 401 401 - 390 = 11
also ist der Messwert 6 die bessere Grenze
bei der oberen Grenze:
1 + 4 + 12 + 34 + 109 + 218 = 378 390 - 378 = 12
1 + 4 + 12 + 34 + 109 + 218 + 375 = 753 753 - 390 = 363
also ist der Messwert 9 die bessere Grenze.
Du kannst natürlich auch Fünftel nehmen (zwnzigste Perzentile und achzigste Perzentile), das ist eine Entscheidung, die Du oder der Auftraggeber treffen muss.
|
|
|
|