www.vorhilfe.de
- Förderverein -
Der Förderverein.

Gemeinnütziger Verein zur Finanzierung des Projekts Vorhilfe.de.
Hallo Gast!einloggen | registrieren ]
Startseite · Mitglieder · Impressum
Forenbaum
^ Forenbaum
Status VH e.V.
  Status Vereinsforum

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Suchen
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
Forum "Statistik (Anwendungen)" - Log-Normalverteilung
Log-Normalverteilung < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Log-Normalverteilung: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 22:14 Mi 11.02.2015
Autor: aco92

Hallo zusammen,

folgendes Problem:

Ich habe einen Datensatz, von dem ich annehmen möchte, dass dieser log-normalverteilt ist. Mithilfe dieses Datensatzes möchte ich mit einer Monte Carlo Simulation "künstliche" Datensätze erzeugen. Hierfür benötige ich aber die Dichtefunktion der angenommenen Log-Normalverteilung.

Diese lautet:

[mm] \bruch{1}{\wurzel{2\pi}*s*x}*exp(-0.5*\bruch{(ln(x)-\mu)^2}{s^2}) [/mm]    [1]

1.Frage: wie erhalte ich aus meinem Datensatz [mm] \mu [/mm] und s?

Probiert habe ich Folgendes:

Wenn die Datensätze log-normalverteil sind, sind die logarithmierten Datensätze normalverteilt.

Also bilde ich ln(X) für meine Daten X. Mithilfe von Excel kann ich dann die Standardabweichung t und den Mittelwert m berechnen lassen.

Also kann ich ansetzen:

[mm] \bruch{1}{\wurzel{2\pi}*t}*exp(-0.5*\bruch{(x-m)^2}{t^2}) [/mm]         [2]

Damit kann ich dann mit Monte Carlo Simulation künstliche Daten des Formats ln(x) erzeugen und mit [mm] e^{ln(x)} [/mm] zurückwandeln.

2.Frage: Ist das legitim?

3.Frage: Es gibt weiterhin für die Log-Normalverteilung die Beziehungen

E(X)= [mm] e^{\mu+\bruch{s^2}{2}} [/mm]        [3.1]

und

[mm] \wurzel{Var(X)} [/mm] = [mm] e^{\mu+\bruch{s^2}{2}} [/mm] * [mm] \wurzel{e^s^2-1} [/mm]       [3.2]

So wie ich das verstanden habe entsprechen in diesen Gleichungen E(X) dem [mm] \mu [/mm] aus [1] und [mm] \wurzel{Var(X)} [/mm] dem s aus [1]. Dabei entspricht dem [mm] \mu [/mm] aus [3.1] & [3.2] m aus [2] und s aus [3.1] & [3.2] t aus [2].

Auch hier die Frage: Stimmt das?

Vielen Dank für die Antworten! Ich hoffe ich habe mich nicht zu verwirrend ausgedrückt.

Viele Grüße

aco92


        
Bezug
Log-Normalverteilung: Antwort
Status: (Antwort) fertig Status 
Datum: 09:07 Do 12.02.2015
Autor: hanspeter.schmid


> [mm]\bruch{1}{\wurzel{2\pi}*s*x}*exp(-0.5*\bruch{(ln(x)-\mu)^2}{s^2})[/mm]
>  
> 1.Frage: wie erhalte ich aus meinem Datensatz [mm]\mu[/mm] und s?
>  
> Probiert habe ich Folgendes:
>  
> Wenn die Datensätze log-normalverteil sind, sind die
> logarithmierten Datensätze normalverteilt.
>  
> Also bilde ich ln(X) für meine Daten X. Mithilfe von Excel
> kann ich dann die Standardabweichung t und den Mittelwert m
> berechnen lassen.

Genau so. Das ist die Maximum-Likelihood-Schätzung der Parameter. Mehr dazu:
[]https://en.wikipedia.org/wiki/Log-normal_distribution#Maximum_likelihood_estimation_of_parameters

> Also kann ich ansetzen:
>  
> [mm]\bruch{1}{\wurzel{2\pi}*t}*exp(-0.5*\bruch{(x-m)^2}{t^2})[/mm]  
>  
> Damit kann ich dann mit Monte Carlo Simulation künstliche
> Daten des Formats ln(x) erzeugen und mit [mm]e^{ln(x)}[/mm]
> zurückwandeln.
>  
> 2.Frage: Ist das legitim?

Ja, genau so macht man es.


> 3.Frage: Es gibt weiterhin für die Log-Normalverteilung
> die Beziehungen
>  
> E(X)= [mm]e^{\mu+\bruch{s^2}{2}}[/mm]        [3.1]
>  
> und
>
> [mm]\wurzel{Var(X)}[/mm] = [mm]e^{\mu+\bruch{s^2}{2}}[/mm] * [mm]\wurzel{e^s^2-1}[/mm]
>       [3.2]
>  
> So wie ich das verstanden habe entsprechen in diesen
> Gleichungen E(X) dem [mm]\mu[/mm] aus [1] und [mm]\wurzel{Var(X)}[/mm] dem s
> aus [1]. Dabei entspricht dem [mm]\mu[/mm] aus [3.1] & [3.2] m aus
> [2] und s aus [3.1] & [3.2] t aus [2].
>  
> Auch hier die Frage: Stimmt das?

Nein (wenn ich es richtig verstanden habe, was Du meinst).

$s$ und [mm] $\mu$ [/mm] sind dasselbe wie in
[mm]p_X(x)=\bruch{1}{\wurzel{2\pi}*s*x}*exp(-0.5*\bruch{(ln(x)-\mu)^2}{s^2})[/mm]

$E(X)$ und [mm] $\mathrm{Var}(X)$ [/mm] sind Erwartungswert und Varianz der Zufallsvariablen $X$, die durch die W'keitsdichtefunktion [mm] $p_X(x)$ [/mm] beschrieben ist.

Gruss,
Hanspeter


Bezug
                
Bezug
Log-Normalverteilung: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 23:45 Do 12.02.2015
Autor: aco92

Alles klar vielen Dank!

Allerdings stellt sich mir noch eine Frage:

Da es sich bei meinen Daten ja nur um näherungsweise log-normalverteilte Daten handelt, sind die Werte ln X ja auch nicht exakt normalverteilt.
Somit erzeuge ich doch wegen der "Sensibilität" des Logarithmus auf kleine Abweichungen durch die "Transformation" der Daten X zu ln X und anschließend umgekehrt möglicherweise recht große Fehler oder nicht?

Mit freundlichen Grüßen

aco92

Bezug
                        
Bezug
Log-Normalverteilung: Antwort
Status: (Antwort) fertig Status 
Datum: 08:30 Fr 13.02.2015
Autor: hanspeter.schmid


> Alles klar vielen Dank!
>  
> Allerdings stellt sich mir noch eine Frage:
>  
> Da es sich bei meinen Daten ja nur um näherungsweise
> log-normalverteilte Daten handelt, sind die Werte ln X ja
> auch nicht exakt normalverteilt.
>  Somit erzeuge ich doch wegen der "Sensibilität" des
> Logarithmus auf kleine Abweichungen durch die
> "Transformation" der Daten X zu ln X und anschließend
> umgekehrt möglicherweise recht große Fehler oder nicht?

Ah. Das ist der Punkt wo's schwierig wird, auch genannt: Realität ;))))

Es gibt mehrere Fehlerquellen:
(a) Rundungsfehler
(b) Abweichung der realen Verteilung von der log-normalen
(c) wenige Daten

Zu (a), das ist jener, wo die Sache mit der Sensitivität greift: einfach nicht unnötig runden ;)

Zu (b), das ist immer das Problem mit näherungsweisen Verteilungen. [mm] $\mu$ [/mm] und $s$ sollten aber einigermassen OK sein, solange Du dann nicht versuchst, genaue Infos Stücke des Wertebereiches weit weg von [mm] $\mu$ [/mm] zu kriegen. Weshalb nimmst Du log-normal an?

Zu (c), sowohl die Bestimmung von [mm] $\mu$ [/mm] wie auch von $s$ ist nicht robust. Ausreisser werden deren Berechnung dominieren. Falls Du nur wenige Daten hast ($<100$ oder so), solltest Du besser mit Median und Perzentilen arbeiten, da diese robust gegen Ausreisser sind. Falls Du es brauchst, zeige ich Dir, wie es geht. Wieviele Messungen hast Du?

Gruss,
Hanspeter


Bezug
                                
Bezug
Log-Normalverteilung: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 11:24 Fr 13.02.2015
Autor: aco92

  
> Zu (a), das ist jener, wo die Sache mit der Sensitivität
> greift: einfach nicht unnötig runden ;)
>  
> Zu (b), das ist immer das Problem mit näherungsweisen
> Verteilungen. [mm]\mu[/mm] und [mm]s[/mm] sollten aber einigermassen OK sein,
> solange Du dann nicht versuchst, genaue Infos Stücke des
> Wertebereiches weit weg von [mm]\mu[/mm] zu kriegen. Weshalb nimmst
> Du log-normal an?

Nein das will ich nicht. Ich werde lediglich eine untere Schranke einbauen, welche niedriger als [mm] \mu [/mm] liegt. Log-normal nehme ich als eine von drei möglichen Verteilungen an. Das haben vorherige Untersuchungen zu diesem Thema nahegelegt.

>  
> Zu (c), sowohl die Bestimmung von [mm]\mu[/mm] wie auch von [mm]s[/mm] ist
> nicht robust. Ausreisser werden deren Berechnung
> dominieren. Falls Du nur wenige Daten hast ([mm]<100[/mm] oder so),
> solltest Du besser mit Median und Perzentilen arbeiten, da
> diese robust gegen Ausreisser sind. Falls Du es brauchst,
> zeige ich Dir, wie es geht. Wieviele Messungen hast Du?
>  

Daten müsste ich mehr als 100 eher so 200-300 haben. Genau kann ich das erst am Montag sagen. Ich werde jetzt erst einmal wie oben beschrieben vorgehen und dann sehen, ob mir das bereits reicht. Ansonsten greife ich das dann hier wieder auf.

Danke für die Unterstützung
und freundliche Grüße

aco92


Bezug
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
ev.vorhilfe.de
[ Startseite | Mitglieder | Impressum ]