www.vorhilfe.de
- Förderverein -
Der Förderverein.

Gemeinnütziger Verein zur Finanzierung des Projekts Vorhilfe.de.
Hallo Gast!einloggen | registrieren ]
Startseite · Mitglieder · Impressum
Forenbaum
^ Forenbaum
Status VH e.V.
  Status Vereinsforum

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Suchen
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
Forum "Uni-Stochastik" - Datenerzeugung für Regression
Datenerzeugung für Regression < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "Uni-Stochastik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Datenerzeugung für Regression: Idee
Status: (Frage) reagiert/warte auf Reaktion Status 
Datum: 12:55 Fr 20.01.2006
Autor: klaudia

Hallo,

ich habe vor verschiedene Methoden der linearen Regression (least squares, orthogonale Regression und andere) in Bezug auf ihre Annäherung an die wahre Ebene zu vergleichen. Dafür brauche ich künstlich erzeugte Punkte aus dem  [mm] \IR^3, [/mm] die fast (bis auf einen kleinen Fehler) auf einer Ebene der Form a [mm] x_{1} [/mm] + b [mm] x_{2} [/mm] +c [mm] x_{3} [/mm] = d liegen sollen.  Ich weiß allerdings nicht wie ich möglichst realitätsnahe Punkte (inklusive Messfehlern in allen Koordinaten) erhalte. Eine Idee wäre a,b,c und d erst fest zu wählen, dann anschliessend [mm] x_{1} [/mm] und [mm] x_{2} [/mm] zufällig rechteckverteilt zwischen 0 und 100 zu bestimmen und dann [mm] x_{3} [/mm] so zu berechnen, so dass der Punkt x exakt auf der Ebene liegt.  Zum Schluß würde ich dann noch einen N(0,1)-verteilten Fehler in jeder Komponente addieren.
Meine Frage ist, ob man dadurch Punkte erhält, die auch tatsächlich hätten gemessen werden können.  Bzw. welche Verteilungen sollte ich wählen, wenn ich zwischen einer linearen Regression auf z.B. physikalischen und wirtschaftlichem Gebiet unterscheiden möchte?

Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt

        
Bezug
Datenerzeugung für Regression: Antwort
Status: (Antwort) fertig Status 
Datum: 10:04 Sa 21.01.2006
Autor: BAGZZlash

Hi!

Also bei uns in den Wirtschaftswissenschaften werden typischerweise normalverteilte Residuen angenommen (nicht unbedingt standardnormalverteilt). Wie's bei physikalischen Größen ist, weiß ich nicht, da aber zur Inferenz bei KQ-Schätzern F-Verteilung erforderlich ist, denke ich mal, daß das kaum anders geht, als mit normalverteilter Störgröße.

Bezug
                
Bezug
Datenerzeugung für Regression: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 13:41 Sa 21.01.2006
Autor: klaudia

Okay, die Residuen sollen normalverteilt sein.  Aber was ist mit den Verteilungen der eigentlichen Datenpunkte. Und wie groß darf die Störgröße sein  im Verhältnis zu dem Wert ohne Fehler? Kann ich also beliebig N(0,1) bis N(0,100) verteilte Residuen betrachten, egal welcher Verteilung die Datenpunkte selbst unterliegen?

Bezug
                        
Bezug
Datenerzeugung für Regression: Antwort
Status: (Antwort) fertig Status 
Datum: 16:44 Sa 21.01.2006
Autor: BAGZZlash

Also mit "verteilten", d.h. stochastischen Regressoren wäre ich ganz vorsichtig. Im allgemeinen dürfte aber das Fitting der Regression sich nicht an der absoluten Größe der Residuen messen lassen, dazu gibt's ja standardisierte Gütemaße wie das (korrigierte) Bestimmtheitsmaß.

Bezug
Ansicht: [ geschachtelt ] | ^ Forum "Uni-Stochastik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
ev.vorhilfe.de
[ Startseite | Mitglieder | Impressum ]