www.vorhilfe.de
- Förderverein -
Der Förderverein.

Gemeinnütziger Verein zur Finanzierung des Projekts Vorhilfe.de.
Hallo Gast!einloggen | registrieren ]
Startseite · Mitglieder · Impressum
Forenbaum
^ Forenbaum
Status VH e.V.
  Status Vereinsforum

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Suchen
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
Forum "Wahrscheinlichkeitstheorie" - Abhängigkeit zw. zwei Zahlen
Abhängigkeit zw. zwei Zahlen < Wahrscheinlichkeitstheorie < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "Wahrscheinlichkeitstheorie"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Abhängigkeit zw. zwei Zahlen: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 21:30 Mo 16.02.2009
Autor: Mafiose

Hallo @all,

ich versuche so eine Art Bewertung für Abhängigkeiten zwischen 2 Zahlen darzustellen.
zum Beispiel man hat einen Beobachteten Wert : 10 Stück und einen Erwarteten/Zufälligen Wert: 9 STück. Das bedeutet, dass von den 10, 9 zufällig enstanden sind. man könnte die Abhängigkeit so ausdrücken: 9/10 = 0.9. Einer war also nicht Zufällig. Wenn ich jetzt Beobachtet: 10.000 st. und Erwartet/Zufällig 9.000 habe, dann 9.000/10.000 = 0.9. Die Abhängigkeit  ist bei beiden 0.9, aber im 1 Beispiel ist 1 stück von 10 nicht Zufällig und im 2ten 1.000.
Also müsste eigentlich ja bei zweiten die Abhängigkeit kleiner als 0.9 sein....WEnn ich zum Beispiel nach WErten suche, die Abhängigkeit < 0.9 haben sollen, dann verliere ich die aus dem 2ten Beispiel obwohl dieser WErt eigentlich interessant wäre (1.000 Stück waren ja nicht zufällig).

hat vielleicht eine Idee nach welchem Verfahren man die Abhängigkeit zwischen 2 Zahlen berechnen kann?

        
Bezug
Abhängigkeit zw. zwei Zahlen: Antwort
Status: (Antwort) fertig Status 
Datum: 22:31 Mo 16.02.2009
Autor: leduart

Hallo
Vielleicht sagst du lieber genauer, um was fuer Zahlen es sich handelt.
Was du angibst mit den 0,9 ist welcher Anteil der gezaehlten erwartet wurde. und deine Aussage ist 90% oder 0,9
das ist natuerlich dasselbe beii 90 und 100, 900 und 1000 usw.
wie bei Zinsen: einbezahlt 100 Zinsen 3 also 3% eingezahlt 1000 Zinsen 30 also 3%
wenn du dein erstes "Experiment" 10 und 9  1000 mal wiederholen wuerdest mit immer demselben Ergebnis haettest du doch auch 9000 und 10000.
Also sag genau, um was es sich handelt.
Man kann nicht sagen Zahlen sind abhaengig, man kann nur sagen 2 Messwerte sind abhaengig  oder so aehnlich. Zahlen sind einfach nur Zahlen.
Gruss leduart


Bezug
                
Bezug
Abhängigkeit zw. zwei Zahlen: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 11:25 Di 17.02.2009
Autor: Mafiose

Hi leduart,

ich versuch mal zu erklären...
Ich habe ein Programm, was mir aus festgelegten Buchstaben Zufällige Texte erzeugt. Danach füge ich bestimmt Wörter selbst in den Text ein. In diesem Text zähle ich dann wie oft ein bestimmtes Wort vorkommt. z.B "hallo" 10 mal. Dann errechne ich anhand der Häufigkeit der Buchstaben im Text und in dem Wort, wie oft ich dieses Wort zufällig erwarten würde. z. B. 9 mal. Jetzt suche ich in den Texten genau nach den Wörtern, die ich selbst dort eingefügt habe.
Für Beispiel 1.
Das bedeutet für mich dann, dass von den 10 gefundenen 1 wahrscheinlich der ist, den ich eingefügt habe. also habe ich für das Wort "hallo" zufälligkeit von 90%
Wenn ich jetzt für "hallo" 1.000 und 900 habe, dann ist die Zufälligkeit. auch 90%, aber in diesen 1.000 stecken 100 wörter, die ich suche.
Am Ende sage ich dann, ich will nur die Wörter betrachten, die eine Zufälligkeit < 50% haben. Der erste Beispiel ist uninteressant für mich, da der wert 10 keine Aussagekraft hat, weil die Zufälligkeit 90% beträgt. Im 2ten Beispiel ist die Zufälligkeit 90%, aber da stecken 100 Wörter, die würde ich verlieren.

Ich bräuchte so eine Art Gewichtung der Wörter, die ich finde. Je nachdem wie zufällig die im Text vorkommen.



Bezug
                        
Bezug
Abhängigkeit zw. zwei Zahlen: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 16:00 Mi 18.02.2009
Autor: Mafiose

hm...und keine Idee?

vlt. sollte ich vorher prüfen wie die Daten verteilt sind...

Bezug
                                
Bezug
Abhängigkeit zw. zwei Zahlen: Antwort
Status: (Antwort) fertig Status 
Datum: 16:38 Mi 18.02.2009
Autor: leduart

Hallo
Ich versteh leider nicht was du tust.
Beispiel hallo.
wenn du nur die buchstaben h a l o eingibst kannst du leicht ausrechnen, wie oft hallo vorkommt, wenn du ausserdem die Laenge der erzeugten worte kennst oder entsteht ein Text an einem Stueck wie hhlohohaloloohhhallolloh usw?
wieso steckst du da noch eigene hallos rein? was gibt dir das mehr an Auskunft als nur die zufaelligen hallo zu zaehlen.
, am Ende kennst du doch immer die Zahl der reingesteckten und der zufaelligen?
Wenn du einfach aus einem langen zufaelligen Text nur einen Ausschnitt waehlst, kannst du mit Hilfe von statistischer auswertung sagen, wie etwa die Gesamtanzahl im Text ist.
also irgendwie versteh ich dein 9,1 und dein 900, 10000 noch immer nicht.
Vielleicht schilderst du dein Projekt noch genauer, Ziel, Hypothese, die du zeigen oder widerlegen willst usw.

Gruss leduart

Bezug
                                        
Bezug
Abhängigkeit zw. zwei Zahlen: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 17:56 Mi 18.02.2009
Autor: Mafiose


Die gesuchten Wörter dürfen auch einen Fehler enthalten.
z.B.
Text:
wwHOLLOwascaökkkkafsäqoqkjcnetiiohaljeofassfasdqhahafsadf
fdsyclkvnmnettaqyxHOLLOcvcxvnasdDALLOfqqweeqweasdsdsadfkjkhzsdf
usw...
Suchwort: hallo mit 1 Fehler.

Ergebnis 1:
Gefunden: 10 mal an position 3, position 22 usw..
Erwarte durch die Kombi von Buchstaben das Wort "hallo" 9 mal zufinden.
d.h. alle gefundene Wörter erhalten eine Gewichtung von 9/10 = 0.9
das Bedeutet, dass die gefundene Wörter für mich uninteressant sind, da 9 von 10 wahrscheinlich zufällig erzeugt sind.

anderer Ergebnis
Gefunden: 10 mal an position 3, position 22 usw..
Erwarte durch die Kombi von Buchstaben das Wort "hallo" 1 mal zufinden.
d.h. alle gefundene Wörter erhalten eine Gewichtung von 1/10 = 0.1
das Bedeutet das 9 von 10 wahrscheinlich z.B biologisch relevant sind.

Ich könnte also definieren, alle gefundene Wörter mit der Gewichtung < 0.7  sind für meine weitere Berechnungen interessant, weil da weniger zufall mitspielt.

wenn ich die Gewichtung so wähle wie oben beschrieben, dann würde ich bei so einem Erg. die Information verlieren.
Ergebnis 3
Gefunden: 1000 mal an position 3, position 22 usw..
Erwarte durch die Kombi von Buchstaben das Wort "hallo" 900 mal zufinden.
d.h. alle gefundene Wörter erhalten eine Gewichtung von 900/1000 = 0.9
mit dem Kriterium <0.7 würden diese Wörter wegfallen.
Aber in den 1000 sind wahrscheinlich 100 Wörter nicht zufällig.
Ich möchte aber möglichst viele Wörter finden, die wahrscheinlich nicht zufällig sind.


Hintergrund: Die Wörter, die nicht zufällig erzeugt wurden, könnten z.B biologisch gesehen etwas bewirken.
Mir geht es dadrum nicht rauszufinden welche Wörter jetzt zufällig im Text sind und welche nicht, sondern einfach nur den gefundenen Wörtern eine Gewichtung geben, was mir dann sagt wie  Zufällig dieses Wort ist.




Bezug
                                                
Bezug
Abhängigkeit zw. zwei Zahlen: Antwort
Status: (Antwort) fertig Status 
Datum: 22:22 Mi 18.02.2009
Autor: leduart

Hallo
Anscheinend suchst du Worte in einem genetischen Code?
warum sagst dus dann nicht.
Woher kennst du die Wahrscheinlichkeit fuer das zufaellige auftreten?
wenn deine Sequenz 100 lang ist und du 10 mal das richtige findest oder wenn sie 1000*100=100000 lang ist und du 1000 findest ist die wahrscheinlichkeit, dass 100 nicht zufaelig sind nicht so viel groesser. Du musst einen sogenannten "Signifikanztest" machen, der gibt dir dann ,nachdem du ne Schranke angegeben hast, (oft 95%) ob die 100 signifikant sind oder nicht.
Das hier zu erklaeren, dauert aber zu lange. Wieviel Statistik kannst du denn?
Gruss leduart

Bezug
                                                        
Bezug
Abhängigkeit zw. zwei Zahlen: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 23:57 Mi 18.02.2009
Autor: Mafiose

einen statistischen Test habe ich schon überlegt.
Chi-Quadrat würde gehen wenn ich 4 Felder angebe z. B. so
gefunden; nicht gefunden;
zufällig gefundne; zufällig nicht gefunden;

die Werte für nicht gefunde errechne ich so: Anzahl aller Möglichen - Anzahl gefundene. Dann kann ich bei Freiheitsgrad 1, ich glaube das ist der 3.84 Wert, gucken welche signifikant sind und welche nicht.
Bei kleineren Werten < 5 müsste ich glaub ich Fischer Test nehmen.
Es gibt ja auch student Test. Also so wirklich weiß ich nicht welchen Test ich da anwenden soll. Müsste man nicht vorher prüfen wie die Daten verteilt sind?


Bezug
                                                                
Bezug
Abhängigkeit zw. zwei Zahlen: Antwort
Status: (Antwort) fertig Status 
Datum: 10:57 Do 19.02.2009
Autor: vivo

Hallo,

was Du da aufzählst sind verschiedene Verteilungen ... Deshalb hast Du dir in deinem letzten Satz die Frage selbst beantwortet.

Kennst Du denn die Verteilung?

Gruß

Bezug
                                                                        
Bezug
Abhängigkeit zw. zwei Zahlen: Frage (reagiert)
Status: (Frage) reagiert/warte auf Reaktion Status 
Datum: 15:48 Fr 20.02.2009
Autor: Mafiose

das ist ja das Problem. Ich weiß nicht wie die verteilt sind.
die Länge des Textes ist nicht konstant und die Anteile von Buchstaben sind immer verschieden. Ein Histogram könnte ich ja erst zeichnen wenn ich mehrere Texte betrachte. Ich brauche aber jeweils für einen Text.
Wenn der Text aus z.B 6 unterschiedlichen Buchstaben besteht, kann ich daraus irgendwie die Verteilung rausfinden?



Bezug
                                                                                
Bezug
Abhängigkeit zw. zwei Zahlen: Antwort
Status: (Antwort) fertig Status 
Datum: 16:09 Fr 20.02.2009
Autor: leduart

Hallo
Manchmal sprichst du von Text, manchmal von biologie.
Kannst du nicht mal sagen, um was es sich genau handelt?
Wie kommen die "Texte" zustande? wer oder was bestimmt die Anzahl der Buchstaben? sind alle Buchstaben gleichverteilt usw.
Du stellst ein voellig undefiniertes System vor, weil du nie wirklich sagst, um was es geht.
Wenn das geheim bleiben soll ok, aber dann erwart keine antworten.
Gruss leduart

Bezug
                                                                                        
Bezug
Abhängigkeit zw. zwei Zahlen: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 17:06 Fr 20.02.2009
Autor: Mafiose

hehe :) sorry..dachte mit Texten wäre es einfacher zu verstehen.
du hast ja schon gesagt das es um Genome geht.
Es geht um Dnasequenz und Proteinsequenz.
Beim Dna wären die Buchstaben: A, C, G, T und bei Proteinen von A bis Z.
Ich suche einfach nach bestimmten Kombinationen von den Buchstaben in einer Dna oder Proteinsequenz. Danach rechne ich aus wieviel ich erwarte Zufällig zu finden. Am Ende habe ich 2 Werte...einer sagt aus:
es gibt von der [mm] Kombination_1: [/mm] 10 Stück.
Zweiter Wert sagt aus, die gefundenen [mm] Kombinationen_1 [/mm] sind 9 Stück wahrscheinlich zufällig enstanden. (Wie das berechnet wird, möchte ich nicht verraten). Ich suche danach alle Kombinationen deren Unterschied zwischen den beiden Werten möglichst groß ist.

Dazu wollte ich eine Gewichtung für jede Kombinationen ausdenken.
Dabei sollte z.B. solche 10 gefunden, 9 zufällig,100 gefunden 99 zufällig  ausgefiltert werden und 100 gefunden, 90 zufällig angezeigt werden.

Bezug
                                                                                                
Bezug
Abhängigkeit zw. zwei Zahlen: Antwort
Status: (Antwort) fertig Status 
Datum: 19:02 Fr 20.02.2009
Autor: leduart

Hallo
Du willst offensichtlich damit gewichten, wie signifikant die "nicht zufaelligen Werte sind. Dazu musst du aber die Wahrscheinlichkeitsverteilung deiner Buchstaben oder Worte angeben. Sicher ist, dass je groesser deine Menge ist, aus der du die Dinger raussuchst, desto signifikanter wird eine 10% Abweichung vom Erwartungswert. damit ist richtig, dass das Verhaeltnis kein gutes Mass ist. Du musst also deine Verteilungsfkt ansehen und einen dazu passenden Signifikanztest machen. Das ist dann deine charakteristische Groesse, die du denke ich suchst.
Gruss leduart

Bezug
                                                                                                        
Bezug
Abhängigkeit zw. zwei Zahlen: Frage (überfällig)
Status: (Frage) überfällig Status 
Datum: 08:53 Mi 25.02.2009
Autor: Mafiose

jepp. genau das suche ich :)

hm..könntest du mir einen Tipp geben wie ich rausfinden kann welcher Wahrsch.verteilung die Kombinationen unterliegen?


Bezug
                                                                                                                
Bezug
Abhängigkeit zw. zwei Zahlen: Fälligkeit abgelaufen
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 09:20 Fr 27.02.2009
Autor: matux

$MATUXTEXT(ueberfaellige_frage)
Bezug
Ansicht: [ geschachtelt ] | ^ Forum "Wahrscheinlichkeitstheorie"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
ev.vorhilfe.de
[ Startseite | Mitglieder | Impressum ]