Mathematik: Wahrscheinlichkeit

Gehört zu Mathematik
Siehe auch: Wellenmechanik

Stand: 06.10.2024

YouTube-Video von Edmund Weitz: https://youtu.be/BYUKbEXXmG4?feature=shared

Die die Anfänge der Wahrscheinlichkeitstheorie stammen wohl aus der Spieltheorie z.B. Würfelspiele etc.

In der klassische Definition hat man:

  • Eine Menge von Elementarereignissen Ω, die alle gleich wahrscheinlich sein sollen
  • Ein Zufallsexperiment bei dem ein Element x ∈ Ω gezogen wird.
  • Man definiert eine Teilmenge A ⊂ Ω.
  • Dann fragt man sich, mit welcher Wahrscheinlichkeit das gezogene Element in der Teilmenge A liegen wird.

Anzahl “günstige” Fälle / Anzahl aller möglichen Fälle

Als Formel:

\( P(A) = \Large\frac{|A|}{|Ω|}  \\ \)

Das ist die sog. Laplace-Wahrscheinlichkeit.

Solange die Menge Ω endlich ist funktioniert das ja bestens.

Man nennt diese Sichtweise auch die “frequentistische”. Da geht es also um relative Häufigkeiten und wiederholbare Versuche, die langfristig sich der “wahren” Wahrscheinlichkeit annähern.

Axiomatische Wahrscheinlichkeitstheorie

Andrei Nikolajewitsch Kolmogorow (1903-1987) hat die Wahrscheinlichkeitsrechnung axiomatisch aufgebaut.

Sei Ω eine beliebige nicht leere Menge und P eine Funktion (Abbildung), die Teilmengen von Ω eine reelle Zahl zuordnet.
Eine Teilmenge von A ⊂ Ω nennen wir auch ein “Ereignis” und die zugeordnete Zahl P(A) die “Wahrscheinlichkeit” des Ereignisses A.

  1. Für alle Ereignisse A ist P(A) ≥ 0
  2. Die Wahrscheinlichkeit des sicheren Ereignisses Ω ist P(Ω) = 1
  3. Wenn wir zwei Ereignisse A und B betrachten, die “unvereinbar” sind; soll heissen A ∩ B = Ø, dann gilt:
    P(A ∪ B) = P(A) + P(B)

Problematisch wird das, wenn die Grundmenge Ω überabzählbar ist. Dann kann man nicht jeder Teilmenge A ⊂ Ω eine reelle Zahl P(A) zuordnen, so dass die obigen Axiome erfüllt sind. Der Definitionsbereich der Funktion P muss dann etwas “trickreicher” definiert werden, was man mit Hilfe der Maßtheorie hinbekommt (Stichwort: σ-Algebra).

Bedingte Wahrscheinlichkeit

Die Wahrscheinlichkeit für das Eintreten von A unter der Bedingung, dass das Eintreten von B bereits bekannt ist schreibt man als: P(A|B).

\( P(A|B) = \Large\frac{P(A \, \cap \, B)}{P(B)} \)

Aufgepasst: die Ereignisse A und B können zeitlich in beliebiger Reihenfolge eintreten. Ein Kausalzusammenhang ist erst recht nicht gemeint.

Wahrscheinlichkeit nach Thomas Bayes

Man nennt diese bisherigen Betrachtungen auch die “frequentistisch”. Da geht es also um relative Häufigkeiten und wiederholbare Versuche, die langfristig sich der “wahren” Wahrscheinlichkeit annähern.

Wir beginnen mal mit der “Bedingten Wahrscheinlichkeit” von oben. Man kann die Formel dafür auch anders schreiben:

\( P(A|B) = \Large \frac{P(B|A) P(A)}{P(B)} \)

Dieses wird auch genannt “Satz von Bayes“.

Wenn ein Ereignis nicht wiederholbar ist, versagt die frequentistisch Definition von Wahrscheinlichkeit.

Beispiele:

  • “Die Inflation wird im nächten Jahr mehr als 2% sein”
  • “Wie wahrscheinlich ist ein Wahlsieg des ehemaligen Präsidenten?”
  • “Wie hoch ist morgen die Regenwahrscheinlichkeit?”

Hier wird der Begriff “wahrscheinlich” umgangssprachlich verwendet – so in etwa in dem Sinne:

Wahrscheinlichkeit ist ein Maß für die Sicherheit der (persönlichen) Einschätzung eines Sachverhalts.

Wahrscheinlichkeiten in diesem Sinne werden auch vergleichend (“komperativ”) gebraucht:  “Die Wahrscheinlichkeit für Regen morgen ist höher als für Regen übermorgen”.

Insofern könnte man eine so gemeinte Wahrscheinlichkeit auch sinnvoll durch eine Zahl zwischen Null und Eins ausdrücken. Man muss dieses o.g. “Maß” also irgendwie quantifizieren.

Für so eine Quantifizierung der Bayesschen Wahrscheinlichkeit gibt es zwei Ansätze.

Ansatz 1: de Finetti

Die Idee ist, dass man Gewissheit durch eine Art Wette quantifizieren kann.

Zu jedem Ereignis A, dem ich eine Wahrscheinlichkeitszahl zuordnen will mache ist ein Los, für das der Käufer einen “Gewinn” von 1 Euro von mir bekommt, wenn das Ereignis A eintrifft. Die Frage ist, zu welchem Preis ich so ein Los verkaufen würde. Dieser Preis, den ich festlege ist so etwas wie die von mir (subjektiv) eingeschätzte Sicherheit/Wahrscheinlichkeit mit der ich glaube, dass das Ereignis eintreten wird.

Ich muss zu diesem Preis (oder höher) verkaufen, wenn ein Käufer das anbietet; ich muss zu diesem (oder einem niedrigeren) Preis selber (zurück)kaufen, wenn ein Verkäufer das von mir verlangt.

Ansatz 2: Erweiterung der klassische Logik

Nachwievor arbeiten wir mit Aussagen die entweder (ganz) wahr oder (ganz) falsch sind, wir wissen es nur nicht genau. Daher ordnen wir solchen Aussagen Plausibilitäten zu (auf Grund von Tatsachen, die wir kennen).

Im Prinzip betrachten wir nicht allein Aussagen, sondern Kombinationen von Aussagen und Informationsständen und schreiben als Plausibilität von A bei einem Informationsstand I:

(A,I) ∈ [0,1]

Wobei das eine reelle Zahl zwischen o und 1 sein soll und bei gleichem A und gleichem I auch (A,I) immer gleich sein soll (Plausibilitäsroboter – also nicht subjektiv).

Das ganze soll nicht der Aussagenlogik widersprechen, was wir in einfachen Axiomen hinschreiben könnten.

Mathematik: Äquivalenzrelation

Gehört zu: Mathematik
Siehe auch: Gruppentheorie
Benutzt: Latex-Plugin für WordPress

Stand: 10.09.2023

Eine Äquivalenzrelation

Bei meiner Beschäftigung mit der Gruppentheorie bin ich auf das klassische Thema Äquivalenzklassen gestoßen.

Eine Äquivalenzrelation in der Mathematik ist ersteinmal eine “Relation”. Dann soll diese Relation inetwa die Eigenschaften haben, die wir von der klassischen Äquivalenz her kennen: Gleichheit oder Ungleichheit.

Allgemein: Was ist eine Relation?

Auf einer Menge M können wir eine Relation R einfach definieren als eine Teilmenge der geordneten Paare. Also

\( R \subseteq M \times M \\\)

So eine Relation wird dann Äquivalenzrelation genannt, wenn sie noch zusätzlich drei wichtige von der Gleichheitsrelation bekannten Eingenschaften besitzt: reflexiv, symmetrisch, transitiv.

Reflexiv: \( (a,a) \in R \text{ für alle } a \in M \\\)

Symmetrisch:  \( \text{Wenn } (a,b) \in R \text{ dann ist auch } (b,a) \in R \\\)

Transitiv: \( \text{Wenn } (a,b) \in R \text{ und } (b,c) \in R \text{ dann ist auch } (a,c) \in R \\\)

Wenn es aus dem Kontext klar ist, welche Relation gemeint ist, schreibt man auch einfach: \( a \sim b\text{  für } (a,b) \in R \)

Äquivalenzklassen

Wenn ich eine Äquivalenzrelation R auf einer Menge M habe, kann ich damit zu jedem Element m ∈ M eine Teilmenge von M definieren:

\( [m]_R =  \{ x \in M \,|\, (m,x) \in R \} \\\)

Diese Teilmenge nennt man Äquivalenzklasse von m (bezüglich der Relation R auf M). Wenn man zwei Äquvalenzklassen betrachtet, sind diese entweder identisch oder disjunkt.
Da jedes Element der Menge M auch in einer (genau einer) Äquivalenzklasse vorkommt, bilden die Äquivalenzklassen also eine (disjunkte) Partition von M.

Faktor-Mengen

Wenn wir die Menge der Äquivalenzklassen betrachten ist aus unserer ursprünglichen Relation dort die Gleichheitsrelation geworden.
Die Menge der Äquivalenzklassen zu einer Relation R über M bezeichnet man auch als Faktor-Menge oder Quotienten-Menge und schreibt:

\( M/R = \{ [m]_R \,|\,  m \in M \} \\ \)

Beispiele von Konstruktionen mit Hilfe von Faktormengen

Generell kann man mit diesem Mechanismus viele interessante mathematische Gebilde konstruieren…

Die Menge der ganzen Zahlen: \( \mathbb{Z} = (\mathbb{N}^2 \times \mathbb{N}^2) / R_1 \)
Wobei die Relation R1 definiert wird als: (n1, n2) ∼ (m1, m2) genau dann wenn n2 + m1 = m2 + n1

Die Menge der rationalen Zahlen: \( \mathbb{Q} = (\mathbb{Z}^2 \times \mathbb{Z}^2) / R_2 \)
Wobei die Relation R2 definiert wir als: (n1, n2) ∼ (m1, m2) genau dann wenn n2 · m1 = m2 · n1

Äquivalenzklassen in der Gruppentheorie

In der Gruppentheorie kann man mittels einer Untergruppe H einer Gruppe G sog.  “Cosets” zu jedem Element g aus G bilden:

\(  gN = \{ x \in G \, | \, \exists h \in H \text{ with } x = g \cdot h \} \\\)

Diese Cosets (deutsch: Nebenmengen) bilden eine disjunkte Überdeckung der Gruppe G.

Ich kann mir auch ganz einfach eine Äquivalenzrelation R definieren, die diese gleichen Nebenmengen als Äquivalenzklassen erzeugt. Dazu muss ich nur definieren, wann zwei Elemente x und y aus G  zueingabder in Relation stehen sollen…

Ich versuche es einmal mit: \( R = \{ (x,y) \, | \, \exists h \in H : h\cdot x = h \cdot y \} \\ \)

Ist das wirklich eine Äquivalenzrelation (1) und erzeugt sie tatsächlich die gewünschen Äquivalenzklassen (2)?

Ad (1): Als Äquivalenzrelation wäre zu überprüfen:

Reflexivität; d.h. ist (x,x) immer in R? Offensichtlich stimmt das.

Symmetrie: d.h. wenn (x,y) in R liegt, liegt dann auch (y,x) in R?

Wenn demnach (x,y) in R liegt, existiert ein h in H sodass hx = hy. Dann ist mit dem gleichen h aus H auch hy = hx. Also ist R symmetrisch.

Transitivität:

Wenn (x.y) und (y,z) in R liegen, so heisst das: Es gibt ein h1 und ein h2 in H sodass gilt: h1 x = h1 y und h2 y = h2 z.
Man könnte es mit h = h1 h2 versuchen, was bei einer kommutativen (abelschen) Gruppe funktionieren würde…

Vertiefung

YouTube-Video:https://www.youtube.com/watch?v=E8gItS9vGKg

YouTupe-Video zum Tensor-Produkt:https://www.youtube.com/watch?v=KnSZBjnd_74

Astronomie: Sphärische Trigonometrie

Gehört zu: Mathematik
Siehe auch: Tägliche Bewegung der Gestirne, Diagramme, Tageslänge, Koordinatensystem
Benötigt: WordPress Latex-Plugin, WordPress Plugin Google Drive Embedder

Was ist Sphärische Trigonometrie?

Die Ebene Trigonometrie ist die Lehre von den Dreiecken in der Ebene.

Die Sphärische Trigonometrie ist die Lehre von den Dreiecken auf einer Kugeloberfläche. Solche Dreiecke werden durch Abschnitte von Großkreisen gebildet.

Das Polar-Dreieck auf der Himmelskugel

Zur Umrechnung eines Koordinatensystems in ein anderes zeichnet man sich ein sog. Polar-Dreieck, in dem die “Pole” (“Drehpunkte”) beider Koordinatensysteme vorkommen.

Zur Umrechnung der äquatorialen Koordinaten Deklination (δ) und Stundenwinkel (t) in die horizontalen Koordinaten Höhe (h) und Azimuth (A) wird das sog. Polar-Dreieck wird gebildet durch den Himmelspol (N), den Zenit (Z) und ein Himmelsobjekt (O).

Im Polardreieck sind die Abstände (Bogenlängen):

  • vom Himmelspol zum Zenit: 90° – φ
  • vom Himmelspol zum Himmelsobjekt: 90° – δ
  • vom Zenit zum HImmelsobjekt: z = 90° – h

Im Polardreieck sind die Winkel an den Ecken des Dreiecks:

  • Winkel am Himmelspol: Stundenwinkel t (oder τ)
  • Winkel am Zenith: 180°  – A   (A = Azimuth von Süden)

Abbildung 1: Das Polardreieck (Google Drive: polardreieck.svg)

polardreieck.svg

Polardreieck

Link: https://de.wikibooks.org/wiki/Astronomische_Berechnungen_f%C3%BCr_Amateure/_Druckversion#Koordinatentransformationen

MIt dem Seiten-Cosinussatz errechnet man den Cosinus der Länge einer Seite aus den Längen der beiden anderen Seiten und dem gegenüberliegenden Winkel:
\(\cos z = \cos (90° – \phi) \cos (90° – \delta) + \sin (90° – \phi) \sin (90° – \delta) \cos t\)

Was schließlich heisst:
\(\sin h = \sin \phi \sin \delta + \cos \phi \cos \delta \cos t \)

Der Cotangens-Satz im Polardreieck sagt:

\(   \cos (90° – \phi)  \cos t = \sin(90° – \phi) \cot (90° – \delta) – \sin t \cot(180° – A)  \)

Trigonometrisch umgeformt ergibt das:
\(  \sin \phi \cos t = \cos \phi \tan \delta – \Large\frac{\sin t}{\tan A}  \)

Aufgelöst nach A ergibt sich:

\(   \tan A = \Large\frac{\sin t}{\sin \phi \cos t – \cos \phi \tan \delta} \)

MIt Hilfe dieser Koordinatentransformation kann man für jedes bekannte Himmelsobjekt (Deklination und Rektaszension) die scheinbare tägliche Bewegung am Himmel berechnen – siehe dazu: Die scheinbare tägliche Bewegung der Gestirne.

Großkreise auf einer Kugel

Wenn ich im obigen Polardreieck h=0 setze, erhalte ich einen gekippten Großkreis (oBdA setze ich t = λ).

\(\Large \frac{\sin{\delta}}{\cos{\delta}} = – \frac{\cos{\varphi}}{sin{\varphi}} \cdot \cos{\lambda}  \)

Abbildung 2: Beispiel eines Großkreises auf der Erde (Google: xyz)

grosskreis-01.svg

Großkreis auf der Erdoberfläche

Bei der Seefahrt bezeichnet man die Navigation auf einem Kurs entlang eines Großkreises als “Orthodrome” (Gegensatz: Loxodrome).

Mehr dazu: https://www.navigareberlin.de/onewebmedia/Grosskreisnavigation%20Ver%C3%B6ffentlichung.pdf

Metrik auf einer Kugeloberfläche

Für eine Kugel mit dem Radius r kann ich auf der Kugeloberfläche (z.B. Erdoberfläche) ein Koordinatensystem (s.o.) benutzen:

  • Koordinatensystem (λ, \( \varphi \))
  • wobei im Bogenmass: \( \Large -\frac{\pi}{2} < \varphi < \frac{\pi}{2} \)
  • und auch im Bogenmass: \( \Large 0 \leq \lambda < 2\pi \)

Zur Messung von Abständen (Längen) benötige ich ein LInienelement:

\(\Large ds^2 = r^2 d \varphi^2 + r^2 \cos{\varphi}^2 d\lambda^2 \)

Die kürzeste Verbindung zweier Punkte liegt dann auf einem sog. “Großkreis” (s.o.).

Beispiel 1 (gerade)

Die Strecke von (0.0) nach (π, 0); das ist ein halber Erdumfang am Äquator) müsste eine Länge von π r haben. Da auf der ganzen Strecke φ konstant =0 ist, ist auch dφ = 0 und es  ergibt sich als Längenintegral:

\( \Large s = r \int\limits_{0}^{\pi} d \lambda = r \cdot \left[ \lambda \right]_0^\pi  = \pi \cdot r\)

Beispiel 2 (gerade)

Die Strecke von (0,0) nach (0, π/2) ist ein Viertel Erdumfang vom Äquator zum Nordpol (ein sog. Quadrant) die Länge müsste also \(r \frac{\pi}{2} \) sein. Da auf der ganzen Strecke λ konstant =0 ist, ist auch dλ=0 und es ergibt sich als Längenintegral:

\( \Large s = r \int\limits_{0}^{\frac{\pi}{2}} d \varphi = r \cdot \left[ \varphi \right]_0^{\frac{\pi}{2}}  = r \cdot \frac{\pi}{2}\)

Beispiel 3 (schräg)

Aus dem obigen “Polardreieck” wird das “nautische Grunddreick“, wo wir wieder den Seiten-Cosinussatz anwenden können, um die Distanz zu berechnen. Die Distanz d zwischen einem Ausgangspunkt \( A = (\lambda_A, \varphi_A) \) zu einem Endpunkt \( B = (\lambda_B, \varphi_B) \) können wir also berechnen als:

\(\Large \cos{d} = \sin{\varphi_A} \sin{\varphi_B} + \cos{\varphi_A} \cos{\varphi_B} \cos{(\lambda_B – \lambda_A)} \ \\ \)

Die Strecke von (0, π/3) nach (π, 0) läuft jetzt “schräg” über unser Koordinatensystem…

\(\Large \cos{d} = \sin{\frac{\pi}{3}} \sin{0} + \cos{\frac{\pi}{3}} \cos{0} \cos{\pi}\)

Das ergibt: \( \Large \cos{d} = \frac{1}{2}\sqrt{3} \cdot 0 + \frac{1}{2} \cdot 1 \cdot (-1) = -\frac{1}{2} \\\ \)

und damit ist die gesuchte Distanz  \( d = \frac{2}{3} \pi \)

Um diese Distanz aus unserem Linienelement zu ermitteln, müssen wir das Linienelement entlang des Bogens von A nach B integrieren.

Dafür wollen wir den Weg zuerst als Funktion \( \varphi = f(\lambda) \) aufschreiben.