Mathematik: Metrik, Abstand und Geometrie

Gehört zu: Mathematik
Siehe auch: Krümmung, Vektorraum

Metrik, Abstand und Geometrie

Auf einer Menge M kann man eine Metrik definieren; dadurch dass man je zwei Punkten einen Abstand (relle Zahl >= Null) zuordnet.

d: M x M -> R

So eine Abstandsfunktion muss drei Axiome erfüllen, um Metrik genannt werden zu dürfen.

Oft ist den Beispielen die Menge M ein Vektorraum z.B. R2 oder R3.

Mit Hilfe einer solchen Metrik kann man eine ganze “Geometrie” definieren, also ein Regelwerk für Punkte, Geraden, Winkel, Dreiecke etc. Klassisch ist die Geometrie nach Euklid; andere Geometrien bezeichnet man als “Nicht-Euklidische Geometrie”…

Euklidische Geometrie

In der sog. Euklidischen Geometrie wird der Abstand im zweier Punkte im Raum (also die Metrik) durch den Satz des Pythagoras definiert.

Zur Berechnung des Abstands zweier Punkte verwenden wir ein Koordinatensystem z.B.  im R3 eine x-Achse, eine y-Achse und eine z-Achse:

\( d((x_a,y_a,z_a),(x_b,y_b,z_b)) = \sqrt{(x_b-x_a)^2 + (y_b-y_a)^2 – (z_b-z_a)^2} \\\  \)

Dieser Abstand ist auch die Länge der geraden Strecke zwischen den Punkten a und b.

Im allgemeinen Fall nehmen wir eine parametrisierte Kurve α: [a,b] -> Rn  und definieren als Länge L der Kurve α:

\( L_\alpha(a,b) = \int_a^b ||\alpha^\prime(t)|| dt \\\ \)

Wir können zeigen, dass diese Längendefinition für Kurven mit der Metrik für Punktabstäde im Euklidischen Raum überein stimmt (ohne Beschänkung der Allgemeinheit: t ∈ [0,1]):

\( \alpha(t) = \left( \begin{array}{c} x_1 + (x_2-x_1) \cdot t \\\ y_1 + (y_2-y_1)\cdot t  \\\  z_1 + (z_2-z_1)\cdot t\end{array}\right)  \\\  \)

Die erste Ableitung ist:

\( \alpha^\prime(t) = \left( \begin{array}{c} (x_2-x_1)  \\\ (y_2-y_1) \\\  (z_2-z_1) \end{array}\right)  \\\  \)

Die Norm der Ableitung ist dann:

\( || \alpha^\prime(t) || = \sqrt{(x_2-x_1)^2 + (y_2-y_1)^2 + (z_2-z_1)^2} \\\ \)

Wenn wir das in die obige Längendefinition einsetzen erhalten wir:

\( L_\alpha(a,b) = \int_a^b ||\alpha^\prime(t)|| dt = \sqrt{(x_2-x_1)^2 + (y_2-y_1)^2 + (z_2-z_1)^2}  \int_0^1 dt  = \sqrt{(x_2-x_1)^2 + (y_2-y_1)^2 + (z_2-z_1)^2}  \\\ \)

Die Länge einer geraden Strecke ist also auch mit der allgemeinen Integral-Formel genauso wie nach Pythagoras oben.

Das Linienelement

Gerne verwendet man auch ein sog. Linienelement um eine Metrik zu definieren. Für die Euklidische Metrik im dreidimensionalen Raum mit einem Chartesischen Koordinatensystem (x,y,z) haben wir das Linienelement:

\( ds^2 = dx^2 + dy^2 + dz^2 \\\  \)

Was ergibt:

\( ds = \sqrt{dx^2 + dy^2 + dz^2} \\\  \)

Was für eine parametrisierte Kurve s: [a,b] -> R3 bedeutet:

\( \Large \frac{ds}{dt} = \sqrt{(\frac{dx}{dt})^2 + (\frac{dy}{dt})^2 + (\frac{dz}{dt})^2} \\\  \)

Was als Kurvenlänge von t=a bis t=b ergibt:

\( \Large L(a,b) = \int_a^b \sqrt{(\frac{dx}{dt})^2 + (\frac{dy}{dt})^2 + (\frac{dz}{dt})^2} dt \\\  \)

Wenn man nun bedenkt dass:

\( s^\prime = \frac{ds}{dt} = \left( \begin{array}{c} \frac{dx}{dt}  \\\ \frac{dy}{dt} \\\  \frac{dz}{dt} \end{array}\right) \\\  \)

ist, ergibt sich die Norm zu:

\( || s^\prime || = \sqrt{(\frac{dx}{dt})^2 + (\frac{dy}{dt})^2 + (\frac{dz}{dt})^2} \\\ \)

Eingesetzt ergibt das:

\( \Large L(a,b) = \int_a^b || s^\prime || dt \\\ \)

was genau der ersten Definition (oben) entspricht.

Man kann auch zeigen, dass die so definierte Länge einer parametrisierten Kurve bei Umparametrisierungen der Kurve gleich bleibt.

Der metrische Tensor

Im allgemeinen Fall drücken wir das Linienelement in einem Koordinatensystem mithilfe des “metrischen Tensors” \(g_{\mu\nu}\) aus:

\( ds^2 = g_{\mu\nu} x^\mu x^\nu \\\ \)

Im Falle der Euklidischen Geometrie im R3 ist im Chartesischen Koordinatensystem der metrische Tensor:

\( g =  \left[ \begin{array}{rrr} 1 & 0 & 0\\  0 & 1 & 0 \\  0 & 0 & 1 \end{array} \right]  \\\)

Ein “Tensor” in diesem Sinne ist nichts anderes als eine (n x n)-Matrix für die man noch einige zusätzliche Regeln hat.

Weiterführende Anmerkungen

Nach der Allgemeinen Relativitätstheorie ART von Einstein, verändert die Anwesenheit von Materie den Raum, was auch “Gravitation” genannt wird.

Wir können das als eine Nicht-Euklidische Metrik verstehen, für die beispielsweise Karl Schwarzschild schon 1916 im vereinfachten Fall einer Kugelmasse (Schwarzes Loch) eine Formel gefunden hat.

Zu Veranschaulichung so einer Nicht-Euklidischen Metrik wird häufig von einer “Krümmung” der Raumzeit gesprochen. Diese “Krümmung” ist aber eigentlich nur eine andere Metrik, trotzdem stellt man sich die Abweichung von der herkömmlichen Euklidischen Metrik gern als “Krümmung” vor,

Da diese “Krümmung” (also Abweichung von der Euklidischen Metrik) aber nicht in eine weitere Dimension, sondern “in sich” d.h. als Stauchung bzw. Streckung erfolgt, würde ich gerne eine solche Abweichung durch ein Verbiegen des Koordinatengitters veranschaulichen. Also durch den optischen Vergleich der Koordinatengitter zweier Metriken.

GeoGebra Gitternetz

Schwarzschild-Metrik

Ich habe zum Thema Schwarzschild-Metrik einen eigenen Artikel geschrieben.

Schwarzschild behandelt ja das Gravitationsfeld einer Punktmasse bzw. einer homogenen kugelförmigen Masse. Zur Beschreibung eignen sich besonders gut Kugelkoordinaten; wobei die Winkel “Länge” und “Breite” wegen der Kugelsymmetrie uninteressant sind. Von Interesse ist nur noch die radiale Raum-Dimension r und die Zeit-Dimension t.

Das Linienelement in der radialen Dimension ist (für r > RS):

\( \Large d s^2 =  g_{rr} \cdot d r^2 = \frac{1}{1 – \frac{R_S}{r}} \cdot d r^2 \)

Mit dem Schwarzschild-Radius von:

\( \Large R_S = \frac{2 \cdot G \cdot M}{c^2} \\ \)
Anders als beim Euklidischen Linienelement ist hier der Vorfaktor grr (Element im Metrik-Tensor g) nicht mehr konstant, sondern seinerseits eine Funktion von r.

In dieser Metrik (Schwarzschild-Metrik) wäre also der Abstand von r1 bis r2 nicht r2 – r1 sondern größer; nämlich:

\( \Delta R = \Large \int\limits_{r_1}^{r_2} \frac{dr}{\sqrt{1 – \frac{R_S}{r}}} = \left[ r \sqrt{1 – \frac{R_S}{r}} + \frac{R_S}{2} \ln{\frac{1+\sqrt{1-\frac{R_S}{r}}}{1-\sqrt{1-\frac{R_S}{r}}}} \right]_{r_1}^{r_2} \)

Dieses Integral habe ich kopiert aus: https://physik.cosmos-indirekt.de/Physik-Schule/Schwarzschild-Metrik

GeoGebra Blatt 2: ds/dr

 

Physik: Krümmung der Raumzeit

Gehört zu: Physik
Siehe auch: Relativitätstheorie, Vektorraum, Gravitation, Schwarze Löcher

Krümmung der Raumzeit

Die Allgemeine Relativitätstheorie (ART) basiert auf dem Postulat der Äquivalenz von Gravitation und Beschleunigung.

Aus diesem Äquivalenzprinzip ergibt sich die Lichtablenkung in Gravitationsfeldern.

Wenn man trotzdem davon ausgehen möchte, dass das Licht immer den kürzesten Weg nimmt, muss die Gravitation den Raum (besser die Raumzeit) entsprechend krümmen, sodaß eine Metrik entsteht bei der der kürzeste Weg zwischen zwei Punkten nicht unbedingt die Euklidische gerade Linie ist.

Wir wollen hier zunächsteinmal den Begriff der “Krümmung” ganz allgemein diskutieren.

Krümmung bei Euklidischer Metrik

Unter der Krümmung eines geometrischen Objekts versteht man die Abweichung von einem geraden Verlauf; dazu bedarf es (mindestens) einer weiteren Dimension in die die Krümmung verläuft oder der Begriff “gerade” muss umdefiniert (siehe: Nicht-Euklidisch) werden.

Wir betrachten eine Gerade. Solange sie wirklich geradeaus verläuft ist sie nicht gekrümmt. Wenn sie eine Kurve nach links (oder rechts) macht, haben wir eine Krümmung – und wir brauchen dafür (mindestens) eine zweite Dimension. Die Stärke der Krümmung kann mehr oder weniger sanft oder kräftiger sein. Wir messen die Stärke der Krümmung an einer Stelle durch einen sog. Krümmungskreis. Das ist ein Kreis, der sich in dem betrachteten Punkt am besten an die Kurve anschmiegt. Ein großer Krümmungskreis bedeutet eine kleine Krümmung ein kleiner Krümmungskrei ein starke Krümmung. Der Kehrwert des Radius ist das Maß für die Krümmungsstärke.

Die andere Frage ist, welche geometrischen Objekte sind es, die da “gekrümmt” werden?  Im einfachsten Fall ist es eine eindimensionale Linie in einer zweidimensionalen Ebene; also z.B. ein Funktionsgraph oder eine sog. Kurve. Kurven sind in diesem Zusammenhang sehr interessant als Teilmenge eines Vektorraums, die durch eine Abbildung von einem reellen Intervall in den Vektorraum  als sog. “parametrisierte” Kurve dargestellt werden kann. Das “Umparametrisieren” ist dann eine Äquivalenzrelation zwischen parametrisierten Kurven. Eine “Kurve” kann dann als Äquivalenzklasse solcher parametrisierten Kurven verstanden werden. Als Repräsentant einer Äquivalenzklasse nimmt man dann gerne eine nach Bogenlänge parametrisierte Kurve.

Wenn wir uns mit Kurven beschäftigen und speziell dann mit der Länge einer Kurve oder der Krümmung von Kurven, haben wir es mit Differentialgeometrie zu tun.
Dazu gibt es eine Reihe von sehr schönen Youtube-Videos:

Schritt 1: Krümmung einer Linie in der Ebene

Wenn das betrachtete Objekt ein Funktionsgraph von beispielsweise y = f(x) in der Ebene ist, können wir die Krümmung leicht berechnen:

Für eine zweimal differenzierbare Funktion  y = f(x) ergibt sich der Krümmungsradius an einem Punkt x zu:

\( \Large  r(x) = \left\vert \frac{(1+(f^\prime(x))^2)^\frac{3}{2}}{f^{\prime\prime}(x)} \right\vert  \)

Als Beispiel nehmen wir mal eine Parabel f(x) = 0,5 * x2
Dazu haben wir die Ableitungen:
f(x) = x
f(x) = 1
Der Krümmungsradius beispielsweise am Punkt x0 = 0 beträgt dann laut obiger Formel:

\( \Large r(x_0) = \frac{(1+{x_0}^2)^{\frac{3}{2}}}{1} = 1 \\\ \)

Und zur Probe nehmen wir noch x=1:

\( \Large r(1) = \frac{(1+1^2)^{\frac{3}{2}}}{1} = 2^\frac{3}{2} = 2 \sqrt{2} \)

Dieses Beispiel habe ich entnommen aus https://www.ingenieurkurse.de/hoehere-mathematik-analysis-gewoehnliche-differentialgleichungen/kurveneigenschaften-im-ebenen-raum/kruemmung/kruemmungsradius.html
Es wird grafisch veranschaulicht durch:

Schritt 2: Krümmung einer Kurve in der Ebene

Wenn das betrachtete Objekt eine “richtige” Kurve in der Ebene ist, wird die Krümmung anders berechnet.

Als “richtige” Kurve (in der Ebene) betrachten wir von der obigen Parabel das Kurvenstück von x=-1 bis x=1. Als Parametrisierte Kurve, wobei der Parameter t auch von -1 bis 1 laufen möge, (was wir uns z.B. als Zeit vorstellen könnten) sieht das dann so aus:

\( \Large \alpha(t) = \left( \begin{array}{c} t \\\ \frac{1}{2}t^2  \end{array}\right)  \\\  \)

Um die Krümmung zu brechnen ermitteln wir zuerst:

\( \Large \alpha^\prime(t) = \left( \begin{array}{c} 1 \\\ t  \end{array}\right)  \)

womit dann:

\( \Large ||\alpha^\prime(t)||^2 =  1 +  t^2   \\\  \)

und mit:

\( \Large \alpha^{\prime\prime}(t) = \left( \begin{array}{c}  0 \\\ 1  \end{array}\right)  \)

ergibt sich:

\( \Large det(\alpha^\prime(t), \alpha^{\prime\prime}(t)) = 1  \\\ \)

und damit ergibt sich dann die Krümmung zu:

\( \Large \kappa_\alpha(t) = \frac{1}{(1 + t^2 )^\frac{3}{2}}  \)

Bei t=0 ist dann die Krümmung:

\( \Large \kappa_\alpha(0) = 1 \\\  \)

und zur Probe nehmen wir noch t=1:

\( \Large \kappa_\alpha(1) = \frac{1}{2 \sqrt{2}} \\\ \)

Weil t=x ist, stimmt das mit den Berechnungen des Krümmungsradius (s.o. Schritt 1) exakt überein.

Schritt 3: Krümmung einer Fläche im Raum

Analog können wir uns gekrümmte Flächen im Raum vorstellen. Hier kann allerdings der Krümmungsradius in unterschiedlichen Richtungen unterschiedlich sein. Inetwa so die wir das von einem Gradienten kennen.

Auch in diesem Fall stellen wir uns das ganz klassisch geometrisch vor als Krümmung in eine weitere Dimension.

Krümmung per Nicht-Euklidischer Metrik

In der Allgemenen Relativitätstheorie spricht man auch von “Krümmung” z.B. Krümmung des Raumes oder Krümmung der Raumzeit.

Hier basiert die “Krümmung” nicht auf einer zusätzlichen Dimension, sondern auf einer speziellen Metrik in ein und demselben Raum. Unter “Metrik” versteht man ja eine Vorschrift, die zwei Punkten in dem betreffenden Raum einen Abstand zuordnet.  So eine Metrik definiert dann auch automatische die Längen von Linien…

Geodätische Linie

Die Linie, die die kürzeste Verbindung zwischen zwei Punkten bildet, nennt man Geodät oder auch Geodätische LInie. Auf der Erdoberfläche kennen wir das z.B. bei der Seefahrt oder Luftfahrt wenn wir beispielsweise die Flugroute von London nach Los Angeles betrachten:

Geodätische LInie Moskau - Los Angeles

Das Licht läuft immer auf einer Geodäte, nimmt also die kürzeste Verbindung. Das kann “gekrümmt” aussehen…

Krümmung ohne zusätzliche Dimension

Für eine solche Krümmung benötigen wir aber nicht zwingend eine zusätzliche Dimension. Die Krümmung kann auch “in sich” durch andere Abstandsgesetze (= Metriken) bewirkt werden.
Siehe Schwarzschild-Metrik

 

Mathematik: Data Science

Gehört zu: Mathematik

Ein neues Buzzword: Data Science

Öfters habe ich schon Vorlesungen auf dem Youtube-Kanal von Prof. Dr. Weitz von der Hamburger Hochschule für Angewandte Wissenschaften (“HAW” – früher: Fachhochschule Berliner Tor) gehört.

Er arbeitet da mit Computer-Software wie:

  • MATLAB
  • Mathematica, was sehr teuer ist. Kann CDF-Dateien erzeugen, die mit einem CDF Player abgespielt werden können
  • jupyter: Link https://jupyter.org/
  • SymPy: Link https://www.sympy.org/en/index.html
  • GeoGebra Link: https://www.geogebra.org/?lang=de
  • WolframAlpha Link: https://www.wolframalpha.com/
  • p5.js Link: https://editor.p5js.org/
  • Anaconda (zum Installieren von Paketen etc.) Link: LInk: https://www.anaconda.com/individual-tutorial?source=win_installer

und anderen.

Herr Weitz unterscheidet sog. Computer Algebra Systeme (abgekürzt CAS) von Numerischen Systemen…

Als Programmiersprache kommt man wohl an JavaScript nicht vorbei, das sich in den letzten Jahren enorm weiterentwickelt hat: z.B. https://eloquentjavascript.net/Eloquent_JavaScript.pdf

 

 

Mathematik: Komplexe Zahlen

Gehört zu: Mathematik
Siehe auch: Quantenmechanik, Von Pytharoras bis Einstein

Die komplexen Zahlen

Ausgangspunkt ist die berühmte imaginäre Einheit: i2 = -1

Eine komplexe Zahl schreibt man gerne als Realteil und Imaginärteil:

z = x + i*y      x = Re(z)   und   y = Im(z)

Wobei x und y reelle Zahlen sind.

Mit den Komplexen Zahlen kann man auch die vier Grundrechnungsarten, so wie wir sie von den “normalen” d.h. reellen Zahlen her kennen, ausführen – Die komplexen Zahlen bilden, mathematisch gesagt, einen “Körper”.

Zu jeder Komplexen Zahl gibt es die “komplex konjugierte“, die mit gern mit einem Sternchen als Superskript schreibt:

zur komplexen Zahl: z = x + i*y
ist die konjugierte:   z* = x – i*y

Jede Komplexe Zahl hat auch einen “Betrag” (kann man sich als Länge vorstellen):

|z|2 = x2 + y2

Darstellung der komplexen Zahlen mit kartesischen Koordinaten

Die Reellen Zahlen konnte ich mir ja durch die sog. Zahlengerade gut veranschaulichen. Die Komplexen Zahlen würde ich mir dann durch die Punkte in einer Ebene veranschaulichen.

Polar-Darstellung der komplexen Zahlen

Wenn komplex Zahlen einfach als Punkte in der Ebene verstanden werden können, kann ich sie anstelle von kartesischen Koordinaten, alternativ auch in durch sog. Polarkoordinaten darstellen; d.h. durch die Entfernung vom Nullpunkt r und den Winkel mit der reellen Achse φ.

Für eine Komplexe Zahl z = x + i*y  gilt:

r² = x² + y²

tan φ = x/y

\(\displaystyle \tan{ \phi} = \frac{x}{y} \)

Exponential-Darstellung der komplexen Zahlen

Die Eulerschen Formel ist:

\(\displaystyle  e^{i  \cdot \phi} = \cos \phi+i \cdot \sin \phi \)

Damit erhalten wir als sog. Exponential-Darstellung:

\(\displaystyle z ={r} \cdot e^{i  \cdot \phi} \)

In der Quantenmechanik wird diese Exponentialdarstellung gerne benutzt, u.a. weil man damit die Multiplikation komplexer Zahlen sehr anschaulich darstellen kann:

\(\displaystyle z_1 \cdot z_2 = {r_1 \cdot r_2} \cdot e^{i  \cdot (\phi_1 + \phi_2)} \)

Sie auch Youtube-Video: https://www.youtube.com/watch?v=pBh7Xqbh5JQ

Die Eulersche Zahl

Definition der Eulerschen Zahl

Die Zahl e wurde von Leonhard Euler (1707-1783) als Grenzwert der folgenden unendlichen Reihe definiert:

\(\displaystyle e = 1 + \frac{1}{1} + \frac{1}{1 \cdot 2} + \frac{1}{1 \cdot 2 \cdot 3} +  \frac{1}{1 \cdot 2 \cdot 3 \cdot 4} + …   \)

Oder:

\(\displaystyle e = \sum_{n=0}^{\infty} \frac{1}{n!} \)

Die Exponentialfunktion

Potenzen zur Basis e bilden die Exponentialfunktion, auch e-Funktion genannt:

f(x) = ex

Die Ableitung (Differentialquotient) der e-Funktion ist wiederum die e-Funktion:

f'(x) = ex

Damit ergibt sich als Taylorsche Reihenentwicklung um den Entwicklungspunkt x0 = 0

\(\displaystyle f(x) = 1 + x + \frac{x^2}{2!} + \frac{x^3}{3!} + \frac{x^4}{4!}  + …  + \frac{x^n}{n!} + …   \)

Allgemein wäre die Taylor-Reihe ja:

\( \displaystyle T_\infty(x;x_0) = \sum_{k=0}^{\infty} \frac{f^(k)(x_0)}{k!} (x-x_0)^k \)

Da der Funktionswert und alle Ableitungen der e-Funktion an der Stelle x0 = 0 sämtlich 1 sind, vereinfacht sich die Darstellung wie oben gezeigt.

Mathematik: Tensoren

Gehört zu: Mathematik

Siehe auch: Diriac-Notation, QuantenmechanikVektorräume, Lineare Algebra

Benutzt: WordPress-Plugin Latex

Was sind Tensoren?

Eine der Voraussetzungen zum Verständnis vieler Dinge (z.B. in der Allgemeinen Relativitätstheorie und der Quantenmechanik) sind sog. Tensoren.

Der Begriff “Tensor” wurde im 19. Jahuhundert relativ unsystematisch bei verschiedenen physikalischen Berechnungen eingeführt.

Darüber gibt es schöne Youtube-Videos von “eigenchris”:  https://youtu.be/sdCmW5N1LW4

Als Vorbereitung dazu habe ich zuerst mal etwas zu Vektorräumen zusammengestellt.

Auffrischung

Wir hatten ja im Artikel über Vektorräume schon gesehen, dass Vektoren Objekte sind, die unabhängig von Koordinatensystemen exsistieren und auch gegenüber einem Wechsel von Koordinatensystemen “invariant” sind. Nur die Komponenten der Vektoren verändern sich dann, nicht aber die Vektoren selber.

Invarianz bedeutet allgemein gesagt, dass ein und dasselbe Objekt verschieden beschrieben (“repräsentiert”) werden kann von verschiedenen Standpunkten (Koordinatensystemen) aus.

Unsere Koordinatensysteme beruhen immer auf einer Menge von sog. Basisvektoren.

Wie verhalten sich dann Vektoren und ihre Komponenten bei einem Wechsel des Koordinatensystems (also der Basisvektoren)?

Im Gegensatz zum invarianten Vektor selbst, verändern sich seine Komponenten bei Änderung der Basis.

Wir sahen, dass wenn sich die Längen der Basisvektoren verlängern, sich die Komponenten von Vektoren verkleinern. Deshalb hatten wir diese Vektoren “kontravariant” genannt.

So ein kontravarianter Vektor ist ein erstes Beispiel für einen Tensor. Ein zweites Beispiel für einen Tensor sind die sog. Co-Vektoren…

Allgemein gesagt bedeutet Kontravarianz, dass wenn ein Ding größer wird, ein anderes Ding kleiner wird. Covarianz dagegen bedeutet, dass die Veränderungen in die gleiche Richtung gehen.

Co-Vektoren

Im Gegensatz zu den “herkömmlichen” kontravarianten Vektoren, die wir als Spalte schreiben, schreiben wir Co-Vektoren als Zeilen.

Dazu hat “eigenchris” ein schönes Youtube-Video gemacht: https://youtu.be/LNoQ_Q5JQMY

In der Sichtweise von Koordinaten macht ein Co-Vektor also folgendes:

\( \Large  \left[  \begin{matrix} a & b & c  \end{matrix} \right] \cdot \left[ \begin{array}{r} x \\\ y \\\ z  \end{array} \right] = ax+by+cz \)

Abstrakt formuliert bildet ein Co-Vektor also Vektoren auf Skalare ab.

Rank 2 Tensoren

Generell soll ein Tensor ja invariant bei einer Koordinatentransformation sein.

Lediglich die “Darstellung” eines Tensors erfolgt mit Komponenten (Koordinaten).

Uns interessieren hier in erster Linie sog. Rank 2 Tensoren. Solche Rank 2 Tensoren können immer als “normale” Matrix mit Zeilen und Spalten dargestellt werden  (Zeilen und Spalten -> Rank 2). So ein Rank 2 Tensor kann aber auch ganz einfach in sog. Index-Schreibweise dargestellt werden z.B. Tij oder g μν (Anzahl Indices = Rank).

 

 

Computer: Mathematik – Vektorräume – Lineare Algebra

Gehört zu: Mathematik

Siehe auch: Diriac-Notation, Tensor-Algebra, Relativitätstheorie, Elektrisches Feld, Magnetisches Feld

Benutzt: WordPress-Plugin Latex

Was ist ein Vektorraum?

Eine der Voraussetzungen zum Verständnis vieler Dinge (z.B. in der Allgemeinen Relativitätstheorie und der Quantenmechanik) sind sog. Vektorräume.

Es gibt dazu eine Menge Videos auf Youtube; z.B. von 3Blue1Brown:  https://youtu.be/fNk_zzaMoSs  – Playlist: https://goo.gl/R1kBdb

Vektorräume verfügen über eine Operation, die Addition genannt wird und eine kommutative Gruppe bildet. Weiterhin muss jeder Vektorraum einen Körper von sog. Skalaren haben, mit denen die Vektoren mutipliziert (“skaliert”) werden können. Man spricht dann von einem Vektorraum “über” einem Körper seiner Skalaren.

  • Physik: Der Physiker stellt sich Vektoren gern als “Pfeile” vor, die also eine Richtung und eine Länge haben, also eher “geometrisch“.
  • Computer: Der Computer-Mensch stellt sich Vektoren eher als Liste von Koordinaten vor (Vektor = Liste) – wozu man aber ersteinmal ein Koordinatensystem haben muss.
  • Mathematik: Der abstrakte Mathematiker sagt, Vektoren sind einfach “etwas”, was man addieren kann (Gruppe) und was man mit “Skalaren” skalieren kann – fertig, einfach ein paar Axiome und das war’s.

Vektorfelder und Skalarfelder

Was meint man mit dem Begriff “Feld”?

Das Wort “Feld” wird gerne gebraucht, wenn eigentlich eine ganz normale Abbildung (auch manchmal Funktion genannt) gemeint ist – “just to confuse the Russians”.

Der Definitionsbereich so einer Abblidung ist der Vektorraum und je nach dem ob der Wertebereich ein Vektorraum oder ein Körper (von Skalaren) ist, spricht man von “Vektorfeld” oder “Skalarfeld” und man schreibt gerne:

  • für ein skalares Feld: \( \Phi(\vec{r}) \)
  • für ein Vektorfeld: \(  \vec{V}(\vec{r)} \)

Beispiele

  • Temperatur: Wenn wir jedem Punkt im Raume seine Temperatur zuordnen, haben wir ein Skalarfeld.
  • Höhe: Wenn wir jedem Punkt auf einer Landkarte die Höhe über dem Meeresspiegel zuordnen, haben wir ein Skalarfeld.
  • Wind: Wenn wir jedem Punkt auf einer Landkarte die Windrichtung und Windstärke zuordnen, haben wir ein Vektorfeld.
  • Gravitation: Wenn wir jedem Punkt im Raum die Richtung und Stärke der Gravitationskraft zuordnen (wäre mit einem kleinen Probekörper zu bestimmen), haben wir ein Vektorfeld, genannt Gravitationsfeld
  • Ein elektrisches Feld (ein Vektorfeld) gibt für jeden Punkt im Raum die Richtung und Stärke der elektrischen Kraft an, die auf ein kleines Probeteilchen der elektrischen Ladung +1 wirkt
  • Ein magnetisches Feld (ein Vektorfeld) gibt für jeden Punkt im Raum die Richtung und Stärke der magnetischen Kraft an, die auf ein kleines Probeteilchen wirkt

Visuelle Veranschaulichung von Feldern

Skalarfelder kann man beispielsweise durch Linien im Definitionsbereich, die alle einen gleichen Skalarwert haben, veranaschaulichen (z.B. Isotermen, Isohypsen etc.)

Vektorfelder veranschaulicht man sich gerne durch sog. “Feldlinien“; diese zeigen dann immer in die Richtung des Werte-Vektors. Beispiel: Feldlinien im Magnetfeld, die in Richtung der magnetischen Kraft zeigen…

Die Physiker sprechen gern von sog. Kraftfeldern. Der Begriff “Feld” hilft, die Vorstellung der Fernwirkung zu vermeiden (sagt Feynman). Die vier konzeptionellen Stufen der Kraftwirkung sind:

  • Die Kraft wird als Beschleunigung   (Newton)
  • Ein Feld bewirkt eine Kraft
  • Kraft durch Raumkrümmung (geometrische Vorstellung) (Einstein)
  • Kraft durch virtuelle Austauschteilchen

Eigenschaften von Vektoren

Geschrieben werden Vektoren meist als eine Liste von Koordinaten, aber nicht waagerecht, sondern senkrecht angeordnet (bei waagerechter Anordnung denkt man eher an einen Punkt im Raum).

\( \Large \vec{v} = \left( \begin{array}{c} x \\\ y \\\ z  \end{array}\right) \)

oder auch in eckigen Klammern:

\( \Large \vec{v} = \left[ \begin{array}{c} x \\\ y \\\ z  \end{array} \right] \)

Wenn ich Vektoren als Liste von Koordinaten schreiben will, muss ich ersteinmal ein Koordinatensystem haben.

Vektoren, und das ist wichtig, exisitieren auch ohne Koordinatensysteme, also einfach geometrisch im Raum. Unabhängig von einem Koordinatensystem hat jeder Vektor eine Länge und eine Richtung. Dies sind also sog. “Invarianten”; d.h. bei Änderung des Koordinatensystems ändern sich diese Eigenschaften nicht.
Also: Vektoren ansich sind invariant gegenüber einem Wechsel des Koordinatensystems. Aber die Vektorkomponenten verändern sich beim Wechsel des Koordinatensystems, sind wie man sagt “variant“. Wie Vektorkomponenten bei Wechsel des Koordinatensystems hin- und hergerechnet werden können, behandeln wir weiter unten. So ein Vektor ist damit der Sonderfall eines Tensors, nämlich ein Tensor vom Rang 1.

Für die Länge eines Vektors (man sagt auch “Norm”) schreibt man:  \( \Large ||  \vec{v}  ||  \)

Das innere Produkt von Vektoren

Für den Winkel zwischen zwei Vektoren schreibt man: \( \Large  \angle \left( \vec{v}, \vec{w} \right)  \)

Das innere Produkt zweier Vektoren (auch Skalarprodukt genannt) ist dann – unabhängig von einem Koordinatensystem – definiert als:

\( \Large \vec{v} \cdot \vec{w} = ||  \vec{v} || \enspace || \vec{w} || \cos(\angle \left( \vec{v}, \vec{w} \right)) \)

Als Schlussfolgerung kann man die Länge eines Vektors auch per innerem Produkt darstellen als:

\( \Large || \vec{v} ||  = \sqrt{\vec{v} \cdot \vec{v}} \)

Das äußere Produkt von Vektoren

Das äußere Produkt zweier Vektoren (auch Kreuzprodukt genannt) ist definiert als ein Vektor:

\( \Large \vec{v} \times \vec{w} = \vec{u} \)

Der Vektor u steht senkrecht auf beiden Vektoren v und w und hat die Länge \( \Large ||\vec{v}|| \cdot ||\vec{w}|| \cdot \sin(\angle \left( \vec{v}, \vec{w} \right)) \)

Differentialoperatoren

Für solche Felder (s.o.) definiert man sog. Differentialoperatoren, wozu allerdings immer die Koordinatenschreibweise benutzt wird.

Wir nehmen mal als Definitionsbereich für unsere Felder den Vektorraum \(\mathbb{R}^3\). dann haben wir partielle Ableitungen nach den drei Koordinaten: x, y und z und man definiert als sog. Nabla-Operator:

\( \Large \nabla = \left[ \begin{array}{c} \frac{\partial}{\partial x} \\\ \frac{\partial}{\partial y} \\\ \frac{\partial}{\partial z}  \end{array} \right]  \\\  \)

Damit kann man dan einfach definieren:

  • Gradient eines Skalarfeldes:  \( \nabla \Phi \)
  • Divergenz eines Vektorfeldes: \( \nabla \cdot \vec{V} \)
  • Rotation eines Vektorfeldes: \( \nabla \times \vec{V} \)

Dies führt in den Bereich der Differentialgeometrie

Basis, Koordinatensystem, Dimension

In einem Vektorraum kann ich viele Koordinatensysteme haben. Jedes Koordinatensystem ist bestimmt durch eine Menge sog. Basis-Vektoren.

Die “Basis” eines Vektorraums besteht aus einer Menge von Vektoren, mit denen man den gesamten Vektorraum “aufspannen” kann. Wobei “Aufspannen” bedeutet, dass jeder Vektor des Vektorraums als sog. Linearkombination aus den Basis-Vektoren hergestellt werden kann. Eine solche “Linearkombination” ist eine Summe von Basis-Vektoren, die mit geeigneten Skalaren multipliziert wurden.

Beispiel für eine Linearkombination:

\( \Large a  \vec{v} + b \vec{w} + c \vec{u} \)

Ganz genau genommen, spannt eine Basis nicht nur den ganzen Vektorraum auf (das wäre ein Erzeugendensystem), sondern enthält dabei eine minimale Anzahl von Vektoren (was äquivalent ist mit der eindeutigen Darstellung aller Vektoren des Vektorraums in Form von Linearkombinationen).

Eine Einheitsbasis (normal basis) ist eine Basis, bei der alle Basisvektoren die Länge 1 haben (“auf die Länge 1 normiert sind”).

Beispiel für eine Basis (im Vektorraum \(\mathbb{R}^3\) ):

\( \hat{i} =\left[ \begin{array}{c} 1 \\\ 0 \\\ 0  \end{array} \right]   \hat{j} =\left[ \begin{array}{c} 0 \\\ 1 \\\ 0  \end{array} \right] \hat{k} =\left[ \begin{array}{c} 0 \\\ 0 \\\ 1  \end{array} \right] \)

Und man schreibt dann auch gerne:

\( \Large \vec{v} = \left[ \begin{array}{c} x \\\ y \\\ z  \end{array} \right] = x \hat{i} + y \hat{j} + z \hat{k}\)

Ein Vektorraum kann mehrere Basen haben, die jeweils ein Koordinatensystem definieren. Dabei werden die Koordinaten (Komponenten) ein und desselben Vektors in verschiedenen Koordinatensystem auch verschieden sein, der Vektor selbst aber ist “invariant”. Wenn man einen Vektor als Liste von Koordinaten hinschreibt, muss man immer sagen. welche Basis gemeint ist.

Ein Vektorraum kann mehrere Basen haben, aber die Anzahl der Vektoren in einer Basis ist immer die gleiche. Diese Anzahl nennt man “Dimension” des Vektorraums.

Lineare Transformationen

Lineare Transformationen sind Transformationen, bei denen Geraden Geraden bleiben und der Null-Punkt (Origin) unverändert bleibt.
Genauer gesagt, bleiben Parallelen parallel und die Koordinatengitter gleichmäßig unterteilt. Man kann das auch abstrakt durch zwei Formeln ausdrücken:

\( L(\vec{v} +  \vec{w}) = L(\vec{v}) +  L(\vec{w})  \)

und

\( L(c \vec{v}) = c L(\vec{v}) \\ \)

Eine Lineare Tranformation kann eindeutig beschrieben werden durch die Werte auf die die Basis-Vektoren abgebildet (transformiert) werden.

Beispielsweise heisst das im Vektorraum \(\mathbb{R}^2\) mit dem kanonischen Koordinatensystem und den Basisvektoren \( \hat{i} \) und \( \hat{j}  \) folgendes:

Wenn wir einen Vektor \( \vec{v} = \left[ \begin{array}{c} x \\\ y  \end{array} \right] = x \hat{i} + y\hat{j} \) betrachten, so wirkt eine Lineare Transformation L wie folgt:

\( L(\vec{v}) = x L(\hat{i}) + y L(\hat{j} )  \)

Wenn wir also die transformierten Basisvektoren \( L(\hat{i}) \) und \( L(\hat{j}) \)  kennen, ist damit die Lineare Transformation L vollständig festgelegt.

Diese transformierten Basis-Vektoren können im verwendeten Koordinatensystem als Matrix schreiben.

Wenn bei unserer Linearen Transformation beispielsweise \( L(\hat{i}) = \left[ \begin{array}{c} 3 \\\ -2  \end{array} \right] \)   und \( L(\hat{j}) = \left[ \begin{array}{c} 2 \\\ 1  \end{array} \right] \)  wäre, bekämen wir eine Matrix:

\(\left[ \begin{array}{rr} 3 & 2 \\  -2 & 1 \\  \end{array} \right] \)

Wir schreiben also in den Spalten der Matrix die transformierten Basisvektoren. Die Lineare Transformation könnte im benutzten Koordinatensystem als Matrixmultiplikation aufgefasst werden:

\(\left[ \begin{array}{rr} 3 & 2 \\  -2 & 1 \\  \end{array} \right]  \left[ \begin{array}{c} x \\\ y  \end{array} \right] = x  \left[ \begin{array}{c} 3 \\\ -2  \end{array} \right] + y  \left[ \begin{array}{c} 2 \\\ 1  \end{array} \right] = \left[ \begin{array}{c} 3x+2y \\\ -2x+1y  \end{array} \right]\)

Völlig analog werden auch Lineare Transformationen in drei oder mehr Dimensionen behandelt.

Wechsel von Koordinatensystemen

Wenn wir zwei Koordinatensysteme betrachten, dann haben die also zwei Basen (wir nennen sie “alte Basis” und “neue Basis”). Intuitiv ist klar, dass wenn die neue Basis z.B. längere Basisvektoren hat, dann sind die Vektorkomponenten kürzer (weil ja der gleiche Vektor wieder herauskommen soll). Die Vektorkomponenten verhalten sich also “umgekehrt” wie die Längen der Basisvektoren. Deshalb nennt man diese Vektoren “kontravariant“.

Wir können das auch haarklein ausrechnen:

  • Die “alte Basis” sei: \( \vec{e}_i  \)
  • Die “neue Basis” sei: \( \tilde{\vec{e}}_i  \)

Dann transformieren sich die Basisvektoren wie folgt:

Alt -> Neu (“Foreward”):

\(  \tilde{\vec{e}}_i =  \sum\limits_{k=1}^{n} F_{ki} \vec{e_k}\)

Neu -> Alt (“Backward”):

\(  \vec{e}_i =  \sum\limits_{j=1}^{n} B_{j i} \widetilde{\vec{e_j}}\)

Für die Komponenten eines Vektors \( \vec{v} \) gilt dann die umgekehrte Richtung (deshalb nennt man sie “kontravariant“)

Alt -> Neu:

\( \tilde{v_i} = \sum\limits_{j=1}^{n} B_{ij} v_j  \)

Neu -> Alt

\( v_i = \sum\limits_{j=1}^{n} F_{ij}\tilde{v_j}   \)

Berechnung der Länge eines Vektors aus seinen Komponenten

Länge eines Vektors im Chartesischen Koordinatensystem

Wir sind ja gewöhnt, die Länge eines z.B. dreidimensionalen Vektors über seine Koordinaten und den Lehrsatz des Pythagoras zu berechnen:

Im Beispiel sei der Vektor \( \Large \vec{v} = \left[ \begin{array}{c} v_1 \\\ v_2 \\\ v_3  \end{array} \right] \)

Dann wäre die Länge dieses Vektors gegeben durch: \( || \vec{v} ||= \sqrt{v_1^2 + v_2^2 + v_3^2} \)  (der gute alte Pythagoras)

In verschiedenen Koordinatensystemen würde dieser Vektor aber mit verschiedenen Koordinaten (Komponenten) beschrieben und es würden mit obiger Formel dann unterschiedliche Längen heraus kommen.

Uns ist ja klar, dass wir zu den Koordinaten (Komponenten) eines Vektors auch immer angeben müssen, in welchem Koordinatensystem diese gemessen werden; d.h. wir müssen zu den Koordinaten die dazugehörige Basis angeben – und berücksichtigen.

Wenn wir als Basis allgemein schreiben: \( \vec{e}_i  \)

dann können wir mit den Komponenten unseres Vektors zu dieser Basis schreiben:

\( \Large \vec{v} = \left[ \begin{array}{c} v_1 \\\ v_2 \\\ v_3  \end{array} \right] = v_1 \vec{e}_1 + v_2 \vec{e}_2 + v_3 \vec{e}_3\)

Im Spezialfall der orthonormalen Basis:

\( \vec{e}_1 = \hat{i}, \vec{e}_2 = \hat{j}, \vec{e}_3 = \hat{k}   \)

hätten wir die Länge unseres Vektors nach Pythagoras (s.o.); mit den Koordinaten zu einer anderen Basis müssten wir umrechnen…

Länge eines Vektors in einem beliebigen Koordinatensystem

Wir hatten die Länge eines Vektors unabhängig von einem Koordinatensystem (also invariant) definiert über:

\( \Large {||  \vec{v}  ||}^2 = \vec{v} \cdot \vec{v} \\\)

Wir nehmen jetzt ein beliebiges Koordinatensystem definiert durch seine Basisvektoren \( \vec{e}_i\).
Dann können wir die Länge des Vektors wie folgt aus seinen Komponenten (Koordinaten) berechnen:

\( \Large  ||  \vec{v} ||^2 = (v_1 \vec{e}_1 + v_2 \vec{e}_2 + v_3 \vec{e}_3) \cdot(v_1 \vec{e}_1 + v_2 \vec{e}_2 + v_3 \vec{e}_3) \\ \)

Wenn wir das ausmultiplizieren bekommen wir:

\( \Large ||  \vec{v} ||^2 =  \sum\limits_{ij} v_i v_j  \enspace \vec{e}_i \cdot \vec{e}_j \\ \)

Um die Länge eines Vektors in einem beliebigen Koordinatensystem zu ermitteln, benötigen wir also “lediglich” alle Kombinationen der inneren Produkte der Basisvektoren dieses Koordinatensystems; d.h. alle \( \vec{e}_i \cdot \vec{e}_j \)

Als Matrix können wir diese Produkte so hinschreiben:

\(\Large g =  \left[ \begin{array}{rrr} \vec{e}_1 \cdot \vec{e}_1 & \vec{e}_1 \cdot \vec{e}_2 & \vec{e}_1 \cdot \vec{e}_3\\  \vec{e}_2 \cdot \vec{e}_1 & \vec{e}_2 \cdot \vec{e}_2 & \vec{e}_2 \cdot \vec{e}_3 \\  \vec{e}_3 \cdot \vec{e}_1 & \vec{e}_3 \cdot \vec{e}_2 & \vec{e}_3 \cdot \vec{e}_3 \end{array} \right]  \\\)

Diese Matrix g nennt man auch den Metrik-Tensor des Koordinatensystems.

Mit Hilfe dieses Metrik-Tensors ergibt sich dann die Länge des Vektors \(\vec{v}\) ganz einfach als Matrixprodukt:

\(\Large || \vec{v} ||^2  =  \left[ \begin{array}{c} v_1 & v_2 & v_3  \end{array} \right]  g  \left[ \begin{array}{c} v_1 \\\ v_2 \\\ v_3  \end{array} \right] \\\)

Ganz allgemein kann man mit diesem Metrik-Tensor das innere Produkt zweier Vektoren aus den Komponenten berechnen:

\( \Large \vec{v} \cdot \vec{w} =  \left[ \begin{array}{c} v_1 & v_2 & v_3  \end{array} \right]  g  \left[ \begin{array}{c} w_1 \\\ w_2 \\\ w_3  \end{array} \right] \)

Das funktioniert, weil der Metrik-Tensor nicht “irgendeine” Matrix ist, sondern “invariant” ist; d.h. unabhängig vom gewählten Koordinatensystem kommt immer das gleiche Ergebnis heraus.

Der Metrik-Tensor

Der Metrik-Tensor definiert also eine (bilinerare) Abbildung:

\(  g: V \times V \to \mathbb{R} \\\)

Dies ist auch im Prinzip der Metrik-Tensor, der in den Einsteinschen Feldgleichungen als \( g_{\mu \nu} \) vorkommt.

Oben hatten wir das innere Produkt zweier Vetoren ja versucht unabhängig von einem Koordinatensystem zu definieren.
Man kann das Ganze nun aber auch umgekehrt “aufzäumen”.  Wenn wir einen Vektorraum und eine Basis haben (damit also ein Koordinatensystem), brauchen wir nur noch einen Metrik-Tensor “g” und können damit ein inneres Produkt zwischen zwei Vektoren v und w als schlichte Matrix-Multiplikation definieren:

\( \Large \vec{v} \cdot \vec{w} =  \vec{v}^T   \enspace g  \enspace \vec{w} \\ \)

Wobei das hochgestellte T “transponiert” meint. So wird aus einem Spaltenvektor ein Zeilenvektor.

Beispielsweise definiert der folgende Metrik-Tensor die übliche Metrik für alle Koordinatensysteme mit einer orthonormaler Basis – denn das innere Produkt verschiedener Basisvektoren ist Null (weil orthogonal) und das innere Produkt eines Basisvektors mit sich selbst ist 1 (weil Länge 1):

\(\Large g =  \left[ \begin{array}{rrr} 1 & 0 & 0\\  0 & 1 & 0 \\  0 & 0 & 1 \end{array} \right]  \\\)

Das gilt z.B. für ein “normales” Koordinatensystem im Euklidischen Raum.
Mit dieser Metrik ist die Länge eines Vektors also:
\( || \vec{v} ||^2 = v_1^2 + v_2^2 + v_3^2 \)
und diese Länge ist invariant gegenüber Koordinatentransformationen.

Und eine Minkowski-Metrik wird definiert durch den Metrik-Tensor:

\(\Large \eta =  \left[ \begin{array}{rrrr} 1 & 0 & 0 & 0\\  0 & -1 & 0  & 0\\  0 & 0 & -1 & 0\\ 0 & 0 & 0 & -1\end{array} \right]  \\\)

Mit dieser Metrik wäre die Länge eines Vektors also gegeben durch:

\( || \vec{v} ||^2  =  v_1^2 – v_2^2 – v_3^2 – v_4^2\)

Diese so definierte Länge wäre invariant gegenüber Lorentz-Transformationen, die wir später in der Speziellen Relativitätstheorie kennenlernen werden.

Bilineare Formen

Der Begriff “Form” wird traditionell gerne verwendet, wenn eine Abbildung Vektoren als Definitionsbereich hat.

Wir betrachten jetzt mal ganz allgemein Abbildungen

\( \mathbb{B}: V \times V \to \mathbb{R} \)

So eine Abbildung heist “bilinear” (später sagen wir “multilinear”), wenn eine “Scaling Rule” und “Addition Rules” erfüllt sind.

Scaling Rule:

\(  a B(\vec{v}, \vec{w}) = B(a \vec{v}, \vec{w}) = B(\vec{v}, a \vec{w}) \\\)

Addition Rules:

\( B(\vec{v} + \vec{u}, \vec{w}) = B(\vec{v}, \vec{w}) + B(\vec{u}, \vec{w}) \)

und

\( B(\vec{v}, \vec{w} + \vec{t}) = B(\vec{v},\vec{w}) + B(\vec{v}, \vec{t}) \\\)

Ein Metrik-Tensor ist eine spezielle Bilineare Abbildung, die erstens symmetrisch ist und zweitens immer positive Werte liefert.

Was ist ein Tensor?

Der oben beschriebene Metrik-Tensor ist ein Tensor vom Rank 2. D.h. eine zweidimensionale (also “normale”) Matix, die sich bei Transformation der Koordinatensysteme “freundlich” verhält, sodass wir von “Invarianz” sprechen können.

Allgemein und formal ist ein Tensor T eine multilineare Abbildung von einem cartesischen Produkt von Vektorräumen über einem gemeinsamen Körper von Skalaren in diesen Skalaren-Körper:

\( T: V_1 \times V_2 \times … \times V_n \to K \)

Wobei die \(V_i\) Vektorräume über K sind.

Das allgemeine Thema “Tensor” ist mathematisch vielschichtig, deshalb habe ich begonnen, einen separaten Artikel darüber zu geschrieben.

Link: https://youtu.be/8ptMTLzV4-I

Determinante und Rank

Diese Konzepte werden in Video 6 und Video 7 behandelt.

Bei einer Linearen Transformation wird die Fläche des Quadrats aus den Basisvektoren  um einen Faktor “transformiert”. Damit wird auch jede beliebige Fläche um diesen Faktor “transformiert”. Diesen “Faktor” nennen wir die Determinante der Linearen Transformation.

Entsprechend ist das auch in höheren Dimensionen z.B. mit drei Dimensionen, wo die Größe des Volumens transformiert wird.

Eine negative Determinante bedeutet, dass sich bei der linearen Transformation die “Orientierung” des Vektorraums umkehrt.

Der Rank meint die Dimension des Ausgaberaums einer Linearen Transformation. Wenn der Rank einer Transformation nicht die volle Dimension (“full rank”) unseres Vektorraums ist, ist die Determinante dieser Transformation natürlich Null, aber der Rank kann etwas differenzierter aussagen was da los ist z.B. der Rank einer 3-dimensionalen Matrix (Transformation) könnte 2 sein, dann ist der Ausgaberaum eine Ebene (2 Dimensionen), wenn der Rank 1 wäre, hätten wir als Ausgaberaum eine Linie (eine Dimension) etc. Dieser “Ausgaberaum” wird auch “Column Space” genannt, weil die Spaltenvektoren diesen aufspannen…

 

Computer: Mathematik – Statistik

Mathematik: Statistik (aus Wiki)

Immer wieder werde ich als gelernter Mathematiker nach elementaren Themen der Statistik gefragt.

Ich habe einen schönen Einführungskurs in die Statistik bei der Universität Newcastle, Australien, gefunden:

http://www.anu.edu.au/nceph/surfstat/surfstat-home/t-table.html

http://www.anu.edu.au/nceph/surfstat/surfstat-home/

Statistik

Typen von Variablen (“Metriken”)

Qualitativ / Quantitativ

Man spricht von “qualitativen” Variablen, wenn die Beobachtungen durch Kategorien beschrieben werden.
Beispiele:

  • Augenfarbe: braun, grau, blau,…
  • Delivery Model: insourced, outsourced
  • Performance Rating: Less than Acceptable, Inconsistent, Fully Successful, Exceeds, Exceptional

Eine qualitative Variable heist “ordinal”, wenn es eine natürliche Reihenfolgebeziehung zwischen den Kategorien gibt, (Beispiel: Performance Rating).

Eine qualitative Variable heisst “nominal”, wenn es keine natürliche Reihenfolgebeziehung gibt, (Beispiel: Augenfarbe).

Man spricht von “quantitativen” Variablen, wenn die Beobachtungen durch numerische Werte beschrieben werden, d.h. durch Zählen oder Messen zustande kommen.
Beispiele:

  • Alter
  • Körpergröße
  • Anzahl Personen im Haushalt
  • Anzahl gerauchter Zigaretten am Tag
  • Einkommen im Jahr

Eine quantitative Variable heisst “diskret”, wenn die Beobachtungen ganzzahlige Werte sind (Beispiel: Anzahl Personen im Haushalt).

Eine quantitative Variable heisst “stetig” (continous), wenn sie durch (im Prinzip) beliebige Zahlen dargestellt wird (Beispiel: Körpergröße).

Normalverteilung mit Perzentil

Fragestellung zu einer Normalverteilung N(My,Sigma):

  • Gegeben sei My und P25
  • Gesucht ist Sigma
  • Lösung: sigma = (P25 – My) / NormInv(0,25; 0; 1)

Im übrigen gilt sowieso: P25 = NormInv(0,25; My; Sigma)

Logarithmische Normalverteilung

Zur Logarithmischen Normalverteilung habe ich einen gesonderten Artikel geschrieben.

Beta-Verteilung

Zur Beta-Verteilung habe ich einen gesonderten Artikel geschrieben.

Dkracht 12:29, 24 March 2008 (CET)

Astronomie: Sphärische Trigonometrie

Gehört zu: Mathematik
Siehe auch: Tägliche Bewegung der Gestirne, Diagramme, Tageslänge
Benötigt: WordPress Latex-Plugin, WordPress Plugin Google Drive Embedder

Was ist Sphärische Trigonometrie?

Die Ebene Trigonometrie ist die Lehre von den Dreiecken in der Ebene.

Die Sphärische Trigonometrie ist die Lehre von den Dreiecken auf einer Kugeloberfläche. Solche Dreiecke werden durch Abschnitte von Großkreisen gebildet.

Das Polar-Dreieck auf der Himmelskugel

Zur Umrechnung eines Koordinatensystems in ein anderes zeichnet man sich ein sog. Polar-Dreieck, in dem die “Pole” (“Drehpunkte”) beider Koordinatensysteme vorkommen.

Zur Umrechnung der äquatorialen Koordinaten Deklination (δ) und Stundenwinkel (t) in die horizontalen Koordinaten Höhe (h) und Azimuth (A) wird das sog. Polar-Dreieck wird gebildet durch den Himmelspol (N), den Zenit (Z) und ein Himmelsobjekt (O).

Im Polardreieck sind die Abstände (Bogenlängen):

  • vom Himmelspol zum Zenit: 90° – φ
  • vom Himmelspol zum Himmelsobjekt: 90° – δ
  • vom Zenit zum HImmelsobjekt: z = 90° – h

Im Polardreieck sind die Winkel an den Ecken des Dreiecks:

  • Winkel am Himmelspol: Stundenwinkel t (oder τ)
  • Winkel am Zenith: 180°  – A   (A = Azimuth von Süden)
polardreieck.svg

Polardreieck

Link: https://de.wikibooks.org/wiki/Astronomische_Berechnungen_f%C3%BCr_Amateure/_Druckversion#Koordinatentransformationen

MIt dem Seiten-Cosinussatz errechnet man den Cosinus der Länge einer Seite aus den Längen der beiden anderen Seiten und dem gegenüberliegenden Winkel:
\(\cos z = \cos (90° – \phi) \cos (90° – \delta) + \sin (90° – \phi) \sin (90° – \delta) \cos t\)

Was schließlich heisst:
\(\sin h = \sin \phi \sin \delta + \cos \phi \cos \delta \cos t \)

Der Cotangens-Satz im Polardreieck sagt:

\(   \cos (90° – \phi)  \cos t = \sin(90° – \phi) \cot (90° – \delta) – \sin t \cot(180° – A)  \)

Trigonometrisch umgeformt ergibt das:
\(  \sin \phi \cos t = \cos \phi \tan \delta – \Large\frac{\sin t}{\tan A}  \)

Aufgelöst nach A ergibt sich:

\(   \tan A = \Large\frac{\sin t}{\sin \phi \cos t – \cos \phi \tan \delta} \)

MIt Hilfe dieser Koordinatentransformation kann man für jedes bekannte Himmelsobjekt (Deklination und Rektaszension) die scheinbare tägliche Bewegung am Himmel berechnen – siehe dazu: Die scheinbare tägliche Bewegung der Gestirne.

Großkreise auf einer Kugel

Wenn ich im obigen Polardreieck h=0 setze, erhalte ich einen gekippten Großkreis (oBdA setze ich t = λ).

\(\Large \frac{\sin{\delta}}{\cos{\delta}} = – \frac{\cos{\varphi}}{sin{\varphi}} \cdot \cos{\lambda}  \)
grosskreis-01.svg

Großkreis auf der Erdoberfläche

Bei der Seefahrt bezeichnet man die Navigation auf einem Kurs entlang eines Großkreises als “Orthodrome” (Gegensatz: Loxodrome).

Mehr dazu: https://www.navigareberlin.de/onewebmedia/Grosskreisnavigation%20Ver%C3%B6ffentlichung.pdf

Metrik auf einer Kugeloberfläche

Für eine Kugel mit dem Radius r kann ich auf der Kugeloberfläche (z.B. Erdoberfläche) ein Koordinatensystem (s.o.) benutzen:

  • Koordinatensystem (λ, \( \varphi \))
  • wobei im Bogenmass: \( \Large -\frac{\pi}{2} < \varphi < \frac{\pi}{2} \)
  • und auch im Bogenmass: \( \Large 0 \leq \lambda < 2\pi \)

Zur Messung von Abständen (Längen) benötige ich ein LInienelement:

\(\Large ds^2 = r^2 d \varphi^2 + r^2 \cos{\varphi}^2 d\lambda^2 \)

Die kürzeste Verbindung zweier Punkte liegt dann auf einem sog. “Großkreis” (s.o.).

Beispiel 1 (gerade)

Die Strecke von (0.0) nach (π, 0); das ist ein halber Erdumfang am Äquator) müsste eine Länge von π r haben. Da auf der ganzen Strecke φ konstant =0 ist, ist auch dφ = 0 und es  ergibt sich als Längenintegral:

\( \Large s = r \int\limits_{0}^{\pi} d \lambda = r \cdot \left[ \lambda \right]_0^\pi  = \pi \cdot r\)

Beispiel 2 (gerade)

Die Strecke von (0,0) nach (0, π/2) ist ein Viertel Erdumfang vom Äquator zum Nordpol (ein sog. Quadrant) die Länge müsste also \(r \frac{\pi}{2} \) sein. Da auf der ganzen Strecke λ konstant =0 ist, ist auch dλ=0 und es ergibt sich als Längenintegral:

\( \Large s = r \int\limits_{0}^{\frac{\pi}{2}} d \varphi = r \cdot \left[ \varphi \right]_0^{\frac{\pi}{2}}  = r \cdot \frac{\pi}{2}\)

Beispiel 3 (schräg)

Aus dem obigen “Polardreieck” wird das “nautische Grunddreick“, wo wir wieder den Seiten-Cosinussatz anwenden können, um die Distanz zu berechnen. Die Distanz d zwischen einem Ausgangspunkt \( A = (\lambda_A, \varphi_A) \) zu einem Endpunkt \( B = (\lambda_B, \varphi_B) \) können wir also berechnen als:

\(\Large \cos{d} = \sin{\varphi_A} \sin{\varphi_B} + \cos{\varphi_A} \cos{\varphi_B} \cos{(\lambda_B – \lambda_A)} \ \\ \)

Die Strecke von (0, π/3) nach (π, 0) läuft jetzt “schräg” über unser Koordinatensystem…

\(\Large \cos{d} = \sin{\frac{\pi}{3}} \sin{0} + \cos{\frac{\pi}{3}} \cos{0} \cos{\pi}\)

Das ergibt: \( \Large \cos{d} = \frac{1}{2}\sqrt{3} \cdot 0 + \frac{1}{2} \cdot 1 \cdot (-1) = -\frac{1}{2} \\\ \)

und damit ist die gesuchte Distanz  \( d = \frac{2}{3} \pi \)

Um diese Distanz aus unserem Linienelement zu ermitteln, müssen wir das Linienelement entlang des Bogens von A nach B integrieren.

Dafür wollen wir den Weg zuerst als Funktion \( \varphi = f(\lambda) \) aufschreiben.

https://drive.google.com/file/d/1KsWze0RuemuXoe755Z_glIkhA2pTGilH/view?usp=drive_web

Mathematik: Von Pythagoras bis Einstein

Gehört zu:  Mathematik und Physik
Siehe auch: Kosmologie , Quantenmechanik, Mathematik, Komplexe Zahlen
Benötigt: WordPress Plugin LaTeX

Ein bisschen Mathematik

Angeregt von einem Youtube-Video “Top 10 equations that changed to world” wollte ich hier die wichtigsten Errungenschaften der Mathematik und Physik sind darstellen:

  • Der Lehrsatz des Pythagoras  10
  • Der Logarithmen (Napier)   9
  • Differentialrechnung (“Calculus”) und Grenzwerte  (Newton, Leibnitz)  8
  • Das Gravitationsgesetz (Newton)  7
  • Die komplexen Zahlen (Euler,…)  6
  • Wellengleichung   (d’Alembert) 5
  • Fourier Transformation   4
  • Navier Stokes Gleichung   – Aerodynamik  –   3
  • Faraday und Maxwell Gleichungen   2
  • Die Black-Schole-Gleichung   – Finanzmathematik    2
  • Einstein Relativitätstheorie und Schrödinger Quantenmechanik  1

Der Lehrsatz des Pythagoras

Im rechtwinkligen Dreieck mit den Katheten a und b und der Hypotenuse c gilt:

a² + b² = c²

Dies ist die Basis für die Messung von Entfernungen. Hierdurch wird die Geometrie mit der Algebra verbunden.

Auf dieser Basis kann man Entfernungen im Raum (sog. Metriken) mit mathematischen Formeln berechnen; z.B. im drei-dimensionalen Euklidischen Raum:

ds2 = dx2 + dy2 + dz2

In der Kosmologie verwendet man weitergehende Metriken, z.B. die Robertson-Walker-Metrik…

Logarithmen

Vereinfachen der Multiplikation zur Addition z.B. bei komplexen astronomischen Berechnungen….

log(a · b) = log(a) + log(b)

Logarithmische Skalen z.B. bei den Helligkeiten von Himmelsobjekten…

Differentialrechnung

Die Differentialrechnung geht auf Newton (1643-1727) und Leibniz (1646-1716) zurück …

\(  \frac{dx}{dy} = \lim \limits_{h \to 0} \frac{f(x+h)-f(x)}{h} \)
Der Begriff des Grenzwerts (des Limes) wurde erst später von Bernhard Bolzano (1781-1848) und Karl Weierstrass (1815-1897) formal eingeführt.
Newton war es, der die Differentialrechnung in die Physik einführte z.B. Kraft = Masse * Beschleunigung = Impuls abgeleitet nach der Zeit

Das Gravitationsgesetz (Newton)

Die Anziehungskraft zwischen zwei Massen m1 und m2, die eine Entfernung r voneinander entfernt sind, ist:

\( F = G \cdot \frac{m_1 \cdot m_2}{r^2} \)

Wobei G die sog. Gravitationskonstante ist.

Die komplexen Zahlen

Hierzu habe ich einen separaten Blog-Artikel geschrieben: Komplexe Zahlen

Die Wellengleichung (d’Alembert)

Die Wellengleichung, auch D’Alembert-Gleichung nach Jean-Baptiste le Rond d’Alembert (1717-1783), bestimmt die Ausbreitung von Wellen wie etwa Schall oder Licht.

 

Fourier Transformation

Joseph Fourier (1768-1830)

\(\Large f(\epsilon) = \int_{-\infty}^{+\infty} f(x) e^{-2 \pi x \epsilon} dx \)

Wobei ε die Frequenz ist…

“Jede” Funktion wir dargestellt als eine Überlagerung von Sinuswellen mit unterscheidlicher Frequenz….

Navier Stokes Gleichung   – Aerodynamik

Claude Navier (1785-1836) und George Stokes (1819-1903)

Das ist nicht so einfach…

Faraday und Maxwell Gleichungen

Michael Faraday  (1791-1867) und  James Clerk Maxwell (1831-1879)

Für das elektrische Feld E gilt:
\(
\nabla \cdot \vec{E} = 0
,
\nabla \times \vec{E} = \Large -\frac{1}{c} \frac{\partial H}{\partial t}
\)
und für das Magnetfeld H gilt:
\(
\nabla \cdot \vec{H} = 0
,
\nabla \times \vec{H} = \Large \frac{1}{c} \frac{\partial E}{\partial t}
\)

Black Schole Gleichung   – Finanzmathematik

Fischer Black (1938-1995) und Myron Scholes (1941-)

Einstein Relativitätstheorie und Schrödinger Quantenmechanik

Albert Einstein  (1879-1955)  und Erwin Schödinger (1887-1961)

Eine der Voraussetzungen zum Verständnis sind sog. Vektorräume.

Vektorräume verfügen über eine Operation, die Addition genannt wird und eine kommutative Gruppe bildet. Weiterhin muss jeder Vektorraum einen Körper von sog. Skalaren haben, mit denen die Vektoren mutipliziert werden können.

Es gibt den Begriff der “Dimension” eines Vektorraumes…..

Besonders interessant ist das sog. “innere Produkt” (engl. Dot Product) zweier Vektoren….