Physik: Richard Feynman Pfadintegral

Keyphrase: Richard Feynman

Gehört zu: Quantenphysik
Siehe auch: Schrödinger-Gleichung, Teilchenphysik, Integralrechnung

Stand: 04.09.2024

Richard Feynman (1918-1988) war Professor für Theoretische Physik an den Universitäten Cornell, Caltech u.a.

Photo from CalTech archives

Feynman gilt als einer der großen Physiker des 20. Jahrhunderts, der wesentliche Beiträge zum Verständnis der Quantenfeldtheorien geliefert hat. 1965 erhielt er den Nobelpreis zusammen mit Shin’ichirō Tomonaga und Julian Schwinger.
Besonders bekannt geworden ist Feynman durch:

Photo from CalTech archives

Das Pfadintegral nach Richard Feynman

Das auf Feynman zurückgehende “Pfadintegral” ist nicht ein Integral entlang eines Pfades von A nach B, sondern ein Integral über alle möglichen Pfade von A nach B.

Das Integral entlang eines Pfades heisst “Kurvenintegral”; dabei muss der Pfad (=die Kurve) parametrisiert werden.

Feynman-Diagramme

Der Witz am “Standardmodell der Elementarteilchenphysik” ist, dass neben der Aufzählung und Klassifikation der Elementarteilchen auch die Wechselwirkungen zwischen ihnen beschrieben werden. Um diese Wechselwirkungen zwischen Elementarteilen zu beschreiben, erfand Richard Feynman eine spezielle Art von Diagrammen, die nach ihm benannt wurden.

Richard Feynman: Seine berühmten Vorlesungen

Berühmt geworden sind die Vorlesungen von Richard Feynman, die man heute noch in Youtube findet.

Search Engine Optimization

We need some more text in this blog article. Otherwise this article will be rated as a “not good”  SEO score. The text length should be 300 words. No problem, we can add words with absolutely no meaning ad libidum. Noch mehr Wörter sind gefordert.

We need some more text in this blog article. Otherwise this article will be rated as “not good” SEO score. The text length should be 300 words. No problem, we can add words with absolutely no meaning ad libidum. Noch mehr Wörter sind gefordert.

Noch mehr Blah-Blah-Text kommt sofort:

We need some more text in this blog article. Otherwise this article will be rated as “not good” SEO score. The text length should be 300 words. No problem, we can add words with absolutely no meaning ad libidum. Noch mehr Wörter sind gefordert.

We need some more text in this blog article. Otherwise this article will be rated as “not good” SEO score. The text length should be 300 words. No problem, we can add words with absolutely no meaning ad libidum. Noch mehr Wörter sind gefordert.

Und noch ein bisschen Text, damit wir die 300 Wörter erreichen.

Mathematik: Variationsrechnung – Calculus of Variation

Gehört zu: Mathematik
Siehe auch: Integralrechnung, Metrik, Lagrange-Formalismus, Pfad-Integral

Stand: 05.06.2024

YouTube: Dr. Juan Klopper

Idee der Variationsrechnung

Mit Hilfe der Variationsrechnung versucht man Minima zu finden.

Beispiele:

  • Der kürzeste Weg zwischen zwei Punkten
  • Die kürzeste Zeit einer Bewegung (Fermat’sches Prinzip)
  • Die kleinste Oberfläche eines Volumens
  • Die kleinste “Wirkung” in einem physikalischen System (s.u.)

Im Gegensatz zur Schul-Mathematik suchen wir jetzt nicht einen Punkt, bei dem eine Funktion ein Minimum hat, sondern einen Pfad (also eine Funktion) bei der ein “Funktional” (Funktion von Funktionen) ein Minimum hat.

Die Euler-Lagrange-Gleichung

Wir haben eine Funktion entlang eines Pfades. Wobei so ein Pfad definiert sei durch eine Funktion y = y(x) zwischen den Stellen x1 und x2. Wir können eine Funktion F entlang eines Pfades “aufsummieren” d.h. integrieren. Wir suchen nun zu einer gegebenen Funktion F  denjenigen Pfad, bei dem dieser Integralwert ein Mininimum wird.

\( S = \int\limits_{x_1}^{x_2} F(x, y, y^\prime) \, dx = Minimum \\\)

Um das Minimum dieses Integralwertes über alle Pfade zu finden, “differenziert” man S nach dem Pfad und schreibt δS=0; d.h. eine infinitesimal kleine Änderung im Pfad soll nur eine infinitesimal kleine Änderung in S bewirken. Man nennt einen solchen Pfad auch “stationär”.

Leonard Euler (1707-1783) entwickelte dazu die “Variationsrechnung”. Sein Trick war, “kleine Änderungen” eines Pfades mathematisch zu beschreiben und einen Methode zu finden, danach zu differenzieren.

Nach längerem Rechnen (auch mit Integration by Parts) bekommt man als Lösung der Minimum-Aufgabe die berühmte Euler-Lagrange-Gleichung,

\(\Large \frac{\partial F}{\partial y} – \frac{d}{dx}(\frac{\partial F}{\partial y^\prime}) = 0 \\\)

Beispiel

Mal ein ganz einfaches Beispiel: Der kürzeste Weg zwischen zwei Punkten P1 =(x1, y1) und P2 =(x2,y2):

\( S = \Large\int\limits_{P_1}^{P_2} ds = \int\limits_{x_1}^{x_2} \sqrt{1 + (\frac{dy}{dx})^2 }\, dx  = Minimum\\ \)

Wir haben in diesem Fall also:

\( F(x, y, y^\prime) = \Large\sqrt{1 + {y^\prime}^2 } \\\)

Wir wollen auf diese Funktion F die obenstehende Euler-Lagrage-Gleichung anwenden und bestimmen dazu zunächst die einzelnen Terme:

\( \frac{\partial F}{\partial y} = 0 \\ \)

und:

\( \frac{\partial F}{\partial y^\prime} = \frac{1}{2}  ( 1 +{ y^\prime}^2) ^{-\frac{1}{2}}\cdot 2 y^\prime = \frac{y^\prime}{\sqrt{1 + {y^\prime}^2}}\\ \)

Wenn wir diese beiden Terme in die Euler-Lagrange-Gleichung einsetzen, erhalten wir schließlich:

\( \frac{d}{dx}(\frac{\partial F}{\partial y^\prime}) =  \frac{d}{dx}(\frac{y^\prime}{\sqrt{1 + {y^\prime}^2}}) = 0\\\)

Wann ist eine Ableitung einer Funktion gleich Null? Wenn die Funktion eine Konstante (c)  ist. Also ist:

\( \frac{y^\prime}{\sqrt{1 + {y^\prime}^2}} = c \\\)

Wenn wir dann diese Gleichung quadrieren und ein wenig umstellen erhalten wir:

\( (y^\prime)^2 = const. \\ \)

Damit ist auch y’ konstant und alle Lösungen dieser Differentialgleichung sind:

\( y = a x + b \\ \)

Also haben wir gerade Linien als Minimum des Abstands.

Somit  haben wir für einen ersten sehr simplen Fall die Richtigkeit der Euler-Langrange-Gleichung gezeigt.

Prinzip der kleinsten Wirkung

Wenn F = Ekin – Epot, nennt man das Integral, warum auch immer, “Wirkung” (engl. action) entlang des Pfades.

\( S = \int\limits_{x_1}^{x_2} (E_{kin}(x, y, y^\prime) – E_{pot}(x, y, y^\prime)) \, dx = Minimum \\\)

Daraus ergibt sich die sog. Lagrange Mechanik.

Genaugenommen müsste der Pfad dann noch mit der Zeit t parametrisiert werden…

Mathematik: Integralrechnung

Gehört zu: Mathematik

Siehe auch: Kurven, Metrik, Pfadintegral

Stand: 30.05.2024

Die Integralrechnung bildet zusammen mit der Differentialrechnung, das was die Engländer und Amerikaner “Calculus” nennen. Bei uns sagt man eher “Infinitesimalrechnung”. Erfunden haben sollen das Newton und Leibnitz unabhängig von einander.

Die Grundlagen haben wir in der Schul-Mathematik gelernt.

Allgemeines

Es gibt ein bestimmtes Integral und ein unbestimmtes Integral.

Das unbestimmte Integral einer Funktion ist einfach die Umkehroperation zum Differenzieren. Man sucht eine sog. Stammfunktion, die differenziert die ursprüngliche Funktion ergibt. Zur Stammfunktion kommt dann immer eine beliebige Integrationskonstante dazu.

Das bestimmte Integral geht von einer Untergrenze zu einer Obergrenze. Da hebt sich eine Integrationskonstante immer weg. Man verbildlicht sich das gerne als Fläche unter einer Kurve.

Wichtige Regeln

Das Integrieren einer Funktion ist im allgemeinen schwieriger als Differenzieren, weil man ja eine Stammfunktion sucht, die…

Neben den vielen einfachen Regeln in der Integralrechnung gibt es eine, die ich aus der Schule so nicht wirklich kannte: “Integration by Parts“.

Integration by Parts (Partielle Integration)

Wenn man ein Integral lösen will, was trotz der üblichen Bemühungen (z.B. algebraisch Vereinfachen, Substituieren,…) widerspenstig ist, hilft es manchmal es so umzuschreiben, dass dann die Lösung klappt.

\( \Large \int u \, dv = u \cdot v \, \, – \int v \, du \)

Wir bekommen statt eines “unschönen” Integrals nun ein anderes Integral; das würde Sinn machen, wenn das neue Integral einfacher zu lösen wäre.

Man muss dazu geschickt wählen, was u sein soll und was dv sein soll.

Beispiel:

\( \Large \int x \cdot e^x \, dx = ? \)

Wir versuchen es mit:  \( u = x \). Dann muss  \( dv = e^x \, dx \) sein.

Um die Formel anzuwenden, brauchen wir dazu du und v.

\(du\) bekommen wir durch Differenzieren von \( u \): \( du = dx \)

\(v\) bekommen wir durch Integrieren von \( dv \): \( v = e^x \)

Das setzen wir nun in die Formel ein:

\(\Large \int x \cdot e^x \, dx = x \cdot e^x  – \int e^x \, dx\\\)

Das neue Integral können wir leicht lösen und bekommen also:

\(\Large \int x \cdot e^x \, dx = x \cdot e^x  –  e^x + c\)

Tipps zur “Integration by Parts”

Man kann einen “schwierigen” Integranden ja verschieden in Faktoren (u und dv) aufbrechen.

Wenn ein Versuch nicht zum Ziel führt, kann man einen neuen Versuch machen etc.

Generell sagt man, dass man denjenigen Faktor als “u” wählen sollte, der beim Differenzieren einfacher wird wobei der andere Faktor “dv” dann beim Integrieren keine Schwierigkeiten machen sollte.

Physik: Quantenmechanik nach Susskind

Gehört zu: Physik
Siehe auch: Quantenmechanik, Die Bra-Ket-Notation, Wellenfunktion, Komplexe Zahlen

Stand: 17.03.2024

Quantenmechanik nach Susskind

Bei Youtube bin ich auf die Vorlesungen von Prof. Susskind an der Stanfort University gestossen (“continued education”).

Professor Susskind beschreibt die für die Quantenmechanik erforderliche Mathematik einfach und anschaulich, was nicht immer ganz genau der reinen Mathematik entspricht. Deswegen kann ich es gut verstehen.

Zunächst betrachten wir klassische Physikalische Systeme, danach gehen wir Zug um Zug in die Welt der Quantenphysik. Der Trick dabei ist, schon die klassische Physik “gepixelt” zu sehen, was approximativ möglich sein sollte.

In der Quantenphysik werden wir es immer wieder mit Komplexen Zahlen zu tun haben. Auch der Begriff der komplex konjugierten wird hier eine große praktische Rolle spielen.

Ket-Vektor

Ein physikalisches System kann verschiedene diskrete Zustände annehmen (ggf. approximiert).

Z.B. Das Werfen  einer Münze: Kopf oder Zahl

Z.B. Ein Würfel: Eins, Zwei, Drei, Vier, Fünf oder Sechs

Z.B. Spin eines Elektrons: Up oder Down

So einen Zustand schreiben wir auf als sog. “Label” in sog. Ket-Schreibweise…

z.B.    |Kopf>   oder |Zahl>

z.B.   |Eins> oder |Zwei> oder…

z.B. |Up> oder |Down>

Wir können jeden Zustand (State) durch einen Spalten-Vektor repräsentieren.

\(  |Kopf> \space  —>   \left( \begin{array}{c} 1 \\\ 0   \end{array}\right)   \)

und

\(  |Zahl>  \space —>   \left( \begin{array}{c} 0\\\ 1   \end{array}\right)  \\  \)

Oder beim Würfel:

\(  |Eins> \space  —>   \left( \begin{array}{c} 1 \\\ 0  \\\ 0 \\\ 0 \\\ 0 \\\ 0  \end{array}\right)   \) und     \(  |Zwei> \space  —>   \left( \begin{array}{c} 0 \\\ 1  \\\ 0 \\\ 0 \\\ 0 \\\ 0  \end{array}\right)   \) und …

Man sagt auch |a> sei ein Vektor, obwohl der zugehörige Spaltenvektor “nur” eine Repräsentation von |a> ist. Manchmal identifizieren wir beides (aus Bequemlichkeit).

Die Menge der möglichen Zustände nennt man auch “Zustandsraum“. Beispielsweise:

\( S = \left\{ \left( \begin{array}{c} 1 \\\ 0   \end{array}\right) , \left( \begin{array}{c} 0\\\ 1   \end{array}\right)  \right\} \\ \)

Der Zustand eines physikalischen Systems könnte sich mit der Zeit ändern. Den Zustand zu einem bestimmten Zeitpunkt nennt man auch “Konfiguration“.

Später werden wir sehen, wie dieser Zustandsraum einen zu einem Vektorraum erweitert werden kann (der Vektorraum wird aufspannt).

Bra-Vektor

Zu jedem Ket-Vektor |a>  bilden wir einen sog. Bra-Vektor <a| auf folgende Weise:

Der Ket-Vektor sei:

\(  |a> \space  —>   \left( \begin{array}{c} a_1 \\\ a_2  \\\ a_3 \end{array}\right)  \\ \)

dann bilden wir den zugehörigen Bra-Vektor als Zeilenvektor folgendermaßen:

\(  <a| \space  —>   \left( \begin{array}{r} {a_1}^* &  {a_2}^*  &  {a_3}^* \end{array}\right)  \\ \)

Wir sagen, der Bra-Vektor sei das komplex konjugierte zum Ket-Vektor

Inneres Produkt

Das sog. “Innere Produkt” zweier Vektoren definieren wir nun einfach als:

\( <a|b> = \left( \begin{array}{r} {a_1}^* &  {a_2}^*  &  {a_3}^* \end{array}\right)  \cdot \left( \begin{array}{c} b_1 \\\ b_2  \\\ b_3 \end{array}\right) = {a_1}^*  b_1 + {a_2}^* b_2 + {a_3}^* b_3 \\ \)

Das Innere Produkt eines Vektors mit sich selbst ist dann immer eine reelle Zahl. Wir definieren als “Länge” oder auch “Norm” eines Vektors die positive Wurzel aus diesem Inneren Produkt.

Wenn das Innere Produkt zweier Vektoren Null ist, sagen wir sie seien “orthogonal”.

Observable

Observable nennt man Dinge, die man messen kann.

In einem bestimmten physikalischen Experiment wollen wir eine bestimme Größe messen und bekommen so zu jedem Zustand des Systems einen Messwert.

Eine bestimmte Observable M ordnet also jedem Zustand aus dem Zustandsraum S einen Messwert (reelle Zahl) zu. Mathematisch geschrieben:

\( M: S \to \mathbb{R} \)

Abstrakter Vektorraum

Die Ket-Vektoren |a> bilden einen (abstrakten) Vektorraum; d.h. es gelten bestimmte Regeln:

Regel 1: Jeder Vektor aus dem Vektorraum kann mit einem Skalar (komplexe Zahl) mutipliziert werden, wobei das Ergebnis wieder ein Vektor aus dem Vektorraum ist.

\( \lambda \space | a> = | a^\prime> \)

Regel 2: Zwei Vektoren aus dem Vektorraum kann ich addieren, wobei das Ergebnis wieder ein Vektor aus dem Vektorraum ist.

\(  | a >  +  | b >  =  | c > \)

Beispiele von Vektorräumen

Die Menge der Ket-Vektoren bilden einen Vektorraum, wobei wir als Einträge ganz allgemein Komplexe Zahlen zulassen und die Dimension des Vektorraums gleich der Anzahl verschiedener Zustände ist.

Die oben aufgeführten Regeln für Vektorräume gelten offenbar:

\( \lambda \left( \begin{array}{c} a_1 \\\ a_2  \\\ a_3 \end{array}\right) = \left( \begin{array}{c}\lambda  a_1 \\\ \lambda  a_2  \\\ \lambda a_3 \end{array}\right) \\\) \(   \left( \begin{array}{c} a_1 \\\ a_2  \\\ a_3 \end{array}\right) + \left( \begin{array}{c} b_1 \\\ b_2  \\\ b_3 \end{array}\right) = \left( \begin{array}{c} a_1 + b_1 \\\ a_2 + b_2 \\\ a_3 + b_3\end{array}\right)   \)

Linearkombinationen

Wir können jeden Ket-Vektor | a > als Linearkombination der Zustandsvektoren darstellen:

\( | a > = \left( \begin{array}{c} a_1 \\\ a_2  \\\ a_3 \end{array}\right) = a_1 \left( \begin{array}{c} 1 \\\ 0  \\\ 0 \end{array}\right) +  a_2 \left( \begin{array}{c} 0 \\\ 1  \\\ 0 \end{array}\right)  + a_3 \left( \begin{array}{c} 0 \\\ 0  \\\ 1 \end{array}\right)  \\\)

Damit spannen die Zustandsvektoren einen (abstrakten) Vektorraum auf, aber nicht jeder Vektor aus diesem Vektorraum beschreibt einen physikalischen Zustand – …

Quantenmechanisches Beispiel

Wenn ich den Spin eines quantenmechanischen Elektrons messe, bekomme ich bei jeder Messung einen von zwei Zuständen, die wir | up > und | down > nennen können.

Diese beiden Zustände repräsentieren wir durch zwei Spaltenvektoren im Vektorraum:

\(  | up > \space  —>   \left( \begin{array}{c} 1 \\\ 0   \end{array}\right)  \\ \) und

\(  | down >  \space —>   \left( \begin{array}{c} 0\\\ 1   \end{array}\right)  \\ \)

In der klassischen Physik würde niemand auf die Idee kommen, Linearkombinationen solcher zwei Zustände zu betrachten. In der Quantenpysik machen wir das aber.

Linearkombination dieser beiden Zustände wären also:

\( a_{up} \space | up > + a_{down} \space | down > \\\)

Die Koeffizienten können wir als Spaltenvektor schreiben:

\( a = \left( \begin{array}{c} a_{up} \\\ a_{down}  \end{array}\right) \\\)

Wobei die Beträge der Komponenten (Koeffizienten der Linearkombination)  interpretiert werden als die Wahrscheinlichkeiten der Zustände; also:

\( P_{up} = a_{up} {a_{up}}^* \\\) und

\( P_{down} = a_{down} {a_{down}}^* \\\)

Wobei natürlich die Summe der Wahrscheinlichkeiten 1 ergeben muss: \( P_{up} + P_{down} = 1 \)

Alle Linearkombinationen der Ket-Vektoren  | up > und | down >, die diese Bedingung (Summe der Wahrscheinlichkeiten = 1) erfüllen, werden in der Quantenmechanik als physikalisch mögliche Zustände angesehen. Wir können diese Bedingung auch schreiben als:

\( P_{up} + P_{down} = a_{up} {a_{up}}^* + a_{down} {a_{down}}^* = \left( \begin{array}{r} {a_{up}}^* &  {a_{down}}^*   \end{array}\right)  \cdot \left( \begin{array}{c} a_{up} \\\ a_{down}   \end{array}\right) = <a|a> = 1 \)

Die Bedingung ist also: “Länge = 1”; d.h. die quantenmechanisch möglichen Zustände des Elektronen-Spins liegen auf dem Einheitskreis.

Das Besondere in diesem Fall also, dass der Elektronenspin zwar gequantelt ist, also nur diskrete Werte (+1 und -1) annehmen kann, aber die Wahrscheinlichkeiten beim Messvorgang durchaus gebrochene Zahlen sein können.

Matrizen

Wir werden Matrizen brauchen. Wofür, sehen wir später.
Eine Matrix ist einfach eine quadratische Anordnung von Zahlen, beispielsweise:

\( M = \left( \begin{matrix} m_{11} & m_{12} & m_{13} \\ m_{21} & m_{22} & m_{23} \\ m_{31} & m_{32} & m_{33} \\ \end{matrix} \right) \\ \)

So eine Matrix M können wir anwenden auf einen Spaltenvektor v indem wir im Prinzip die inneren Produkte von Matrix-Zeilen mit dem Spaltenvektor bilden:

\( M v =  \left( \begin{matrix} m_{11} & m_{12} & m_{13} \\ m_{21} & m_{22} & m_{23} \\ m_{31} & m_{32} & m_{33} \\ \end{matrix} \right)  \left( \begin{array}{c} v_1 \\\ v_2  \\\ v_3 \end{array}\right) = \left( \begin{array}{c} m_{11} v_1  + m_{12} v_2  + m_{13} v_3 \\\ m_{21} v_1 + m_{22} v_2 + m_{23} v_3  \\\ m_{31} v_1 + m_{32} v_2 + m_{33} v_3\end{array}\right) \\ \)

Das Ergebnis ist wieder ein Spaltenvektor.

Wenn wir nun einen Zeilenvektor w und eine Matrix M nehmen, sieht das ganz analog aus:

\( w M  =  \left( \begin{array}{c} w_1 & w_2  & w_3 \end{array}\right) \left( \begin{matrix} m_{11} & m_{12} & m_{13} \\ m_{21} & m_{22} & m_{23} \\ m_{31} & m_{32} & m_{33} \\ \end{matrix} \right)  = \left( \begin{array}{c} w_1 m_{11}  + w_2 m_{21} + w_3 m_{31}  & w_1 m_{12}  + w_2 m_{22} + w_3 m_{32}  & w_1 m_{13} + w_2 m_{23} + w_3 m_{33} \end{array}\right) \\ \)

Das Ergebnis ist wieder ein Zeilenvektor.

Matrizen als Operatoren auf einem Vektorraum

Matrizen kann man auch “Operatoren” nennen. Sie können die Vekoren eines Vektorraums transformieren. Das allgemeine KOnzept heißt “Linearer Operator” oder auch “Lineare Transformation”. Wir identifizieren diese zur Vereinfachung.

Wir schauen uns mal ein paar Beispiele aus dem 2-dimensonalen reellen Vektorraum an.

Beispiel 1: Stretchen um einen Faktor 2

\( M v = \left( \begin{matrix} 2 & 0 \\ 0 & 2  \end{matrix} \right)  \left( \begin{array}{c} v_x \\\ v_y  \end{array}\right)  =   \left( \begin{array}{c} 2 v_x \\\  2 v_y  \end{array}\right)  \\ \)

Beispiel 2: Stretchen in Richtung der y-Achse

\( M v = \left( \begin{matrix} 1 & 0 \\ 0 & 2  \end{matrix} \right)  \left( \begin{array}{c} v_x \\\ v_y  \end{array}\right)  =   \left( \begin{array}{c} v_x \\\  2 v_y  \end{array}\right)  \\ \)

Beispiel 3: Rotieren um 90 Grad im Uhrzeigersinn

\( M v = \left( \begin{matrix} 0 & 1 \\ -1 & 0  \end{matrix} \right)  \left( \begin{array}{c} v_x \\\ v_y  \end{array}\right)  =   \left( \begin{array}{c} v_y \\\  -v_x  \end{array}\right)  \\ \)

Wir sehen also: Matrizen transformieren einen Vektorraum; aber nicht alle Transformationen sind Matrizen.

Hermitische Matrizen

Observable in der Quantenphysik werden durch hermitische Operatoren dargestellt. Wir schauen hier deswegen auf hermitische Matrizen.

Eine hermitische Matrix ist definiert durch: \( m_{ij} = {m_{ji}}^*   \)

Eine hermitische Matrix ist vom Konzept her so etwas wie eine reelle Transformation, aber nicht ganz genau: nur die Diagonalelemente der Matrix sind reell, die anderen Elemente werden beim Spiegeln an der Diagonale komplex konjugiert.

Die Namensgebung geht zurück auf den französischen Mathematiker Charles Hermite (1822-1901).

Hintergrund:

Zu einer Matrix \(M = (m_{ij}) \) definieren wir eine “Hermitsch konjugierte” Matrix und schreiben die mit einem “Dagger”;

\( \Large M^\dagger = (m_{ij}^*) \)

Wir nennen eine Matrix M “hermitisch”, wenn sie gleich ihrer hermitisch konjugierten ist, also wenn:

\( \Large M = M^\dagger \\ \)

Diese Eigenschaft ist so ähnlich wie \( z = z^* \) bedeutet, dass z eine reelle Zahl ist.

In der Quantenphysik werden wir es fast ausschließlich mit Hermitischen Matrizen (Hermitischen linearen Operatoren) zu tun haben.

Zusammenfassung Nr. 1 zur Quantenphysik

In der Quantenphysik geht es darum, Wahrscheinlichkeiten zu berechnen. Wahrscheinlichkeiten, dass eine Observable bei einem bestimmten Zustand des Systems einen bestimmten Wert (Messwert) annimmt.

Vektoren repräsentieren die Zustände.
Solche Zustandsvektoren bekommen eine irgendwie geartete Bezeichnung (“Label”); z.B. \( |hinz\rangle  \text{ und } |kunz\rangle \).
Auch die Linearkombinationen solcher Zustandsvektoren werden als Zustände bezeichnet.
Alle solchen Linearkombinationen, im Beispiel:  \( a |hinz\rangle + \enspace b |kunz\rangle \enspace mit\enspace  a, b \in C \), bilden einen Vektorraum, den sog, Zustandsraum

Hermitische Matrizen repräsentieren die Observablen.
Wie ich zu einer Observablen (also einer Messgröße) die Matrix finde, ist noch ein Geheimnis.
Später werden wir sehen, dass die Eigenwerte der Matrix die Werte sind, die die Observable annehmen kann; d.h. die wir messen können.

Erwartungswert einer Observablen

Nun entspricht also eine Hermitische Matrix M einer Observablen.

In einem bestimmten Zustand  | a > ist der Erwartungswert der Observablen M:

\( < a | M | a> = \text{Erwartungswert von M} \\ \)

Vergleiche dazu auch: Schroedinger

Eigenwert und Eigenvektor in der Quantenphysik

Wofür diese Konzepte gut sind, sehen wir hier in der Quantenphysik: Die Eigenwerte einer Hermitischen Matrix werden die möglichen Messwerte der Observablen sein.

Wir betrachten eine hermitische Matix M und fragen uns, ob es dazu einen Vektor |a>  gibt, der durch die Matrix M nicht in der Richtung, sondern nur in der Länge verändert wird. Die Längenveränderung  wäre dann ein Faktor, der vom Vektor |a> abhängt, weswegen wir in λa nennen.

\(  M|a> = \lambda_a | a > \\ \)

Wenn es so etwas zu der Matrix M gibt, nennen wir so ein  λa einen Eigenwert, und den Vektor |a> einen Eigenvektor der Matrix.

Der Witz in der Quantenmechanik ist, dass die Eigenwerte einer hermitische Matrix M die möglichen Messwerte der Observablen sind und der zugehörige Eigenvektor ist der Zusrand in dem die Wahrscheinlichkeit, diesen Wert zu messen 1 ist.

Wie man auf diese Matrizen kommt, die ja Observable repräsentieren sollen, ist noch völlig offen.

Wir schauen uns als Beispiele mal diagonale Matrizen an. Man sieht leicht, dass die Diagonalelemente die Eigenwerte sind und die Eigenvektoren die möglichen Einheitsvektoren aus lauter Nullen und einer Eins.

Beispiel Elektronenspin

Die Observable ist also der Spin eines Elektrons, der +1 oder -1 sein kann.

Als Matrix für diese Observable nehmen wir mal:

\( \sigma_3 = \left( \begin{matrix} 1 & 0  \\ 0 & -1  \\ \end{matrix} \right) \\ \)

Diese Matrix wird auch “Spinoperator” genannt und mit σ3 bezeichnet. Diese Matrix als Repräsentation der Observablen “Spin” fällt hier ersteinmal so vom Himmel. Wir können aber einfach nachweisen, dass es stimmt, den die Eigenwerte sind:
+1 zum Eigenvektor \( \left( \begin{array}{c} 1 \\\ 0   \end{array}\right)  = |up> \) und -1 zum Eigenvetor \( \left( \begin{array}{c} 0 \\\ 1   \end{array}\right)  =|down> \)

Genaugenommen steht σ3 für die Messung des Eletronenspins in z-Richtung (wieso das so ist kommt später).

In y-Richtung gemessen bekommen wir als Observable:

\(  \sigma_2 = \left( \begin{matrix} 0 & -i  \\ i & 0  \\ \end{matrix} \right) \\\)

In x-Richtung gemessen bekommen wir als Observable:

\( \sigma_1 = \left( \begin{matrix} 0 & 1  \\ 1 & 0  \\ \end{matrix} \right) \\ \)

Wir haben also 3 Spinoperatoren…

Wichtiger Satz über Eigenwerte (Lecture 3, t=59m)

Wenn es zu einer Observablen (hermitischen Matrix) M mehrere Eigenvektoren gibt:

\(  M | a > = \lambda_a  | a > \\ \)

und

\(  M | b > = \lambda_b  | b > \\ \)

und die Eigenwerte verschieden sind, dann sind die Eigenvektoren orthogonal; also <a|b> = 0.

Ein Eigenvektor |a> beschreibt ja einen Zustand, in dem die Wahrscheinlichket 1 ist, den Wert λa zu messen.

Wenn ich also zu einer Observablen zwei unterschiedliche Messwerte λa bzw. λb bekomme, gibt es dazu zwei orthogonale Zustandsvektoren |a> und |b>, in denen die Wahrscheinlichkeit 1 ist, die Messwerte λa bzw. λb zubekommen.

Ein Satz zu Wahrscheinlichkeiten (Lecture 3, t= 1h 14:30m)

Wir mögen ein System haben, das im Zustand |b> präpariert ist – z.B. ein Elektron haben mit dem Elektronenspin |b>

Nun betrachten wir eine Observable M mit einem Eigenwert λa zum Eigenvektor |a> .

Wenn wir in dem gegebenen Zustand |b> eine Messung mit M durchführen, können wir uns fragen, mit welcher Wahrscheinlichkeit P unser Messergebnis λa sein wird.
Prof. Susskind sagt:
\( P = \langle a|b \rangle {\langle a|b \rangle}^* \)

Quantenmechanik mit einem Elektronenspin (Lecture 4)

Wir stellen uns vor, wir hätten ein Elektron so präpariert, dass der Elektronenspin in Richtung des (räumlichen) Vektors n = (n1, n2, n3) zeigt.

Nun wollen wir den Elektronenspin dieses Elektrons entlang der Richtung m = (m1, m2, m3) messen. Das Ergebnis ist (natürlich) entweder +1 oder -1 (so merkwürdimg ist die Quantenwelt).

Dieses ganze Experiment (präparieren und dann messen) wiederholen wir sehr oft, um die Wahrscheinlichkeit P+ für das Messergebnis +1 bzw. die Wahrscheinlichkeit P für das Messergebnis -1  zu bestimmen.

Das können wir jetzt ja ganz einfach ausrechnen. Als Ergebnis (ohne Beweis)  erhalten wir, dass die Wahrscheinlichkeit nur vom (räumlichen) Winkel θ zwischen den beiden Vektoren abhängt. Der Cosinus dieses Winkels ist bekanntlich das Innere Produkt der beiden Richtungs-Vektoren:

\( \Large \cos{\theta} = \langle n, m \rangle \\ \)

Und die Wahrscheinlichkeit wird (ohne Beweis):

\( \Large P_+ = \frac{1 + \cos{\theta}}{2} \\ \)

Wichtger Zusatz: Kommutator (Lecture 4, t= 1h 54m)

Wenn wir eine Messung einer Observablen durchführen, verändern wir den Zustand des Quantensystems. (Detail: Es ändert sich der “Eigenzustand” auf einen Eigenvektor, der zu dem gemessenen Eigenwert gehört.)

Wir können also nicht zwei Messungen eines Anfangszustands machen, denn der Anfangzustand hat sich ja durch die erste Messung verändert. Das würde nur gehen, wenn die beiden Matrizen (=Observablen) die gleichen Eigenvektoren hätten.

Prof. Susskind sagt (ohne Beweis), dass zwei Matrizen A und B genau dann die gleichen Eigenvektoren haben (evtl. aber andere Eigenwerte) , wenn sie kommutieren; d.h. wenn AB = BA.
Man nennt AB – BA den Kommutator von A und B und schreibt auch:

\(  [A,B] = AB – BA \\\)

Ein System mit zwei Elektronen: Entanglement (Lecture 4, t= 1h 55m)

Zunächst machen wir mal eine kleine Tabelle, wie das mit einem Elektron war:

\( \begin{array}{l} \sigma_1 | up \rangle = | down \rangle \\ \sigma_1 | down \rangle = | up \rangle \\ \sigma_2 | up \rangle = i | down \rangle \\ \sigma_2 | down \rangle = -i | up \rangle \\ \sigma_3 | up \rangle =  | up \rangle \\ \sigma_3 | down \rangle = – | down \rangle \end{array} \\\)

Wenn wir nun zwei Elektronen betrachten, haben wir die vier möglichen  Zustände der beiden Elektronenspins, die wir als Ket-Vektoren aufschreiben:

| u u >

| u d >

| d u >

| d d >

Diese vier spannen mit ihrern Linearkombinationen einen vierdimensionalen komplexen Vektorraum auf:

\( a | u u > + b | u d > + c | d u > + d | d d > \\ \)

Physik: Elektrodynamik

Gehört zu: Physik

Stand: 16.02.2024

Elektrodynamik

Die klassische Elektrodynamik (auch Elektrizitätslehre) ist das Teilgebiet der Physik, das sich mit bewegten elektrischen Ladungen und mit zeitlich veränderlichen elektrischen und magnetischen Feldern beschäftigt. Die Elektrostatik als Spezialfall der Elektrodynamik beschäftigt sich mit ruhenden elektrischen Ladungen und ihren Feldern.

Die zugrundeliegende Grundkraft der Physik heißt elektromagnetische Wechselwirkung.

Die Theorie der klassischen Elektrodynamik wurde von James Clerk Maxwell (1831-1879) Mitte des 19. Jahrhunderts mithilfe der nach ihm benannten Maxwell-Gleichungen formuliert.

Älterer Blog-Artikel: Elektrisches Feld

Physik: Entropie

Gehört zu: Klassifikation
Siehe auch: Maschine Learning, Thermodynamik, Zustand
Benutzt: Latex-Plugin für WordPress, Fotos von Wikimedia

Stand: 26.01.2024

Was ist Entropie?

Der Begriff “Entropie” wird klassischerweise in der statistischen Thermodynamik verwendet.
Dieser Begriff wurde von Rudolf Clausius (1822-1888) in die Physik eingeführt.

Ludwig Boltzmann (1844-1906)  hat dann 1877 die berühmte Formel aufgestellt, die auch auf seinem Grabstein auf dem Wiener Zentralfriedhof steht:

\(  S = k \log_2{W} \\\)

Zur Beschreibung des Zustands eines physikalischen Systems wird eine physikalische Größe, die Entropie (Formelzeichen S) verwendet.   Wobei k die Boltzmann-Konstante und W eine Art “Wahrscheinlichkeit” für den Zustand sein soll…

Die Entropie wird auch gerne als Ausmaß von Unordnung der Teilchen eines Systems gesehen. Hohe Entropie wäre hohe Unordnung; niedrige Entropie wäre stärkere Ordnung der Teilchen.

Abbildung 1: Boltzmanns Grab (Wikimedia: Grab_von_Ludwig_Boltzmann_auf_dem_Wiener_Zentralfriedhof.JPG)

Klassifikationsalgorithmen

Beim “Machine Learning” ist es die allgemeine Aufgabe Muster in Datensätzen (Data Records) einer Datenmenge (Data Set – gerne falsch übersetzt mit “Datensatz”) zu finden.

Wenn wir ein Modell suchen, das Voraussagen zu einer Zielvariablen, einer Klassifikation, machen kann und wenn wir dazu ein Trainings-Datenmenge haben, sprechen wir von sog. “Supervised Learning“,

Ein Ansatz zur Klassifikation ist die wiederholte Aufteilung (rekursive Partitionierung).
Die “Güte” einer möglichen Aufteilung kann man durch den sog. Informationsgewinn, soll heissen Entropiedifferenz (nach der Aufteilung – vor der Aufteilung) bestimmen. So einen Klassifizierungsalgorithmus nennt man auch C5.

Zur Veranschaulichung nehmen wir mal ein ganz einfaches Beispiel. Eine Datenmenge soll eine binäre Klassifikation bekommen; z.B. Personen sind “kreditwürdig” oder “nicht kreditwürdig”.

Wir haben eine Trainings-Datenmenge in der Personen mit mehreren Attributen (“Features”) beschrieben sind; z.B. Jahreseinkommen, Alter, Name der Wohngemeinde, Einwohnerzahl der Wohngemeinde,…

Auch die Klassifikation auf der Trainings-Datenmenge ist bereits erfolgt. Wir haben da also schon ein Attribut Kreditwürdig Ja/Nein. Deshalb sprechen wir von “Supervised” Learning.

Diese gesamte Trainings-Datenmenge möchten wir anhand eines Entscheidungs-Kriteriums in zwei Teilmengen aufteilen, sodass die Summe der Entropien der Teilmengen kleiner ist als die Entropie der gesamten Trainings-Datenmenge.
So ein “Entscheidungs-Kriterium” wollen wir mithilfe der Datenattribute (den sog. Features) formulieren z.B. “Einwohnerzahl > 500”.

Zunächst haben wir also die Aufgabe, die Entropie (S) von Teilmengen der Trainings-Datenmenge zu bestimmen.

Quelle: https://rpubs.com/cyobero/C50

Die Formel lautet (nach Boltzmann s.o.)

\( S = \sum\limits_{i=1}^n {-p_i \cdot \log_2{p_i}} \\\)

Wobei n die Anzahl der Klassen in unserer Klassifizierung ist und pi die Anteil der Datensätze, die in die Klasse i fallen.

Wenn wir, wie im Beispiel, eine binäre Klassifikation haben, ist n=2 und p2 = 1- p1.

Wir betrachten im Beispiel einmal folgende Trainingsmenge:

Tabelle 1: Trainingsmenge

Feature 1 Feature 2 Klasse
Gehalt Alter Kreditwürdigkeit
48000 ./. ja
30000 ./. nein
52000 ./. ja
31000 ./. nein
53000 ./. ja
32000 ./. nein
54000 ./. ja
55000 ./. ja
49000 ./. ja
33000 ./. nein

Hier haben wir p1 =0.6 und p2=0.4

Woraus sich eine Entropie für die gesamte Trainings-Datenmenge ergibt von:

\( S = -0.6 \cdot \log_2{0.6} – 0.4 \cdot \log_2{0.4} = 0.970951  \)

Wir versuchen jetzt einmal eine Partitionierung anhand von Feature 1 und probieren ein Kriterium Gehalt>50000. Daduch erhalten wir zwei Teilmengen durch Gehalt>50000 und Gehalt≤50000.

Tabelle 2: Teilmenge 1

Feature 1 Feature 2 Klasse
Gehalt Alter Kreditwürdigkeit
52000 ./. ja
53000 ./. ja
54000 ./. ja
55000 ./. ja

Hier haben wir p1 = 1.0 und p2 = 0.0

Das ergibt eine Entropie S1 = 0.0

Tabelle 3: Teilmenge 2

Feature 1 Feature 2 Klasse
Gehalt Alter Kreditwürdigkeit
48000 ./. ja
30000 ./. nein
31000 ./. nein
32000 ./. nein
49000 ./. ja
33000 ./. nein

Hier haben wir p1 =0.3333 und p2 = 0.6667

Das ergibt eine Entropie S2 = 0.918296

Nun müssen wir die beiden “Teil-Entropien” addieren.
Dazu gewichten wir jede Teilmenge i mit dem Anteil der Datensätze, die in diese Teilmenge fallen wi.
Wir bekommen als Gewichte: w1=0.4 und w2= 0.6 und damit die Gesamtentropie nach erster Aufteilung bei Gehalt>50000:

\( S = w_1 \cdot S_1 + w_2 \cdot S_2 = 0.4 \cdot 0.0 + 0.6 \cdot 0.918296 = 0.5509776 \)

Durch die Aufteilung haben wir also Informationsgewinn (Differenz der Entropien) von:  0.970951 – 0.5509776 = 0,419973

Das ist schon einmal ganz gut, wir müssen nun noch prüfen, ob wir bei einer anderen Aufteilung im Feature “Gehalt” noch besser würden und ob eine Aufteilung nach einem andren Feature (z.B. “Alter”) ein noch größeren Informationsgewinn bringen würde.

Mathematik: Körper (Grundlagen)

Gehört zu: Mathematik
Siehe auch: Gruppentheorie, Vektorraum, Taylor-Entwicklung

Stand: 25.12.2023

Axiomatische Definition eines Körpers

Ein Körper ist eine Menge K mit zwei (zweistelligen) Verknüpfungen, die meist Addition und Multiplikation genannt werden. Für die folgende Axiome gelten:

(1) Bezüglich der Addition genannten Verknüpfung soll die Menge eine abelsche Gruppe sein – das Neutrale Element schreiben wir als: 0.

(2) Bezüglich der Multiplikation genannten Verknüpfung soll die Menge K ohne das Element 0 eine abelsche Gruppe sein – das Neutrale Element schreiben wir als: 1.
Es gibt also zu jedem Element \( k \in K  \text{ aber } k \neq 0 \)  ein Inverses, geschrieben \( k^{-1} \); also: \( k \cdot k^{-1} = 1 \).

(3) Distributivgesetz: \( a \cdot (b + c) = (a \cdot b) + (a \cdot c) \)

Beispiele

Die Menge der Ganzen Zahlen \( \mathbb{Z} \) bildet keinen Körper, sonder (nur) einen Ring.

Die Menge der Rationalen Zahlen \( \mathbb{Q} \) bildet einen Körper.

Die Menge der Reellen Zahlen \( \mathbb{R} \) bildet einen Körper.

Die Menge der Komplexen Zahlen \( \mathbb{C} \) bildet einen Körper.

Ordnungsrelation auf \( \mathbb{Q} \)

Im Körper der Rationalen Zahlen \( \mathbb{Q} \)  können wir eine Ordnungsrelation definieren durch:

\( \Large \frac{a}{b} \ge \frac{c}{d} \normalsize \text{ genau dann, wenn: } a d \ge c b \text{ in } \mathbb{Z}  \)

Norm in \( \mathbb{Q} \)

Für ein Element  \( a \in \mathbb{Q} \) können wir eine Norm |a| definieren:

\( |a| = a \text{ wenn } a \geq 0, -a \text{ wenn } a  \lt 0  \\ \)

Diese Norm ist abgeschlossen in \( \mathbb{Q} \), denn es gilt:

\( a \in \mathbb{Q} \Rightarrow -a \in \mathbb{Q} \\\)

Folge und Grenzwert

Als Folge in einem Körper K wir bezeichnet eine Abbildung:

\( \mathbb{N} \to K \)

Meist geschrieben als: a1, a2, a3,… mit ai aus K.

Cauchy-Folge

Eine Folge ai heisst Cauchy-Folge wenn für jedes (noch so kleine)  ε > 0 eine natürliche Zahl Nε exisistiert, sodass:

\( | a_n – a_m | < ε \text{ für alle } n,m \in \mathbb{N} \text{ mit } n, m > N_\epsilon \\\)

Die Elemente einer Cauchy-Folge rücken also beliebig dicht aneinander.

Grenzwert einer Folge

Eine Folge ai hat einen Grenzwert g ∈ K wenn für jedes ε > 0 eine natürlche Zahl Nε exisistiert, sodass:

\( | a_n – g | < ε \text{ für alle } n \in \mathbb{N} \text{ mit } n \gt N_\epsilon\\\)

Die Elemente der Folge kommen dem Grenzwert beliebig nahe.

Falls so ein Grenzwert exisitiert, schreiben wir:

\( \lim  \limits_{i \to \infty}  {a_i} = g \\\)

Vektorraum

Jeder Körper K ist auch ein Vektorraum über K (also über sich selbst).

Physik: Wärmepumpe

Gehört zu: Physik
Siehe auch: Thermodynamik

Stand: 25.10.2023

Prinzip der Wärmepumpe

Gestern (24.10.2023) konnte ich als Ringvorlesung “Physik im Alltag”  von Herrn Prof. Dr. Markus Drescher hören, der über das Thema “Physik der Wärmepumpe” sprach.
Link: https://www.physik.uni-hamburg.de/oeffentlichkeit/veranstaltungen/ringvorlesung.

Der physikalische Prozess ist ja im Prinzip einfach ein umgekehrter Carnotscher Kreisprozess. Wir haben also vier thermodynamische Zustände, mit vier  Zustandsveränderungen, die am Ende wieder beim Ausgangszustand landen. So ein Kreisprozess ist schon seit längerem bekannt und technisch realisiert in unseren elektrischen Kühlschränken (auch: Wäschtrockner, Klimaanlage,…).

Wir haben ein externes Wärmereservoir mit der Temperatur T1. Die Wärmepumpe soll dort Wärme entnehmen und in einen zu heizenden Raum pumpen.

Zustand 1: Das Arbeitsmedium ist gasförmig und habe einen Druck von p1 und eine Temperatur T1 . Diese Anfangstemperatur T1 soll die Temperatur des externen Wärmereservoirs sein.

Zustandsübergang 1 nach 2: Kompression durch Verrichtung mechnischer Arbeit.
Das gasförmige Arbeitsmedium wird mit mechanischer Arbeit W zusammengedrückt (durch einen Kompressor).
Die Temperatur und der Druck des Arbeitsmediums erhöhen sich.
Das Arbeitsmedium muss so weit zusammengedrückt werden, dass die Temperatur oberhalb der Temperatur des Heizwassers (Vorlauftemperatur) liegt.

Zustand 2: Der Druck ist auf p2 und  die Temperatur auf T2 gestiegen.

Zustandsübergang 2 nach 3: Wärmetransport vom Arbeitsmedium zu der Heizflüssigkeit im zu heizenden Raum (Vorlauftemperatur).
Das warme Arbeitsmedium wird durch Kontakt mit dem Heizwasser im zu heizenden Raum (Wärmetauscher) soweit abgekühlt , dass ein Temperaturausgleich stattfindet. Das heisst, es wird eine gewisse Wärmemenge ΔQ in das Heizwasser transportiert.

Zustand 3: Die Temperatur des  des Arbeitsmediums ist gesunken auf T3. Beim unverändert hohen Druck ist das Arbeitsmedium jetzt flüssig geworden.

Zustandsübergang 3 nach 4: Das Arbeitsmedium wird entspannt d.h. der Druck wird von p2 zurück auf p1 entspannt. Dabei kühlt sich das Arbeitsmedium stark ab, so dass die Temperatur unterhalb der Temperatur des externen Wärmereservoirs liegt; sagen wir auf T4 < T1.

Zustand 4: Die Temperatur des Arbeitsmediums ist weiter gesunken auf T4, der Druck ist wieder bei p1.

Zustandsübergang 4 nach 5: Wärmetransport vom externen Wärmereservoir in das Arbeitsmedium. Durch Kontakt mit dem  Wärmereservoir (Wärmetauscher) wird die Temperatur auf den ursprünglichen Wert T1 erhöht. D.h. es wird eine gewisse Wärmemenge ΔQ aus dem externen Wärmereservoir entnommen.

Zustand 5 = Zustand 1
Temperatur T1 Druck p1, Das Arbeitsmedium ist jetzt wieder gasförmig geworden.

In jedem Zyklus investieren wir also eine mechanische Arbeit von W und gewinnen (pumpen) eine Wärmemenge ΔQ.

Effizienz einer Wärmepumpe

In jedem Zyklus der Wärmepumpe stecken wir also eine Energiemenge (W), als mechanische Arbeit zur Kompression, hinein und entnehmen dem externen Reservoir eine Energiemenge ΔQ (Wärmemenge). Als Kennzahl für die “Effizienz” dieses Prozesses nehmen wir die sog. “Leistunsgzahl” (englisch: “Coefficient of Performance” COP):

\( \Large  COP = \frac{\Delta Q}{W} \\   \)

Dieser COP besagt also, wieviel Wärmemenge bekomme ich heraus (gepumpt) im Verhältnis zur hineingesteckten mechanischen Energie.

Der Prozess in der Wärmepumpe entspräche genau einem umgekehrten Carnotschen Kreisprozess, wenn er “reversibel” wäre. Dazu müssten in den Wärmetauschern am Ausgang tatsächlich die beiden Temperaturniveaus identisch sein. Für diesen Idealfall kann man das physikalisch berechnen als:

\( \Large  COP = \frac{T_3}{T_3 – T_1} \\   \)

Dies ist aber “nur” der physikalisch maximal mögliche COP. In der technischen Realisierung haben wir es aber immer mit unvollkommenen Prozessen und Verlusten zu tun, sodass in den real exsitierenden Wärmepumpen wir tatsächlich nur so etwa die Hälfte dieses physikalisch möglichen Werts erreichen.

Wenn die Temperatur des externen Wärmereservoirs jahreszeitlich schwankt (wenn man z.B. Aussenluft als Reservoir nimmt) wird vielfach ein sog. Seasonal COP (“SCOP“) genommen. Der ist ein Mittelwert aus vier COP-Werten bei vier unterschiedlichen Außentemperaturen.

Eine noch realistischere Kennzahl ist die JAZ (Jahresarbeitszahl). Da wird die übers Jahr tatsächlich “erzeugte” Wärmemenge ins Verhältnis gesetzt zur tatsächlich eingesetzten Strommenge; dazu muss man diese beiden Werte mit speziellen Zählern einzeln messen.

Beispiel:

Das externe Wärmereservoir sei die Aussenluft mit einer Temperatur T1 von 0° C.
Die Temperatur beim Wärmeaustausch (gewünschte Vorlauftemperatur der Heizung) möge sein: T3 = 40° C.

Um obige Formel anwenden zu können, müssen wir die Temperaturen in Kelvin umrechnen:

T1 = 273 K
T3 = 313 K

Damit bekommen wir:

\(  \Large COP = \frac{273}{313 – 273} = \frac{273}{40} =  6,825   \\\)

In der technischen Realisierung könnten wir uns freuen, wenn wir einen COP von 3 erreichen würden.

Phasenübergänge

Besonders effizient arbeitet eine Wärmepumpe dann, wenn das Arbeitsmedium bei der Wärmeaufnahme und der Wärmeabgabe die Temperatur nicht großartig ändert, sondern stattdessen ein sog. Phasenübergang stattfindet.

Statt einer großen Temperaturdifferenz bei der Erwärmung, wäre ein Phasenüberang von flüssig zu gasförmig gut; also beim Zustandsübergang 4 nach 1.
Statt einer großen Temperaturdifferenz beim Abkühlen, wäre ein Phasenübergang von gasförmig zu flüssig gut; also beim Zustandsübergang 2 nach 3.

Die Abgabe von Wärme und die Aufnahme von Wärme erfolgt in sog. Wärmetauschern.  In den beiden Wärmetauschern arbeitet man mit einem geeigneten Druck, sodass genau in dem Wärmetauscher ein Phasenübergang stattfindet (bei gegebenen Temperaturverhältnissen und gegebenem Arbeitsmedium). Beispielsweise 2 bar bei der Wärmeaufnahme und 12 bar bei der Wärmeabgabe.

Youtube-Video: Ganteföhr Energie und Klima

Technische Realisierung einer Wärmepumpe

Das Arbeitsmedium in der Wärmepumpe wird technisch auch “Kältemittel” genannt. Es wird nicht verbraucht, sondern befindet sich in einem geschlossenen System in einem ewigen Kreislauf. Nach dem heutigen Stand der Technik (2023) kommt hierfür praktisch nur Butan (früher: FCKW) zum Einsatz.

Die zu leistende mechanische Arbeit wird ein kleiner Elektromotor besorgen. Woher der Strom dafür kommt, wäre eine weitere Frage…

Das externe Wärmereservoir muss sehr groß sein; so groß, dass eine Entnahme einer kleinen Wärmemenge die Temperatur des Reservoirs unverändert lässt. Als so ein Wärmereservoir kommt in der Praxis infrage:

  • Das Grundwasser
  • Das Erdreich
  • Die Aussenluft
  • Fließende Gewässer
  • Das Meer

Interessant zu wisssen ist, dass auch wenn es draussen richtig kalt ist, trotzdem diese “kalte” Draussenluft sehr viel Wärme-Energie enthält.
Erst bei einer Temperatur von -273° C wäre keine Wärme-Energie mehr da.

 

 

 

 

 

Mathematik: Äquivalenzrelation

Gehört zu: Mathematik
Siehe auch: Gruppentheorie
Benutzt: Latex-Plugin für WordPress

Stand: 10.09.2023

Eine Äquivalenzrelation

Bei meiner Beschäftigung mit der Gruppentheorie bin ich auf das klassische Thema Äquivalenzklassen gestoßen.

Eine Äquivalenzrelation in der Mathematik ist ersteinmal eine “Relation”. Dann soll diese Relation inetwa die Eigenschaften haben, die wir von der klassischen Äquivalenz her kennen: Gleichheit oder Ungleichheit.

Allgemein: Was ist eine Relation?

Auf einer Menge M können wir eine Relation R einfach definieren als eine Teilmenge der geordneten Paare. Also

\( R \subseteq M \times M \\\)

So eine Relation wird dann Äquivalenzrelation genannt, wenn sie noch zusätzlich drei wichtige von der Gleichheitsrelation bekannten Eingenschaften besitzt: reflexiv, symmetrisch, transitiv.

Reflexiv: \( (a,a) \in R \text{ für alle } a \in M \\\)

Symmetrisch:  \( \text{Wenn } (a,b) \in R \text{ dann ist auch } (b,a) \in R \\\)

Transitiv: \( \text{Wenn } (a,b) \in R \text{ und } (b,c) \in R \text{ dann ist auch } (a,c) \in R \\\)

Wenn es aus dem Kontext klar ist, welche Relation gemeint ist, schreibt man auch einfach: \( a \sim b\text{  für } (a,b) \in R \)

Äquivalenzklassen

Wenn ich eine Äquivalenzrelation R auf einer Menge M habe, kann ich damit zu jedem Element m ∈ M eine Teilmenge von M definieren:

\( [m]_R =  \{ x \in M \,|\, (m,x) \in R \} \\\)

Diese Teilmenge nennt man Äquivalenzklasse von m (bezüglich der Relation R auf M). Wenn man zwei Äquvalenzklassen betrachtet, sind diese entweder identisch oder disjunkt.
Da jedes Element der Menge M auch in einer (genau einer) Äquivalenzklasse vorkommt, bilden die Äquivalenzklassen also eine (disjunkte) Partition von M.

Faktor-Mengen

Wenn wir die Menge der Äquivalenzklassen betrachten ist aus unserer ursprünglichen Relation dort die Gleichheitsrelation geworden.
Die Menge der Äquivalenzklassen zu einer Relation R über M bezeichnet man auch als Faktor-Menge oder Quotienten-Menge und schreibt:

\( M/R = \{ [m]_R \,|\,  m \in M \} \\ \)

Beispiele von Konstruktionen mit Hilfe von Faktormengen

Generell kann man mit diesem Mechanismus viele interessante mathematische Gebilde konstruieren…

Die Menge der ganzen Zahlen: \( \mathbb{Z} = (\mathbb{N}^2 \times \mathbb{N}^2) / R_1 \)
Wobei die Relation R1 definiert wird als: (n1, n2) ∼ (m1, m2) genau dann wenn n2 + m1 = m2 + n1

Die Menge der rationalen Zahlen: \( \mathbb{Q} = (\mathbb{Z}^2 \times \mathbb{Z}^2) / R_2 \)
Wobei die Relation R2 definiert wir als: (n1, n2) ∼ (m1, m2) genau dann wenn n2 · m1 = m2 · n1

Äquivalenzklassen in der Gruppentheorie

In der Gruppentheorie kann man mittels einer Untergruppe H einer Gruppe G sog.  “Cosets” zu jedem Element g aus G bilden:

\(  gN = \{ x \in G \, | \, \exists h \in H \text{ with } x = g \cdot h \} \\\)

Diese Cosets (deutsch: Nebenmengen) bilden eine disjunkte Überdeckung der Gruppe G.

Ich kann mir auch ganz einfach eine Äquivalenzrelation R definieren, die diese gleichen Nebenmengen als Äquivalenzklassen erzeugt. Dazu muss ich nur definieren, wann zwei Elemente x und y aus G  zueingabder in Relation stehen sollen…

Ich versuche es einmal mit: \( R = \{ (x,y) \, | \, \exists h \in H : h\cdot x = h \cdot y \} \\ \)

Ist das wirklich eine Äquivalenzrelation (1) und erzeugt sie tatsächlich die gewünschen Äquivalenzklassen (2)?

Ad (1): Als Äquivalenzrelation wäre zu überprüfen:

Reflexivität; d.h. ist (x,x) immer in R? Offensichtlich stimmt das.

Symmetrie: d.h. wenn (x,y) in R liegt, liegt dann auch (y,x) in R?

Wenn demnach (x,y) in R liegt, existiert ein h in H sodass hx = hy. Dann ist mit dem gleichen h aus H auch hy = hx. Also ist R symmetrisch.

Transitivität:

Wenn (x.y) und (y,z) in R liegen, so heisst das: Es gibt ein h1 und ein h2 in H sodass gilt: h1 x = h1 y und h2 y = h2 z.
Man könnte es mit h = h1 h2 versuchen, was bei einer kommutativen (abelschen) Gruppe funktionieren würde…

Vertiefung

YouTube-Video:https://www.youtube.com/watch?v=E8gItS9vGKg

YouTupe-Video zum Tensor-Produkt:https://www.youtube.com/watch?v=KnSZBjnd_74