Physik: Entropie

26. January 202422. May 2025 dkracht

Gehört zu: Klassifikation
Siehe auch: Machine Learning, Thermodynamik, Zustand
Benutzt: Latex-Plugin für WordPress, Fotos von Wikimedia

Stand: 26.01.2024

Was ist Entropie?

Warnung / Disclaimer

Diesen Blog-Artikel schreibe ich ausschließlich zu meiner persönlichen Dokumentation; quasi als mein elektronisches persönliches Notizbuch. Wenn es Andere nützlich finden, freue ich mich, übernehme aber kleinerlei Garantie für die Richtigkeit bzw. die Fehlerfreiheit meiner Notizen. Insbesondere weise ich darauf hin, dass jeder, der diese meine Notizen nutzt, das auf eigene Gefahr tut.
Wenn Podukteigenschaften beschrieben werden, sind dies ausschließlich meine persönlichen Erfahrungen als Laie mit dem einen Gerät, welches ich bekommen habe.

Der Begriff “Entropie” wird klassischerweise in der statistischen Thermodynamik verwendet.
Dieser Begriff wurde von Rudolf Clausius (1822-1888) in die Physik eingeführt.

Ludwig Boltzmann (1844-1906) hat dann 1877 die berühmte Formel aufgestellt, die auch auf seinem Grabstein auf dem Wiener Zentralfriedhof steht:

\( S = k \log_2{W} \\\)

Zur Beschreibung des Zustands eines physikalischen Systems wird eine physikalische Größe, die Entropie (Formelzeichen S) verwendet. Wobei k die Boltzmann-Konstante und W eine Art “Wahrscheinlichkeit” für den Zustand sein soll…

Die Entropie wird auch gerne als Ausmaß von Unordnung der Teilchen eines Systems gesehen. Hohe Entropie wäre hohe Unordnung; niedrige Entropie wäre stärkere Ordnung der Teilchen.

Abbildung 1: Boltzmanns Grab (Wikimedia: Grab_von_Ludwig_Boltzmann_auf_dem_Wiener_Zentralfriedhof.JPG)

Klassifikationsalgorithmen

Beim “Machine Learning” ist es die allgemeine Aufgabe Muster in Datensätzen (Data Records) einer Datenmenge (Data Set – gerne falsch übersetzt mit “Datensatz”) zu finden.

Wenn wir ein Modell suchen, das Voraussagen zu einer Zielvariablen, einer Klassifikation, machen kann und wenn wir dazu ein Trainings-Datenmenge haben, sprechen wir von sog. “Supervised Learning“,

Ein Ansatz zur Klassifikation ist die wiederholte Aufteilung (rekursive Partitionierung).
Die “Güte” einer möglichen Aufteilung kann man durch den sog. Informationsgewinn, soll heissen Entropiedifferenz (nach der Aufteilung – vor der Aufteilung) bestimmen. So einen Klassifizierungsalgorithmus nennt man auch C5.

Zur Veranschaulichung nehmen wir mal ein ganz einfaches Beispiel. Eine Datenmenge soll eine binäre Klassifikation bekommen; z.B. Personen sind “kreditwürdig” oder “nicht kreditwürdig”.

Wir haben eine Trainings-Datenmenge in der Personen mit mehreren Attributen (“Features”) beschrieben sind; z.B. Jahreseinkommen, Alter, Name der Wohngemeinde, Einwohnerzahl der Wohngemeinde,…

Auch die Klassifikation auf der Trainings-Datenmenge ist bereits erfolgt. Wir haben da also schon ein Attribut Kreditwürdig Ja/Nein. Deshalb sprechen wir von “Supervised” Learning.

Diese gesamte Trainings-Datenmenge möchten wir anhand eines Entscheidungs-Kriteriums in zwei Teilmengen aufteilen, sodass die Summe der Entropien der Teilmengen kleiner ist als die Entropie der gesamten Trainings-Datenmenge.
So ein “Entscheidungs-Kriterium” wollen wir mithilfe der Datenattribute (den sog. Features) formulieren z.B. “Einwohnerzahl > 500”.

Zunächst haben wir also die Aufgabe, die Entropie (S) von Teilmengen der Trainings-Datenmenge zu bestimmen.

Quelle: https://rpubs.com/cyobero/C50

Die Formel lautet (nach Boltzmann s.o.)

\( S = \sum\limits_{i=1}^n {-p_i \cdot \log_2{p_i}} \\\)

Wobei n die Anzahl der Klassen in unserer Klassifizierung ist und p_i die Anteil der Datensätze, die in die Klasse i fallen.

Wenn wir, wie im Beispiel, eine binäre Klassifikation haben, ist n=2 und p₂ = 1- p₁.

Wir betrachten im Beispiel einmal folgende Trainingsmenge:

Tabelle 1: Trainingsmenge

Feature 1	Feature 2	Klasse
Gehalt	Alter	Kreditwürdigkeit
48000	./.	ja
30000	./.	nein
52000	./.	ja
31000	./.	nein
53000	./.	ja
32000	./.	nein
54000	./.	ja
55000	./.	ja
49000	./.	ja
33000	./.	nein

Hier haben wir p₁ =0.6 und p₂=0.4

Woraus sich eine Entropie für die gesamte Trainings-Datenmenge ergibt von:

\( S = -0.6 \cdot \log_2{0.6} – 0.4 \cdot \log_2{0.4} = 0.970951 \)

Wir versuchen jetzt einmal eine Partitionierung anhand von Feature 1 und probieren ein Kriterium Gehalt>50000. Daduch erhalten wir zwei Teilmengen durch Gehalt>50000 und Gehalt≤50000.

Tabelle 2: Teilmenge 1

Feature 1	Feature 2	Klasse
Gehalt	Alter	Kreditwürdigkeit
52000	./.	ja
53000	./.	ja
54000	./.	ja
55000	./.	ja

Hier haben wir p₁ = 1.0 und p₂ = 0.0

Das ergibt eine Entropie S₁ = 0.0

Tabelle 3: Teilmenge 2

Feature 1	Feature 2	Klasse
Gehalt	Alter	Kreditwürdigkeit
48000	./.	ja
30000	./.	nein
31000	./.	nein
32000	./.	nein
49000	./.	ja
33000	./.	nein

Hier haben wir p₁ =0.3333 und p₂ = 0.6667

Das ergibt eine Entropie S₂ = 0.918296

Nun müssen wir die beiden “Teil-Entropien” addieren.
Dazu gewichten wir jede Teilmenge i mit dem Anteil der Datensätze, die in diese Teilmenge fallen w_i.
Wir bekommen als Gewichte: w1=0.4 und w2= 0.6 und damit die Gesamtentropie nach erster Aufteilung bei Gehalt>50000:

\( S = w_1 \cdot S_1 + w_2 \cdot S_2 = 0.4 \cdot 0.0 + 0.6 \cdot 0.918296 = 0.5509776 \)

Durch die Aufteilung haben wir also Informationsgewinn (Differenz der Entropien) von: 0.970951 – 0.5509776 = 0,419973

Das ist schon einmal ganz gut, wir müssen nun noch prüfen, ob wir bei einer anderen Aufteilung im Feature “Gehalt” noch besser würden und ob eine Aufteilung nach einem andren Feature (z.B. “Alter”) ein noch größeren Informationsgewinn bringen würde.

Mathematik: Körper (Grundlagen)

25. December 202326. December 2023 dkracht

Gehört zu: Mathematik
Siehe auch: Gruppentheorie, Vektorraum, Taylor-Entwicklung

Stand: 25.12.2023

Axiomatische Definition eines Körpers

Ein Körper ist eine Menge K mit zwei (zweistelligen) Verknüpfungen, die meist Addition und Multiplikation genannt werden. Für die folgende Axiome gelten:

(1) Bezüglich der Addition genannten Verknüpfung soll die Menge eine abelsche Gruppe sein – das Neutrale Element schreiben wir als: 0.

(2) Bezüglich der Multiplikation genannten Verknüpfung soll die Menge K ohne das Element 0 eine abelsche Gruppe sein – das Neutrale Element schreiben wir als: 1.
Es gibt also zu jedem Element \( k \in K \text{ aber } k \neq 0 \) ein Inverses, geschrieben \( k^{-1} \); also: \( k \cdot k^{-1} = 1 \).

(3) Distributivgesetz: \( a \cdot (b + c) = (a \cdot b) + (a \cdot c) \)

Beispiele

Die Menge der Ganzen Zahlen \( \mathbb{Z} \) bildet keinen Körper, sonder (nur) einen Ring.

Die Menge der Rationalen Zahlen \( \mathbb{Q} \) bildet einen Körper.

Die Menge der Reellen Zahlen \( \mathbb{R} \) bildet einen Körper.

Die Menge der Komplexen Zahlen \( \mathbb{C} \) bildet einen Körper.

Ordnungsrelation auf \( \mathbb{Q} \)

Im Körper der Rationalen Zahlen \( \mathbb{Q} \) können wir eine Ordnungsrelation definieren durch:

\( \Large \frac{a}{b} \ge \frac{c}{d} \normalsize \text{ genau dann, wenn: } a d \ge c b \text{ in } \mathbb{Z} \)

Norm in \( \mathbb{Q} \)

Für ein Element \( a \in \mathbb{Q} \) können wir eine Norm |a| definieren:

\( |a| = a \text{ wenn } a \geq 0, -a \text{ wenn } a \lt 0 \\ \)

Diese Norm ist abgeschlossen in \( \mathbb{Q} \), denn es gilt:

\( a \in \mathbb{Q} \Rightarrow -a \in \mathbb{Q} \\\)

Folge und Grenzwert

Als Folge in einem Körper K wir bezeichnet eine Abbildung:

\( \mathbb{N} \to K \)

Meist geschrieben als: a₁, a₂, a₃,… mit a_i aus K.

Cauchy-Folge

Eine Folge a_i heisst Cauchy-Folge wenn für jedes (noch so kleine) ε > 0 eine natürliche Zahl N_ε exisistiert, sodass:

\( | a_n – a_m | < ε \text{ für alle } n,m \in \mathbb{N} \text{ mit } n, m > N_\epsilon \\\)

Die Elemente einer Cauchy-Folge rücken also beliebig dicht aneinander.

Grenzwert einer Folge

Eine Folge a_i hat einen Grenzwert g ∈ K wenn für jedes ε > 0 eine natürlche Zahl N_ε exisistiert, sodass:

\( | a_n – g | < ε \text{ für alle } n \in \mathbb{N} \text{ mit } n \gt N_\epsilon\\\)

Die Elemente der Folge kommen dem Grenzwert beliebig nahe.

Falls so ein Grenzwert exisitiert, schreiben wir:

\( \lim \limits_{i \to \infty} {a_i} = g \\\)

Vektorraum

Jeder Körper K ist auch ein Vektorraum über K (also über sich selbst).

Physik: Wärmepumpe

25. October 202330. November 2023 dkracht

Gehört zu: Physik
Siehe auch: Thermodynamik

Stand: 25.10.2023

Prinzip der Wärmepumpe

Gestern (24.10.2023) konnte ich als Ringvorlesung “Physik im Alltag” von Herrn Prof. Dr. Markus Drescher hören, der über das Thema “Physik der Wärmepumpe” sprach.
Link: https://www.physik.uni-hamburg.de/oeffentlichkeit/veranstaltungen/ringvorlesung.

Der physikalische Prozess ist ja im Prinzip einfach ein umgekehrter Carnotscher Kreisprozess. Wir haben also vier thermodynamische Zustände, mit vier Zustandsveränderungen, die am Ende wieder beim Ausgangszustand landen. So ein Kreisprozess ist schon seit längerem bekannt und technisch realisiert in unseren elektrischen Kühlschränken (auch: Wäschtrockner, Klimaanlage,…).

Wir haben ein externes Wärmereservoir mit der Temperatur T₁. Die Wärmepumpe soll dort Wärme entnehmen und in einen zu heizenden Raum pumpen.

Zustand 1: Das Arbeitsmedium ist gasförmig und habe einen Druck von p₁ und eine Temperatur T₁ . Diese Anfangstemperatur T₁ soll die Temperatur des externen Wärmereservoirs sein.

Zustandsübergang 1 nach 2: Kompression durch Verrichtung mechnischer Arbeit.
Das gasförmige Arbeitsmedium wird mit mechanischer Arbeit W zusammengedrückt (durch einen Kompressor).
Die Temperatur und der Druck des Arbeitsmediums erhöhen sich.
Das Arbeitsmedium muss so weit zusammengedrückt werden, dass die Temperatur oberhalb der Temperatur des Heizwassers (Vorlauftemperatur) liegt.

Zustand 2: Der Druck ist auf p₂ und die Temperatur auf T₂ gestiegen.

Zustandsübergang 2 nach 3: Wärmetransport vom Arbeitsmedium zu der Heizflüssigkeit im zu heizenden Raum (Vorlauftemperatur).
Das warme Arbeitsmedium wird durch Kontakt mit dem Heizwasser im zu heizenden Raum (Wärmetauscher) soweit abgekühlt , dass ein Temperaturausgleich stattfindet. Das heisst, es wird eine gewisse Wärmemenge ΔQ in das Heizwasser transportiert.

Zustand 3: Die Temperatur des des Arbeitsmediums ist gesunken auf T₃. Beim unverändert hohen Druck ist das Arbeitsmedium jetzt flüssig geworden.

Zustandsübergang 3 nach 4: Das Arbeitsmedium wird entspannt d.h. der Druck wird von p₂ zurück auf p₁ entspannt. Dabei kühlt sich das Arbeitsmedium stark ab, so dass die Temperatur unterhalb der Temperatur des externen Wärmereservoirs liegt; sagen wir auf T₄ < T₁.

Zustand 4: Die Temperatur des Arbeitsmediums ist weiter gesunken auf T₄, der Druck ist wieder bei p₁.

Zustandsübergang 4 nach 5: Wärmetransport vom externen Wärmereservoir in das Arbeitsmedium. Durch Kontakt mit dem Wärmereservoir (Wärmetauscher) wird die Temperatur auf den ursprünglichen Wert T₁ erhöht. D.h. es wird eine gewisse Wärmemenge ΔQ aus dem externen Wärmereservoir entnommen.

Zustand 5 = Zustand 1
Temperatur T₁ Druck p₁, Das Arbeitsmedium ist jetzt wieder gasförmig geworden.

In jedem Zyklus investieren wir also eine mechanische Arbeit von W und gewinnen (pumpen) eine Wärmemenge ΔQ.

Effizienz einer Wärmepumpe

In jedem Zyklus der Wärmepumpe stecken wir also eine Energiemenge (W), als mechanische Arbeit zur Kompression, hinein und entnehmen dem externen Reservoir eine Energiemenge ΔQ (Wärmemenge). Als Kennzahl für die “Effizienz” dieses Prozesses nehmen wir die sog. “Leistunsgzahl” (englisch: “Coefficient of Performance” COP):

\( \Large COP = \frac{\Delta Q}{W} \\ \)

Dieser COP besagt also, wieviel Wärmemenge bekomme ich heraus (gepumpt) im Verhältnis zur hineingesteckten mechanischen Energie.

Der Prozess in der Wärmepumpe entspräche genau einem umgekehrten Carnotschen Kreisprozess, wenn er “reversibel” wäre. Dazu müssten in den Wärmetauschern am Ausgang tatsächlich die beiden Temperaturniveaus identisch sein. Für diesen Idealfall kann man das physikalisch berechnen als:

\( \Large COP = \frac{T_3}{T_3 – T_1} \\ \)

Dies ist aber “nur” der physikalisch maximal mögliche COP. In der technischen Realisierung haben wir es aber immer mit unvollkommenen Prozessen und Verlusten zu tun, sodass in den real exsitierenden Wärmepumpen wir tatsächlich nur so etwa die Hälfte dieses physikalisch möglichen Werts erreichen.

Wenn die Temperatur des externen Wärmereservoirs jahreszeitlich schwankt (wenn man z.B. Aussenluft als Reservoir nimmt) wird vielfach ein sog. Seasonal COP (“SCOP“) genommen. Der ist ein Mittelwert aus vier COP-Werten bei vier unterschiedlichen Außentemperaturen.

Eine noch realistischere Kennzahl ist die JAZ (Jahresarbeitszahl). Da wird die übers Jahr tatsächlich “erzeugte” Wärmemenge ins Verhältnis gesetzt zur tatsächlich eingesetzten Strommenge; dazu muss man diese beiden Werte mit speziellen Zählern einzeln messen.

Beispiel:

Das externe Wärmereservoir sei die Aussenluft mit einer Temperatur T₁ von 0° C.
Die Temperatur beim Wärmeaustausch (gewünschte Vorlauftemperatur der Heizung) möge sein: T₃ = 40° C.

Um obige Formel anwenden zu können, müssen wir die Temperaturen in Kelvin umrechnen:

T₁ = 273 K
T₃ = 313 K

Damit bekommen wir:

\( \Large COP = \frac{273}{313 – 273} = \frac{273}{40} = 6,825 \\\)

In der technischen Realisierung könnten wir uns freuen, wenn wir einen COP von 3 erreichen würden.

Phasenübergänge

Besonders effizient arbeitet eine Wärmepumpe dann, wenn das Arbeitsmedium bei der Wärmeaufnahme und der Wärmeabgabe die Temperatur nicht großartig ändert, sondern stattdessen ein sog. Phasenübergang stattfindet.

Statt einer großen Temperaturdifferenz bei der Erwärmung, wäre ein Phasenüberang von flüssig zu gasförmig gut; also beim Zustandsübergang 4 nach 1.
Statt einer großen Temperaturdifferenz beim Abkühlen, wäre ein Phasenübergang von gasförmig zu flüssig gut; also beim Zustandsübergang 2 nach 3.

Die Abgabe von Wärme und die Aufnahme von Wärme erfolgt in sog. Wärmetauschern. In den beiden Wärmetauschern arbeitet man mit einem geeigneten Druck, sodass genau in dem Wärmetauscher ein Phasenübergang stattfindet (bei gegebenen Temperaturverhältnissen und gegebenem Arbeitsmedium). Beispielsweise 2 bar bei der Wärmeaufnahme und 12 bar bei der Wärmeabgabe.

Youtube-Video: Ganteföhr Energie und Klima

Technische Realisierung einer Wärmepumpe

Das Arbeitsmedium in der Wärmepumpe wird technisch auch “Kältemittel” genannt. Es wird nicht verbraucht, sondern befindet sich in einem geschlossenen System in einem ewigen Kreislauf. Nach dem heutigen Stand der Technik (2023) kommt hierfür praktisch nur Butan (früher: FCKW) zum Einsatz.

Die zu leistende mechanische Arbeit wird ein kleiner Elektromotor besorgen. Woher der Strom dafür kommt, wäre eine weitere Frage…

Das externe Wärmereservoir muss sehr groß sein; so groß, dass eine Entnahme einer kleinen Wärmemenge die Temperatur des Reservoirs unverändert lässt. Als so ein Wärmereservoir kommt in der Praxis infrage:

Das Grundwasser
Das Erdreich
Die Aussenluft
Fließende Gewässer
Das Meer
…

Interessant zu wisssen ist, dass auch wenn es draussen richtig kalt ist, trotzdem diese “kalte” Draussenluft sehr viel Wärme-Energie enthält.
Erst bei einer Temperatur von -273° C wäre keine Wärme-Energie mehr da.

Mathematik: Äquivalenzrelation

7. September 202317. December 2023 dkracht

Gehört zu: Mathematik
Siehe auch: Gruppentheorie
Benutzt: Latex-Plugin für WordPress

Stand: 10.09.2023

Eine Äquivalenzrelation

Bei meiner Beschäftigung mit der Gruppentheorie bin ich auf das klassische Thema Äquivalenzklassen gestoßen.

Eine Äquivalenzrelation in der Mathematik ist ersteinmal eine “Relation”. Dann soll diese Relation inetwa die Eigenschaften haben, die wir von der klassischen Äquivalenz her kennen: Gleichheit oder Ungleichheit.

Allgemein: Was ist eine Relation?

Auf einer Menge M können wir eine Relation R einfach definieren als eine Teilmenge der geordneten Paare. Also

\( R \subseteq M \times M \\\)

So eine Relation wird dann Äquivalenzrelation genannt, wenn sie noch zusätzlich drei wichtige von der Gleichheitsrelation bekannten Eingenschaften besitzt: reflexiv, symmetrisch, transitiv.

Reflexiv: \( (a,a) \in R \text{ für alle } a \in M \\\)

Symmetrisch: \( \text{Wenn } (a,b) \in R \text{ dann ist auch } (b,a) \in R \\\)

Transitiv: \( \text{Wenn } (a,b) \in R \text{ und } (b,c) \in R \text{ dann ist auch } (a,c) \in R \\\)

Wenn es aus dem Kontext klar ist, welche Relation gemeint ist, schreibt man auch einfach: \( a \sim b\text{ für } (a,b) \in R \)

Äquivalenzklassen

Wenn ich eine Äquivalenzrelation R auf einer Menge M habe, kann ich damit zu jedem Element m ∈ M eine Teilmenge von M definieren:

\( [m]_R = \{ x \in M \,|\, (m,x) \in R \} \\\)

Diese Teilmenge nennt man Äquivalenzklasse von m (bezüglich der Relation R auf M). Wenn man zwei Äquvalenzklassen betrachtet, sind diese entweder identisch oder disjunkt.
Da jedes Element der Menge M auch in einer (genau einer) Äquivalenzklasse vorkommt, bilden die Äquivalenzklassen also eine (disjunkte) Partition von M.

Faktor-Mengen

Wenn wir die Menge der Äquivalenzklassen betrachten ist aus unserer ursprünglichen Relation dort die Gleichheitsrelation geworden.
Die Menge der Äquivalenzklassen zu einer Relation R über M bezeichnet man auch als Faktor-Menge oder Quotienten-Menge und schreibt:

\( M/R = \{ [m]_R \,|\, m \in M \} \\ \)

Beispiele von Konstruktionen mit Hilfe von Faktormengen

Generell kann man mit diesem Mechanismus viele interessante mathematische Gebilde konstruieren…

Die Menge der ganzen Zahlen: \( \mathbb{Z} = (\mathbb{N}^2 \times \mathbb{N}^2) / R_1 \)
Wobei die Relation R₁ definiert wird als: (n₁, n₂) ∼ (m₁, m₂) genau dann wenn n₂ + m₁ = m₂ + n₁

Die Menge der rationalen Zahlen: \( \mathbb{Q} = (\mathbb{Z}^2 \times \mathbb{Z}^2) / R_2 \)
Wobei die Relation R₂ definiert wir als: (n₁, n₂) ∼ (m₁, m₂) genau dann wenn n₂ · m₁ = m₂ · n₁

Äquivalenzklassen in der Gruppentheorie

In der Gruppentheorie kann man mittels einer Untergruppe H einer Gruppe G sog. “Cosets” zu jedem Element g aus G bilden:

\( gN = \{ x \in G \, | \, \exists h \in H \text{ with } x = g \cdot h \} \\\)

Diese Cosets (deutsch: Nebenmengen) bilden eine disjunkte Überdeckung der Gruppe G.

Ich kann mir auch ganz einfach eine Äquivalenzrelation R definieren, die diese gleichen Nebenmengen als Äquivalenzklassen erzeugt. Dazu muss ich nur definieren, wann zwei Elemente x und y aus G zueingabder in Relation stehen sollen…

Ich versuche es einmal mit: \( R = \{ (x,y) \, | \, \exists h \in H : h\cdot x = h \cdot y \} \\ \)

Ist das wirklich eine Äquivalenzrelation (1) und erzeugt sie tatsächlich die gewünschen Äquivalenzklassen (2)?

Ad (1): Als Äquivalenzrelation wäre zu überprüfen:

Reflexivität; d.h. ist (x,x) immer in R? Offensichtlich stimmt das.

Symmetrie: d.h. wenn (x,y) in R liegt, liegt dann auch (y,x) in R?

Wenn demnach (x,y) in R liegt, existiert ein h in H sodass hx = hy. Dann ist mit dem gleichen h aus H auch hy = hx. Also ist R symmetrisch.

Transitivität:

Wenn (x.y) und (y,z) in R liegen, so heisst das: Es gibt ein h₁ und ein h₂ in H sodass gilt: h₁ x = h₁ y und h₂ y = h₂ z.
Man könnte es mit h = h₁ h₂ versuchen, was bei einer kommutativen (abelschen) Gruppe funktionieren würde…

Vertiefung

YouTube-Video:https://www.youtube.com/watch?v=E8gItS9vGKg

YouTupe-Video zum Tensor-Produkt:https://www.youtube.com/watch?v=KnSZBjnd_74

Mathematik: Gruppentheorie

30. August 202319. December 2023 dkracht

Gehört zu: Mathematik
Siehe auch: Standardmodell der Elementarteilchenphysik, Symmetrien, Äquivalenzrelation
Benutzt: Latex-Plugin für WordPress

Stand: 30.8.2023

Was ist eine Gruppe?

Bei meiner Beschäftigung mit dem Standardmodell der Elementarteilchen bin ich auf das klassische Thema der Gruppentheorie gestoßen.

Eine Gruppe in der Mathematik ist eine Menge mit einer “inneren” Verküpfung (die man gerne mit dem Symbol “+” schreibt) und die bestimmten, unten aufgeführten Axiomen genügt.

Die Verknüpfung

Die Menge bezeichnen wir mal mit M und nehmen dann zwei Elemente aus dieser Menge:

\( a \in M \) und \( b \in M \)

Dann soll die Verknüpfung (geschieben als +) von a und b wieder in der Menge M liegen:

\( a + b \in M \)

Die Axiome

Damit das ganze dann eine Gruppe ist, müssen folgende Axiome gelten:

Assoziativgesetz:

\( (a + b) + c = a + (b + c) \\ \)

Existenz eines “neutralen Elements” e, sodass:

\( \exists e \in M \space \forall a \in M: a + e = a \\\)

Existenz eines inversen Elements zu jedem Element der Gruppe:

\( \forall a \in M \space \exists b \in M : a + b = e \\ \)

Beispiel 1: Die ganzen Zahlen

Die Menge der ganzen Zahlen \(\mathbb{Z}\) mit der Addition als Verknüpfung bildet eine Gruppe.

Beispiel 2: Die Kleinsche Vierergruppe

Die Kleinsche Vierergruppe (nach Felix Klein 1849-1925) besteht aus vier Elementen, wobei jedes Element mit sich selbst invers ist.

Die Menge schreiben wir als:
V = {e, a, b, c}

Die Verknüpfung definieren wir über eine Verknüpfungstafel (auch Cayley Table genannt):

	e	a	b	c
e	e	a	b	c
a	a	e	c	b
b	b	c	e	a
c	c	b	a	e

Wie man leicht sieht, werden mit der so definierten Verknüpfung die Gruppenaxiome erfüllt.

Beispiel 3: Die komplexen Zahlen auf dem Einheitskreis

In der komplexen Zahlenebene \(\mathbb{C}\) ist er Einheitskreis einfach die Teilmenge S der komplexen Zahlen, die wir definieren als:

\(S = \{ z \in \mathbb{C} \space : \space |z| = 1 \} \\ \)

Als Verknüpfung auf dieser Menge nehmen wir die Multiplikation der komplexen Zahlen; geometrisch können wir uns das als Drehungen vorstellen.

Damit wird das Ganze eine Gruppe.

Symmetrien und Drehungen

Gruppen kann man also ganz axiomatisch Definieren, wie oben; in der Praxis sind die Elemente einer Gruppe typischerweise die Symmetrien eines Objekts.

Ganz allgemein bilden die Symmetrien eines Objekts eine Gruppe. Eine speziell Art von Symmetrien sind Drehungen.

Die Leute, die sich mit den verschiedenen Arten von “Drehungsgruppen” als Spezialgebiet beschäftigen, bezeichnen die Gruppe der komplexen Zahlen auf dem Einheitskreis auch gerne als U(1); wobei die “1” bedeuten soll, dass wir nur eine Drehachse haben und das “U” steht für “unitär”, was man gerne zu einer Verknüpfung (Abbildung) sagt, wenn die Länge gleich bleibt (“längentreu”) – allerdings müsste man dann den Begriff “Länge” noch definieren.

Solche Gruppen, die aus Drehungen bestehen, spielen später im Standardmodell der Elementarteilchenphysik eine wichtige Rolle. Wobei eine Drehung auch als sog. “kontinuierliche Symmetrie” bezeichnet wird.

Da solche Drehungen ja “kontinuierlich” (im Gegensatz zu Spiegelungen) um auch beliebig kleine Winkel stattfinden können, kommt man damit auch in das Gebiet der Differentialgeometrie und letztlich zum Begriff der Lie-Gruppen (nach Sophus Lie, 1842-1899).

Vergleiche hierzu auch das YouTube-Video von Josef Gassner: https://www.youtube.com/watch?v=zFhjF6sfY4o

Nur für Mathematiker:
Drehungen im n-dimensionalen komplexen Raum sind lineare Abbildungen und damit als eine spezielle Art von nxn-Matrizen darstellbar.
\(U(n) = \{ U \in \text{ nxn Matrix } | \space U^\dagger U = I \} \)
Die nxn-Matrizen werden auch “General Linear Group” genannt und man schreibt sie als: \(GL(n,\mathbb{C}) \), wobei man zusätzlich fordert: det(U)>0 damit jede Matrix U invertierbar ist und so \(GL(n,\mathbb{C}) \) eine Gruppe ist.

Direktes Produkt von Gruppen

Wenn wir zwei Gruppen G und H haben, können wir das sog. “Direkte Produkt” dieser zwei Gruppen bilden, indem wir von den Mengen das cartesische Produkt \(G \times H\) nehmen und eine Verknüpfung auf diesem cartesischen Produkt komponentenweise definieren.
Wenn wir die Verknüpfungen mit dem Zeichen “+” schreiben, wäre das also:

\((g_1,h_1) + (g_2,h_2) = (g_1+g_2,h_1+h_2) \text{ wobei } g_1, g_2 \in G \text{ und } h_1,h_2 \in H\\\)

Wobei uns klar ist, dass das Symbol “+” hier für drei verschiedene Verknüpfungen benutzt wird.
Die Menge \(G \times H\) ausgestattet mit der so definierten Verknüpfung bezeichnet man als “Direktes Produkt” der Gruppen G und H und schreibt das als \(G \oplus H\).

Physik: Tscherenkow-Strahlung

3. August 20237. October 2023 dkracht

Gehört zu: Physik
Siehe auch: Elementarteilchen, Lichtgeschwindigkeit, Brechungsindex

Stand: 3.8.2023

Tscherenkow-Strahlung

auch: Cherenkov-Strahlung

Tscherenkow-Strahlung ist eine elektromagnetische Strahlung, die durch den Tscherenkow-Effekt entsteht. Benannt nach Pawel Alexejewitsch Tscherenkow (1904-1990), der zusammen mit Kollegen 1934 diese Strahlung entdeckte. Nobelpreis 1958.

Der Tscherenkow-Effekt entsteht, wenn schnelle elektrisch geladene Teilchen (z.B. Elektronen) in ein Medium eintreten, in dem die Lichtgeschwindigkeit kleiner ist, als die Geschwindigkeit der Teilchen.

Der Tscherenkow-Effekt kann nur in Medien mit Brechungsindex n>1 auftreten, weil im Gegensatz zur Lichtgeschwindigkeit im Vakuum von c = 299 792,458 km/s z. B. die Lichtgeschwindigkeit in Wasser nur etwa c′ ≈ 225 000 km/s beträgt und so Teilchen dort schneller sein können als dort das Licht.

Die ausgesandte Strahlung entlang der Flugbahn beschreibt einen sogenannten Mach-Kegel. Das Tscherenkow-Licht ist somit das optische Analogon zum Überschallkegel, der entsteht, wenn Flugzeuge sich schneller als der Schall fortbewegen.

Wo kann man Tscherenkow-Strahlung beobachten?

Im Abklingbecken von Kernkraftwerken

In der Hochatmoshäre, ausgelöst durch kosmische Strahlung

Astronomie: Synchrotron-Strahlung

31. July 202317. December 2023 dkracht

Gehört zu: Physik
Siehe auch: Quantenmechanik, Relativitätstheorie, Elementarteilchen

Stand: 02.08.2023

Synchrotron-Strahlung

Wenn sich elektrisch geladene Teilchen (z.B. Elektronen) gleichförmig bewegen, geschieht nichts besonderes.

Wenn sich solche Teilchen (z.B. Elektronen) aber nicht gleichförmig bewegen, also bescheunigt werden, gebremst werden oder ihre Richtung verändern, dann entsteht elektromagnetische Strahlung; d.h. es werden Photonen abgestrahlt, die der Energiedifferenz entsprechen. Allgemein heisst so eine Strahlung “Bremsstrahlung”.

Abbildung 1: Bremsstrahlung (Wikipedia)

Bremsstrahlung

Abbildung 2: Bremsstrahlung (http://microanalyst.mikroanalytik.de/info1.phtml)

Klassische Bremsstrahlung

Ein klassische Anwendung dieses Effekts ist das Erzeugen von Röntgen-Strahlen. Dazu werden Elektronen beschleunigt und dann auf ein Stück Metall geschossen, wo sie durch das Coulomb-Feld der Metallatome abgebremst werden.

Relativistische Bremsstrahlung

Wenn man zu sehr hohen Energien (v > 0,9 c) kommt, kann man relativistische Effekte nicht mehr vernachlässigen; man spricht dann von “relativistischen” Teilchen (z.B. Elektronen). Diese Art Bremsstrahlung nennt man “Synchrotron-Strahlung”; auch weil solche hohen Energien praktisch nur in Teilchenbescheunigern mit Magnetfeldern erzielt werden können.

Die Richtung dieser Synchrotron-Strahlung ist tangential zur Bahn des bewegten Teilchens – vorrangig nach vorne, aber auch etwas nach hinten.

Der Name Synchrotron-Strahlung

Man nennt das “Synchrotron-Strahlung”, weil diese Strahlung zu erst (1947) in Teilchenbeschleunigern, die man Sychrotron nannte, auftrat und nachgewiesen wurde. In einem solchen Teilchenbeschleuniger werden geladene Teilchen (z.B. Elektronen) durch Magnete so abgelenkt, dass ein Kreisbahn entsteht, was eine Beschleunigung bedeutet.

Stärke der Synchrotron-Strahlung

Je größer die Geschwindigkeitsänderung pro Zeiteinheit (also die Beschleunigung als Vektor) ist, desdo intensiver ist auch die Synchrotron-Strahlung, wobei ein breites Spektrum entsteht: vom Infrarot bis zum Röntgenbereich…

Da viele Elektronen unterschiedlich stark abgelenkt bzw. abgebremst werden, entstehen Photonen mit unterschiedlichen Energien. Die Energieverteilung der Photonen ist deswegen kontinuierlich und breit. Bremsstrahlung hat ein kontinuierliches Spektrum.

Wenn man besonders starke Synchrotron-Strahlung herstellen will, reichen “einfache” Teilchenbescheuniger, wie Synchrotrons den Forschern aber nicht mehr aus. Man muss dann die bewegten geladenen Teilchen durch Parcours von starken Magneten schicken, sodass sie bei diesen vielen Richtungswechseln tausendmal stärker als in den Kurven eines klassischen Ringbeschleunigers strahlen.

Synchrotron-Strahlung in der Astronomie

Synchrotronstrahlung gibt es nicht erst seit es Teilchenbeschleuniger gibt, sondern auch im Weltall gibt es Quellen.

In der Astronomie beobachtet man Synchrotronstrahlung immer dann, wenn sich ein heißes Plasma in einem Magnetfeld befindet. Beispiele für kosmische Synchrotronquellen sind Pulsare, Radiogalaxien und Quasare.

Bei astronomischen Synchrotronquellen, kann es auch weniger energetische Synchrotronstrahung geben, die dann Frequenzen im Radiobereich hat.

Physik: Tunneleffekt

29. June 20233. July 2023 dkracht

Gehört zu: Physik
Siehe auch: Kernfusion, Quantenmechanik
Benutzt: Fotos vom Spiegel

Stand: 02.07.2013

Was ist der Tunneleffekt?

Tunneleffekt ist eine anschauliche Bezeichnung dafür, dass ein Teilchen eine Potentialschwelle auch dann überwinden kann, wenn seine Energie geringer als die „Höhe“ der Barriere (Schwelle) ist. In der klassischen Physik ist das nicht möglich, aber in der Quantenphysik gibt es das mit einer gewissen Wahrscheinlichkeit.

Der Spiegel

Quelle: https://www.spiegel.de/fotostrecke/erwischt-elektronen-beim-tunneln-fotostrecke-20657.html

Beispiel einer Potentialschwelle

Elektrisch gleichnamig geladene Teilchen stoßen sich ab – wie z.B. zwei Protonen durch ihr elektrisches Feld (das Coulomb-Potential). Diese abstoßende Kraft steigt an, je näher sich die Teilchen kommen (mit r^-2).

Eine “Potentialschwelle” kommt hier dadurch zustande, dass die Starke Kernkraft anziehend wirkt und bei kleineren Abständen stärker ansteigt, als die abstoßende elektromagnetische Kraft. Das Überwinden einer solchen Potentialschwelle, auch wenn die Energie dafür eigentlich nicht reicht, ist ein quantenmechanischer Effekt, der mit einer gewissen Wahrscheinlichkeit auftreten kann.

Die Stärke der sog. Starken Kernkraft, die zwei Protonen bei kleinem Abstand anzieht, ist nur durch sehr aufwendige Berechnungen zu ermitteln. Denn diese Starke Kernkraft wirkt primär zwischen den Quarks im Inneren eines Protons. Man spricht dann noch von einer “restlichen” Wirkung. Dazu das Stichwort: Gamow Peak.

Berechnung des Tunneleffekts

Zuerst müssten wir das Potential des betrachteten Teilchens in Abhängigkeit vom Ort mit einer Funktion V(x) beschreiben.

Diese Potentialfunktion können wir dann in die stationäre Schrödinger-Gleichung einsetzen.

Diese Schrödinger-Gleichung ist damit eine Differentialgleichung, deren Lösung die Wellenfunktion Φ des betrachteten Teilchens ist. Damit haben wir sich die Aufenthaltswahrscheinlichkeit |Φ|² des Teilchens in Abhängigkeit von seinem Ort, welche auch jenseits der Potientialschwelle größer als Null ist.

Beispiel des Tunneleffekts

Bei der Kernfusion in unserer Sonne findet in der Hauptsache der sog. p-p-Prozess statt. Der p-p-Prozess beginnt mit der Verschmelzung zweier Protonen und der anschließenden Umwandlung eines Protons in ein Neutron und eine Positron, sodass ein Deuterium-Kern ²H entsteht.

\( ^1H + {^1H} \to {^2H} + e^+ + \nu_e + 0.42 MeV \\\)

Für diesen ersten Reaktionsschritt muss die Potentialschwelle zwischen den beiden Protonen ¹H überwunden werden, was der Tunneleffekt ermöglicht. Die Wahrscheinlichkeit dafür ist aber so klein, dass die durchschnittliche Reaktionszeit 1.4 10¹⁰ Jahre (in unserer Sonne) beträgt.

Quelle: https://sternentstehung.de/von-wasserstoff-zu-helium-die-pp-kette

Physik: Phasenraum

6. April 20239. June 2024 dkracht

Gehört zu: Mechanik, Physik
Siehe auch: Newtonsche Mechanik, Lagrange-Formalismus
Benutzt: SVG-Grafiken aus Github

Stand: 06.04.2023

Quellen

Anregungen hierzu habe ich von Stefan Müllers Youtube-Video

erhalten.

Der Phasenraum

Im Phasenraum (auch Zustandsraum genannt) bezeichnen die Punkte die Zusände eines mechanischen Systems.

Der Zustand eines mechanischen Systems (zu einer Zeit t) kann durch Ort und Geschwindigkeit seiner Massepunkte beschrieben werden.

Dazu dienen sog. “generalisierten Koordinaten” (auch “verallgemeinerte Koordinaten” genannt).

Solche generalisierten Koordinaten werden meist geschreiben als:

Ortskoordinaten: \( q_1, q_2,…,q_i,… \)
Geschwindigkeiskoordinaten: \( \dot{q_1}, \dot{q_2},…, \dot{q_i},… \)

Den Physiker interessiert nun eine Zustandsveränderung mit der Zeit.
Möge ein Zustand 1 (Anfang) beschrieben sein durch \( q_i(t_1), \dot{q_i(t_1} \)
und ein Zustand 2 (Ende) beschrieben sein durch \( q_i(t_1), \dot{q_i(t_1} \).

Diese beiden Punkte im Phasenraum kann man in einem Diagramm des Phasenraums graphisch darstellen.

Es gibt viele Wege auf denen man vom Zustand 1 zum Zustand 2 kommen kann.

Abbildung 1: Wege in einem Phasenraum (Github: Phasenraum.svg)

Wege in einem Phasenraum

Auf jedem dieser Wege kann man das Integral entlang des Weges (nicht: Pfadintegral) der Engergie über die Zeit bilden. Diese Größe nennt man “Wirkung“.
Genaugenommen sind hier (infenitesimale) Energie-Unterschiede entlang des Weges gemeint.

Die Natur wählt nun denjenigen Weg, auf dem diese Wirkung minimal ist.
Hinter dem Begriff “minimal” steckt so eine Idee von “einfacher”, “ökonomischer”, “sparsamer”,….

Um von so einem Integral das Minimum zu finden bedient man sich der mathematischen Methode der Variationsrechnung. Da werden “kleine” Differenzen betrachtet (geschrieben als kleiner Griechischer Buchstabe Delta) und diese Differenzen werden dann als Taylorentwicklung dargestellt…

Aber welche “Energie” ist das, die wir da integrieren sollen? In der klassischen Sichtweise ist das die Lagrange-Funktion. Aber wo bekommen wir die denn her???

Wir haben da immer irgendein Kraftfeld, was zu Bewegungsgleichungen führt. Ähnlich wie wir statt eines konservativen Kraftfeldes auch das Potenzial als skalares Feld nehmen konnten, wollen wir nun statt des Potenzials die Lagrange-Funktion nehmen….

Warum ist das dann immer noch richtig?

Computer: Differentialoperatoren

25. February 20233. December 2023 dkracht

Gehört zu: Mathematik
Siehe auch: Lineare Algebra, Kraftfeld, Arbeit, Schrödinger, Maxwell

Stand: 03.12.2013

Differentialoperatoren: Gradient

Bei einer Funktion von \(\mathbb{R} \to \mathbb{R} \) ist ja klar, was eine Ableitung (Differentialquotient) ist: Anschaulich die Änderungsrate des Funktionswerts an einer bestimmten Stelle…
Wenn der Definitionsbereich einer Funktion nicht mehr \(\mathbb{R}\) sondern \(\mathbb{R}^3\) ist, nennt man eine solche Funktion auch ein “Skalarfeld”, weil durch die Funktion jedem Punkt im Raum \(\mathbb{R}^3\) ein skalarer Wert zugeordnet wird (Beispiel: Temperatur). Eine “Änderungsrate” einer solchen Funktion wäre dann ja von der Richtung abhängig, in die ich gehe; also muss so eine “Änderungsrate” ein Vektor werden. So eine “Änderungsrate” eines Skalarfeldes nennt man dann den “Gradienten” s.u.

Sei also \( \Phi \) eine Funktion \(\Phi: \mathbb{R}^3 \to \mathbb{R} \) dann ist der Gradient von \( \Phi \) :

\( \Large grad \enspace\Phi = \left[ \begin{array}{c} \frac{\partial \Phi}{\partial x} \\\ \frac{\partial \Phi}{\partial y} \\\ \frac{\partial \Phi}{\partial z} \end{array} \right] \\\ \)

Differentialoperatoren: Nabla

Generell definiert man auf einem Vektorraum dann besondere Abbildungen, sog. Differentialoperatoren. Man benutzt dazu die Koordinatenschreibweise. Wir nehmen hier immer die klassischen Cartesischen Koordinaten. Wenn man andere Koordinatensystem hat, sehen die Formeln dann etwas anders aus.

Wir nehmen als Definitionsbereich für unsere “Felder” den Vektorraum \(\mathbb{R}^3\). dann haben wir partielle Ableitungen nach den drei Koordinaten: x, y und z und man definiert als sog. Nabla-Operator:

\( \Large \nabla = \left[ \begin{array}{c} \frac{\partial}{\partial x} \\\ \frac{\partial}{\partial y} \\\ \frac{\partial}{\partial z} \end{array} \right] \\\ \)

Damit kann man dann einfach definieren:

Gradient eines Skalarfeldes: \( \nabla \Phi \) (ist ein Vektorfeld)
Divergenz eines Vektorfeldes: \( \nabla \cdot \vec{V} \) (ist ein Skalarfeld)
Rotation eines Vektorfeldes: \( \nabla \times \vec{V} \) (ist ein Vektorfeld)

Dies wird benutzt beispielsweise bei den Maxwellschen Gleichungen und der Schrödinger-Gleichung.

Im einfachen Fall, wenn unser Definitionsbereich nur ein Vektorraum der Dimension 1 ist (\(\mathbb{R}^1\)), ist der Gradient einfach die erste Ableitung.

Kraftfeld und Gradient

In einem konservativen Kraftfeld F(r) kann man als Skalar ein Potential V(r) definieren, sodass die Kraft der Gradient den Potentials wird:

\( \vec{F}(r) = \nabla V(r) \)

Elektrisches Feld und Divergenz

Ein Elektrisches Feld wird durch eine ruhende elektrische Ladung erzeugt.
Ein Elektrisches Feld ist ein Vektorfeld, das man üblicherweise \( \vec{E} \) schreibt.

Feldstärke – Feldlinien – xyz

Für das von einer Elektrischen Ladung Q erzeugte E-Feld \( \vec{E} \) gilt:

\( \nabla \cdot \vec{E} = 4 \pi Q \\\)

Da die Elektrische Ladung Q sozusagen das Elektrische Feld erzeugt, nennt man es auch die Quelle des E-Feldes…

Magnetisches Feld

Ein Magnetisches Feld wird durch bewegte elektrische Ladungen erzeugt.
Ein Magnetisches Feld ist ein Vektorfeld, das man üblicherweise \( \vec{B} \) schreibt.

Für ein Magnetisches Feld gilt:

\( \nabla \cdot \vec{B} = 0 \\\)

D.h. es gibt keine Quelle und alle Feldlinien sind geschlossen…