Baumdiagramm: Unterschied zwischen den Versionen

Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
 
(3 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
Ein Baum ist ein spezieller Typ von Graph. Im Kontext der Informatik, Mathematik und Datenanalyse ist der Begriff "Baum" eine fundamental wichtige Datenstruktur, die hierarchische Beziehungen darstellt. Er kommt in vielen Bereichen zur Anwendung.
Ein Baum ist ein spezieller Typ von Graph. Im Kontext der Informatik, Mathematik und Datenanalyse ist der Begriff "Baum" eine fundamental wichtige Datenstruktur, die hierarchische Beziehungen darstellt. Er kommt in vielen Bereichen zur Anwendung. Ein Baumdiagramm ist eine visuelle Darstellungsform, die verwendet wird, um Entscheidungen, Möglichkeiten oder Abläufe zu veranschaulichen. Es besteht aus Knoten, die Ereignisse oder Entscheidungen repräsentieren, und Ästen, die die möglichen Ergebnisse oder Schritte verbinden.
 
[[Datei:Baumstruktur.png|mini]]
[[Datei:Baumstruktur.png|mini]]
=== Eigenschaften eines Baumdiagramms: ===
* Knoten: Stellen Entscheidungen oder Ereignisse dar.
* Äste: Zeigen die möglichen Ergebnisse oder Folgeentscheidungen an.
* Hierarchische Struktur: Die Darstellung ist oft hierarchisch, wobei der Ausgangspunkt oben steht und die möglichen Ergebnisse nach unten verzweigen.


== Wahrscheinlichkeitsrechnung: Ereignisbäume (Entscheidungsbäume) ==
=== Anwendung: ===
Baumdiagramme finden in verschiedenen Bereichen Anwendung, wie zum Beispiel in der Mathematik zur Darstellung von Wahrscheinlichkeiten, in der Informatik zur Veranschaulichung von Algorithmen oder Entscheidungsprozessen und in der Statistik zur Analyse von Zufallsexperimenten.
== Wahrscheinlichkeitsrechnung: Ereignisbäume ==


In der Wahrscheinlichkeitsrechnung werden Bäume oft als '''Ereignisbäume''' oder '''Wahrscheinlichkeitsbäume''' verwendet, um eine Sequenz von Ereignissen und deren mögliche Ausgänge sowie die zugehörigen Wahrscheinlichkeiten zu visualisieren und zu berechnen.
In der Wahrscheinlichkeitsrechnung werden Bäume oft als [[Baumdiagramm (Wahrscheinlichkeitsrechnung)|'''Ereignisbäume''' oder '''Wahrscheinlichkeitsbäume''']] verwendet, um eine Sequenz von Ereignissen und deren mögliche Ausgänge sowie die zugehörigen Wahrscheinlichkeiten zu visualisieren und zu berechnen.


=== Struktur ===
=== Struktur ===
Zeile 20: Zeile 28:
* '''Risikobewertung:''' Analyse von Pfaden und Wahrscheinlichkeiten, die zu einem bestimmten Risikoereignis führen können.
* '''Risikobewertung:''' Analyse von Pfaden und Wahrscheinlichkeiten, die zu einem bestimmten Risikoereignis führen können.


---
== Maschinelles Lernen ==
 
== Entscheidungsfindung: Entscheidungsbäume ==
 
'''Entscheidungsbäume''' sind eng mit den Wahrscheinlichkeitsbäumen verwandt, fokussieren sich aber stärker auf die Unterstützung rationaler Entscheidungen unter Unsicherheit. Sie helfen dabei, den optimalen Aktionsplan zu finden, indem sie mögliche Entscheidungen, deren Konsequenzen und die damit verbundenen Wahrscheinlichkeiten und Werte abbilden.
 
=== Struktur ===
* '''Entscheidungsknoten (Quadrate):''' Punkte, an denen eine Entscheidung getroffen werden muss.
* '''Zufallsknoten (Kreise):''' Punkte, an denen ein zufälliges Ereignis eintritt.
* '''Äste:''' Repräsentieren Optionen oder mögliche Ereignisse.
* '''Blätter:''' Endergebnisse, oft mit einem monetären Wert oder Nutzen assoziiert.
 
=== Anwendungsbeispiel ===
* '''Investitionsentscheidungen:''' Ein Unternehmen entscheidet, ob es in ein neues Produkt investieren soll.
** '''Startknoten:''' Entscheidung, Produkt A zu entwickeln oder nicht.
** Wenn entwickelt: Zufallsknoten für Markterfolg (hoch, mittel, niedrig), jeweils mit einer Wahrscheinlichkeit und einem erwarteten Gewinn.
** Wenn nicht entwickelt: Möglicher Verlust durch verpasste Gelegenheit.
** Der Baum hilft, den erwarteten Wert (Expected Monetary Value, EMV) jeder Entscheidung zu berechnen und die Option mit dem höchsten EMV zu wählen.
* '''Projektmanagement:''' Auswahl des besten Vorgehens bei Risiken.
* '''Geschäftsstrategie:''' Planung von Marketingkampagnen basierend auf potenziellen Kundenreaktionen.
 
---
 
== Maschinelles Lernen: Entscheidungsbäume und Baum-Ensembles ==


Im Maschinellen Lernen sind Bäume eine der grundlegendsten und leistungsstärksten Modelltypen, sowohl für Klassifikations- als auch für Regressionsprobleme.
Im Maschinellen Lernen sind Bäume eine der grundlegendsten und leistungsstärksten Modelltypen, sowohl für Klassifikations- als auch für Regressionsprobleme.
Zeile 49: Zeile 34:
=== Entscheidungsbäume (als Modell) ===
=== Entscheidungsbäume (als Modell) ===
* '''Struktur:''' Hierarchische Struktur, bei der interne Knoten "Tests" auf Merkmale der Daten repräsentieren (z.B. "Ist Alter > 30?"). Jeder Ast repräsentiert das Ergebnis dieses Tests, und jeder Blattknoten repräsentiert eine Klassenzuordnung (bei Klassifikation) oder einen Wert (bei Regression).
* '''Struktur:''' Hierarchische Struktur, bei der interne Knoten "Tests" auf Merkmale der Daten repräsentieren (z.B. "Ist Alter > 30?"). Jeder Ast repräsentiert das Ergebnis dieses Tests, und jeder Blattknoten repräsentiert eine Klassenzuordnung (bei Klassifikation) oder einen Wert (bei Regression).
* '''Lernen:''' Der Baum wird durch rekursive Partitionierung der Daten gelernt, indem an jedem Knoten das Merkmal ausgewählt wird, das die Daten am besten trennt (z.B. basierend auf Gini-Impurity oder Entropie).
* '''Lernen:''' Der Baum wird durch rekursive Partitionierung der Daten gelernt, indem an jedem Knoten das Merkmal ausgewählt wird, das die Daten am besten trennt (z.B. basierend auf Entropie).


=== Anwendungsbeispiel ===
=== Anwendungsbeispiel ===
Zeile 55: Zeile 40:
* '''Krankheitsdiagnose:''' Klassifikation von Patienten in "krank" oder "gesund" basierend auf Symptomen.
* '''Krankheitsdiagnose:''' Klassifikation von Patienten in "krank" oder "gesund" basierend auf Symptomen.


=== Baum-Ensembles (Random Forests, Gradient Boosting Trees wie XGBoost, LightGBM) ===
== Suche: Suchbäume und Baumtraversierung ==
* Diese leistungsstärkeren Modelle basieren auf der Kombination vieler einzelner Entscheidungsbäume.
* '''Random Forests:''' Erstellen eine Vielzahl von Entscheidungsbäumen auf zufälligen Teilmengen der Daten und Merkmale und aggregieren deren Vorhersagen (durch Mehrheitsvotum bei Klassifikation, Durchschnitt bei Regression). Dies reduziert Überanpassung (Overfitting) und verbessert die Generalisierung.
* '''Gradient Boosting (z.B. XGBoost):''' Erstellt Bäume sequenziell, wobei jeder neue Baum versucht, die Fehler des vorhergehenden Baumes zu korrigieren. Dies führt zu sehr genauen Modellen.
 
=== Anwendungsbeispiel ===
* '''Kaggle-Wettbewerbe:''' Häufig die Gewinner-Algorithmen in strukturierten Daten-Wettbewerben.
* '''Betrugserkennung:''' Identifizierung betrügerischer Transaktionen.
* '''Kundenabwanderung:''' Vorhersage, welche Kunden wahrscheinlich ihren Vertrag kündigen werden.
 
---
 
== 4. Suche: Suchbäume und Baumtraversierung ==


Im Bereich der Suche und Datenstrukturen sind Bäume fundamental, um Daten effizient zu speichern und zu durchsuchen.
Im Bereich der Suche und Datenstrukturen sind Bäume fundamental, um Daten effizient zu speichern und zu durchsuchen.