Verwendungszweck Mithilfe des Kreuzvalidierungs-Assistenten erhalten Sie Informationen über die Genauigkeit von Data Mining-Modellen ...

Verwendungszweck 
Mithilfe des Kreuzvalidierungs-Assistenten erhalten Sie Informationen über die Genauigkeit von Data Mining-Modellen und deren allgemeine Anwendbarkeit auf Ihre Daten. Bei der Kreuzvalidierung werden die Daten in eine Reihe von 'Aufteilungen' partitioniert und die Genauigkeit und Fehler des Modells für jede Aufteilung einzeln getestet. Wenn für alle Aufteilungen gute Ergebnisse erzielt werden und die einzelnen Ergebnissätze etwa im gleichen Bereich liegen, ist dies eine Bestätigung dafür, dass sich das Modell für die gesamten Daten gut generalisieren lässt. Wenn jedoch bei einigen Aufteilungen eine hohe Varianz auftritt, lässt sich daraus ableiten, dass das Modell nicht auf alle Daten anwendbar ist und optimiert werden muss.

Funktionsweise
Im Kreuzvalidierungs-Assistenten können Sie die Modelle angeben, die getestet werden sollen. Sie können außerdem angeben, in wie viele Aufteilungen die Daten partitioniert werden sollen. Auf Grundlage dieser Angaben wird für jede Aufteilung ein Modell erstellt und trainiert. Die Anwendung gibt dann einen Satz von Genauigkeitsmetriken für jede Aufteilung im Modell zurück und fasst die Ergebnisse für das Modell zusammen. Zu den Ergebnissen zählen die Anzahl der richtig und falsch positiven Ergebnisse, die vom Modell vorhergesagt werden, sowie die Wurzel des mittleren quadratischen Fehlers und die logarithmische Wahrscheinlichkeit. Informationen über diese Ergebnisse finden Sie in den entsprechenden Hilfedateien.
Verwendungszweck 
Mithilfe des Kreuzvalidierungs-Assistenten erhalten Sie Informationen über die Genauigkeit von Data Mining-Modellen und deren allgemeine Anwendbarkeit auf Ihre Daten. Bei der Kreuzvalidierung werden die Daten in eine Reihe von 'Folds' partitioniert und die Genauigkeit und Fehler des Modells für jeden Fold einzeln getestet. Wenn für alle Folds gute Ergebnisse erzielt werden und die einzelnen Ergebnissätze etwa im gleichen Bereich liegen, ist dies eine Bestätigung dafür, dass sich das Modell für die gesamten Daten gut generalisieren lässt. Wenn jedoch bei einigen Folds eine hohe Varianz auftritt, lässt sich daraus ableiten, dass das Modell nicht auf alle Daten anwendbar ist und optimiert werden muss.

Funktionsweise
Im Kreuzvalidierungs-Assistenten können Sie die Modelle angeben, die getestet werden sollen. Sie können außerdem angeben, in wie viele Folds die Daten partitioniert werden sollen. Auf Grundlage dieser Angaben wird für jeden Fold ein Modell erstellt und trainiert. Die Anwendung gibt dann einen Satz von Genauigkeitsmetriken für jeden Fold im Modell zurück und fasst die Ergebnisse für das Modell zusammen. Zu den Ergebnissen zählen die Anzahl der richtig und falsch positiven Ergebnisse, die vom Modell vorhergesagt werden, sowie die Wurzel des mittleren quadratischen Fehlers und die logarithmische Wahrscheinlichkeit. Informationen über diese Ergebnisse finden Sie in den entsprechenden Hilfedateien.
Verwendungszweck 
Mithilfe des Kreuzvalidierungs-Assistenten erhalten Sie Informationen über die Genauigkeit von Data Mining-Modellen und deren allgemeine Anwendbarkeit auf Ihre Daten. Bei der Kreuzvalidierung werden die Daten in eine Reihe von "Folds" partitioniert und die Genauigkeit und Fehler des Modells für jeden Fold einzeln getestet. Wenn für alle Folds gute Ergebnisse erzielt werden und die einzelnen Ergebnissätze etwa im gleichen Bereich liegen, ist dies eine Bestätigung dafür, dass sich das Modell für die gesamten Daten gut generalisieren lässt. Wenn jedoch bei einigen Folds eine hohe Varianz auftritt, lässt sich daraus ableiten, dass das Modell nicht auf alle Daten anwendbar ist und optimiert werden muss.

Funktionsweise
Im Kreuzvalidierungs-Assistenten können Sie die Modelle angeben, die getestet werden sollen. Sie können außerdem angeben, in wie viele Folds die Daten partitioniert werden sollen. Auf Grundlage dieser Angaben wird für jeden Fold ein Modell erstellt und trainiert. Die Anwendung gibt dann einen Satz von Genauigkeitsmetriken für jeden Fold im Modell zurück und fasst die Ergebnisse für das Modell zusammen. Zu den Ergebnissen zählen die Anzahl der richtig und falsch positiven Ergebnisse, die vom Modell vorhergesagt werden, sowie die Wurzel des mittleren quadratischen Fehlers und die logarithmische Wahrscheinlichkeit. Informationen über diese Ergebnisse finden Sie in den entsprechenden Hilfedateien.