Warum müssen wir validieren?
Bei der Validierung der Bestandsdaten geht es um die Ermittlung eines belastbaren Berechnungsmodells. Ein Vergangenheitsforecast liefert uns dafür die Daten: Validierte Saisonalitätsdaten.
Saisonalität berechnen
Wir können aus der gesamten Bandbreite eines Datensets im Standardfall nie ein einheitliches Berechnungsmodell ableiten, welches ursächlich für das Wiedereintreten bestimmter Muster wäre.
Um ein solches Berechnungsmodell zu ermitteln, muss für einen realitätsnahen Forecast eine realitätsnahe Saisonalität errechnet werden. Die Saisonalität ist eine notwendige Eingabe für Regressionsanalysen aus einem Datenset, und beschreibt den Zeitraum des Dateneinzugs in Punkten. Wenn im Datenset zum Beispiel 1.000 nacheinanderfolgende Tage mit organischen Website-Klicks aus der Google-Suche gelistet sind, wären dies 1.000 Datenpunkte. Eine Saisonalität könnte nun auf einen bestimmten Wert festgelegt werden, damit diese berücksichtigt wird. Datenpunkte könnten als Jahre, Quartale, Tertiale, Monate, Wochen, Tage, Stunden, Minuten und Sekunden bemessen werden – wichtig ist nur, dass die Metrik und die Abstände zwischen den Einträgen gleich sind.
Wenn wir die Entwicklung für 6 – 12 Monate vorhersagen wollen, müsste die Saisonalität ebenfalls auf 6 – 12 Monaten bemessen werden. Das wären – im Falle von Tagen als Datenpunkte – entsprechend 182,5 bis 365 Punkte in der Saisonalität. Als Best Practice empfiehlt es sich bei organischen Website-Klicks mit einer Saisonalität von 200 Punkten zu beginnen.
Vergangenheitsforecast
Für die Ermittlung des ursächlichen Musters für bestehende Entwicklungen, ermitteln wir die Saisonalität mit einem Vergangenheitsforecast. Hierfür wird ein Forecast für einen vorangegangenen Zeitraum berechnet. Wir können dazu die Daten aus dem letzten Jahr verwenden, um für ein vergangenes Halbjahr des aktuellen Jahres einen Forecast zu errechnen.
Links in blauen Balken: Beispiel für Bestandsdaten für Website-Klicks aus organischer Google-Suche. Rechts in gelben Balken: Forecast-Werte aus Bestandsdaten.
Echte Entwicklung
Diese Daten aus dem Vergangenheitsforecast werden dann mit dann mit der echten Entwicklung verglichen.
Links in blauen Balken: Beispiel für Bestandsdaten für Website-Klicks aus organischer Google-Suche. Rechts in gelben Balken: Echte Entwicklung der Bestandsdaten.
Trendentwicklung prüfen
Beim Abgleich zwischen Vergangenheitsforecast und echter Entwicklung kommt es darauf an, ob Trends im Großen und Ganzen übereinstimmen. Wenn es größere Abweichungen gibt, sollten für die Berechnung des Forecast-Modells andere Saisonalitätswerte getestet werden. Erst wenn wir einen Saisonalitätswert für eine passende Trendentwicklung haben, wissen wir, wie ein wiederkehrendes Muster für einen realitätsnahen Forecast berechnet werden kann. Dieser Wert muss dann für den richtigen Forecast verwendet werden.
Gegenüberstellung zwischen echten Bestandsdaten und Forecast-Werten. Entscheidend hier ist vor allem, ob die Trendentwicklung im Großen und Ganzen realitätsnah ist.
Vernetze dich mit mir auf LinkedIn
Slava Wagner
#opentonetwork: Vernetze dich mit mir auf LinkedIn & stelle mir deine Fachfragen.
Slava Wagner
Marketing & Leadgenerierung
SEA, Paid Media, Conversion-Rate-Optimierung, Markt- und Trendanalysen im Raum Berlin-Brandenburg.