Holide-Modul zur Extraktion von Feiertagsdaten der deutschen Bundesländer

8.03.2021

Feiertage sind bestimmte Tage im Jahr, in deren Umfeld Menschen ihr Verhalten ändern. Ein einfaches Beispiel dafür kann rund um die Weihnachtsfeiertage beobachtet werden, wenn es in der Regel einen Anstieg der Gesamtumsätze gibt. Da Feiertage im Jahresverlauf nicht so häufig vorkommen, wirken sie sich in den Daten meist besonders stark aus und sind daher von besonderer Bedeutung für die Qualität der darauf basierenden Analysen. In den meisten Fällen erweist es sich als nicht unbedeutender Aufwand, diese Daten korrekt zu modellieren hinsichtlich Vorhersageanalysen wie zum Beispiel Prognosen. Einige Studien zeigen sogar, dass der Gesamtprognosefehler um bis zu 10 % reduziert werden kann, wenn die Feiertage korrekt in den Datensatz integriert werden.

Das von Jonas Greifenhain erstellte Holide-Modul ist eine Python-Bibliothek, die in unseren Quellcode eingefügt werden kann, um die Feiertagsdaten in Deutschland auf eine sehr einfache und intuitive Weise abzurufen. Es enthält Funktionen, welche die aktuellen Feiertage aus dem Web abruft und dann in einer .json-Datei zur einfachen Datenverarbeitung speichert. Es bietet dann eine Vielzahl von verschiedenen Funktionen zum Abrufen von Schulferien, gesetzlichen Feiertagen und bundeslandspezifischen Feiertagen. Dieses Modul extrahiert die Feiertage in Deutschland auf einfache Weise und kann zur Anreicherung des eigenen Datenbestandes verwendet werden.
Dies hilft die Gesamtleistung unseres Vorhersagemodells zu verbessern, indem es zusätzliches Wissen in die Daten einbringt, um Trends, die in den Daten vorhanden sein könnten, besser zu verstehen.

Den Code zum Holide-Modiul finden Sie hier auf Github.

Beitrag von Dr. Mishal Benz