„Das SDSC-BW hat in diesem gemeinsamen Projekt gezeigt, wie wertvoll unsere Daten sind. Für uns als Mittelständler war dabei insbesondere die Zusammenarbeit mit den Experten aus der Forschung sehr hilfreich.“
Alexander Voitl, Projektmanager IT & Digitalisierung

Ein maschineller Lernansatz für die wichtigsten Faktoren, die die Fertigungszeit beeinflussen.

Wie die zukünftige Produktnachfrage mit Hilfe des maschinellen Lernens vorhergesagt werden kann

Der Kunde

VAF ist ein weltweit bekannter Hersteller von Sondermaschinen für die Automobilbranche, ein mittelständisches Familienunternehmen, das über 450 Mitarbeiter beschäftigt und in der ganzen Welt vertreten ist. Zu seinen Haupttätigkeiten gehört unter anderem die Lieferung von Sondermaschinen und Sonderanlagen für namhafte Automobilhersteller und deren Zulieferer.www.vaf-bopfingen.de

Die Daten

VAF verfügt über eine breite Palette von Produkten. Sie unterscheiden sich u. a. in Bezug auf Produktionszeiten, Produktionsverfahren und Rohstoffe. Um zu untersuchen, welche Faktoren letztlich die Produktionszeiten bestimmen, hat die VAF einen großen Datensatz zur Verfügung gestellt: er umfasst etwa 250.000 Produktionsdatensätze von 2008 bis 2021. Jeder davon bildet einen Produktionsprozess ab und enthält 33 verschiedene Attribute; z. B. das für die Produktion verwendete Rohmaterial, die verwendete Produktionsmethode, die Form des Produktionsziels und die Produktionszeit. Die meisten Attributwerte im Datensatz sind unabhängig von ihrem Typ als Text gespeichert, was eine große Schwierigkeit bei diesem Projekt darstellte.

Die Herausforderung

Diese Aufgabe war mit zwei Schwierigkeiten verbunden: 1) die Anforderung der Interpretierbarkeit schränkt die Auswahl der Modelle ein und 2) die große Anzahl als Text gespeicherter Merkmale erschwert die Analyse und beeinträchtigt gleichzeitig die Leistung einiger Modelle.Es gibt viele komplexe Modelle, deren Entscheidungen schwer zu erklären sind, tiefe neuronale Netze sind eines der typischen Beispiele dafür. Attribute, die mit Hilfe von Text gespeichert werden, sind meist kontextabhängig und können durch semantische Analyse gut behandelt werden, aber sie erfordert eine große Menge Daten und Zeit und ist nicht interpretierbar. Stattdessen können bei einigen einfachen Methoden Informationen hinzugefügt oder entfernt werden.

Die Potentialanalyse

Bei der kostenlosen Potenzialanalyse richten die Experten des SDSC-BW ihr Hauptaugenmerk auf die Vorverarbeitung der Daten. Dazu gehören die Analyse der Datenverteilung, die Korrektur fehlerhafter Daten, die Verarbeitung von „Charaktertypen“ daten und, durch Forschung, die Konstruktion neuer Attribute auf der Grundlage der ursprünglichen Attribute mit Hilfe mathematischer Operatoren. Die neu aufbereiteten Daten wurden dann an einer Reihe verschiedener “einfacher” Modelle getestet, und es wurde versucht, die Leistung der Modelle durch Ensemble zu verbessern.

Das Resultat

Nach sechswöchiger Arbeit haben die Experten des SDSC-BW die Machbarkeit der Verwendung von Attributen zur Vorhersage von Produktionszeiten experimentell überprüft und festgestellt, welche Attribute den größten Einfluss auf die Zeit haben. Darüber hinaus stellten die Experten den Einfluss einiger Attribute in Form eines Baumdiagramms dar und boten eine Möglichkeit, den Einfluss anderer Attribute weiter zu untersuchen

Wie es weiter geht

Bei der Analyse der Daten stellten die Experten von SDSC-BW fest, dass es in zwei Bereichen die Verbesserungsmöglichkeiten des Projekts gab. Die eine ist die Speicherung der Daten. Die Experten stellten fest, dass die Art und Weise, wie die VAF-Daten gespeichert werden, weiter optimiert werden könnte. Sauberere Daten würden die Analyse der Daten erleichtern. Eine weitere Möglichkeit ist die Verwendung komplexerer Modelle. Komplexe Modelle sind schwer zu interpretieren, aber nicht unerklärlich. Es gibt Möglichkeiten, komplexe Modelle zu verwenden und trotzdem eine gute Interpretierbarkeit zu erreichen, aber das kostet mehr Zeit