Objekterkennung in technischen Zeichnungen
Wie das SDSC-BW mit Methoden der Bildverarbeitung Toleranz-Information findet
Der Kunde
Die Karlsruher EDI GmbH (Engineering Data Intelligence) bietet KI-basierte Applikationen an, mit denen Prozesse und Maschinen optimiert, gesteuert und überwacht werden können. Das eigens entwickelte EDI hive IoT Framework mit patentierter Technologie ermöglicht eine schnelle Umsetzung dieser Aufgabe. Ziel ist es, Unternehmen das Potenzial künstlicher Intelligenz (KI) durch eine semantische Vernetzung ihrer Daten mit Expertenwissen zu eröffnen. Darüber hinaus unterstützt EDI seine Kunden auch bei der Entwicklung von neuen digitalen Geschäftsmodellen.
Die Daten
EDI stellte dem SDSC-BW rund 1.000 technische Zeichnungen im PDF-Format zur Verfügung. In diesen tech-nischen Zeichnungen werden unterschiedlichen Normen für Oberflächenangaben, Maße und Bezüge verwendet. Die Schriftarten der Produktbeschreibungen sind dabei nicht einheitlich und werden aufgrund von Änderungen in den Produktbeschreibungen oftmals zusätzlich durch handschriftliche Notizen ergänzt. Diese Vielfalt der Beschriftungen stellt eine Herausforderung für klassische Verfahren der optischen Zeichenerkennung dar.
Die Herausforderung
Die Mindesttoleranz eines Bauteils hat einen entscheidenden Einfluss auf die Produktionsplanung und die Produk-tionskosten. Das Problem: Für manche technischen Zeichnungen existieren keine entsprechenden CAD-Daten mehr; und das manuelle Erfassen der Toleranzen tausender technischer Zeichnungen ist sehr zeitauf-wändig. Kann diese Arbeit von einem Computer übernommen werden, spart dies viel Zeit und reduziert den Arbeits-aufwand erheblich. Generell sind für die Ermittlung der Mindesttoleranz in einer technischen Zeichnung zwei Schritte erforderlich: Im ersten Schritt muss die Position der Bemaßung durch Bilderkennungsmethoden bestimmt werden. Anschließend gilt es, die entsprechende Bemaßung und ihre Toleranzinformation mit Hilfe von optischer Zeichenerkennung (OCR) zu erfassen.
Die Potentialanalyse
Die Arbeit der SDSC-BW-Experten konzentrierte sich hauptsächlich auf den ersten Schritt. Mit State-of-the-Art-Objekterkennungsmethoden versuchten sie, die Position der Bemaßung zu detektieren und gleichzeitig die Winkelinformationen der detektierten Positionen bereitzustellen. So reagiert die OCR-Methode (Optical Character Recognition) sehr empfindlich auf die Drehung von Zeichen. Durch die Winkelinformationen lassen sich die Zeichen in die richtige Richtung drehen, so dass die OCR-Methode zuverlässiger arbeitet. Die Arbeit des SDSC-BW umfasste die Datenaufbereitung, die Definition der Objektklassen, die Datenmarkierung und schließlich die Erstell-ung der Objekterkennungsmodelle. Hierfür testete das Team verschiedene Objekterkennungsmodelle, wie zum Beispiel YOLO V2 & V3 und FRCNN. Darüber hinaus versuchte es, Erkennungsmodelle für die Rotation Bounding Box zu erstellen, um genauere Winkelinformationen bereitzustellen – und somit die Erkennung zu verbessern.
Das Resultat
Das trainierte Modell erzielte eine sehr gute Leistung: Die Erkennungsgenauigkeitsrate bezüglich der Position von Maßeintragungen mit Toleranzen erreichte dabei 93.3 Prozent. Über diesen Erfolg hinaus brachten die Experten des SDSC-BW bei EDI auch weitere Ideen ein, zum Beispiel Sequence-to-Sequence Learning oder die Kombination mit dem Graph Convolutional Modell. Abschließend zeigten sie Möglichkeiten zur weiteren Verbesserung des Systems auf, welche sich beispielsweise die Abhängigkeitsstruktur von Bezeichnungselementen (durch Graph Convolutional Networks) zunutze machen könnten.
Wie es weiter geht
Die Ergebnisse der Potentialanalyse belegten, dass die Bildverarbeitungsmethode unter Nutzung von tiefen neuronalen Netzen besser mit der Vielfalt der Schriftarten umgehen konnte. Das SDSC-BW und EDI bereiten gemeinsam einen Antrag für ein weiterführendes Projekt vor, um weitere Elemente in technischen Zeichnungen automatisch erkennen und in Hinblick auf deren fertigungstechnische Relevanz evaluieren zu können.