„Zusammen mit Experten des SDSC-BW untersuchten wir verschiedene Lösungen zur Textklassifizierung, einem wichtigen Kernbereich unserer Geschäftstätigkeit. Die Analyse führte zu mehreren signifikanten Ergebnissen und aufschlussreichen Forschungsfragen.“
Sebastian Richter, Co-Founder

Wissen besser vernetzen

Wie Smart Data KI-Technologie-Scouting unterstützen kann.

Der Kunde

Coral Innovation, ein junges Start-Up der Universität Stuttgart, hat es sich zur Aufgabe gemacht, Innovation zu fördern, indem es Technologien, die einen größeren Bekanntheitsgrad verdienen, verständlich darstellt und inhaltlich vernetzt. Ziel des Unternehmens ist es, die Vielzahl der bestehenden innovativen Technologien kleinen und mittleren Unternehmen (KMU) einfach zugänglich zu machen.
www.coral-innovation.de

Die Daten

Im Zuge des Projekts sammelte und verarbeitete Coral Innovation offene Daten über deutsche technische Dokumente aus verschiedenen Bereichen wie beispielsweise Technologie, Landwirtschaft, Mechanik oder Chemie. Die daraufhin vorliegenden reinen Datensätze beinhalteten Beschreibungen und entsprechende Technologie-Zuordnungen von 1,5 Mio. Dokumenten. Dieser riesige Textkörper enthielt mehr als 4 Mio. Eindeutigkeitswörter unterschiedlicher Häufigkeit. Nach der Entfernung selten auftretender Wörter blieben mehr als 300.000 Eindeutigkeitswörter übrig. Die mehr als 8.000 Technologie-Zuordnungen teilten die Experten in verschiedene Ebenen ein.

Die Herausforderung

Einen Technologie- Empfehlungsdienst für verschiedene Unternehmen aufzubauen ist komplex: Es sind intelligente Algorithmen erforderlich, um gute Übereinstimmungen zwischen Technologien zu finden. Die Ergebnisse können dabei nur indirekt durch das Feedback der Nutzer festgestellt werden, während der Dienst online ist. Dies erschwert die Trainingsphase, in der das Fehlen von Referenzdaten die Evaluation der Lernalgorithmen spürbar einschränkt. Die Hauptaufgabe des SDSC-BW war es, bei der Prüfung verschiedener Methoden zu helfen, um den bestehenden Ansatz noch besser zu implementieren und darüber hinaus andere Ansätze zu diskutieren.

Die Potentialanalyse

In einer kostenfreien Potentialanalyse berücksichtigten die Experten des SDSC-BW die von Coral Innovation bereitgestellten reinen Daten als Input für mehr als 8.000 binäre Text-Klassifizierungsfragestellungen. Die Initialanalyse konzentrierte sich dabei auf verschiedene Klassifizierungsmethoden und unterschiedliche Techniken, um die Dimensionen des Merkmalsraums zu verringern. Die Analyse wurde vom Ministerium für Wissenschaft, Forschung und Kunst Baden Württemberg finanziert.

Das Resultat

Mithilfe der SDIL-Plattform, einer leistungsstarken In-Memory-Computing-Infrastruktur des Smart Data Innovation Labs (SDIL), fanden die Experten des SDSC-BW einen Algorithmus, der die Klassifikationsergebnisse von Coral Innovation in den meisten Fällen weiter verbessert. In Bezug auf die Techniken der Dimensionsreduktion wendeten sie verschiedene Methoden an und zeigten deren Potenzial zur Optimierung der Klassifikationswerte auf. Die verbesserten Bewertungen lieferten die Informationen für den Technologie-Empfehler von Coral Innovation.

Wie es weiter geht

Neben den Ergebnissen der Potentialanalyse rückte ein weiteres Themenfeld in den Fokus: Die Implementierung einer neuronalen Active-Learning-Netzwerkarchitektur für das Empfehlungssystem von Coral Innovation, die die Fähigkeit besitzt, ihre Gewicht- ungen auf Basis von Benutzer-Feedback selbständig zu aktualisieren.Dazu müssen verschiedene Methoden zur Messung des Benutzer-Feedbacks und unterschiedliche Verlustfunktionen untersucht werden. Coral Innovation und das SDSC-BW planen hierfür zeitnah ein weiteres gemeinsames Projekt.