FAQ

Auf dieser Seite finden Sie Antworten auf einige häufig gestellte Fragen zum Leistungsangebot des SDSC-BW.
Falls Sie noch weitere Fragen haben, kontaktieren Sie uns gerne.

Wissenswertes für Anbieter

Ja, der Service des SDSC-BW ist grundsätzlich kostenlos. Die Durchführung einer Potenzialanalyse ist allerdings nur für kleine und mittelständische Unternehmen aus Baden-Württemberg aufgrund der Förderung durch das Wissenschaftsministerium des Landes kostenfrei. Große und nicht-BW Unternehmen können aber gegen Kostenerstattung teilnehmen.

Idealerweise gibt es eine Fragestellung von Ihrem Kunden, für deren Lösung Sie die Expertise des SDSC-BW mit einbinden möchten. Dann wird ein entsprechender Datennutzungsvertrag zwischen den drei Parteien geschlossen. Die Analysen werden dann gemeinsam von Ihnen und den Experten des SDSC-BW durchgeführt mit dem Ziel, dass Sie anschließend in der Lage sind den Kunden weiter zu betreuen und ähnliche Fragestellungen künftig eigenständig bearbeiten können.

Melden Sie sich einfach bei uns über das Kontaktformular.

Auch hier melden Sie sich einfach über das Kontaktformular. Je nach Intensität der Beziehung und der gemeinsamen Projekterfahrung können Sie dann als Bronze-, Silber- oder Goldpartner gelistet werden.

Nein, einfachen Zugriff bekommen Sie nicht. Aber wir unterstützen Sie gerne bei der Antragstellung für Fördermittel, die in die Themenbereiche des SDSC-BW passen. Nehmen Sie einfach Kontakt zu uns auf. Idealerweise haben Sie bereits eine Idee, die gefördert werden soll; dann können wir ihre Förderbarkeit prüfen, ein geeignetes Förderprogramm suchen und Sie bei der Antragstellung unterstützen.

Wissenswertes für Forscher

Wir teilen gerne unserer Erfahrungen mit Ihnen und helfen Ihnen dabei, unsere Methodik auf Ihre Umgebung zu übertragen. Außerdem können Sie über unser Netzwerk ebenso geeignete Partner für Forschung oder auch als Dienstleister für Ihre Unternehmen finden.

Direkt können wir Sie nicht fördern, aber wir arbeiten gerne mit anderen Forschern (und auch Unternehmen) bei der Beantragung von Fördermitteln zusammen. Mit dem richtigen Konsortium steigen auch die Chancen für einen Erfolg.

Das SDSC-BW stellt selbst keine Rechenkapazität zur Verfügung, aber das KIT verfügt, auch im Rahmen des Smart Data Innovation Labs, über Ressourcen, die Sie als Hochschule gegebenenfalls auch nutzen können.

Unsere Plattform steht selbstverständlich auch anderen Hochschulen aus Baden-Württemberg offen, um ihre Angebote, beispielsweise aus der Weiterbildung, zu vermarkten. Wir sehen uns nicht als Konkurrenz, sondern vielmehr als Partner, um das weite Feld der Data Analytics gemeinsam besser abdecken und so ein besseres Angebot für die KMU machen zu können.

Wissenswertes für Anwender

Allgemeines zur Datenanalyse

Unter einer Datenanalyse versteht man den Prozess der Bereinigung, Veränderung und Verarbeitung von Rohdaten und der Extraktion von verwertbaren, relevanten Informationen, die Unternehmen helfen, fundierte Entscheidungen zu treffen. Der Datenanalyseprozess unterstützt dabei, die mit der Entscheidungsfindung verbundenen Risiken zu reduzieren, indem wertvolle Erkenntnisse und Statistiken geliefert werden, die in Diagrammen, Bildern, Tabellen und oder anderweitigen Grafiken dargestellt werden.

Die wesentlichen Schritte einer Datenanalyse lassen sich in 6 Abschnitte unterteilen. Durch die Sammlung von Datenanforderungen wird erfasst, zu welchem Zweck sowie um welche Art Datenanalyse es sich handelt. In der folgenden Datenerfassung auf Basis der Anforderungen werden Daten aus identifizierten Quellen gesammelt und organisiert. Die organisierten Daten müssen bereinigt bzw. aufbereitet werden, da Rohdaten z.B. mit fehlenden Werten und oder Formatierungsfehlern vorhanden sind. Nun findet unter Anwendung von Datenanalysesoftware die eigentliche Auswertung auf Basis gewählter Modelle statt. Nach Erhalt der Ergebnisse werden diese interpretiert und Handlungsoptionen entwickelt. Unter Zuhilfenahme des Visualisierungsmodulen werden Grafiken genutzt, um wertvolle Erkenntnisse zu gewinnen durch Darstellung von z.B. Vergleichen und Beziehungen.

Die Datenmengen und Zusammensetzungen hängen sehr stark von der zugrundeliegenden Fragestellung ab. Wichtig ist, stets für den Zweck erhobene Daten zu verwenden, weil sich nur Informationen finden lassen, wenn sie auch in den Daten enthalten sind. Darauf aufbauend muss auf Redundanz verzichtet werden, da dadurch keine neuen Erkenntnisse entstehen. Des Weiteren sollte Wert auf saubere Daten gelegt werden, da diese keine störenden Überraschungen beinhalten und dementsprechend die Werte der Feldbeschreibungen sinnvoll definiert sind. Und die Bezüge zwischen den Daten sollten klar erkennbar sein, um einen Zusammenhang zu Eingangs- und Zielvariablen herzustellen.

Die quantitative Menge an Daten ist weniger relevant für eine erfolgreiche Datenanalyse. Viel wichtiger ist, wie oft das zu untersuchende Ereignis in den zugrundeliegenden Daten vorhanden ist. Dementsprechend wird an der Stelle auch von einer effektiven Datenmenge gesprochen. Die effektive Datenmange lässt sich aus einer geeigneten Fragestellung ableiten. Die Fragestellung sollte messbar, klar und prägnant sein und so entwickelt werden, dass sie potenzielle Lösungen für ein spezifisches Problem entweder qualifiziert oder disqualifiziert.

Für die Datenanalyse von kleinen Datenmengen ist es von großer Bedeutung wie „klein“ einzuordnen ist. Unter der Voraussetzung, dass es sich um eine effektive Datenmenge handelt, und dementsprechend eine hohe Datenqualität vorliegt, können die Daten in Einzelfällen für ein Proof of Concept ausreichen, jedoch nicht für den Produktionseinsatz. Im Allgemeinen erfordern kleine Datensätze Modelle mit geringer Komplexität, um eine Überanpassung des Modells an die Daten zu vermeiden. Erschwerend kommt hinzu, dass z.B. Texte, Bilder und Videos in der Regel mehr Daten benötigen und eine aussagekräftige Datenanalyse aufwendiger wird.

Der Unterschied zwischen einer statistischen Analyse und einer Datenanalyse besteht darin, dass bei Ersterer statistische Methoden auf eine Datenstichprobe angewendet werden, um ein Verständnis für die Gesamtpopulation zu erhalten. Bei der Datenanalyse hingegen besteht der Prozess aus der Inspektion, Bereinigung, Umwandlung und Modellierung verfügbarer Daten in nützliche Informationen. Damit die Informationen auch von nicht-technischen Personen verstanden werden, agiert der Datenanalyst als Intermediär.

Sie dürfen auch selbst Datenanalysen durchführen. Hierzu benötigen Sie in der Regel Programmierkenntnisse, Zeit und ein geeignetes Werkzeug. Es gibt eine Reihe gängiger Datenanalysewerkzeuge, die Ihnen helfen Ihre Daten zu interpretieren, zu verstehen und Schlussfolgerungen zu ziehen. Zu den genannten Werkzeugen gehören unter anderem Microsoft Excel, Python, R, Looker, Rapid Miner, Chartio, Metabase, Redash und Microsoft Power BI.

Während traditionelle Business Intelligence regelbasierte Programme verwendet, um statische Analyseberichte aus Daten zu erstellen, nutzen Datenanalysen KI-Techniken wie Machine Learning – maschinelles Lernen (ML). Maschinelles Lernen ist in seiner grundlegendsten Form die Praxis der Verwendung von Algorithmen, um Daten zu analysieren, daraus zu lernen und dann eine Vorhersage über unternehmensspezifische Fragestellungen zu treffen. Anstatt von Hand Software-Routinen mit einem bestimmten Satz von Anweisungen zu programmieren, um eine bestimmte Aufgabe zu erfüllen, wird die Maschine mit Datenmengen und Algorithmen “trainiert”, um ihr die Fähigkeit geben, die Fragestellung zu lösen.

Abhängig von der Technologie und den Geschäftszielen kann aus einem Repertoire von Datenanalysetechniken gewählt werden.

  • Bei der Textanalyse (Data Mining) werden Datenbanken und Data-Mining-Tools genutzt, um Muster in großen Datensätzen zu finden.
  • Im Rahmen der deskriptiven Analyse werden entweder vollständige Daten oder auf eine Stichprobe zusammengefasste numerische Daten genutzt, um Erkenntnisse wie den Mittelwert und die Standardabweichung abzuleiten.
  • Daneben werden mittels der inferentiellen Analyse aus einer Stichprobe vollständiger Daten unterschiedliche Schlussfolgerungen gewonnen, indem unterschiedliche Stichproben aus demselben Datensatz nutzbar sind.
  • Die prädiktive Analyse geht auf der Grundlage früherer Daten davon aus, was in der Zukunft passieren wird, bevor es eintritt. Sie liefert eine vernünftige Antwort auf die Frage “Was wird höchstwahrscheinlich passieren?” Die Genauigkeit dieser Vorhersage hängt von der Qualität der vergangenen und aktuellen Daten bzw. Eingaben ab.
  • Die preskriptive Analyse nutzt alle vorherigen Analysemodelle, um die beste Aktion zur Lösung eines aktuellen Problems zu definieren, wie z.B. die Ermittlung des Wettbewerbsvorteils.

SDSC-BW spezifische Fragenstellungen

Dann melden Sie sich bei uns, telefonisch oder über unser Kontaktformular. Wir werden dann in einem Erstgespräch schauen, ob diese Daten für eine Potenzialanalyse geeignet sind und dann in einer zweiten Runde mit den Experten vom KIT und den Fachleuten aus Ihrem Hause herausfinden, ob es sich lohnt eine Potenzialanalyse durchzuführen.

Wenn Sie davon überzeugt sind, melden Sie sich und fragen nach unserer Potenzialanalyse.

Diese Frage werden wir spätestens in der zweiten Runde mit den Experten des KIT beantworten. Und wenn sich das Format einfach importieren oder konvertieren lässt, ist eine wichtige Hürde zur Potenzialanalyse bereits genommen.

Der Potenzialanalyseprozess des SDSC-BW ist in drei Abschnitte unterteilt. Während der Vorphase findet ein Kennenlernen statt im Rahmen eines Erstgesprächs. Darin werden Anforderungen und Ziele der Datenanalyse dargelegt und Vertragsangelegenheiten besprochen. Die Hauptphase beginnt, sobald die Daten an die Datenspezialisten des KIT übermittelt wurden und die Analysearbeit beginnen kann. Nach einer erfolgreichen Analyse wird die Abschlussphase eingeleitet mit einer Ergebnispräsentation sowie der Darbietung von weiteren Handlungsempfehlungen.

In der Datenanalysephase ist der Kontakt mit Ihnen fester Bestandteil. Es gibt zwei offizielle Präsentationstermine, beginnend mit der Zwischenpräsentation, aus der die gewählte Methodik mit den erwarteten Ergebnissen hervorgeht. Bei der Abschlusspräsentation bekommen sie detaillierten Einblick in den gesamten Analyseprozess nebst erhaltenen Erkenntnissen. Zusätzlich können Sie sich jederzeit über den Stand der Analyse informieren.

Ja, Ihre Daten sind beim SDSC-BW sicher. Dafür wird ein Datennutzungsvertrag vor einer Datenanalyse von allen beteiligten Parteien unterzeichnet. Die Daten liegen auf einem sicheren Server des KIT und werden nach einer Potenzialanalyse ordnungsgemäß, auf Basis des definierten Zeitrahmens im Datennutzungsvertrag, gelöscht.

Die Ergebnisse der Potenzialanalyse erhalten Sie in Form einer Powerpoint Präsentation (Abschlusspräsenation) mit gezieltem Einblick in den Datenaufbereitungs- und Analyseprozess. Des Weiteren erhalten Sie die eigens erstellte Jupyter-Notebooks der Datenspezialisten des KIT.

Für den Fall, dass ihr KMU in Baden-Württemberg ansässig ist und unter die KMU-Definition fällt, so ist die Potenzialanalyse für Sie kostenfrei auf Basis einer Förderung des Ministeriums für Wissenschaft, Forschung und Kunst. Sollte Ihr Unternehmen größer sein, melden Sie sich bitte bei uns für ein Angebot.

Wir bieten ein maßgeschneidertes Schulungsangebot über das SDSC-BW an, indem fundiertes Wissen für die die Datenaufbereitung und Durchführung einer Datenanalyse gelehrt wird. Daneben erhalten sie die finalen Jupyter Notebooks der Datenspezialisten des KIT mit Kommentaren, die Gedankengänge und Methodik offenlegen.

r den Fall, dass während der Datenanalyse gehobenes Potenzial aufgedeckt wurde, gibt es die Möglichkeit gemeinsame Förderanträge mit den SDSC-BW Akteuren und oder Partnern zu entwickeln sowie einzureichen.