Lesedauer ca. 5 Minuten

Der Begriff Datenqualität klingt zunächst einmal weitläufig – viele können sich darunter alles und nichts vorstellen. Irrelevant ist die Thematik dennoch nicht, da sich schlecht gepflegte Stammdaten und Dubletten sehr geschäftsschädigend auswirken können. Schon früh hat das Unternehmen Omikron Data Quality GmbH dem Datenchaos den Kampf angesagt. Doch welche Technologie steckt dahinter? Um mehr zu erfahren, statteten wir Omikron einen Besuch direkt im Hauptfirmensitz in Pforzheim ab.

Think global – act local

Die Firmengeschichte Omikrons beginnt in den 1980er Jahren: Zu einer Zeit, in der sich Nutzer über 16 Farben und wenige Kilobyte Arbeitsspeicher freuten. Noch vor seinem Abitur gründete Carsten Kraus mit einem Freund das Unternehmen. 1988 lizensierte Atari die von Omikron entwickelte Sprache „Omikron-Basic“ und packte sie in alle Atari Rechner aus dieser Zeit. Um Datenqualität ging es bei Omikron spätestens seit 1993: In diesem Jahr wurde Omikrons erste Software zum Auffinden und Eliminieren von Dubletten entwickelt. Seitdem geht es bei dem Pforzheimer Unternehmen mit schnellen Schritten voran. So ist Omikron mit seinen Bereichen Data Quality, FACT-Finder und FACT-Finder Travel in 26 Ländern im Einsatz und in 9 Ländern mit Büros vertreten. Der Hauptsitz mit über 100 Mitarbeitern aber ist und bleibt Pforzheim. Für sein großes Engagement als Unternehmer ehrte die Stadt Pforzheim im Jahr 2013 den Gründer deshalb mit dem ersten Wirtschaftspreis für „Innovation und Idee“.

Auch das Thema Ausbildung hat für Omikron einen hohen Stellenwert, so absolvieren dort derzeit 8 Nachwuchsfachkräfte ihre Ausbildung. Die Qualität kann sich sehen lassen: Bereits zum 2. Mal stellte Omikron 2016 den landesbesten Fachinformatiker. Dabei sind für Carsten Kraus die Schulnoten der Azubis nicht ausschlaggebend. Intelligenz und Leidenschaft für den Job sind das, was für den Geschäftsführer zählt.

Über 60 Auszubildende arbeiten derzeit bei Omikron (Bild: techtag)

Selbst wenn sich Carsten Kraus auf seinem Twitter-Account @CarstenKraus als „pan-european“ bezeichnet, hat Baden-Württemberg für ihn sehr viel Aufbruchsstimmung und eine Kultur des Erfindens, was sich nicht zuletzt an den zahlreichen Patentanmeldungen aus Baden-Württemberg zeigt: Ganze 14374 waren es im letzten Jahr. Auch Omikron hat daran seinen Anteil.

…was ist denn nun Datenqualität?

Die Antwort Carsten Kraus‘ klingt sichtlich simpel: Datenqualität ist, „wenn die Daten gut für den Zweck verwendet werden können, für den sie verwendet werden sollen.“ Was jedoch früher einfach war, als es noch Karteikarten gab und wenige Menschen Zugriff auf Kundendaten hatten, wird durch die zunehmende Automatisierung erschwert. Digitale Daten müssen strukturierter sein, da sie nicht von Menschen, sondern von Maschinen interpretiert werden. Während ein Mensch unter „Geschäftsführer“, „Geschäftsführerin“ und „Geschwäftsführer“ dieselbe Positionsbezeichnung versteht, kann der Computer eine solche Zuweisung nicht leisten.

Auch im E-Commerce spielt die Auffindbarkeit eine entscheidende Rolle. Ein einfaches Beispiel: Werden Farbnuancen wie Bordeauxrot nicht der Grundfarbe Rot zugeordnet, könnten Kunden manche Artikel im Onlineshop nicht angezeigt bekommen. Die Anforderungen an die Datenqualität sind also ständig im Wandel und ebenso arbeiten die Mitarbeiter von Omikron daran, stets mit der Zeit zu gehen. Eine der erfolgreichsten Entwicklungen für den E-Commerce Bereich ist hierbei FACT-Finder: Ein Tool, welches auf einem mathematisch-linguistischen Ähnlichkeitsverfahren basiert und sowohl Rechtschreibfehler bei der Suchanfrage erkennt, als auch Features wie standortabhängige Ergebnisse und Zubehör von Produkten. FACT-Finder wird inzwischen von 43 der größten 100 Onlineshops als zentrale Suche eingesetzt und ist damit klarer Marktführer.

Semantische Suche – oder einfach mal verstanden werden

Unsere Gerätenutzung ändert sich. Der Einkauf per Smartphone-App wird beliebter, auch die Sprachsuche wird häufiger genutzt.  Suchanfragen werden zunehmend in einen Kontext gesetzt und die OnSite-Suche muss intelligent sein, semantisch werden. „Der Grundunterschied bei einer semantischen Suche ist, dass man versucht, Fragen zu verstehen und auf diese Fragen zu antworten, statt Keywords zu finden“, so Carsten Kraus. Dass dieses Verstehen für Computer erst erlernt werden muss, veranschaulicht der Omikron-Gründer mit einem einfachen Beispiel: Wenn eine Person in den Urlaub fliegt, dann wissen wir Menschen intuitiv, dass beispielsweise die Haare der Person als fester Bestandteil der Person „mitreisen“, die Wohnung allerdings an Ort und Stelle bleibt. Computer wissen auch das nicht und müssen es erlernen.

Speziell für die Onlinebuchung von Reisen wurde vor einigen Jahren ein solches Verfahren mit FACT-Finder Travel entwickelt. Wenn eine Person beispielsweise noch kein konkretes Reiseziel hatte und in der Feldsuche eingibt: „Mit meiner kleinen Tochter über Weihnachten eine Woche lang an den Strand“, kann eine semantische Suche weiterhelfen. „Eine Keyword-Suche würde in so einem Fall nicht funktionieren, da beispielsweise der Begriff ‚über Weihnachten‘ nicht in der Hotelbeschreibung drin ist, ebensowenig ‚mit meiner Tochter‘ oder ‚eine Woche lang‘, man muss also den Kontext verstehen“, so Kraus.

Darüber hinaus fand Carsten Kraus in A/B-Tests heraus, dass die Buchung auf Reiseportalen bis zu 3 Mal schneller als über die konventionelle Suchmaske verläuft. Allerdings fand er im Feldversuch mit weg.de auch heraus, dass lediglich 2% der User eine freie Suchanfrage nutzten. Das wird allerdings in Zukunft kommen, da ist sich Carsten Kraus sicher. Er arbeitet derzeit mit seinem Entwicklern und Kunden zusammen, um die neue FACT-Finder-Generation mit integrierter Semantik voranzubringen – nicht nur in der Reisebranche.

Was da wohl noch auf uns zu kommt?

Intelligente Datenverwaltung und Algorithmen, die Beziehungen zwischen Worten, Sätzen und Texten verstehen – das alles und viel mehr ist definitiv die Zukunft. Vor allem der E-Commerce wird davon profitieren können, da sich die Rechenzeit verkürzt und durch die Vorschlagsfunktion Besucher leichter zu Kunden gemacht werden können. Mit Experimentierfreude und seiner großen Erfahrung im Bereich Datenqualität und Semantik wird Omikron auch sicherlich noch die eine oder andere neue Technologie auf den Markt bringen. Wir dürfen gespannt sein.