Monatspass

Wie Machine Learning Suchlösungen im Unternehmen produktiver macht

Daniel Wrigley, Spezialist für Search und Analytics. Foto: SHI.

Daniel Wrigley ist seit 2012 als Search & Analytics Consultant bei SHI tätig. Dort beschäftigt er sich meist mit Search- und Big-Data-Anwendungen unter Verwendung moderner Open-Source-Technologien wie Solr, NiFi, Spark, Kafka oder Zeppelin. Seine jahrelange Erfahrung als Solr-Trainer hat er als Co-Autor des ersten deutschsprachigen Buch zu Solr verarbeitet (Foto: SHI).

Künstliche Intelligenz (KI) und Machine Learning (ML) werden auch in der Medienbranche intensiv diskutiert. Doch wie schaffen es Verlage, tatsächlichen Nutzen aus ihnen zu ziehen? Enterprise Search, also die Suche in unternehmensinternen Datenbeständen, ist ein Feld, in dem maschinelles Lernen wirksam die Produktivität heben kann, und damit ein denkbarer erster Ansatzpunkt für KI-Projekte. Denn: Das zu Daten geronnene Wissen eines Unternehmens ist nichts wert, wenn niemand es auffinden und nutzen kann.

Suchexperte und Buchautor Daniel Wrigley vom Search- und Big-Data-Spezialisten SHI gibt im IT-Channel von buchreport.de einen Überblick über Möglichkeiten und Grenzen der Technologie.

 

Warum lohnt es sich, in die Optimierung von Enterprise Search Lösungen zu investieren? Dies ist allein damit zu begründen, dass die Zeit, die während der Arbeit mit dem Suchen von Informationen verbracht wird, stetig steigt. Diesen Prozess so effektiv wie möglich zu gestalten, muss im Interesse jeden Unternehmens liegen, um trotz wachsender Datenmengen schnell und effizient zum Ziel zu kommen.

Ganz generell kann Machine Learning immer dann unterstützen, wenn komplexe Abfrageprobleme auf großen Datenmengen gelöst werden sollen. Enterprise-Search-Systeme müssen in zusehends größeren Datenbeständen die richtigen Inhalte finden. Um dies zu erleichtern, ist eine Anreicherung der abgelegten Dokumente mit zusätzlichen Daten sinnvoll. Dabei gibt es zahlreiche Möglichkeiten der Anreicherung. Beispiele sind:

  • Klassifikation von Dokumenten: Handelt es sich beim jeweiligen Dokument um eine Rechnung, eine Bestellung oder um ein Meeting-Protokoll? Für den Suchenden kann dies eine zentrale Information sein, anhand derer er das Dokument schnell und zielgerichtet finden kann.
  • Erkennung von Entitäten: Welche Orte, Personen, Organisationen etc. kommen in einem Dokument vor? Bei Organisationen oder Personen kann es in bestimmten Fällen (zum Beispiel bei einer Rechnung) von Bedeutung sein, ob das Dokument von dieser Entität kam oder an diese Entität ging.
  • Synonym-Erkennung: Dokumente mit Begriffen anzureichern, die gleichbedeutend sind oder eine ähnliche Bedeutung haben, kann einen wesentlichen Beitrag dazu leisten, ob ein Dokument später überhaupt gefunden wird. Diese Erweiterung des Bedeutungsspektrums kann auch Abkürzungen oder Akronyme umfassen. Denn wer sucht schon gerne nach einem komplexen Fachbegriff, wenn es dafür auch eine bequeme Abkürzung gibt?

Diese Anreicherungen sind theoretisch Tätigkeiten, die auch von einem Menschen durchgeführt werden können. Aber wie lange bräuchte ein Mensch, um eine Million Dokumente zu klassifizieren? Oder alle Entitäten aus einer derartigen Menge an Inhalten zu extrahieren? Hier helfen Modelle des Machine Learning, die solche Aufgaben übernehmen können, während der Suchindex noch erstellt wird. Und für die Machine-Learning-Modelle spielt es keine Rolle, ob diese Tätigkeiten für ein paar Dutzend oder für ein paar Millionen Datensätze durchgeführt werden müssen.

IT-Grundlagen und Technologien der Zukunft

Mehr zum Thema IT und Digitalisierung lesen Sie im IT-Channel von buchreport und den Channel-Partnern knk und Rhenus.
Hier mehr…

Doch nicht nur die Indexierungsseite einer Enterprise-Search-Lösung kann von Machine Learning profitieren, sondern auch die Suchseite:

  • Learning to Rank: Regelbasiert das optimale Ranking einzustellen, sodass für jede Suchanfrage die relevantesten Ergebnisse an erster Stelle erscheinen, ist eine aufwendige und knifflige Aufgabe. In solchen Fällen können Machine-Learning-Modelle helfen.
  • Personalisierung & Recommendations: Was im E-Commerce seit Jahren funktioniert, kann auch auf Enterprise Search übertragen werden, denn die Historie eines Nutzers kann dabei helfen, zukünftig relevante Dokumente anzubieten (Recommendations) oder bestimmte Merkmale des Nutzers in eine Suchanfrage einzubeziehen, um die Trefferliste individuell relevanter zu gestalten (Personalisierung).
  • Query Intent Classification: Wer versteht, was der User mit seiner Suchanfrage bezwecken will, kann ihm vermutlich die am besten an den Bedarf angepassten Inhalte anbieten. Machine Learning kann helfen zu verstehen, welche Absicht ein User mit seiner Suchanfrage verfolgt.
  • Chatbots: Mit Chatbots lassen sich bestimmte Suchanfragen in einen Dialog überführen, was die Hürde beim Zugang zu den Informationen herabsetzt und das Browsen oder Navigieren zu den gewünschten Informationen beschleunigen kann.

Gerade Learning to Rank, Personalisierung, Recommendations und Query Intent Classification basieren auf den Daten, die die Nutzer durch die Interaktion mit Suchapplikationen hinterlassen. Machine Learning und KI können diese Daten verwenden, um das Fundament der genannten Features aufzubauen. Dies gilt, nebenbei bemerkt, nicht nur für Enterprise-Search-Lösungen, sondern für Suchapplikationen jeglicher Art.

Natürlich sind KI und Machine Learning nicht der „Generalschlüssel“, der allein alle Probleme löst oder eine Enterprise-Search-Anwendung auf ein neues Produktivitätslevel hebt. Und auch nicht jede Suchanwendung mag für alle Features tatsächlich qualifiziert sein. Aber auf dem dargestellten Fundament können Sie klein starten und erste Erkenntnisse darüber gewinnen, wie die Suchanwendung verwendet wird und wo weiteres Verbesserungspotenzial steckt. Die beschriebene Struktur können Sie anschließend immer weiter ausbauen, um Machine Learning in Ihre Enterprise-Search-Lösung zu integrieren und dadurch die Effizienz der Plattform zu steigern, damit weniger Zeit für die Informationssuche verschwendet wird.

Kommentare

Kommentar hinterlassen zu "Wie Machine Learning Suchlösungen im Unternehmen produktiver macht"

Hinterlassen Sie einen Kommentar

Mit dem Abschicken des Kommentars erklären Sie sich damit einverstanden, dass Ihre Daten elektronisch gespeichert werden. Diese Einverständniserklärung können Sie jederzeit gegenüber der Harenberg Kommunikation Verlags- und Medien-GmbH & Co. KG widerrufen. Weitere Informationen finden Sie in unseren Datenschutz-Richtlinien

E-Mail Adresse wird nicht veröffentlicht.


*

Webinar-Mediathek

Geballtes Fachwissen

Auf pubiz.de finden Fach- und Führungskräfte aus der Buch- und Medienbranche passgenau auf Ihre Bedürfnisse zugeschnittene Live-Webinare, Video-Kurse, Praxisbeiträge, Interviews und Anleitungen.

Themen-Kanäle

SPIEGEL-Bestseller

Hardcover Belletristik
1
Houellebecq, Michel
DuMont
2
Hansen, Dörte
Penguin
3
Neuhaus, Nele
Ullstein
4
Fitzek, Sebastian
Droemer
5
Galbraith, Robert
Blanvalet
14.01.2019
Komplette Bestsellerliste Weitere Bestsellerlisten

Veranstaltungen

  1. 23. Januar - 24. Januar

    Jahrestagung der IG Belletristik und Sachbuch

  2. 24. Januar - 25. Januar

    future!publish

  3. 24. Januar - 26. Januar

    Antiquaria

  4. 24. Januar - 25. Januar

    libri booklab

  5. 25. Januar - 29. Januar

    christmasworld