MUM von Google
MUM folgt BERT
Google hat den Nachfolger von BERT vorgestellt. MUM steht für Multitask Unified Model und soll deutlich besser darin werden, die Suchintention des Users zu verstehen, und ihm die dazu passenden Informationen zur Verfügung zu stellen.
Das von Google angeführte Beispiel bezieht sich auf folgende Situation: „Ich bin am Mt.Adams in den USA gewandert und möchte nun nächsten Herbst den Mt.Fuji in Japan besteigen. Was sollte ich bei der Vorbereitung anders machen?“. Um die nötigen Antworten zu bekommen müsste der User eine Vielzahl an Einzelsuchen durchführen: Vergleich der Wetterverhältnisse an beiden Bergen, Schwierigkeit der Wanderwege, empfohlene Kleidung, Vergleiche verschiedener Kleidungsanbieter, Suche danach in den diversen Shops etc…
Im Idealfall soll MUM die Frage so umfangreich verstehen können, dass gleich alle relevanten Informationen ausgespielt werden: Es würde erkannt werden, dass zwei Berge verglichen werden sollen, d.h. es müssten alle Daten (Höhe, Routen, Wetter, durchschnittliche Temperatur) zusammengestellt werden. MUM würde verstehen, welche Kleidung bzw. Ausrüstung notwendig wäre, könnte gleich diverse Anbieter miteinander vergleichen und gleich zu passenden Shop-Angeboten leiten. MUM würde auch erkennen, dass Mt.Fuji steiler ist, und man im Vergleich zu Mt.Adams mehr Ausdauer braucht. Dazu passend würden Anleitungen (z.B. Videos) mit passenden Fitnessübungen ausgegeben.
Wie will Google das schaffen?
Erreicht werden soll das mit dem Einsatz einer neuen Künstlichen Intelligenz (KI). Sie basiert wie bereits BERT auf der sogenannten Transformer-Architektur, soll aber 1000-mal leistungsstärkere sein, und die Fragen in 75 Sprachen verstehen. Zudem soll es multimodal sein, d.h. es soll Informationen aus unterschiedlichen Formaten wie Bild, Video und Audio einbeziehen können. So könnte man z.B. ein Bild mit einer Jacke hochladen und fragen „Gibt es noch andere Kleidungsstücke in diesem Muster?“. Daraufhin würde MUM aus geschriebener oder gesprochener Frage + Bildinhalt entsprechende Antworten generieren.
Die Vorteile auf einen Blick
- Der User bekommt Antworten auf komplexe Fragen ohne mehrere Einzelfragen stellen zu müssen.
- MUM versteht die Einzelaspekte der Frage und kann eine Antwort auf Experten-Level ausgeben.
- Für die Antworten werden Informationen aus verschiedenen Sprachen herangezogen und in der gewünschten Sprache ausgegeben.
- Die Suche wird multimodal, d.h. Frage und Antwort sind unabhängig von Text, Bild und Video-Formaten.
Klingt nach Zukunftsmusik
Das Projekt ist noch in einer frühen Entwicklungsphase, doch Google hat schon bei bisherigen Updates gezeigt, dass man mit aller Macht daran arbeitet, das Spiel von Frage/Antwort zu perfektionieren. Denn letztlich liegt Googles Erfolg einzig und allein darin, das Informationsbedürfnis der Nutzer zu befriedigen. Solange man darin schneller und besser ist als die Konkurrenz, bleibt man auch Herr über das damit verbundene Werbegeschäft.