Wenn jemand sagt „unsere Suche nutzt Embeddings", meint er folgendes: Begriffe werden in Zahlen verwandelt, sodass ähnliche Bedeutungen nahe beieinander liegen. Klingt abstrakt? Ist es nicht. In 5 Minuten erklärt, ohne Mathe.
Das klassische Problem
Stellen Sie sich vor, ein Kunde sucht „V2A" und Ihre Suche soll Produkte mit „A2-Edelstahl" finden. Das sind zwei völlig unterschiedliche Wörter. Eine klassische Suche, die Wörter vergleicht, hat keine Chance: für sie sind „V2A" und „A2-Edelstahl" so verschieden wie „Banane" und „Schraubendreher".
Manuelle Synonym-Listen helfen, aber Sie müssten jede mögliche Variante pflegen: „V2A", „1.4301", „rostfrei", „nicht-rostend", „austenitisch", „inox". Für 280.000 Produkte mit 50 Werkstoff-Klassen wird das unmenschlich.
Die Idee hinter Embeddings
Statt Wörter zu vergleichen, wandelt eine KI jedes Wort in eine Koordinate in einem hochdimensionalen Raum um. Sie können sich das wie eine Landkarte vorstellen, nur mit viel mehr Dimensionen als zwei.
Diese Landkarte ist so gebaut, dass ähnliche Bedeutungen nahe beieinander liegen:
- „V2A", „A2-Edelstahl", „1.4301", drei Punkte fast übereinander
- „Hutmutter", „Mutter mit Kappe", ebenfalls dicht beieinander
- „Banane" und „Schraubendreher", weit voneinander entfernt
Wenn jemand „V2A" sucht, schaut die Suche nicht nach dem Wort, sondern nach allen Produkten, deren Koordinate in der Nähe liegt. So findet sie „A2-Edelstahl", auch wenn das Wort „V2A" dort nirgends steht.
Wo die Magie wirklich passiert
Die Embeddings werden nicht von Hand gebaut. Eine KI lernt sie aus großen Textmengen: Produktbeschreibungen, Datenblätter, Foren, Wikipedia. Sie sieht: „V2A" und „A2-Edelstahl" kommen oft im gleichen Kontext vor („rostfrei", „lebensmittelecht", „Schrauben"). Also bekommen sie ähnliche Koordinaten.
Bei Eywora kommt dazu, dass die Embeddings branchen-spezifisch nachtrainiert werden. „M12" hat in einem Werkzeug-Shop eine andere Bedeutung als in einem Fahrzeugteile-Shop. Wir trainieren auf Ihrem Sortiment mit, damit Ihre Bedeutungen ankommen.
Was Embeddings nicht können
Drei Punkte, die ehrlich gehören:
- Sie sind keine Wundermaschine. Wenn Sie ein Produkt nicht im Sortiment haben, findet auch eine semantische Suche nichts.
- Sie ersetzen nicht alle klassischen Techniken. Tippfehler-Toleranz, SKU-Exact-Match und Filter-Logik laufen weiterhin klassisch, und werden durch Embeddings ergänzt, nicht ersetzt.
- Sie brauchen Daten. Bei sehr kleinen Sortimenten (<5.000 Artikel) ist der Trainingsaufwand höher als der Nutzen.
Wie es im Hintergrund konkret läuft
Vereinfacht in drei Schritten:
- Indexierung: Jedes Ihrer Produkte (Titel, Beschreibung, Attribute) wird einmalig in einen Embedding-Vektor umgewandelt und gespeichert.
- Suche: Wenn jemand sucht, wird auch die Eingabe in einen Vektor verwandelt, in Echtzeit, unter 47 ms.
- Ähnlichkeit: Das System sucht im Index nach den Produkten, deren Vektoren am nächsten zur Suchanfrage liegen. Das sind die Top-Treffer.
Die ganze Magie steckt in Schritt 1 (gute Embeddings trainieren) und Schritt 3 (schnell und korrekt Nachbarn finden). Das Werkzeug dafür sind unter anderem Vector Databases.
Wofür Sie das wissen sollten
Sie müssen Embeddings nicht selbst implementieren. Aber wenn Sie als Shop-Betreibender Such-KI evaluieren, schadet es nicht, das Konzept zu verstehen:
- Wenn ein Anbieter „semantische Suche" sagt, meint er fast immer Embeddings.
- Wenn die Demo „V2A findet A2-Edelstahl" zeigt: das ist das Embedding-Versprechen in Aktion.
- Wenn die Demo „die Suche lernt aus Klicks" zeigt: das ist die Kombination aus Embeddings + Re-Ranking.
Mehr zur konkreten Wirkung im Eywora-Search-Modul finden Sie auf der Search-Detail-Seite.