Was sind Embeddings? (Definition)
Embeddings sind mathematische Darstellungen von Informationen. Sie ermöglichen es KI-Systemen, Bedeutung und Zusammenhänge zu verstehen. Ein Embedding übersetzt z. B. Texte in Zahlenwerte, damit künstliche Intelligenz Inhalte nicht nur „liest“, sondern auch semantisch „versteht“.
Large Language Models und generative Suchsysteme wie ChatGPT nutzen Embeddings, um Bedeutungen und thematische Zusammenhänge zwischen Begriffen zu erfassen, statt Wörter nur isoliert zu betrachten.
Folgende Eingaben (Prompts) in einem Suchsystem liegen zum Beispiel nah beieinander:
- beste Pizza in der Stadt XY
- beste Pasta in der Stadt XY
- bestes italienisches Restaurant in der Stadt XY
Obwohl unterschiedliche Wörter verwendet werden, erkennt die KI mithilfe von Embeddings, dass diese Suchanfragen eine ähnliche Bedeutung haben. Die Inhalte liegen also im „semantischen Raum“ nah beieinander.
Wie funktionieren Embeddings?
Ein KI-Modell wandelt Wörter, Sätze oder ganze Dokumente in Zahlenreihen, sogenannte Vektoren, um. Diese Zahlen beschreiben die Bedeutung des Inhalts mathematisch. Da ähnliche Inhalte ähnliche Vektoren erhalten, können sie von KI-Systemen miteinander verglichen werden.


