Wat zijn Embeddings?

Hoe AI betekenis omzet in getallen — en waarom dat alles verandert

Niveau Kern
Engels Embeddings
Categorie Representatie, fundamentele techniek
Status Stabiel begrip, brede toepassing

Snel Antwoord

Embeddings zijn de manier waarop AI-systemen betekenis omzetten in getallen. Een woord, zin, document, afbeelding of geluid wordt vertaald naar een vector — een rij van honderden tot duizenden getallen — waarin gerelateerde concepten dicht bij elkaar liggen. “Koning” en “koningin” staan dichter bij elkaar dan “koning” en “fiets.” Dit klinkt abstract, maar het is de techniek achter vrijwel alles wat moderne AI doet: zoekmachines die op betekenis zoeken (niet alleen op woorden), aanbevelingssystemen die “vergelijkbaar” begrijpen, RAG-systemen die relevante context ophalen, en de interne werking van elk taalmodel. Wie embeddings begrijpt, begrijpt waarom moderne AI zo goed wordt in begrijpen — en waar de grenzen liggen.

01In één alinea

Een computer kan niet rechtstreeks met “betekenis” werken — alleen met getallen. De vraag was decennia: hoe vertaal je betekenis op een manier die zinvolle berekeningen mogelijk maakt? Eerste pogingen werkten met sleutelwoorden: het woord “koning” werd gewoon code 4271, “koningin” werd 8856. Computers konden zo woorden tellen, maar niet zien dat 4271 en 8856 iets met elkaar te maken hebben. Embeddings veranderden dit. In plaats van willekeurige codes krijgt elk woord een lange rij getallen waarvan de waarden iets zeggen over de betekenis. “Koning” en “koningin” krijgen vergelijkbare getallenreeksen omdat ze in vergelijkbare contexten voorkomen. Daardoor kan een AI nu wiskundig “weten” dat ze gerelateerd zijn — zonder dat iemand dit ooit handmatig heeft opgeschreven. Het is een verrassend krachtige techniek die zo fundamenteel is dat ze in vrijwel alle moderne AI verborgen zit.

02Voor de strateeg

Voor wie strategisch over AI denkt zijn embeddings geen technisch detail maar een capability die strategische beslissingen verandert. Drie dimensies waarin het verschil maakt.

Semantisch zoeken als nieuwe standaard Klassieke zoekmachines vinden documenten die jouw zoekwoorden bevatten. Embedding-gebaseerde zoekmachines vinden documenten die over hetzelfde gáán — ook als ze andere woorden gebruiken. Een zoekopdracht “auto verzekering opzeggen” vindt zo ook documenten over “polisbeëindiging voertuig.” Voor klantenondersteuning, kennismanagement en interne zoeksystemen verandert dit verwachting fundamenteel — gebruikers moeten niet meer raden welke woorden hun antwoord bevat.
RAG werkt dankzij embeddings De groeiende populariteit van RAG (Retrieval-Augmented Generation) — waarmee een AI antwoorden geeft op basis van jouw eigen documenten — leunt volledig op embeddings. Je documenten worden geconverteerd naar embeddings, opgeslagen in een vector database, en bij elke vraag wordt de meest semantisch relevante passage opgehaald. Voor strategische beslissingen relevant: zonder embeddings geen RAG, en zonder RAG werkt zakelijke AI op eigen data nauwelijks. Het AI-Groeimodel behandelt dit als kerncompetentie kennisinfrastructuur.
Crossmodaal als nieuwe horizon Moderne embeddings werken niet alleen voor tekst, maar ook voor beeld, audio en zelfs gestructureerde data — vaak in dezelfde vector-ruimte. Dit betekent dat je een afbeelding kunt zoeken met een tekstuele beschrijving, of geluiden met een tekst kunt vergelijken. Voor organisaties met diverse content (foto’s, video’s, documenten, audio) opent dit nieuwe mogelijkheden voor uniforme zoek- en classificatiesystemen. Wie hier strategisch op anticipeert, ligt voor.

03Technisch diep

Een embedding is wiskundig gezien een vector — een rij getallen — in een hoogdimensionale ruimte. Voor moderne taalmodellen heeft elke embedding typisch tussen de 768 en 12.000 dimensies. Dit klinkt onvoorstelbaar, maar elke dimensie correspondeert met een gemeten “kenmerk” dat het model heeft geleerd uit zijn trainingsdata.

Wat staat er in een embedding? Niemand heeft handmatig bepaald wat elke dimensie betekent. Het model heeft tijdens training zelf ontdekt welke kenmerken nuttig zijn om te coderen. Onderzoek heeft aangetoond dat sommige dimensies herkenbare betekenissen hebben — een dimensie kan correleren met “mannelijkheid versus vrouwelijkheid,” een andere met “abstract versus concreet,” een derde met “positief versus negatief sentiment.” Maar de meeste dimensies zijn niet menselijk-interpreteerbaar — ze zijn statistische patronen die voor het model nuttig zijn, ook al kan geen mens zeggen wat ze “betekenen.”

Het beroemde “King – Man + Woman = Queen”-experiment. Een van de eerste demonstraties van wat embeddings kunnen, kwam in 2013 met Word2Vec. Onderzoekers ontdekten dat je met embedding-vectoren kunt rekenen: neem de embedding van “King,” trek de embedding van “Man” af, en tel de embedding van “Woman” op — het resultaat ligt extreem dicht bij de embedding van “Queen.” Hetzelfde werkt voor “Paris – France + Italy = Rome.” Dit toonde dat embeddings semantische relaties wiskundig representeren — een ontdekking die het hele AI-veld veranderde.

De evolutie van embeddings:

Word2Vec en GloVe (2013-2014). De eerste praktische tekstembeddings. Eenvoudig idee: woorden die in vergelijkbare contexten voorkomen, krijgen vergelijkbare vectoren. Werkte verrassend goed maar had één beperking: elk woord kreeg één vaste embedding, ongeacht context. “Bank” als financiële instelling kreeg dezelfde vector als “bank” als zitmeubel.

Contextual embeddings via BERT (2018). De doorbraak: embeddings die afhangen van context. Hetzelfde woord krijgt verschillende vectoren in verschillende zinnen. “Ik ga naar de bank” en “Ik zit op de bank” produceren nu twee verschillende embeddings voor “bank.” Dit verbeterde de kwaliteit van semantisch begrip drastisch.

Sentence en document embeddings. In plaats van één woord per keer, hele zinnen of documenten omzetten naar één embedding. Dit maakt het mogelijk om documenten te vergelijken, semantisch te zoeken en te clusteren op betekenis.

Multimodale embeddings. Sinds 2021 (CLIP en opvolgers) kunnen tekst en beeld in dezelfde vectorruimte worden ingebed. Een foto van een kat en de tekst “een kat” krijgen vergelijkbare embeddings — wat tekst-naar-beeld zoeken en omgekeerd mogelijk maakt.

Hoe werken embeddings in moderne systemen? In een typische zakelijke RAG-toepassing zien embeddings er zo uit:

Indexering. Alle documenten van de organisatie worden door een embedding-model geleid. Elk document (of stuk van een document, “chunk”) krijgt een vector. Deze vectoren worden opgeslagen in een vector database — een speciaal soort database die snel kan zoeken op vector-gelijkenis.

Bevraging. Wanneer iemand een vraag stelt, wordt die vraag ook door het embedding-model geleid. Dat geeft een vector. Het systeem zoekt vervolgens in de vector database naar de documenten waarvan de vector het dichtst bij de vraag-vector ligt.

Generatie. De gevonden documenten worden meegegeven aan een taalmodel als context, zodat het een onderbouwd antwoord kan formuleren. Het hele proces vindt plaats in milliseconden.

Cosine similarity — de meetlat. De gangbaarste manier om embedding-gelijkenis te meten is cosine similarity: de hoek tussen twee vectoren. Vectoren die in dezelfde richting wijzen (kleine hoek) zijn semantisch vergelijkbaar; vectoren die haaks op elkaar staan zijn ongerelateerd. Deze wiskundige eenvoud maakt embedding-zoeken extreem snel — zelfs met miljarden vectoren.

De fundamentele beperkingen. Embeddings zijn machtig maar niet magisch. Ze kunnen:

Bias overdragen. Wanneer trainingsdata vooroordelen bevat, worden die in de embeddings gecodeerd. Onderzoek heeft aangetoond dat bijvoorbeeld beroepen-embeddings genderbias kunnen reflecteren.

Falen op nuance. Voor zeer specialistische domeinen kunnen algemene embeddings tekortschieten. Specifieke domein-embeddings (medisch, juridisch, technisch) presteren dan beter.

Verouderen. Embedding-modellen zijn getraind op data uit een bepaalde periode. Nieuwe terminologie, recente gebeurtenissen of culturele verschuivingen worden niet automatisch meegenomen.

04In de praktijk

Voorbeeld — Interne kennisbank voor een Nederlandse adviesorganisatie

Een Nederlands adviesbureau met 200 consultants heeft over de jaren 15.000 rapporten, voorstellen en analyses geproduceerd. Het probleem: niemand kan vinden wat collega’s eerder hebben geschreven. Trefwoord-zoeken werkt nauwelijks omdat elke consultant zijn eigen terminologie gebruikt. De oplossing maakt fundamenteel gebruik van embeddings:

Wat embeddings hier toevoegen Een consultant zoekt “concurrentieanalyse retail” en vindt ook documenten over “marktpositionering detailhandel,” “competitive intelligence consumentengoederen” en “branchescan winkels.” De zoeker hoeft niet meer de exacte terminologie van de auteur te kennen — het systeem begrijpt dat deze concepten over hetzelfde gaan.
Wat de organisatie blijft doen Documenten classificeren op vertrouwelijkheid, toegangsrechten beheren (klant-vertrouwelijke informatie blijft afgeschermd), kwaliteitsbeoordeling van resultaten, beslissen welke informatie wel of niet relevant is voor de huidige opdracht.

De technische implementatie is gangbaar in 2026: een embedding-model van OpenAI of Cohere via API, een vector database (Pinecone, Weaviate of een lokale Qdrant), en een eenvoudige zoekinterface. Totale ontwikkelkosten voor een dergelijke kennisbank: enkele tienduizenden euro’s. De waarde voor de organisatie: enorm — productiviteitswinst per consultant van meerdere uren per week.

Praktische lessen voor wie embeddings inzet:

Kies het juiste embedding-model. Algemene modellen (OpenAI’s text-embedding-3, Cohere’s embed-multilingual) werken goed voor brede toepassingen. Voor specialistische domeinen — juridisch, medisch, financieel — overweeg een domein-specifiek of fine-tuned model.

Chunk-grootte is kritisch. Hoe knip je een document op voor embedding? Te kort en je verliest context; te lang en de embedding wordt diffuus. Voor de meeste teksten werken chunks van 200-500 woorden goed, met overlap tussen chunks om verlies van context te voorkomen.

Hybride zoeken vaak het beste. Combineer embedding-zoek met klassieke trefwoord-zoek. Embedding vangt semantiek; trefwoord vangt exacte termen (productnamen, codes). Beide samen geeft de meest robuuste zoekervaring.

Hertraining of vervanging. Wanneer je domein wezenlijk verandert, of nieuwe embedding-modellen significant beter worden, moet je de hele corpus opnieuw embedden. Plan voor periodieke vervanging — niet alle informatie blijft eindig relevant.

05Verwarring vermijden

  • Niet hetzelfde als databank. Een embedding is geen opslag van het origineel — je kunt geen tekst terugkrijgen uit een embedding. Het is een betekenisrepresentatie, geen compressie. Originele documenten moet je apart opslaan.
  • Niet hetzelfde als woord-tellen. Klassieke tekstanalyse telt woorden of frequenties. Embeddings zijn iets fundamenteel anders — ze representeren betekenis. Twee teksten met totaal verschillende woorden kunnen vergelijkbare embeddings hebben.
  • Niet hetzelfde als tokenization. Tokenization splitst tekst in stukjes (tokens) voor het model. Embedding zet die tokens om in betekenisvolle vectoren. Twee verschillende stappen in dezelfde pipeline.
  • Niet automatisch betrouwbaar. Embedding-gelijkenis betekent niet automatisch werkelijke relevantie. Twee documenten kunnen hoge cosine similarity hebben terwijl ze functioneel niet hetzelfde zijn. Verificatie blijft nodig.
  • Niet één-op-één met menselijk begrip. Embeddings benaderen menselijk semantisch begrip, maar zijn niet identiek. Soms maken ze associaties die voor mensen vreemd zijn — culturele context of gespecialiseerde kennis kunnen ontbreken.

06Plek in het AIWiser-ecosysteem

Waar dit begrip terugkomt op de rest van de site:

AI-Strategie · Kennisinfrastructuur

Investering in embedding-gebaseerde kennissystemen is een centrale strategische beslissing voor moderne organisaties.

Naar de strategie →

AI-Groeimodel · Datakwaliteit

Effectieve embeddings vereisen kwalitatieve, goed gestructureerde data — een aparte kerncompetentie binnen het Groeimodel.

Naar het Groeimodel →

AI-Rollen · ML-engineer

De rol die embedding-pipelines ontwerpt en in productie brengt binnen organisaties.

Bekijk de rol →

AI Top 100 · Vector databases

Pinecone, Weaviate, Qdrant en andere platforms die embedding-gebaseerde zoek mogelijk maken.

Naar de tools →

Verwante begrippen

Termen die direct met embeddings verbonden zijn:

Bronnen

Wetenschappelijke en gezaghebbende bronnen die bij deze definitie geraadpleegd zijn. De volledige onderbouwing en context staat in AI-Publicaties.

Scroll naar boven