Du interessierst Dich für das Thema semantische Suche bzw. semantische Suchmaschinen. Dann bist Du in unserem Glossar für Fachbegriffe aus dem (Online-) Marketing genau richtig. In diesem Beitrag bekommst Du alle wichtigen Informationen zum Thema semantische Suche.

 

Was ist eine semantische Suchmaschine? Was ist semantische Suche?

Eine semantische Suchmaschine berücksichtigt den Kontext einer Suchanfrage, um die Bedeutung des Suchterms besser zu verstehen. Im Gegensatz zu rein Keyword basierten Such-Systemen soll in der semantischen Suche die Bedeutung bzw. Suchintention der Suchanfrage und von die Bedeutung von Dokumenten besser interpretiert werden. Während Keyword basierte Suchmaschinen auf Grundlage eines Keyword-Text-Abgleich funktionieren, berücksichtigen semantische Suchmaschinen auch die Beziehungen zwischen Entitäten für die Ausgabe von Suchergebnissen.

Welche semantischen Suchmaschinen gibt es?

Es gibt eine Reihe semantischer Suchmaschinen, die allerdings relativ einfach funktionieren bzw. nur einen kleine Datenbestand verfügen.

Google ist die Suchmaschine mit dem größten semantischen Datenbestand in Form des Knowledge Graph und dem Knowledge Vault.

Wie funktioniert Google als semantische Suche?

Entitäten sind die zentrale Organisationseinheit innerhalb des Knowledge Graph. Grundsätzlich kann zwischen „Named Entities“ (zu Deutsch: benannten Entitäten) und Konzepten unterschieden werden. Benannte Entitäten sind Objekte aus der echten Welt, wie beispielsweise Personen, Orte, Organisationen, Produkte, Events etc.

Konzepte sind abstrakte Entitäten physikalischer, psychologischer oder sozialer Natur, wie etwa Entfernung, Quantität, Emotionen, Menschenrechte, Friede etc. Mehr zum Thema „Entitäten“ findet ihr im Glossar von Aufgesang und im Beitrag „Alles was Du zu Entitäts-Typen, -Klassen & Attributen wissen solltest“.

Als Grundlage für den Knowledge Graph dienen drei Ebenen:

  • Entitäten-Katalog: Hier werden alle Entitäten gespeichert, die mit der Zeit identifiziert worden sind.
  • Knowledge Repository: Die Entitäten werden in einem Wissensdepot (Knowledge Repository) mit den Informationen bzw. Attributen aus verschiedenen Quellen zusammengeführt. Im Knowledge Repository geht es in erster Linie um die Zusammenführung und Speicherung von Beschreibungen und die Bildung semantischer Klassen bzw. Gruppen in Form von Entitätstypen. Die Daten generiert Google über den Knowledge Vault. Über den Knowledge Vault ist es Google möglich, Data Mining aus unstrukturierten Quellen zu betreiben.
  • Knowledge Graph: Im Knowledge Graph werden die Entitäten mit Attributen verknüpft und Beziehungen zwischen Entitäten hergestellt.

Für die Identifikation von Entitäten und der dazugehörigen Informationen kann Google auf verschiedene Quellen zurückgreifen.

Übersicht: Datenquellen für den Google Knowledge Graph

Mehr zum Thema „Erfassung von Informationen aus strukturierten Daten und Data Mining aus unstrukturierten Daten“ in den Beiträgen „Wie verarbeitet Google Informationen aus der Wikipedia für den Knowledge Graph?“ und „Wie kann Google aus unstrukturierten Inhalten Entitäten identifizieren und deuten?“.

Nicht alle im Knowledge Repository erfassten Entitäten werden in den Knowledge Graph übernommen. Folgende Kriterien könnten über die Aufnahmen in den Knowledge Graph entscheiden:

Generelle Kriterien:

  • Nachhaltige gesellschaftliche Relevanz
  • Genügend Suchtreffer für die Entität im Google-Index
  • Anhaltende öffentliche Wahrnehmung
  • Einträge in einem anerkannten Lexikon oder einer anerkannten Enzyklopädie bzw. in einem fachspezifischen Nachschlagewerk

Die Google-Suche basiert heute auf einem Query-Processor für die Interpretation von Suchanfragen und der Zusammenstellung von Korpussen aus für die Suchanfrage relevanten Dokumenten. Hier kommt BERT und Rankbrain zum Einsatz.

Dabei greift Google auf den klassischen Such-Index, als auch auf die eigene semantische Datenbank in Form des Knowledge Graph zurück. Es ist wahrscheinlich, dass es zwischen diesen beiden Datenbanken ein Austausch über eine Schnittstelle stattfindet.

Eine Scoring Engine aus verschiedenen Algorithmen basierend auf dem Kern-Algorithmus von Hummingbird ist für das Scoring also die Bewertung der Dokumente zuständig und bringt diese dann anhand des Scorings in eine Reihenfolge.

Über eine Cleaning Engine werden diese Suchergebnisse dann von Duplikaten befreit und etwaige Abstrafungen berücksichtigt.

Übersicht: Funktionsweise der semantischen Suche bei Google

So kann Google die Bedeutung von Suchtermen identifizieren, ohne dass die eigentlichen Begriffe im Suchterm vorkommen. Die Suchanfrage nach „sängerin blank space“ ergibt folgendes Suchergebnis:

Knowledge Card für Taylor Swift

Diese Interpretation der Suchanfrage und Ausgabe der Informationen kann nur funktionieren, wenn die verschiedenen Entitäten aus dem Song Blank Space, der Personen-Entität Taylor Swift in Beziehung zueinander gesetzt werden können, was im Knowledge Graph von Google passiert.

Beziehungen im Google Knowledge Graph

 

 

Die Geschichte von Google als semantische Suchmaschine

Die ersten konkreten Schritte in Richtung einer semantischen Suchmaschine unternahm Google im Jahr 2010 mit dem Kauf des Betreibers der Wissensdatenbank Freebase Metaweb. Freebase war eine semantische Datenbank, die das Wissen der Welt in geordneter und strukturierter Form erfassen sollte.

Freebase bildete die Grundlage für den 2012 vorgestellten Google Knowledge Graph. Bei der Einführung des Knowledge Graph umfasste dieser über 500 Millionen Einträge zu Entitäten wie Personen, Organisationen, Orten, Bauwerken und andere Dingen. Beim Kauf von Freebase im Jahr 2010 beinhaltete die Datenbank nur ca. 12 Millionen Einträge.

Durch die Einführung von Hummingbird im Jahr 2013 wurde die Basis des Ranking-Algorithmus auf eine semantische Funktionsweise umgestellt. Die Einführung von Hummingbird war der eigentliche Startschuss der semantischen Suche, da nun auch das Information Retrieval auf eine semantische Grundlage gestellt wurde. Google selbst hat dieses Algorithmus-Update als das bedeutendste seit dem Caffeine-Update im Jahr 2010 bezeichnet.

 

Im Jahr 2014 stellte Google den Knowledge Vault vor. Ein System zur Identifikation und Extraktion von Tail-Entitäten, um den Ausbau des „Long Tail of Knowledge“ voranzutreiben. Über den Knowledge Vault ist es Google möglich, Data Mining aus unstrukturierten Quellen zu betreiben.

Weitere große Updates und Einführungen in den Folge-Jahren wie Rankbrain, BERT und Passage Ranking hatten einen Bezug zu Entitäten und damit der Weiterentwicklung von Google als semantische Suchmaschine.

 

Weitere Quellen zur semantischen Suche

 

Zu Olaf Kopp

Olaf Kopp ist Co-Founder, Chief Business Development Officer (CBDO) und Head of SEO der Aufgesang GmbH . Im Fokus seiner Untersuchungen, Ideen und Arbeiten stehen die Themen digitaler Markenaufbau, Online- und Content-Marketing-Strategien entlang der Customer-Journey und semantische Suchmaschinenoptimierung. Von 2012 bis 2015 war er Geschäftsführer. Als begeisterter Suchmaschinen- und Content-Marketer schreibt er für diverse Fachmagazine, u.a. t3n, Website Boosting, suchradar, Hubspot ... und war als Gastautor in diverse Buch-Veröffentlichungen involviert. Sein Blog zählt laut diversen Fachmedien und Branchenstimmen zu den besten Online-Marketing-Blogs in Deutschland. Zudem engagiert sich Olaf Kopp als Speaker für SEO und Content Marketing in Bildungseinrichtungen sowie Konferenzen wie z.B. der Hochschule Hannover, SMX, CMCx, OMT, OMX, Campixx… Er ist Mitveranstalter des SEAcamps und Moderator des Podcasts Content-Kompass auf termfrequenz. Olaf schloss 2006 sein BWL-Studium mit Schwerpunkt Marketing und E-Business als Diplom Kaufmann (FH) ab und beschäftigt sich seit 2005 mit Marketing und digitaler Kommunikation.
herausgegeben von: Olaf Kopp
Datum: 15. April 2021

Blog-Artikel zu diesem Thema

SEO-Aufgaben: Was macht ein(e) SEO-Manager(in)?

Suchmaschinenoptimierung hat sich in den letzten Jahren deutlich verändert. Dadurch auch die Arbeit für SEO-Manager und SEO-Verantwortliche. In diesem Beitrag möchte ich eine Übersicht über die wichtigsten Aufgaben eines(einer) SEO-Managers/in bei der taktischen und strategischen Suchmaschineno... Artikel anzeigen

Google achtet jetzt auf innere Werte

2013 hat Google sich zum 15. Geburtstag ein ganz besonderes Geschenk gemacht. Die Suchmaschine hat einen Vogel, einen Kolibri, um genau zu sein und der wirbelt den Tiergarten nicht nur farblich auf. Es handelt sich dabei nämlich nicht um ein Anti-Spam-Update á la Panda oder Pinguin, mit dem die S... Artikel anzeigen