Was ist eine Entität ? Was sind Entitäten ?
5 (100%) 5 votes
Eine Entität ist ein Begriff aus der Philosophie, Semantik und Informatik. Eine Entität beschreibt das Wesen bzw. die Identität eines konkreten oder abstrakten Gegenstand des Seins. Entitäten sind eindeutig identifizierbar und damit einzigartig.

Aufbau und Eigenschaften von Entitäten

Um Entitäten zu verstehen, wird ihnen ein Uniform Resource Identifier (URI) zugewiesen. Das kann eine URL sein oder eine willkürliche Zahlenreihe, wie man sie von Wikidata kennt. (Wikidata dient übrigens als eine Ressource für Google’s Wissen) Dort ist der Sänger Prince unter /m/01/wycq bekannt. Der Grund warum eine Zahlenreihe mehr Sinn macht, als zum Beispiel ein Name ist die mögliche Mehrdeutigkeit von Worten. Wer nach Prince sucht, meint unter Umständen gar nicht den Sänger, sondern den Prince of Wales (/m/0xnc3) oder das Konzept des Nobelmannes (/m/0dl76).

Grundbausteine der semantischen Suche

Quelle: Semantic Search, David Amerland

Das Wort „Uniform“ oder „Universal“ wie Tim Berners-Lee es am Anfang nannte ist dabei extrem wichtig. Man muss sich also darauf einigen, dass alle denselben Ausdruck benutzen. Wir kennen dieses Konzept aus unserer Sprache. Irgendwann hat sich irgendwer darauf geeinigt, dass eine Platte mit Füssen, auf der man Dinge abstellen kann als „Tisch“ bezeichnet wird. Dass es sich dabei nicht um eine intrinsische Wahrheit handelt sieht man daran, dass es im englischen „Table“ und im spanischen „Mesa“ heißt.

 

Der (die oder das?!) URI ist also die Basis für eine Entität und bedeutet erst mal nichts. Deswegen kommen die nächsten beiden Ebenen ins Spiel und zwar in Form von einem Resource Description Framework (RDF) und einer Ontologie. Wikipedia beschreibt das so: „Im RDF-Modell besteht jede Aussage aus den drei Einheiten Subjekt, Prädikat und Objekt, wobei eine Ressource als Subjekt mit einer anderen Ressource als Prädikat näher beschrieben wird.”

 

SubjektPrädikatObjekt
Princeist einSänger
SängerproduzierenAlbum
Albumist einTonträger

 

Diese Dinge sind für uns als Menschen intuitiv verständlich, wir lernen das im Laufe unseres Lebens, aber einer Maschine müssen diese Zusammenhänge erst erklärt werden, sie weiß zum Beispiel nicht, dass Michael Jackson tot bleibt, auch wenn seine Lieder weiterleben und er (bzw. seine Kinder) nach wie vor Geld damit verdienen und somit in aktuellen Forbes Listen auftaucht. Ein RDF ist also nur eine Auszeichnungssprache, so etwas wie schema.org, ein Raster, mit dem Daten strukturiert werden. Allerdings reicht das noch nicht ganz, um die Bedeutung zu verstehen. Auch wenn die Maschine weiß, dass /m/01/wycq Prince heißt und ein Sänger ist, so muss sie auch noch verstehen, was ein Sänger ist und was der macht. Dafür gibt es Ontologien und das wird ziemlich philosophisch, denn das gehört zum Bereich der Metaphysik.

Entitäten lassen sich über eine eindeutige ID und die Kombination bestimmter Eigenschaften eindeutig identifizieren. Somit können Benennungen mit mehreren Bedeutungen wie z.B. „Jaguar“ (Mit Jaguar kann ein Tier, Panzer, Auto … gemeint sein) eindeutig hinsichtlich Bedeutung identifiziert werden. Entitäten können Personen, Unternehmen, sachliche und abstrakte Dinge, Bauwerke … sein.

Aufbau einer Entität

Aufbau einer Entität

In einem wissenschaftlichen Projekt, an dem auch ein Google-Mitarbeiter beteiligt war, wird eine Entität gleich gesetzt mit einem Wikipedia-Beitrag.

An entity (or concepttopic) is a Wikipedia article which is uniquely identified by its page-ID.”

Wikipedia-Beiträge spielen bei vielen Knowledge Graph Boxen eine übergeordnete Rolle als Quelle der Informationen und werden von Google neben den Wikidata-Einträgen als Proof für die Relevanz einer Entität genutzt. Ohne Eintrag bei Wikipedia oder Wikidata keine Entitäten-Box.

Welche zentrale Rolle die Wikipedia bei der Identifikation von Entitäten und deren thematischen Kontext spielen kann, zeigt das wissenschaftliche Papier Using Encyclopedic Knowledge for Named Entity Disambiguation.

Beziehungen zwischen Entitäten könnte Google u.a. über Annotationen bzw. Verlinkungen innerhalb der Wikipedia herstellen.

An annotation is the linking of a mention to an entity.  tag is the annotation of a text with an entity which captures a topic (explicitly mentioned) in the input text.”

Was sind Entitäts-Typen ?

Ein Entitäts-Typ beschreibt eine Klasse oder Gruppe von Entitäten, die über ähnliche Attribute beschrieben werden können.

Die Entität „Krieg der Sterne“ vom Entitätstyp „Film“ und verbunden mit der Entität George Lucas über die Beziehung „Produzent“ und „Harrison Ford“ mit  dem Entitätstyp „Schauspieler“.  Der Produzent George Lucas lässt sich eindeutig über die Beziehung zu anderen Entitäten wie  Star Wars, Modesto, Marin County, Mellody Hobson … identifizieren.

Bestimmte Entitätstypen haben oft ein ähnliche Zusammenstellung von Attributen und bilden damit eine Klasse. z.B. können dem Entitätstyp „Person“ immer Attribute wie Geburtsort, Wohnort, Geburtsdatum … zugeordnet werden. Dadurch ist der Entitätstyp klar definiert.

Eine klare Abgrenzung zwischen Entitäten und Ontologien ist nicht immer möglich. Genau so wenig kann man nicht immer einen Entitätstyp und Beziehungsbeschreibung klar voneinander trennen. Die einzige klare Bedeutung von Entitäten lässt sich über die Attribute und die Beziehungs zu anderen Entitäten feststellen.

Was ist eine Ontologie ?

Eine Ontologie ist ein Klassifizierungssystem zur Beschreibung von Wirklichkeit und Möglichkeit. Um Wikipedia hier noch mal zu zitieren: „Dabei wird etwa eine Systematik grundlegender Typen von Entitäten (konkrete und abstrakte Gegenstände, Eigenschaften, Sachverhalte, Ereignisse, Prozesse) und ihrer strukturellen Beziehungen diskutiert.” Damit ist die Suchmaschine in der Lage komplexe Beziehungen hinter Informationen zu verstehen und ihnen Bedeutungen zuzuweisen. Gekoppelt mit Inferenzregeln, ist eine Maschine dann in der Lage „eigenständig“ Schlussfolgerungen zu ziehen und Fragen selbst zu beantworten. Das hört sich alles nicht nur crazy an, sondern das ist es auch.

Ontologien und Entitäten

Ontologien stellen in der Semantik ein Umfeld dar, in dem Entitäten in Beziehung zueinander gestellt werden können. Eine bestimmte Branche kann als Ontologie dienen in der verschiedene Marktteilnehmer/Unternehmen als Entität fungieren und in Beziehung zueinander stehen.

Bei der Semantik im Sinne der Linguistik dreht es sich in erster Linie um die Identifikation der Bedeutung von Sprache. Über Entitäten werden Bezüge hergestellt, die in bestimmten Umfeldern (Ontologien) stattfinden. Darüber lassen sich Kontext und Bedeutung von Entitäten identifizieren. Damit lassen sich Entitäten kategorisieren, aber auch bewerten.

 

Ontologien und Entitäten

Ontologien und Entitäten

Warum sind Entitäten so relevant für SEO?

Google hat mit dem Knowledge Graph und dem Hummingbird Update den Ranking-Algorithmus und  Teile des Index auf eine semantische Suche umgestellt. Ein wichtiger Bestandteil spielt dabei der Knowledge Graph als semantische Datenbank. Graphen-Modelle bestehen immer aus sogenannten Knoten und Kanten. Die Knoten sind Entitäten und die Kanten beschrieben die Beziehung zwischen diesen Entitäten. Somit ist Google in der Lage auch Fragen bzw. Suchterme zu beantworten, bei denen der gesuchte Begriff gar nicht vorkommt.

Mehr dazu in meinem Fachartikel bei Searchmetrics Wie interpretiert Google heute Suchanfragen?

 

Was sind Entitäten für Google?

Übertragen in die reale Welt können Entitäten sogenannte Dinge des Seins wie etwa Personen, Unternehmen, Bauwerke, Fahrzeuge oder abstrakte Dinge / Objekte sein.

Mit Blick auf die Suchmaschinenoptimierung ist es wichtig zu verstehen, was Google als Entität begreift. Das ist relativ einfach möglich, indem man sich klar macht, für welche Suchanfragen Google Knowledge-Graph-Cards, ich nenne sie ab hier Entitäten-Box platziert.

Entitäten-Box am Beispiel Donald Trump

Interessant ist, dass Google bei Fragestellungen nach einer unbekannten Entität wie zum Beispiel „Was ist die Hauptstadt von Australien?“ oder impliziten Fragen wie „haupstadt australien“  die Entitäten-Boxen oberhalb der SERPs ausliefert. Bei einer direkten Eingabe der Entitäten-Bezeichnung werden die Boxen rechts neben den SERPs ausgeliefert:

Zudem gibt es noch als Spielart der Entitäten-Boxen das Karussel als Ausgabe-Form für Knowledge-Graph-Daten:

Knowledge Graph Karussel am Beispiel Kinofilme

Neben den Entitäten-Boxen gibt es noch die Wissens-Boxen oder Know-Simple-Boxen, die oberhalb der SERPs platziert sind. Diese werden in erster Linie für Know-Simple Keywords ausgeliefert. Hier ein Beispiel:

Know-Simple-Box am Beispiel Wetter

Diese werden in erster Linie bei Suchanfragen ausgegeben, die Google als Know-Simple –Keywords einstuft. Mehr dazu im Beitrag  Infos zu den Keyword-Arten, Suchintention, Identifikation Nutzerintention. Oder es handelt sich um Themenbereiche:

Wissens-Box am Beispiel des Themas Suchmaschinenmarketing

Themen- / Wissens-Box am Beispiel des Themas Suchmaschinenmarketing

Die oberhalb der SERPs platzierten Wissens-Boxen oder Know-Simple-Boxen sind keine Entitäten-Boxen. Genauso wenig wie alle anderen Knowledge-Graph-Boxen. Daraus lässt sich auch ableiten, was Google nicht als Entität einordnet.

In Bezug auf Entitäten spielen die Entitäten-Boxen die größte Rolle. Sobald Google eine Suchanfrage oder Teil eines Suchterms als Entität erkennt  versucht Google  Informationen für eine Entitäten-Box zu sammeln.

Theoretisch gibt es eine Vielzahl an Entitäts-Arten, doch für den Knowledge Graph und somit SEO sind die folgenden interessant. Google schreibt, dass folgende Entitäten-Arten im Knowledge Graph berücksichtigt werden (Durch Klick auf die jeweilige Entitäts-Art gelangt man zur schema.org Auszeichnung):

Ein Blick auf die Entitätstypen bei schema.org gibt einen kompletten Überblick darüber, was als Entität gilt.

Am häufigsten findet man bei Google aktuell die Entitäten-Boxen für die folgenden Typen:

  • Personen
  • Unternehmen
  • Tiere
  • Bauwerke
  • Städte/Orte
  • Bücher
  • Filme

Bezogen auf Unternehmen und Personen kann man eine Entität auch als Marke verstehen.

Hier einige Beispiele für Entitäten-Boxen:

nike_entitaeten-box

Knowledge Graph Box bzw. Entitäten Box für das Unternehmen/Marke Nike

michael_jordan-entitaeten-box

Knowledge Graph Box bzw. Entitäten Box für die Person/Marke Michael Jordan

Knowledge Graph Box bzw. Entitäten Box Hannover

Knowledge Graph Box bzw. Entitäten Box für die Stadt Hannover

freiheitsstatue_entitaeten-box

Knowledge Graph Box bzw. Entitäten Box für das Bauwerk Freiheitsstatue

Bezogen auf Unternehmen muss man zwischen Brand-Entitäten-Boxen und  lokalen Entitäten-Boxen unterscheiden. Für die Brand-Entitäten-Boxen benötigt man einen Eintrag bei Wikipedia und/oder Wikidata. Damit haben nur  bestimmte Unternehmen die Möglichkeit ein Brand-Entitäten-Box in den SERPs zu bekommen. Die lokalen Entitäten-Boxen beziehen die Informationen in erster Linie aus dem Google MyBusiness-Eintrag und sind somit für jedes Unternehmen möglich. Hier zwei Beispiele:

Brand-Entitäten-Box von Continental

Lokale Entitäten Box für Kopp Online Marketing Consulting

Diese Entitäten-Boxen erscheinen immer rechts von den Anzeigen und/oder Suchergebnissen.

Aus Googles Sicht scheinen keine Entitäten zu sein:

  • Fahrzeuge und Fahrzeugtypen
  • Branchen wie zum Beispiel Automobil-Industrie
  • Themen und Dinge des allgemeinen Gebrauchs wie Content-Marketing, Suchmaschinenmarketing, Zündkerzen, Reifen …
  • URLs bzw. Dokumente
  • Domains

Domains  können Attribute von Entitäten sein und/oder ein digitales Abbild einer Entität, aber keine Entität selbst. Genauso wenig wie Dokumente. Bezogen auf SEO gilt es, die eigene Entität über die Domain ins Internet zu spiegeln und Google diesen Zusammenhang deutlich zu machen. Google muss zuvor allerdings verstanden haben, dass es sich bei dem Namen der Marke/des Unternehmens um eine Entität handelt.

An dem folgenden Beispiel lässt sich der Zusammenhang zwischen Entität und Domain gut darstellen. Die Suchanfrage nach „Olaf Kopp“ ergibt folgendes Bild:

olaf-kopp_entitaet

Knowledge Graph Boxen Kopp Online Marketing Consulting & Olaf Kopp

In diesem Fall hat Google erkannt, dass „Olaf Kopp“, eine Entität ist. Deswegen wird eine eigene Brand-Entitäten-Box als auch eine Local-Entitäten-Box, auch im nicht eingeloggten Zustand angezeigt. Hierzu hat Google die Informationen aus Freebase bzw. Wikidata für Brand-Entitäten-Box und aus Google MyBusiness für die lokale Entitäten-Box.

Hier erkennt man auch, dass Google den Zusammenhang zwischen der Entität „Olaf Kopp“ und der Domain „kopp-online-marketing.de“ bzw. mit der Entität „Kopp Online Marketing Consulting“ herstellt und gibt deswegen bei der Suche nach olaf kopp zusätzlich die Entitäten-Box zu meinem zweiten Unternehmen aus. Diese Daten bezieht Google aus MyBusiness.

Eine Entität scheint in der Google-Welt eng verknüpft mit der Domain als digitales Abbild zu sein.

 

Weiterführende Quellen zum Thema Entität

SEMrush
Verfasst von: Olaf Kopp
Datum: 28. November 2018

Blog-Artikel zu diesem Thema

Artikelreihe: Semantische Suchmaschinenoptimierung (SEO)

Die Einführung der semantischen Suche durch das Hummingbird-Update im Jahre 2013 veränderte grundlegend die Google-Suche und dadurch die Nutzererfahrung bei Google. Hummingbird wird nicht ohne Grund als eins der größten Google Updates der Geschichte gesehen.Die Einführung des Knowledge Gra... Artikel anzeigen

Wie man seine Entität bei Google beanspruchen kann

In diesen Beitrag möchte ich eine Entdeckung mir Dir teilen, die ich bei Google gemacht habe. Google möchte wohl zukünftig, dass man seine eigene Entitäten-Box bzw. Knowledge-Panel bearbeiten beanspruchen und bearbeiten kann.Doch vorher muss man einen Verifizierungsprozess durchlaufen um die... Artikel anzeigen

Suchintention & Nutzerintention von Keywords

Die verschiedenen Keyword-Arten und die Identifikation der Suchintention bzw. Nutzerintention eines Keywords ist der wichtigste Schritte im Rahmen der Keyword-Analyse. Warum? Weil Landingpages bzw. Zielseiten dem Zweck gemäß der Suchintention entsprechen sollten. Nachfolgend einige Erläuterung... Artikel anzeigen

SERPs in den SERPs: Die Entitäten-Box bei Google

 Bei der Suchmaschinenoptimierung dreht sich alles um die Sichtbarkeit in den Suchergebnissen. Und da ist seit einigen Jahren eine Menge los. Panda und Pinguin haben die Spielregeln für das Ranking verändert und der Knowledge-Graph hat uns das Konzept der Entitäten gebracht.Im he... Artikel anzeigen

Leidenschaft: die Grundlage guter Inhalte

Content ist eigentlich nichts anderes als das englische Wort für Inhalte. Im Bereich Online Marketing ist der Begriff seit einigen Jahren inflationär vertreten und das zu Recht. Denn Inhalte transportieren Marken- und Produktbotschaften und sind damit ein wichtiges Bindeglied zur Zielgruppe. Inhal... Artikel anzeigen

Build your Brand mit Storytelling

Eine starke Marke verkauft Produkte wie von selbst. Und Storytelling eignet sich hervorragend zur Verbreitung der Markenbotschaft, weil sie auf emotionaler Ebene verankern kann. Geschichten bleiben uns dann anders in Erinnerung als reine Fakten, denn sie regen Phantasie und Gefühle an. Manche z... Artikel anzeigen

Branking: Notizen zur SEOptimierung des Selbst

Der wahre Preis von Anonymität ist Irrelevanz. Diese vielzitierte Aussage von Eric Schmidt klingt im Schatten von Geheimdienstaffären und Datenspeicherungen wie Hohn. Sie verrät uns aber eine Menge über Google und die Zukunft der Optimierung innerhalb der Suchmaschine.Es geht nicht mehr ... Artikel anzeigen

Effektiver Content-Outreach durch Online-PR

Mit welchen Methoden wir bei Aufgesang Inbound-Marketing-Kampagnen Leben einhauchen: Der biblischen Überlieferung nach begann Adam erst dann zu leben, als Gott ihm seinen Odem in die Nase blies. Nachdem jedes Detail vollendet war, brauchte es noch einen letzten entscheidenden Akt, um die Schö... Artikel anzeigen