5/5 - (3 votes)

Dieser Beitrag beschreibt den Zusammenhang zwischen Entitäten und Expertise, Autorität und Vertrauen bzw. der E-A-T-Bewertung von Autoren, Publishern und Unternehmen.

Autoren, Unternehmen und Publisher als Entitäten

Inhalte werden durch Personen wie Autoren und Organisationen wie Unternehmen, Vereine, Behörden … veröffentlicht. Diese Organisationen und Personen sind benannte Entitäten (mehr dazu im Beitrag Entitäten einfach erklärt). Da wir in der Artikelreihe bis dato gelernt haben, dass Google Inhalte immer mehr rund um Entitäten anordnet bzw. organisiert (siehe z.B. den Beitrag Entitäten-basierte Indexierung kann Google über die jeweilige Entität Rückschlüsse auf die Glaubwürdigkeit und Relevanz des Dokuments bzw. des Inhalts ziehen.

Bei Online-Inhalten sind i.d.R. mindestens zwei Parteien beteiligt.  Der Autor/Produzent, der den Inhalt erstellt hat und der Publisher  bzw. die Domain, auf der der Inhalt veröffentlicht wird. Der Autor ist nicht immer direkt Mitarbeiter oder Inhaber der Domain. Z.B. bei einem Gastartikel sind Publisher und Autor nicht identisch.

Mi Blick auf SEO spielen die Entitäten-Klassen wie Organisationen, Produkte und Personen eine besondere Rolle, da diese über die Eigenschaften einer Marke wie Autorität und Trust bzw. E-A-T bewertet werden können. Dazu im Verlauf dieses Beitrags mehr.

Digitale Abbilder von Entitäten

Entitäten, die zu bestimmten Entitäts-Klassen wie z.B. Personen oder Organisationen zuzuordnen sind können digitale Abbilder wie z.B. die offizielle Website (Domain), Social-Media-Profile, Bilder sowie Wikipedia-Einträge haben. Während Bilder gerade bei Personen oder Sehenswürdigkeiten eher das visuelle Abbild der Entität darstellen, ist die Unternehmens-Website oder das Social-Media-Profil einer Person das inhaltliche Abbild.

Diese digitalen Abbilder sind die zentralen Orientierungspunkte und eng mit der Entität verknüpft.

Diese Verknüpfung kann Google in erster Linie über externe Verlinkungen der Website oder der Profile mit Linktexten, die exakt den Entitätsnamen enthalten und/oder das eindeutige Klickverhalten bei Suchanfragen mit navigationaler bzw. brand oder personenbezogener Suchintention auf die jeweilige URL identifizieren. (Mehr zum Thema Suchintention hier nachlesen)

 

Von der Entität zur digitalen Autorität und Marke

Betrachtet man die Eigenschaften einer Marke spielen Expertise, Autorität und Vertrauen eine zentrale Rolle. Neben den genannten Eigenschaften ist auch Popularität eine wichtige Eigenschaft einer Marke, die bei einer Autorität oder einem Experten jedoch nicht zwangsläufig im Vordergrund steht. Zusammengefasst kann man daher sagen, dass eine Marke auch alle Eigenschaften einer Autorität plus einen hohen Bekanntheitsgrad bzw. Popularität in sich vereint.

Google legt einen großen Wert auf Marken und Autoritäten beim Ranking von Websites.

Bereits im Jahr 2009 rollte Google das als Brand-Update bezeichnete Vince-Update aus, dass bekannte Offline-Marken deutliche Ranking-Vorteile bescherte.(mehr zum Vince-Update)

In diesem Zuge äußerte sich der ehemalige Google-CEO Eric Schmidt wie folgt:

The internet is fast becoming a ‘cesspool’ where false information thrives. Brands are the solution, not the problem. Brands are how you sort out the cesspool… Brand affinity is clearly hard wired. „It is so fundamental to human existence that it’s not going away. It must have a genetic component.

Auch Matt Cutts äußerte sich zu dem Thema:

Marken vereinen Eigenschaften wie Popularität, Autorität und Reputation also Trust. Trust und Autorität sehe ich neben der Dokumenten-Relevanz bezogen auf die Suchintention aktuell als eines der wichtigsten Kriterien, ob Google einen Content auf die erste Suchergebnisseite lässt oder nicht. Google kann es sich nicht erlauben Inhalte aus nicht vertrauenswürdigen Quellen in das Blickfeld des Nutzers zu platzieren, gerade bei YMYL-Themen.

Dadurch sind viele Affiliate-Projekte, die sich bisher nicht um den Aufbau einer Marke gekümmert haben, unter die Räder gekommen. Popularität alleine spielt nur eine bedingte Rolle. Amazon und Ebay sind sehr populäre Marken, Ihnen fehlt aber die Autorität in bestimmten thematischen Bereichen. Deswegen ranken spezialisiertere Shops meistens besser als die großen E-Commerce-Portale.

Mehr dazu im Beitrag E-A-T & thematische Marken-Positionierung als kritischer Erfolgsfaktor in der SEO.

Google kann Beziehungen zwischen Keywords, Themen & Entitäten erkennen

Google kann über Kookkurrenzen aus Entitäten und Keywords erkennen mit welchen Themen Entitäten im Kontext stehen. Je häufiger dieser Kookkurrenzen vorkommen, desto größer ist die Wahrscheinlichkeit, dass ein semantischer Zusammenhang besteht. Diese Kookkurrenzen können über strukturierte und unstrukturierte Informationen aus Website-Inhalten, als auch über Suchterme ermittelt werden. (Mehr dazu auch in den Beiträgen Wie verarbeitet Google Informationen aus der Wikipedia für den Knowledge Graph ?Wie kann Google aus unstrukturierten Inhalten Entitäten identifizieren und deuten ? und Die Rolle von Natural Language Processing für Data Mining, Entitäten & Suchanfragen. )

Wird die Entität   „Empire State Building“ häufig zusammen mit dem Entitätstyp „Wolkenkratzer“genannt liegt eine Verwandschaft bzw. Beziehung vor. So kann Google bereits beim Indexieren von Inhalten oder der Verarbeitung einer Suchanfrage die Beziehung zwischen Entitäten untereinander und Entitätstypen, Themen, Keywords … feststellen. Den Grad der Verwandschaft kann Google über die durchschnittliche Nähe in den Texten und/oder die Häufigkeit der vorkommenden Kookkurrenzen ermitteln.

Entitäten können wie bereits erwähnt zur eindeutigen Identifizierung und zur besseren Einordnung im ontologischen bzw. thematischen Kontext mit Labels bzw. Informationen versehen werden. Wie Google das im Suchmaschinen-Kontext genau macht ist Spekulation. Aber ich möchte nachfolgend einige Möglichkeiten erläutern wie man feststellen kann mit welchen Eigenschaften Google eine Entität verbindet.

Wenn man im Keyword-Planer früher meinen Namen „olaf kopp“ eingegeben hat konnte man sich Keywords bereits in vorgruppierter Form ausgeben lassen. Für Personen, Marken, Unternehmen … scheint das nicht mehr zu funktionieren. Ich konnte den folgenden Screenshot nicht mehr reproduzieren. Es werden nur noch Keywords ausgegeben, die auch den Entitätsnamen enthalten. Aber probiere es lieber selbst einmal aus.

Abfrage Olaf Kopp im Keyword Planer (früher)

Google hat meiner Entität mit „Oberthemen“ wie Werbeagentur, Online Marketing, Agentur, Internet Marketing … in Verbindung gebracht und nach Relevanz sortiert.

Die Ausgabe der Keywords in ungruppierter Form sah so aus.

Abfrage Keyword-Ideen im Keyword Planer für Olaf Kopp (früher)

Ich denke daran erkennt man ganz gut mit welchen Themen und Begriffen Google mich als Entität in Verbindung bringt. Da Google bestimmte Eigenschaften bzw. Begrifflichkeiten einem thematischen Kontext zuordnen kann wird Google die Entität „Olaf Kopp“ in bestimmte Ontologien, Domains bzw. Entitäts-Klassen einordnen.

Ein alternativer Weg ist es im Keyword-Planer über die offizielle Website herauszufinden. Fragt man Keywords über diesen Weg im Keyword-Planer ab bekommt man im Falle der Abfrage nach der Website www.sem-deutschland.de folgende Keywords ausgegeben:

Wie bereits erklärt ist die Website ein digitales Abbild der Entität. Deswegen sind auch diese Informationen interessant, da die nach Relevanz sortierte Keyword-Liste aufzeigt wie nahe die Website semantisch mit Begriffen und damit Themen verknüpft ist. Das Gleiche für die Domain von footlocker.

In Bezug auf Entitäten der Klasse „Personen“ gibt die Nutzung der Vision-API interessante Insights welche Begriffe und Themen Google einer Personen-Entität zuweist. Dabei hängt es aber stark davon ab in welchem Kontext das Bild genutzt wurde. Hier ein Beispiel eines Bilds von mir.

Beispiel-Bildabfrage über die Vision-API von Google

Google erkennt meine Entität bringt mich aber auch mit den Themen Marketing, Internet Marketing, Content Marketing … in Verbindung inkl. einer Gewichtung. Über diese Labels kann Google das Bild, aber auch mich als Entität Kategorien zuordnen und mich in Beziehung zu anderen Entitäten bringen wie z.B. t3n. Google gibt zusammen mit den Labels Auskunft über die URLs auf denen das Bild genutzt wurde.

Meine Vermutung ist, dass sich diese Labels aus den Themen ergeben, in denen dieses Bild genutzt wurde. Bei einem anderen Bild sehen diese Labels und URLs anders aus.

Die Organisationsstruktur rund um eine Entität könnte wie folgt aussehen:

Zum Vergrößern auf die Abbildung klicken

Den Entitäten sind mit Entitäts-Typen belabelt. Daraus ergeben sich Attribute. Ebenso werden der Entität Bilder, die offizielle Website, Profile & Dokumente fortlaufend zugeordnet. Daraus ergeben sich Informationen, die den Kontext bestimmen, in denen die Entität verortet ist. Der Kontext wird durch Themen und dementsprechende Keywords dargestellt.

Wie relevant die Entität im einzelnen tehamtischen Kontext ist ergibt sich aus der E-A-T-Bewertung bzw. der Autorität und dem Trust.

 

Methoden zur Ermittlung von Vertrauenswürdigkeit (Trust) und Autorität

Nachfolgend möchte ich einige Methoden erläutern wie Google die Vertrauenswürdigkeit, Glaubwürdigkeit und Autorität einer Quelle bzw. Entität ermitteln kann.

Sentimentanalysen als Methode zur Trust-Einschätzung

Sentimentanalysen werden genutzt, um die Stimmung eines Satzes oder Textabschnitts zu bewerten. Wie man aus der NLP-API von Google ableiten kann, ist Google in der Lage Sentimentanaylsen durchzuführen. Sentimentanalysen und Entitätsanalysen sind zentrale Teilschritte beim Natural Language Processing. Über diesen Weg kann Google die Stimmung rund um die Nennung von Entitäten also auch Unternehmen und Personen analysieren. Wird die Entität häufig in negativen Kontext genannt scheint sie nicht vertrauenswürdig und umgekehrt. Besonders Reviews und Bewertungen könnten eine interessante Quelle für solche Analysen sein.

Beispiel einer Sentiment-Analyse über die Google NLP-API, Quelle: digitale-wunderwelt.de

Hier ein Auszug aus der der Dokumentation der NLP-API von Google:

Bei der Sentimentanalyse pro Entität wird die Entitätsanalyse mit der Sentimentanalyse kombiniert und es wird versucht, die (positive oder negative) Einstellung zu erkennen, die in den Entitäten des Texts zum Ausdruck kommt. Jede Entitätsstimmung wird durch numerische Score- und Magnitude-Werte dargestellt und für jede Erwähnung einer Entität bestimmt. Diese Punktzahlen werden dann in eine allgemeine Sentimentpunktzahl (Score und Magnitude) für eine Entität zusammengefasst…

Die Natural Language API verarbeitet den gegebenen Text, um die Entitäten zu extrahieren und die Stimmung zu bestimmen. Eine Anfrage für eine Sentimentanalyse pro Entität gibt eine Antwort zurück, die folgende Informationen enthält: die im Dokumentinhalt gefundenen entities, den Eintrag mentions für jede Erwähnung der Entität und die numerischen Werte von score und magnitude für jede Erwähnung, wie unter Werte der Sentimentanalyse interpretieren beschrieben. Die score– und magnitude-Werte für eine Entität sind eine Zusammenfassung der spezifischen score– und magnitude-Werte für jede Erwähnung der Entität. Die score– und magnitude-Werte für eine Entität können 0 sein, wenn die Stimmung im Text einen niedrigen Wert ergibt, was zu einer magnitude von 0 führt, oder wenn die Stimmung gemischt ist, was zu einem score von 0 führt.

Dazu auch folgendes Patent.

Sentiment detection as a ranking signal for reviewable entities

Dieses Google Patent wurde in der neuesten Version im Oktober 2017 gezeichnet. Das Patent beschreibt in Teilen den Prozess der Sentiment-Analyse über die NLP-API von Google.

Im Patent wird beschrieben wie aufgrund von Sentiment-Analysen Stimmungen rund um bewertbare Entität in Dokumenten identifiziert werden können. Die Ergebnisse können dann für das Ranking von Entitäten und zugehörigen Dokumenten genutzt werden. Zu den bewertbaren Entitäten gehören Personen, Orte oder Dinge, zu denen sich die Meinung äußern lässt, wie z. B. Restaurants, Hotels, Konsumgüter wie Elektronik, Filme, Bücher und Live-Auftritte.

Als Quelle für die Sentiment-Analysen können strukturierte unstrukturierte Daten und Text genutzt werden. Strukturierte Reviews werden über bekannte Bewertungs-Websites wie Google Maps, TripAdvisor, Citysearch oder Yelp gesammelt. Strukturierte Rezensionen können auch aus anderen Arten von Textdokumenten wie dem Text von Büchern, Zeitungen und Zeitschriften gesammelt werden.

Unstrukturierte Bewertungen sind Textdokumente, die auf die überprüfbare Entität verweisen und mit hoher Wahrscheinlichkeit eine Meinung über die überprüfbare Entität enthalten. Unstrukturierte Bewertungen enthalten eine Textüberprüfung, jedoch keine Bewertung wie z.B. durch Sterne. Unstrukturierte Bewertungen  enthalten in der Regel Stimmungen in Dokumenten mit weniger strukturierten Formaten wie Newsgroups oder Blogs.

Der Prozess für Speicherung und Ranking wird über eine Ranking-Analysis-Engine und ein Entity Ranking Data Repository durchgeführt. Das Entity Ranking Data Repository setzt sich aus einer Datenbank für die Sentiments, die Entitäten-Bewertungen und die Nutzer-Interaktion zusammen. In der Datenbank für die Nutzer-Interaktion wird das Nutzerverhalten in den SERPs mit den Entitäten-relevanten Dokumenten erfasst. Der Prozess umfasst typischen NLP-Teilschritte wie z.B. Part of Speech Tagging.

Die in der Sentiment-Datenbank gespeicherten Entitäten werden durch Tuples in Form von der Entitäten-ID, Entitätstyp und einem oder mehreren Reviews repräsentiert. Die Reviews werden mit unterschiedlichen Scorings versehen, die in der Ranking Analysis Engine errechnet werden.

In der Ranking Analysis Engine werden Sentiment-Scores betreffend den jeweiligen Bewertungen inkl. Zusatzinformationen wie z.B. den Autor  ermittelt.

  • User Interaction Score
  • Consensus Sentiment Score

Zu der Ermittlung eines Nutzer-Interaktions-Score wird auf Nutzersignale wie SERPCTR und Aufenthalstdauer eingegangen.

The User Interaction Score 406 is generated using user interaction metrics such as user click through and time spent at web pages associated with Ranked Entities 415 presented in search results. The Ranking Analysis Engine 130 monitors user interaction with results to generate user interaction metrics which are stored in the User Interaction Database 148.

Neben dem Nutzer-Interaktions-Score werden noch weitere Scorings wie den Consensusus Sentiment Score für das Ranking einbezogen.

410. Consensus Sentiment Scores 410 can be generated by averaging the Sentiment Scores 312 associated with a Reviewable Entity 315, selecting the median Sentiment Score 312 of the Sentiment Scores 312 associated with a Reviewable Entity 315 or selecting the Sentiment Score 312 which is most frequently associated with a Reviewable Entity 315.

 

Spannend ist auch noch die Erwähnung, dass das System aufgrund Domain-relevanter Inhalte bzw. Dokumente Domain-spezifische Classifier erlernt, die für eine Domain-spezifische Sentiment-Analyse genutzt werden. Domain beschreibt hier die oberste Hierarchie-Klasse wie z.B. Person. Mehr dazu in dem Beitrag Alles was Du zu Entitäts-Typen, -Klassen & Attributen wissen solltest .

In one embodiment, the domain-specific corpus 818 contains enough documents to constitute a representative sample of how sentiment is expressed in the domain. Likewise, the domain-independent corpus 820 contains enough documents to constitute a representative sample of how sentiment is expressed generally, exclusive of any specific domain.

 

Business category classification 

Im Google Patent Business Category Classification aus dem Jahr 2015 wird beschrieben wie Dokumente und Entitäten einer Branche bzw. Geschäftskategorie zugeordnet werden können. Im ersten Schritt werden Dokumente einer Entität zugeordnet. Über die Nennungen möglicher Geschäftsfelder bzw. -kategorien kann die Entität dieser bzw. diesen zugeordnet werden. Desweiteren kann für eine Entität  eine Relevanz-Bewertung in Bezug auf eine Branche durchgeführt. Diese kann aufgrund

  • der Häufigkeit den Entitäten-Nennungen in Verbindung mit der Kategorie je Dokument
  • die Menge an Dokumenten, die diese Kookkurrenzen beinhalten
  • im Verhältnis zu der allgemeinen Nennungen der Kategorie

erstellt werden. Erreicht dieser Bewertung einen Schwellenwert wird die Entität einer Kategorie zugeordnet. Die Relevanzbewertungen werden für eine oder mehrere Geschäftskategorien in Bezug auf eine Entität berechnet und liefern ein Maß für die Relevanz zwischen einer bestimmten Geschäftsklassifizierung und der Geschäftseinheit.

In some aspects, the method further comprises steps for calculating a relevance score for each of the plurality of business categories, wherein the relevance score for each business category is based on the term frequency, the document frequency and the global frequency for each of the category phrases associated with that business category and associating one or more of the plurality of business categories with the business entity based on the relevance score calculated for each of the one or more of the plurality of business categories.

Zu den der Entität zugeordneten Dokumenten gehören beispielsweise Webseiten, auf denen eine oder mehrere Geschäftseinheiten erwähnt werden, Ankertexte von Hyperlinks zu einer oder mehreren Unternehmenswebsites, Webdokumente, Anzeigen und / oder Feeds mit Geschäftsberichten usw.

In dem Patent wird auf mögliche Einsatzgebiete dieser Methode z.B. für die Anzeige von Entitäten bei Google Maps eingegangen.

 

Bewertung aufgrund von Entitäts-Metriken

Im Google Patent Ranking search results based on entity metricwird beschrieben wie eine Entität aufgrund von verschiedenen Metriken bewertet werden können. Die Metriken sind

  • Einen Score für die Nähe der Verwandschaft zwischen Entitäten und Entitätstypen. Der Score wird ermittel über Kookkurrenzen von Entitäten miteinander oder mit Entitäts–Typen.
  • Einen Score für die Erwähnungswürdigkeit oder Bemerkbarkeit. Notability bezieht sich darauf, wie bedeutend eine Entität ist, wenn sie sich auf eine Suchanfrage oder eine andere Entität bezieht. Dazu wird die globale Popularität der Entität (dh die Anzahl der Links, Erwähnungen in Social Media usw.) verglichen und dividiert diese durch den Popularitäts-Wert des Entitätstyps selbst.
  • Einen Beitrags-Anteil-Score, der den Einfluss einer Entität auf ein Thema/Branche hat beschreibt. Die Beitragsmetrik basiert auf externen Einflusspunkten wie Reviews, Best-of-Listen usw. und kann so gewichtet werden, dass bestimmte Arten von Beitragsmetriken (wie Reviews) einen größeren Einfluss erhalten. Eine kritische Bewertung durch einen renommierten Experten hätte beispielsweise einen größeren Einfluss auf die Beitragsmetrik als eine Bewertung durch Yelp-Benutzer.
  • Eine Preis-Metrik, die aufgrund von Awards … gemessen wird.

Neben diesen Metriken werden auch Popularität, Nutzer-Auswahl und Reviews als Rankingfaktoren für Entitäten genannt.

  • User selection and popularity are ranking factors for entities.
  • Reviews count in ranking factors for entities.

Hier ein Auszug aus dem Patent:

Another illustrative metric is, for example, a notable entity type metric. In some implementations, the value of the notable entity type metric is a global popularity metric divided by a notable entity type rank. The notable entity type rank indicates the position of anentity type in a notable entity type list.

Another illustrative metric is, for example, a contribution metric. In some implementations, the contribution metric is based on critical reviews, fame rankings, and other information. In some implementations, rankings are weighted such that the highest values contribute most heavily to the metric .

Another illustrative metric is, for example, a prize metric. The prize metric is based on an entity’s awards and prizes. For example, a movie may have been awarded a variety of awards such as Oscars and Golden Globes, each with a particular value. In some implementations, the prize metric is weighted such that the highest values contribute most heavily to the metric.

 

Search result ranking based on trust

Dieses sehr spannende Patent wurde im Oktober 2017 von Google in der neuesten Version gezeichnet und hat den Status „Application status active“ . Im Patent wird beschrieben wie das Ranking-Scoring von Dokumenten aufgrund eines Trust-Labels ergänzt wird.

The trust factors are used to adjust information retrieval scores of the documents. The search results are then ranked based on the adjusted information retrieval scores.

Die Informationen zu den Labels werden durch einen Crawler gesammelt und an das System der Suchmaschine geschickt. Diese Informationen können aus dem Dokument selbst oder aus verweisenden Fremd-Dokumenten in Form von Linktexten oder anderen Informationen bezüglich des Dokuments bzw. der Entität sein. Diese Labels werden mit der URL verknüpft und in einer Annotation-Datenbank erfasst.

In one embodiment of the present invention, a web crawler (not shown) obtains labels and trust information and sends it to search engine system 100 to facilitate subsequent usage in search result ranking.

Weitere Signale können von den Nutzern z.B. über einen Trust-Button selbst an ein Dokument und/oder die publizierende Entität vergeben werden oder über eine Liste, in der der Nutzer angeben kann für welche Themen er der Entität vertraut. Diese Informationen werden in einer Trust-Datenbank abgelegt iund basierend darauf ein Trust-Faktor je Dokument ermittelt. Die Namen der Nutzer und den bewerteten Labels werden offen in der SERPs zusammen mit dem jeweiligen Suchergebnis angezeigt.

Der Trust-Button ist nur eine Möglichkeit des Nutzer-Feedbacks. Doch in dem Patent steht etwas nebulös, dass alle Formen von Signalen genutzt werden können, die einen Aufschluss über die Vertrauens-Beziehung zwischen der Entität und Nutzer geben. So kann z.B. auch die Häufigkeit der Aufrufe der Website der jeweiligen Entität einen Aufschluss dazu geben wie große das Vertrauen ist.

The system can also examine web visitation patterns of the user and can infer from the web visitation patterns which entities the user trusts. For example, the system can infer that a particular user trust a particular entity when the user visits the entity’s web page with a certain frequency.

Diese Trust-Signale können auch indirekt über die Website einer dritten Entität, die wiederrum der ersten Entität vertraut zugeordnet werden.

Für das Ranking der Dokumente werden dann auch die Informationen aus der Trust-Datenbank herangezogen.

A document’s trust factor is a function of the trust ranks associated with the entities have labeled the document with labels that match the query labels. The search engine 180 adjusts each document’s underlying information retrieval score using the document’s trust factor, and then reranks the search results using the adjusted scores.

Credibility of an author of online content

Dieses Google Patent besitzt  den Status „Application status is actice“. Es beschreibt wie eine Suchmaschine Dokumente unter Einfluss eines Kredibilitäts-Faktors und Reputation-Score des Autors ranken kann. Es werden folgende mögliche Signale für einen Reputation-Score genannt:

  • wie lange der Autor bereits nachweislich Content in einem Themenbereich produziert
  • Bekanntheitsgrad des Autors
  • Bewertungen der veröffentlichten Inhalte durch Nutzer
  • Wenn Inhalte des Autors von einem anderen Publisher mit überdurchschnittlichen Bewertungen veröffentlicht werden
  • Die Anzahl der durch den Autor veröffentlichten Inalte
  • Wie lange die letzte Veröffentlichung des Autors her ist
  • Die Bewertungen bisheriger Veröffentlichungen ähnlichen Themas des Autors

Weitere interessante Informationen zum Reputation-Score aus dem Patent:

  • Ein Autor kann mehrere Reputation-Scores haben, je nachdem zu wie viel verschiedenen Themen er Inhalte publiziert.
  • Der Reputation-Score eines Autors ist unabhängig vom Publisher.
  • Der Reputation-Score kann zurückgestuft werden wenn Duplikate von Inhalten oder Auszüge mehrfach veröffentlicht werden.
  • Der Reputation-Score kann durch die Anzahl der Verlinkungen der veröffentlichten Inhalte beeinflusst werden.

Desweiteren wird in dem Patent auf einen Kredibilitäts-Faktor für Autoren eingegangen. Für diesen sind verifizierte Informationen zum Beruf bzw. die Rolle des Autors in einem Unternehmen relevant. Dabei spielt auch die Kredibiliät des Unternehmens eine Rolle.Entscheiden für die Glaubwürdigkeit des Autors ist auch die Relevanz des Berufs zu den Themen der veröffentlichten Inhalte. Auch Bildungsgrad und Ausbildung des Autors können hier einen Ausschlag haben.

The verified information about the author can include the number of other publications of the author that are relevant to the author’s online content item. The verified information about the author can include the number of citations to the author’s online content item that are made in other publications of one or more different authors. The verified information about the author can include information about awards and recognition of the author in one or more fields. The credibility factor can be further based on the relevancy of the one or more fields to the author’s online content item. The verified information about the author can include feedback received about the author or the author’s online content item from one or more organizations. The credibility factor can be further based on the relevancy of the one or more organizations to the author’s online content item and the feedback received. The verified information about the author can include revenue information about the author’s online content item.

Systems and Methods for Re-Ranking ranked Search Results

Dieses Google Patent wurde im August 2018 gezeichnet. Es beschreibt die Verfeinerung von Suchergebnissen nach einem Autoren-Scoring inkl. einem Citation-Scoring. Das Citation-Scoring basiert auf der Anzahl der Verweise auf die Dokumente eines Autors. Ein weiteres Kriterium für das Autor-Scoring ist der Anteil der Inhalte, die ein Autor zu einem Korpus an Dokumenten beigesteuert hat.

wherein determining the author score for a respective entity includes: determining a citation score for the respective entity, wherein the citation score corresponds to a frequency at which content associated with the respective entity is cited; determining an original author score for the respective entity, wherein the original author score corresponds to a percentage of content associated with the respective entity that is a first instance of the content in an index of known content; and combining the citation score and the original author score using a predetermined function to produce the author score;

Knowledge-Based Trust: Estimating the Trustworthiness of Web Sources

Dieses wissenschaftliche Papier aus dem Hause Google beschäftigt sich damit wie man die Vertrauenswürdigkeit von Online-Quellen ermitteln kann. Es wird neben der Analyse von Verlinkungen eine neue Methode vorgestellt, die auf der Prüfung der veröffentlichten Informationen auf Richtigkeit beruht.

We propose a new approach that relies on endogenous signals, namely, the correctness of factual information provided by the source. A source that has few false facts is considered to be trustworthy.

Dafür werden Methoden des Data Mining genutzt, auf die ich bereits in den Beiträgen Wie kann Google aus unstrukturierten Inhalten Entitäten identifizieren und deuten ? und Die Rolle von Natural Language Processing für Data Mining, Entitäten & Suchanfragen   detailliert eingegangen bin.

We call the trustworthiness score we computed Knowledge-Based Trust (KBT). On synthetic data, we show that our method can reliably compute the true trustworthiness levels of the sources.

Die bisherige Bewertung der Glaubwürdigkeit von Quellen basierend auf Links und Browser-Daten über das Nutzungsverhalten von Websites hat Schwächen, da weniger populäre Quellen schlechtere Karten haben und ungerechterweise zu kurz kommen, obwohl sie sehr gute Informationen bereitstellen.

Über diesen Ansatz können Quellen mit einem „Trustworthiness-Score“ bewertet werden, ohne den Faktor Popularität einfließen zu lassen. Websites, die häufig falsche Informationen bereitstellen werden abgewertet. Websites, die Informationen im Einklang mit dem generellen Konsens veröffentlichen werden belohnt. Damit sinkt auch die Wahrscheinlichkeit, dass Websites, die durch Fake News auffallen Sichtbarkeit bei Google bekommen.

Producing a ranking for pages using distances in a web-link graph

Dieses Patent wurde 2017 von Google in der neuesten Version gezeichnet und der Status ist aktiv. Es beschreibt wie aufgrund der Nähe zu ausgewählten Seed-Websites ein Ranking-Score für verlinkte Dokumente erstellt werden kann. Dabei werden die Seed-Seiten selbst individuell gewichtet.

In a variation on this embodiment, a seed page sin the set of seed pages is associated with a predetermined weight wherein 0<wi≦1. Furthermore, the seed page sis associated with an initial distance dwherein di=−log(wi).

Die Seed-Seiten selbst sind von hoher Qualität bzw. die Quellen besitzen eine hohe Glaubwürdigkeit. Zu diesen Seiten kann man folgendes in dem Patent lesen:

 In one embodiment of the present invention, seeds 102 are specially selected high-quality pages which provide good web connectivity to other non-seed pages. More specifically, to ensure that other high-quality pages are easily reachable from seeds 102, seeds in seeds 102 need to be reliable, diverse to cover a wide range of fields of public interests, as well as well-connected with other pages (i.e., having a large number of outgoing links). For example, Google Directory and The New York Times are both good seeds which possess such properties. It is typically assumed that these seeds are also “closer” to other high-quality pages on the web. In addition, seeds with large number of useful outgoing links facilitate identifying other useful and high-quality pages, thereby acting as “hubs” on the web.

Laut dem Patent müssen diese Seed-Seiten manuell ausgewählt werden und die Anzahl sollte limitiert sein, um Manipulation vorzubeugen. Die Länge eines Links zwischen eine Seed-Seite und dem zu rankenden Dokument kann z.B. über folgend Kriterien ermittelt werden:

  • Position des Links
  • die Schriftart des Links
  • Grad der thematischen Abweichung der Quellseite
  • Anzahl ausgehender Links der Quellseite

Interessant ist, dass Seiten die keine direkte oder indirekte Verlinkung zu mindestens einer Seed-Seite haben gar nicht erst in das Scoring aufgenommen werden.

Note that however, not all the pages in the set of pages receive ranking scores through this process. For example, a page that cannot be reached by any of the seed pages will not be ranked.

Mögliche Kriterien für eine algorithmische E-A-T-Bewertung

Zusammengefasst würde ich aus den Erkenntnissen schließen, dass folgende Komponenten einen maßgeblichen Einfluss auf die algorithmische Bewertung von Quellen wie  Autoren und Publishern gemäß E-A-T haben:

  • wie lange der Autor / Publisher bereits nachweislich Content in einem Themenbereich produziert
  • Bekanntheitsgrad des Autors / Publishers
  • Bewertungen der durch den Autor / Publisher veröffentlichten Inhalte durch Nutzer
  • Die Anzahl der durch den Autor / Publisher veröffentlichten Inalte zu einem Thema
  • Wie häufig der Autor / Publisher Inhalte zu dem Thema veröffentlicht
  • Kookkurrenzen des Autors / Publishers in Zusammenhang mit Begriffen aus dem Themen-Umfeld
  • Richtigkeit der veröffentlichten Informationen im Abgleich mit der „gängigen Meinung“ bzw. wissenschaftlichen Erkenntnissen (KBT)
  • Häufige Link-Nähe zu Seed-Sites der Inhalte des Publishers / Autors
  • Nutzer-Signale wie CTR der Dokumente des Publishers / Autors
  • Nennungen des Autors / Publishers in Best-Of-Listen
  • Preise und Awards, die der Autor / Publisher gewonnen hat
  • Stimmung / Sentiment in Bezug auf das Unternehmen / Publisher / Autor

Diese Signale müssen durch den Crawler erkannt werden und algorithmisch ausgewertet werden können. Sobald eine Entität in Form eines Unternehmens, Publishers, Autors oder Produkts über diese Signale bewertet werden können die mit der Entität verbunden Dokumente gemäß E-A-T bewertet werden.

Autoren-Box und E-A-T

Da die Autoren-Box gerade viel diskutiert wird möchte ich an dieser Stelle kurz darauf eingehen. Eine Autoren-Box an sich wird beim Ranking keinen großen Einfluss haben. Sie kann helfen einen Inhalt mit einer Entität in Zusammenhang zu bringen. Wird der Autor aber noch nicht als Entität von Google erkannt bzw. besitzt dieser keine thematische Glaubwürdigkeit bzw. Autorität, die von Google algorithmisch erkannt werden kann wird eine Autoren-Box keinen Einfluss auf das Ranking haben.

Nicht validierte Entitäten neben Knowledge Graph

Ich denke Google hat mehr Entitäten auf dem Schirm als nur die, die im Knowledge Graph offiziell erfasst sind. Da über den Knowledge Vault bzw. Natural Language Processing sowohl in Suchanfragen auch in Inhalten jeglicher Art Entitäten analysiert werden können wird es neben dem Knowledge Graph eine zweite unvalide Datenbank geben. In dieser Datenbank könnten alle Entitäten erfasst sein, diez war als Entität erkannt sind, die einer Domain sowie einem Entitäts Typ zugeordnet sind, aber gesellschaftlich nicht relevant genug für die Ausspielung eines Knowledge Panels sind.

Aus Performance-Gründen würde so etwas Sinn machen, da so ein Repository ermöglichen würde nicht immer wieder bei Null zu beginnen. Ich denke dort werden alle Entitäten gespeichert bei denen die Informationen hinsichtlich Richtigkeit (noch) nicht validiert werden können.

Somit hätte Google die Möglichkeit die erläuterten Signale auch auf weitere Entitäten neben denen im Knowledge Graph erfassten anzuwenden, um E-A-T-Bewertungen durchzuführen.

Schlussfolgerung für SEOs und Content-Marketer

Wie in meinem Beitrag Branding & das neue Google Ranking: Warum SEO nicht mehr reicht… bereits 2014 erläutert spielen die  Marke und Autorität  in der Suchmaschinenoptimierung eine immer wichtigere Rolle . Das sorgt dafür, dass die Suchergebnisse alleine durch SEO-Techniken nicht mehr beeinflusst werden können. Es geht genauso um Marketing und PR. Neben den bekannten SEO-Onpage-Basics zur Sicherstellung der Crawlability, Indexierungssteuerung, Optimierung der internen Verlinkung (siehe hier) und Website Hygiene gilt es in erster Linie den Dreiklang aus Relevanz, Trust und Autorität zu beachten.

Für Findbarkeit bei Google, aber auch generell, sollten SEOs und Online-Marketer neben Content, Linkaufbau und Crawling-, & Indexierungssteuerung auch die Effekte auf das Ranking durchMarkenaufbau im Fokus haben. Dazu bedarf es einer Zusammenarbeit mit den Personen, die für das Branding und PR verantwortlich sind. So können bereits bei der Kampagnen-Konzeption mögliche Synergien berücksichtigt werden.

Zusammengefasst kann man sagen, dass es sinnvoll ist, bei allen Marketing- und PR-Aktivitäten mit Blick auf das Google-Ranking die eigene Marke mit Themen/Produkten in Zusammenhang zu bringen, für die man gefunden werden möchte. Sei es bei Marketing-Kampagnen, Marketing-Kooperationen wie es etwa Home2go oder Footlocker gemacht haben, um bestimmte Suchanfragen-Muster zu fördern.

Man sollte versuchen, über PR-Aktionen oder Content-Marketing-Kampagnen Kookkurrenzen und Verlinkungen aus themenaffinen redaktionellen Umfeldern zu generieren.

Generell kann man sagen, dass eigener Content über Owned Media und Signale über Kookkurrenzen bzw. Marken- und Domain-Nennungen in bestimmten Themen-Umfeldern die Autorität einer Marke steigern können und damit das Ranking für Keywords, die in diesen Umfeldern verortet sind.

Je eindeutiger Google die Positionierung des Unternehmens, Autors, Publishers… identifizieren kann, desto leichter wird es, die mit dieser Entität verknüpften thematisch relevanten Inhalten zu ranken.

Der Kreis schließt sich: Semantische Suche & Digitaler Markenaufbau

Mit diesem Beitrag schließt sich ein Kreis aus über 6 Jahren Recherche in Sachen semantische Suche und Entitäten für mich. Seit dem Hummingbird-Update im Jahr 2013 stehen Entitäten und die semantische Suche im Fokus meines Interesses wenn es um Suchmaschinenoptimierung geht. Durch die Erfahrungen, die ich mit eigenen Projekten machen durfte ist mir bewusst geworden, wie große der Einfluss der Reputation und Autorität einer Domain bzw. eines Autors also einer Entität hinsichtlich Sichtbarkeit, Rankings, aber auch Abschlussraten bzw. Conversions ist.

Über diese Erkenntnisse habe ich mir seit 2014 mit dem digitalen Markenaufbau einen  weiteren Bereich erschlossen, der mich seitdem nicht mehr los lässt. Zum Abschluss möchte ich an dieser Stellen meine bisherigen Publikationen zum Thema digitaler Markenaufbau für Dich als Leser dieses Beitrags zur weiteren Lektüre auflisten. Viel Spass beim Eintauchen. Ich hoffen ich kann Dich inspirieren…

 


Zu Olaf Kopp

Olaf Kopp ist international anerkannter Online-Marketing-Experte mit mehr als 15 Jahren Erfahrung im Online-Marketing, Google Ads, SEO und Content Marketing. Olaf Kopp ist Co-Founder, Chief Business Development Officer (CBDO) und Head of SEO bei der Aufgesang GmbH. Er ist Autor, Podcaster und anerkannter Branchenexperte für semantische SEO, E-A-T, Online- und Content-Marketing-Strategien entlang der Customer Journey und digitale Markenbildung. Olaf Kopp ist Mitgründer und Moderator des Content-Marketing-Podcasts Content-Kompass. Kopp ist Autor des Buches “Content-Marketing entlang der Customer Journey” und Mitorganisator des SEAcamp. Als begeisterter Suchmaschinen- und Content-Marketer schreibt er für diverse Fachmagazine, u.a. Search Engine Land, t3n, Website Boosting, suchradar, Hubspot ... und war als Gastautor in diverse Buch-Veröffentlichungen involviert. Sein Blog zählt laut diversen Fachmedien und Branchenstimmen zu den besten Online-Marketing-Blogs in Deutschland. Zudem engagiert sich Olaf Kopp als Speaker für SEO und Content Marketing in Bildungseinrichtungen sowie Konferenzen wie z.B. der Hochschule Hannover, SMX, CMCx, OMT, OMX, Campixx… Olaf Kopp ist Suchmaschinen-Marketer, Content-Marketer und Customer-Journey-Enthusiast, bewegt sich als Schnittstelle zwischen verschiedenen Marketing-Welten und baut Brücken immer eine nutzerzentrierte Strategie im Auge.

7 Kommentare

    Hi, danke für diese wiederum wertvollen Informationen.

    Eine kleine Anmerkung:
    Der Link im ersten Abschnitt “ Entitäten einfach erklärt“ gibt einen Doppellink aus.
    Habe es trotzdem gefunden…. dachte aber, könnte interessieren 😉

    LG
    Marcel

    Jan sagt:

    Dass Marken-Relevanz und Autorität Einflüsse auf das Ranking bei Google haben, ist inzwischen unbestritten. Wie Google dies in Bezug auf bestimmte Themen ermittelt und wie man diese Einflussfaktoren optimieren kann, ist aber nicht eindeutig klar.

    ONMA sagt:

    Hallo lieber Olaf.

    An dieser Stelle erstmal ein großartiges danke, dass du dein ganzes Wissen zum Thema Entitäten und E-A-T nochmal umfangreich überarbeitet hast und aktualisiert hast.

    Es ist wirklich sehr erstaunlich welches Wissen du ja aufgesetzt hast. Ich habe das Gefühl dass man einen Studiengang draus machen könnte.

    Vor allen Dingen ist dein Wissen nicht nur für große Marken immer relevanter sondern eben auch in einem wettbewerbsintensiven Umfeld. Und das ist natürlich bei einer Vielzahl an diverse Onlineshops zugeben.

    Was mir zudem an deinem Beitrag wirklich extrem gut gefällt, ist nicht nur die wissenschaftliche Ausarbeitung, sondern eben auch Content-Marketing vom allerfeinsten, wie ich es schon seit Jahren unseren Kunden empfehle. Dieser Beitrag ist ein exemplarisches Musterbeispiel mit allen notwendigen Kriterien eines einwandfreien Content Marketings.

    Spannend finde ich aber auch, dass ich neue Wörter/Fachbegriffe in deinem Fachbeitrag kennenlernen darf, die ich zuvor noch nicht kannte. So bezeichnet “Kookkurrenz” (das weiß ich jetzt) in der allgemeinen Linguistik das gemeinsam auftreten zweier lexikalischer Einheiten in einer übergeordneten Einheit….

    Vielen herzlichen Dank abschließend für diesen extrem geilen Beitrag, von dem ich sehr profitieren konnte.

    Allerbeste Grüße.

    Winni.

    Elias Lange sagt:

    Eine wirklich gute Zusammenfassung und Übersicht zum derzeitigen Stand bzgl. EAT & Entitäten. 🙂👍

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.