5/5 - (1 vote)

In modernen Suchmaschinen sind Keywords nicht mehr nur ein Mittel zum Zweck um einen Dokumenten-Suchanfragen-Abgleich durchzuführen. Keywords sind vor allem dazu da ein semantisches Verständnis sowohl des Suchterms als auch eines Dokuments/Inhalts zu entwickeln. Basierend auf einem Google-Patent möchte ich eine mögliche Anwendungsfälle beleuchten wie Keywords durch semantische Suchmaschinen wie Google genutzt werden können.

Keywords im Kontext von Wissensdomänen

Wissensdomänen oder Ontologien bzw. Themenbereiche können durch Keyword-Cluster definiert werden, die in einer bestimmten semantischen Nähe zueinander stehen. Die Nähe der Keywords zueinander definieren, ob Keywords zu einer thematischen Ontologie gehören oder nicht. Diese Ontologien können auch durch Vektoren in einem Vektorraum dargestellt werden, wobei jeder Vektor für ein Keyword steht. Über Vektorraumanalysen können in den Vektorräumen Gruppen von Keywords in Beziehung bzw. Nähe zueinander gesetzt werden. Je näher zwei oder mehrere Keywords in einem Vektorraum zusammenliegen desto enger ist die die semantische Verwandschaft.

Im Falle von Kontextvektoren können beispielsweise Domänenbegriffe (wie in Wissensdomänen), die die Bedeutung hinter einem für eine Seite gewählte Schlüsselwortbegriff oder -satz erkennen lassen, der Suchmaschine helfen zu verstehen, welche Bedeutung ein Satz, Absatz oder der Content an sich hat. Diese Methode könnte auch beim Passage Ranking eine Rolle spielen.

Wird eine Seite beispielsweise für den Begriff „Pferd“ optimiert und werden der Seite Domänenbegriffe wie „Steigbügel“, „Sattel“ oder „Vollblut“ hinzugefügt, kann die Suchmaschine die richtige Bedeutung für dieses Text erkennen.

 

Häufig vorkommende Begriffe und Phrasen in relevanten Dokumenten (TF-IDF)

Bei der phrasenbasierten Indexierung kann ein Keywords und Phrasen berücksichtig werden, die häufig auf anderen Seiten vorkommen, die für dieselbe Phrase  oder Keyword ein hohes Ranking in der Suchmaschine haben. Dieses Prinzip kennen wir von TF-IDF- bzw. WDF-*IDF-Analysen.

Beispiel TF-IDF-Analyse mit Termlabs.io

Eine Fokussierung auf die Begriffe, die in den Top-n rankenden Dokumenten benutzt werden ist eine gute Grundlage für die Erstellung eines Texts, aber reicht häufig alleine nicht aus, da man immer ein bisschen besser sein sollte, als das was schon an Inhalten da ist.

Google möchte in den Suchergebnissen eine gewisse Vielfältigkeit bzw. Diversität präsentieren. Deswegen macht es durchaus Sinn auch Begriffe zu nutzen, die nicht in diesen Dokumenten vorkommen, die dennoch semantischer Nachbarschaft zum Hauptbegriff liegen. Dafür kann man sich mit neuen Perspektiven beschäftigen, die man z.B. bei den Nutzern oder anderen Experten direkt erfragt. Dadurch erlangt der Inhalt eine Einzigartigkeit.

Google oder andere moderne Suchmaschinen können diese häufig vorkommenden vollständigen und aussagekräftigen Phrasen in einer Liste indexieren. Dazu auch mehr in dem Beitrag Are You Using Google Phrase-Based Indexing? vom geschätzten Kollegen Bill Slawski oder meinen Beiträgen Wie kann Google über Entitäten, NLP & Vektorraumanalysen relevante Dokumente identifizieren und ranken? und Die  Rolle von Natural Language Processing für Data Mining, Entitäten & Suchanfragen.

 

LSI Keywords & Keyword-Stuffing

Es gibt einige  SEOs, die über so genannte „LSI Keywords“ schreiben, ohne wirklich zu zeigen, was das in der Praxis bedeutet bzw. ob die Verwendung von LSI-Keywords wirklich für die Suchmaschinenoptimierung funktioniert. Oft wird dann im Kontext von LSI-Keywords auf den Google Keyword-Planner, hervorgehobene Wörter in Suchergebnissen und Google-Abfrageverfeinerungen verwiesen.

Google hat vor „Keyword-Stuffing“ gewarnt, d. h. davor, das gleiche Keyword immer wieder auf einer Seite zu wiederholen und die Seite mit diesem Keyword „vollzustopfen“. Die sogenannte Termfrequenz war in der SEO-Steinzeit ein probates Mittel um Rankings zu manipulieren hat heute aber keinen großen Einfluss mehr, sondern könnte sogar als Überoptimierung erkannt und abgewertet werden.

 

Keywords als Entitäten

Begriffe bzw. Keywords können über die grammatikalische Satzstruktur als Entitäten identifiziert werden. Substantive bzw. Subjekte und Objekte sind häufig Entitäten. So können semantische Suchmaschinen über sogenannte Triples aus Subjekt, Prädikat und Objekt Entitäten in Sätzen identifizieren und in Beziehung zueinander setzen. Darüber lassen sich in einem Graphen-Konstrukt wie z.B. dem Google Knowledge Graph Beziehungen zwischen Entitäten aus unstrukturierten Informationen wie Texten identifzieren. Moderne Suchmaschinen wie Google können dafür Methoden wie Natural Language Processing nutzen.

Mehr dazu auch in meiner Beitragsreihe Entitäten, NLP & Semantik bei Suchmaschinen

 

Kanonische Keywords erkennen

Unterschiedliche Keywords mit einer nahezu gleichen Bedeutung können über Vergleiche mit Wörterbüchern identifiziert und zusammengeführt werden. So kann z.B. die Mehrzahl eines Begriffs mit der Einzahl zusammengeführt werden. Z.B. „Schuhe“ wird kanonisiert mit „Schuh“. In Bezug auf Suchanfragen könnte dann die eigentliche Suchanfrage „schuhe“ in „schuhe“ umgeschrieben werden, bevor die Suchergebnisse ausgeliefert werden.

 

Was ist die semantische Relevanz von Keywords?

Die semantische Relevanz von Keywords basiert auf den semantischen Abständen zwischen den einzelnen Keywords. Wie bereits beschrieben ist dies über sogenannte Vektorraumanalysen festzustellen.

 

Semantische Beziehungsgraphen als Abbild semantischer Beziehungen zwischen Keywords und Entitäten

5/5 - (1 vote)

Wenn Du das Thema spannend findest kannst Du den kompletten Zugriff auf diesen und alle anderen Premium Inhalte hier im Blog erwerben.

Hier findest Du einen Überblick über die aktuellen Premium-Inhalte.


Du bist bereits Mitglied? Dann logg Dich hier ein und viel Spass beim weiter lesen.

Zu Olaf Kopp

Olaf Kopp ist Co-Founder, Chief Business Development Officer (CBDO) und Head of SEO der Aufgesang GmbH . Im Fokus seiner Arbeit stehen die Themen digitaler Markenaufbau, Online- und Content-Marketing-Strategien entlang der Customer-Journey und semantische Suchmaschinenoptimierung. Er ist Autor des Buchs "Content-Marketing entlang der Customer Journey", Mitveranstalter des SEAcamps und Moderator des Podcasts Content-Kompass. Von 2012 bis 2015 war er Geschäftsführer. Als begeisterter Suchmaschinen- und Content-Marketer schreibt er für diverse Fachmagazine, u.a. t3n, Website Boosting, suchradar, Hubspot ... und war als Gastautor in diverse Buch-Veröffentlichungen involviert. Sein Blog zählt laut diversen Fachmedien und Branchenstimmen zu den besten Online-Marketing-Blogs in Deutschland. Zudem engagiert sich Olaf Kopp als Speaker für SEO und Content Marketing in Bildungseinrichtungen sowie Konferenzen wie z.B. der Hochschule Hannover, SMX, CMCx, OMT, OMX, Campixx… Olaf Kopp ist Suchmaschinen-Marketer, Content-Marketer und Customer-Journey-Enthusiast, bewegt sich als Schnittstelle zwischen verschiedenen Marketing-Welten und baut Brücken immer eine nutzerzentrierte Strategie im Auge.