Um was geht es in der Studie über Google (Intro)

Kürzlich wurde Google-CEO Sundar Pichai aufgefordert, vor dem Kongress über mögliche Verzerrungen in Googles Algorithmen auszusagen. Dies ist nicht das erste Mal, dass Google der Voreingenommenheit beschuldigt wird, und wird wahrscheinlich auch nicht das letzte Mal sein. Google behauptet, es gebe keine Voreingenommenheit, doch viele amerikanische Konservative argumentieren, Google sei gegen sie voreingenommen.
Mit unserem Expertenwissen im Bereich der Suchmaschinenoptimierung (SEO) und den enormen Datenmengen von Ahrefs wollten wir sehen, ob wir dies überprüfen können, indem wir uns die Daten beliebter Nachrichtenseiten der amerikanischen Konservativen und Liberalen genauer ansehen. Wenn Sie mit Ahrefs nicht vertraut sind, dies ist ein Top-SEO-Tool mit großen Datenmengen aus dem Web.

  • Methodik
  • Ergebnisse

Methodik

Google nimmt jedes Jahr Hunderte von Optimierungen an seinen Ranking-Algorithmen vor. Die meisten davon bleiben unbemerkt, weil sie klein sind, aber von Zeit zu Zeit gibt es eine große “Kern”-Aktualisierung, die sich auf einen großen Prozentsatz der Suchergebnisse auswirkt. Da Google uns die Daten dieser Aktualisierungen mitteilt, dachten wir uns, wir könnten nach Verzerrungen suchen, indem wir den organischen Verkehr zu bekannten Nachrichtenseiten der Liberalen und Konservativen vor und nach diesen Aktualisierungen untersuchen.

Hier ist zum Beispiel der geschätzte organische Suchverkehr zu Fox News seit 2015. Jede Zeile stellt ein Google Core Update dar:

Wie sich die Googles Core Updates seit 2015 auf den Organische Suchverkehr von Fox News ausgewirkt haben 

Screenshot 2020 11 06 123106 |

Allerdings sagt uns der Blick auf diese Daten für eine Website nicht viel aus, also haben wir dasselbe getan, und zwar auch für die Top-Nachrichtenseiten der Konservativen und Liberalen. Wir zogen diese aus den AllSides Media Bias Ratings (linke und rechte Bias-Bewertungen). Hier ist eine Liste dieser Websites:

Nachrichten-Websites der Konservativen:

  • New York Post
  • The Last Refuge
  • Drudge Report
  • The Federalist
  • Orange County Register
  • The Epoch Times
  • Washington Times
  • Christian Broadcasting Network
  • National Review
  • Townhall
  • The Mark Levin Show
  • The Rush Limbaugh Show
  • Breitbart
  • Newsmax
  • The National Interest
  • The Gateway Pundit
  • RedState
  • PJ Media
  • Washington Examiner
  • Fox News
  • Christian Today
  • Zero Hedge
  • The Daily Caller
  • TheBlaze
  • The Daily Wire

Nachrichten-Websites der Liberalen:

  • Vox
  • U.S. News & World Report
  • The Washington Post
  • CNN
  • Bustle
  • NBC News
  • Hollywood Reporter
  • Los Angeles Times
  • Yahoo News
  • Al Jazeera
  • Rolling Stone
  • HuffPost
  • The Verge
  • The New York Times
  • ABC News
  • TIME
  • CBS Local
  • The Guardian
  • Bloomberg
  • NPR
  • CBS News
  • The Atlantic
  • Politico
  • Univision

Bevor wir zu den Ergebnissen kommen, sollte ich ein wenig über die Ahrefs-Daten sprechen. Wir haben Hunderte von Millionen von Suchbegriffen und große Mengen von Clickstream-Daten. Wir verwenden diese Daten, um den organischen Verkehr abzuschätzen, indem wir alle verschiedenen Suchanfragen, nach denen Menschen suchen, die Positionen, die Websites in den Suchergebnissen einnehmen, und die Klicks der Benutzer betrachten. Für die Kern-Updates haben wir beschlossen, den Verkehr zu Beginn der Google-Core-Updates und den Traffiv 14 Tage später zu untersuchen. Dies soll Google Zeit geben, die Änderungen in den verschiedenen Rechenzentren einzuführen. Es gibt uns auch Zeit, damit unsere Daten die Änderungen widerspiegeln können.

Unsere Daten sind insofern normalisiert, als das Volumen über 12 Monate gemittelt wird, so dass sie hauptsächlich die Saisonabhängigkeit berücksichtigen sollten, wobei Wahlen eine Ausnahme bilden, da sie nicht jedes Jahr stattfinden. Wir werden auch nicht frühzeitig neuere Geschichten oder Suchthemen sehen, aber wir sollten alle populären Suchanfragen und damit zusammenhängende Clickstream-Daten später aufgreifen.

Ergebnisse

Von 2015 bis heute sehen wir einen Rückgang des durchschnittlichen Traffics für die Top-Nachrichtenseiten in jeder Kategorie während der Zeiträume von Google Core Update.

Konservativer Rückgang des Gesamtverkehrs: -2,65%
Liberaler Gesamtverkehrsrückgang: -1,78%

Diese Zahlen sind eigentlich sehr ähnlich und statistisch nicht signifikant, wenn man bedenkt, dass wir den Traffic von 50 Websites berücksichtigen und einen Zeitraum von 6 Jahren betrachten. Bis zur letzten Wahl im Jahr 2016 waren die Auswirkungen auf beide Kategorien ungefähr gleich. Wenn Sie sich bis zur Wahl im Jahr 2020 die Ergebnisse aus dem Vorjahr oder so ansehen, werden Sie feststellen, dass die Auswirkungen für beide Kategorien ungefähr gleich waren, wobei die jüngste Aktualisierung für Websites der Konservativen besser zu sein scheint.

Wie sich Google Core-Updates auf den organischen Suchverkehr zu liberalen und konservativen Nachrichten-Websites ausgewirkt haben

Screenshot 2020 11 06 125605 |

Betrachtet man die einzelnen Datenpunkte, so haben sowohl die Nachrichten-Websites der Konservativen als auch der Liberalen bei jedem dieser Google Core Updates positive und negative Auswirkungen. Jeder Kastenplot unten stellt die Top-Websites in jeder Kategorie dar, und ich wiederhole noch einmal, dass es bei jedem einzelnen Update Gewinner und Verlierer für beide Kategorien gab. Ob eine Website bei einem Core-Update gewinnt oder verliert, hängt in der Regel mehr von ihrer Qualität ab als von irgendetwas anderem.

Wie sich Google Core-Updates auf den organischen Suchverkehr zu liberalen und konservativen Nachrichten-Websites ausgewirkt haben

Screenshot 2020 11 06 131117 |

Aus diesen Daten können wir zwar nicht schließen, dass es keine Verzerrung in den Google-Suchergebnissen gibt, aber wir können sagen, dass in den letzten 6 Jahren bei Google Core Updates keine neuen Verzerrungen eingeführt wurden.

Gibt es eine Verkehrsverzerrung?

Eines der Dinge, die uns auffielen, ist, dass liberale Websites definitiv mehr Traffic erhalten als konservative Websites.

Anteil der Seiten für die 25 wichtigsten liberalen und konservativen Nachrichten-Websites

Screenshot 2020 11 06 131829 |

Nun stellt sich die Frage, warum das der Fall ist. Zeigt dies eine potenzielle Verzerrung, die älter ist als unser Stichwortdatensatz? Lassen Sie uns herausfinden, ob wir den Verkehrsunterschied erklären können.

Menge des Contents:

Betrachtet man die Anzahl der indexierten Seiten, so haben liberale Nachrichtenquellen über 8x mehr Seiten indexiert als konservative Nachrichtenquellen. Tatsächlich ist das Diagramm fast identisch mit dem oben für den Verkehrsanteil. Infolgedessen haben die Top-Nachrichtenseiten der Liberalen im Allgemeinen mehr Chancen auf eine Rangfolge für verschiedene Dinge als die Top-Nachrichtenseiten der Konservativen.

Screenshot 2020 11 06 131829 |

Branded vs. unbranded traffic

Der gebrandmarkte Traffic für CNN und Fox News ist in etwa gleich groß, was bedeutet, dass eine ähnliche Anzahl von Menschen gezielt bei der organischen Suche nach ihnen sucht. Der Marken-Traffic macht jedoch einen kleineren Prozentsatz des Gesamt-Traffics von CNN aus, wahrscheinlich weil sie einfach mehr Inhalt haben. CNN hat ~2,5-mal so viele indexierte Seiten wie Fox News, so dass sie mehr Chancen haben, nach verschiedenen Dingen zu rangieren.

bild1 |

~40% des Traffics auf CNN ist Branded, etwa 32,5 Millionen monatliche organische Besuche.

 

 

 

 

 

 

bild2 |

~67% des Traffics zu Fox News ist gebranded, etwa 33 Millionen monatliche organische Besuche.

 

 

 

 

 

 

 

Andere Erklärungen für die Trafficunterschiede

Mit nur Google-Suchdaten ist es schwierig, definitiv zu bestimmen, warum liberale Websites mehr Besucher erhalten als konservative Websites. Es kann sein, dass die Konservativen dazu neigen, Google weniger zu nutzen. Es ist auch möglich, dass die Konservativen mehr Nachrichten aus dem Fernsehen, von Apps oder sozialen Medien erhalten als Google. All dies mag wahr sein, aber ohne zusätzliche Daten können diese Aussagen nicht bestätigt werden und sind lediglich Vermutungen.

Mehr Möglichkeiten, wie wir nach Voreingenommenheit hätten suchen können

Wenn wir uns konkrete Beispiele von Anfragen angesehen hätten, hätten wir sicher auch Beispiele für Verzerrungen gefunden. Das Problem bei der Verwendung einzelner Beispiele besteht darin, dass die Person, die die Analyse durchführt, von Natur aus verzerrt ist. Die Daten sind komplex, und Sie bräuchten eine gute Methode, um festzustellen, ob die Sites und Inhalte für bestimmte Abfragen relevant sind. Leider wäre dies schwierig und extrem subjektiv, weshalb wir uns entschieden haben, diesen Weg nicht weiterzuverfolgen.

Wir hätten uns auch Linkdaten oder Links von anderen Websites zu diesen Nachrichtenseiten ansehen können. Auch hier habe ich keinen Zweifel daran, dass diese Daten verzerrt sind, da die populäreren und hochrangigeren Websites mit mehr Seiten dazu neigen würden, natürlich mehr Links zu erhalten. Wir haben dies bereits in unserer Backlink-Wachstumsstudie bewiesen.

Wie viele neue Backlinks haben die Top-10-Ranking-Seiten erhalten? (Studie: 10K keywords)

Screenshot 2020 11 06 134804 |

Wir hätten uns konkrete Beispiele für Suchbegriffe ansehen können, die Google über sein Autovervollständigungssystem vorgeschlagen hat, aber wir wissen bereits, dass Google viele negative Begriffe aus diesen Ergebnissen entfernt. Auch dies ist bereits verzerrt, und es wäre schwierig, hier eine böswillige Verzerrung nachzuweisen.

Abschließende Gedanken

Alles ist von Natur aus verzerrt. Obwohl unsere Daten zeigen, dass Google Core Updates in den letzten Jahren nicht auf die eine oder andere Weise verzerrt schien, können wir noch immer nicht mit Sicherheit sagen, dass es keine Verzerrung an anderer Stelle im System von Google gibt.