Google Scholar, eine der größten Suchmaschinen für wissenschaftliche Publikationen, macht Dokumente, die nicht auf Englisch sind, quasi unsichtbar. Zu diesem Ergebnis kommt eine spanische Studie. Demnach erscheinen „ausländische“ Artikel im Google Ranking oft jenseits von Platz 900 – obwohl sie um ein Vielfaches öfter zitiert wurden als entsprechende englische Artikel.

Die Sichtbarkeit von wissenschaftlichen Artikeln Beiträgen hängt stark davon ab, ob und wie Nutzer sie in akademischen Suchmaschinen, insbesondere in Google Scholar, finden. Um die Sichtbarkeit zu verbessern, werden Publikationen und Artikel anhand bestimmter Kriterien optimiert, sogenannte akademische Suchmaschinenoptimierung (ASEO). Das soll sicherstellen, dass sie in den Suchergebnisseiten besser, sprich weiter oben, erschienen.

Forscher der Abteilung für Kommunikation an der Universitat Pompeu Fabra Barcelona (UPF) haben nun herausgefunden, dass auch die Sprache des Dokuments eine entscheidende Rolle spielt. Die Autoren Cristòfol Rovira, Lluís Codina und Carlos Lopezosa kommen zu dem Schluss, dass Google Scholar „die große Mehrheit der Dokumente in anderen Sprachen als Englisch auf Positionen verweist, die sie praktisch unsichtbar machen“. Die Ergebnisse ihrer Studie veröffentlichten sie – auf Englisch – in der Fachzeitschrift „Future Internet“.

Qualitativ hochwertige Artikel praktisch unsichtbar

Das Prinzip der Suchmaschinenoptimierung bestimmt nicht nur maßgeblich, was Forscher sehen, sondern auch, was Sie bei der alltäglichen Suche im Internet sehen. Um betrügerischen Praktiken vorzubeugen, erklärt Google diesen Algorithmus jedoch nicht.

Für die Studie griffen die Autoren daher auf eine statistische Analyse zurück. Sie führten drei verschiedene Arten von Suchen durch: nach Autor, nach Jahr und nach Stichwort. 45 Stichproben ergaben dabei jeweils 1.000 Ergebnisse mit insgesamt 45.000 Dokumenten. Basierend auf dem Wissen, welche Merkmale akademische Dokumente bereits aufweisen und wo sie in den Suchergebnissen erschienen, konnten die Forscher einen Einblick in die Google-Platzierung erhalten.

Die Ergebnisse zeigen, dass bei einer Suche auf Google Scholar mit Ergebnissen in verschiedenen Sprachen die überwiegende Mehrheit – etwa 90 Prozent – der Dokumente in anderen Sprachen als Englisch systematisch auf Positionen verwiesen wird, die sie praktisch unsichtbar machen.

Obwohl es sich dabei um qualitativ hochwertige Artikel mit Hunderten Zitationen handelt, platziert Google diese „fast immer auf Positionen jenseits von Rangposition 900“, so die Forscher. Es kann also festgestellt werden, dass Google Scholar bei Suchen mit mehrsprachigen Ergebnissen Dokumente diskriminiert, die nicht auf Englisch verfasst sind.

„Bemerkenswerter Vorteil“ englische Sprache

Ein mangelndes Bewusstsein für diesen Faktor könnte sich für Forscher aus der ganzen nicht-englischsprachigen Welt nachteilig auswirken. Ein Blick auf die ersten zehn oder 20 Seiten von Google könne glauben machen, dass es keine Literatur in ihrer Landessprache gibt. Auch dann nicht, wenn Forscher die Suchoptionen auf mehrsprachige Ergebnissen umstellen.

„Dies ist vor allem bei den häufigsten Suchanfragen der Fall. Insbesondere bei der Suche nach Jahren. Es kann aber auch bei Suchen mit bestimmten Schlüsselwörtern auftreten, die in allen Sprachen der Welt gleich sind. Darunter fallen Marken, chemische Verbindungen, Industrieprodukte, Akronyme, Medikamente und Krankheiten. Wobei COVID-19 das jüngste Beispiel ist“, erklären die Studienautoren.

Und sie fügen hinzu: „Wenn wir die Ergebnisse dieser Studie aus der Perspektive von ASEO betrachten, ist es außerdem mehr als offensichtlich, dass, bis diese Verzerrung angegangen wird, die Chancen, in einer mehrsprachigen Google Scholar-Suche gerankt zu werden, bemerkenswert steigen, wenn die Forscher sich für eine Veröffentlichung auf Englisch entscheiden.“

Grafische Auswertung zeigt Vorurteile (und Ausreißer)

Im folgenden Diagramm fassen die Forscher die Forschungsergebnisse zusammen. Es gibt 45.000 Punkte, einen pro gefundenem Dokument. Die grauen Punkte repräsentieren englischsprachige Dokumente. Rote Punkte stehen für andere Sprachen. Blau zeigt die Medianpositionen der Ergebnisse.

Die rote Wolke auf der rechten Seite zeigt, wie Artikel, die in anderen Sprachen als Englisch geschrieben sind, ab der 900. Position im Google Scholar-Ranking (x-Achse) erscheinen. Dies ist selbst bei qualitativ hochwertigen Dokumenten der Fall, die bereits Hunderte oder Tausende Male zitiert wurden und im Wissenschaftsranking für die Anzahl der Zitationen (y-Achse) gut platziert sind.

Interessanterweise gibt es auch einige Ausreißer, die trotz nicht-englischer Sprache und mittelmäßiger wissenschaftlicher Relevanz sehr weit vorne im Google-Ranking erscheinen. Besonders markant sind dabei zwei Fälle, die im Wissenschaftsranking um 315 beziehungsweise 360 liegen aber in den ersten zehn Plätzen auf Google erscheinen.

Die auffälligsten Fälle sind jedoch die roten Punkte, die sich in der unteren rechten Ecke häufen. Sie entsprechen nicht-englischen Dokumenten, die unabhängig von ihrer wissenschaftlichen Relevanz mit jeweils über 1.000 Zitationen jenseits des 900. Platzes erscheinen. In Google Scholar erscheinen sie an denselben Positionen wie englischsprachige Dokumente, die nur ein paar Dutzend Mal zitiert werden.

(Mit Material der Universitat Pompeu Fabra Barcelona)

