Literaturrecherche mit Google Scholar – die Fallen

In meinem ersten Beitrag über Google Scholar habe ich ja bereits auf ein paar Haken hingewiesen; z. B. die Bezahlschranke, wenn ein PDF in der rechten Spalte als Option auftaucht, das aber nur beim Verlag gekauft werden kann. Heute möchte ich weitere Haken aufzeigen.

Google Scholar ist eine Suchmaschine

Auch solch eine Spezialsuchmaschine wie diese hier, ist und bleibt genau das: eine Suchmaschine. Trotz der zugekauften Informationen. Und das heißt:

  1. es gibt keine gesicherte Datengrundlage
  2. Relevanz ist abhängig von Klicks

1.1. Datengrundlage

Wie jede andere Suchmaschine auch, crawlt Google Scholar durchs WWW und liest Seiten aus. Die haben zwar einen Spezialfilter (für Hochschulen und Bildungseinrichtungen, für bestimmte Formate in Texten wie Abstract oder Literaturverzeichnis), aber es gibt keine verlässliche Grundlage, was damit alles abgedeckt ist.

Zudem finden Sie auf Uni-Seiten zwar Publikationen, doch es sind keine Kataloge oder Datenbanken – es handelt sich immer um eine Auswahl.

Inde rZusammenarbeit mit den Verlagen bleibt einiges unkler:

  • Welche Verlage sind überhaupt dabei?
  • Werden alle Zeitschriften des Verlags berücksichtigt?
  • Wenn nicht – welche Kriterien bestimmen die Auswahl?

Deshalb eignet sich Google Scholar sehr gut, um sich einen ersten Überblick zu verschaffen, erste Namen zu finden usw. Als Grundlage für eine umfassende Literaturrecherche ist Google Scholar jedoch zu unsicher. Vergleichen Sie diese Ausgangssituation mit der in einer Bibliothek oder Datenbank:

1.1. Bibliothekskatalog oder Datenbank versus Google Scholar

Bibliotheken und Datenbanken erfassen die Datensätze von Publikationen systematisch. Dazu gehört:

  • Einordnung bestimmter Informationen nach Kategorien (Autor, Titel usw., aber auch Schlagwörter und übergeordnete Titel , z. B. in Reihen)
  • Regeln für die Erfassung, so dass Datensätze vergleichbar sind
  • Erfassung aller Titel, die der Datenbank/dem Katalog verfügbar sind
  • bei Bibliotheken: Anschaffungsregeln, die den Bestand systematisch aufbauen
  • bei Datenbanken: Thematische Erfassung eines Bereichs, ebenfalls regelbasiert und umfassend
  • es gibt Verantwortliche

Wenn Sie das mit der Beschreibung von Google Scholar vergleichen, sehen Sie bereits die Unterschiede: Die verbindlichen Aspekte fehlen bei der Suchmaschine. Für eine gesicherte Literaturgrundlage müssen Sie aber die Gewähr haben, alles wirklich Relevante auch finden zu können. Da bleibt Ihnen nichts anderes übrig, als genau zu schauen, welche Datenbanken und Kataloge Ihrer Suchanfrage am besten entsprechen. Sie brauchen grundsätzlich mehr als eine Recherchequelle 😉

Bibliotheken und Datenbanken gehören zum so genannten „Deep Web„. Dessen Inhalte sind von Suchmaschinen – und somit auch von Google Scholar – nicht durchsuchbar. Passwort- oder logingeschützt verbergen sich hier Datensätze unterschiedlichster Art (z. B. die metereologischen Daten weltweit, die für die Wettermodelle genutzt werden). Die Datensätze von Katalogen und Datenbanken findet Google Scholar also nicht.

2. Quantität = Qualität bei Google Scholar

Screenshot "Relevanz" als Filter bei Google Scolar
Eine Filteroption bei Google Scholar: Relevanz

„Relevanz“ ist ein Vertrauen erweckendes Wort, nicht wahr? Google Scholar arbeitet auch damit.

Sie finden es als Filteroption in der linken Seitenleiste. Doch was heißt das?

Wie bei Google selbst bedeutet Relevanz bei Google Scholar auch:
Wie oft wurde ein angezeigter Treffer angeklickt und wie lange blieben die Leute dort? Wenn etwas oft geklickt wird und lange Verweildauer registriert werden kann, handelt es sich um einen relevanten Treffer. Sagen Suchmaschinen (nicht nur Google). Diese Daten gehören zu den Grundlagen der Algorithmen, die die Trefferliste sortieren. (und ja: Auch hier gibt es noch weitere Kriterien – aber diese hier gehören zu den Basics.)

Deshalb landen z. B. Wikipedia-Treffer immer so weit oben. Wir alle schauen gern „mal eben“ in der Wikipedia was nach. Der Traffic dort ist enorm Und dann setzt ein sich selbst verstärkender Prozess ein: Weil die Ergebnisse so weit oben landen, gelten sie als relevant, werden noch häufiger geklickt und landen weiter oben, weshalb sie als relevant …

Sie verstehen.

Screenshot Google Scholar Zeitfilter als Option
Publikationszeiträume bei Google Scholar mit Zeitfilter festlegen

So funktioniert auch Google Scholar. Und das macht Probleme, wenn Sie aktuelle Literatur finden wollen. „Einfach so“ bekommen Sie die nämlich nicht. Die Klickzahlen älterer Titel sind „von Natur aus“ höher als die jüngerer Publikationen. Wenn Sie nicht die absolut passenden Suchbegriffe für Ihr Thema haben oder diese so global sind, dass sie ständig genutzt werden, bekommen Sie immer die älteren Titel in der Trefferlliste nach oben gespült.

Für die aktuellen Treffer müssen Sie den Zeitfilter setzen. Aber stellen Sie sich mal vor, Sie wollen zu einem sehr aktuellen Thema recherchieren, wo gerade sehr sehr viel publiziert wird. Mit dem eingebauten Zeitfilter können Sie nur nach Jahren filtern – das kann zu grob sein.

Wenn Sie sich den oberen der Screenshots anschauen, gibt es auch die Option „nach Datum“ zu sortieren. Dann kommen die aktuellsten Publikationen nach oben. Wenn Ihre Suchbegriffe sehr präzise sind, ist auch das eine Option. Sie müssen nur daran denken, den Filter „umzuschalten“. Denn als Grundeinstellung haben Sie „Relevanz“ …

Fazit

Google Scholar ist eine schnelle Quelle für den ersten Überblick. Doch als einzige Grundlage für Ihre Literaturrecherche kann ich sie Ihnen nicht empfehlen. Wie überhaupt „die eine“ Quelle in den Bereich der Märchen gehört. Sie brauchen immer mehrere Suchorte, um Ihr Thema gründlich bearbeiten zu können.

Die Datenbasis bei Google Scholar ist unsicher und unbekannt.

Das Kriterium „Relevanz“ ist suchmaschinentypisch von der Anzahl der Klicks auf bestimmte Treffer und der Verweildauer abhängig – das heißt: Quantität steht für Qualität.

Inzwischen sind in meiner Reihe rund um Google-Angebote folgende Beiträge erschinen:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.