Mehrere Wikipedien gleichzeitig durchsuchen?

Symbolbild PC-Nutzer mehrere Wikipedien gleichzeitg abfragen
Manche Ideen zur Recherche muss man testen – nicht alle Ideen klappen

Nur wenige Tage auseinander lagen die beiden identischen Anfragen: Kann man Recherchen starten, die gleichzeitg mehrere Wikipedien – also in unterschiedlichen Sprachen – abfragen?

Wie spannend!

Meine erste Assoziation: der Befehl “site:” (Den habe ich bisher hier noch nicht vorgestellt – das hole ich bald nach.)

Ganz kurz zu dem Befehl: Mit “site:” können Sie in einer bestimmten Quelle suchen. Das klassische Beispiel ist die Recherche in Zeitungen wie der Süddeutschen: “site:sz.de”. Wichtig bei der site:-Suche – die Topleveldomain (TLD), in diesem Falle also “.de”; ohne TLD erkennen Suchmaschinen den Befehl nicht. Und: kein Leerzeichen zwischen Doppelpunkt und dem Begriff danach!

Doch wie geht das nun mit den verschiedenen Wikipedien?

Die URL der deutschen Wikipedia ist “de.wikipedia.org”, die der englischen “en.wikipedia.org” – das können Sie nun mit allen Sprachen so fortsetzen. Mein erster Gedanke: Ich brauche eine Suche, in der die URLs der unterschiedlichen Wikipedien vorkommen. Zwingend notwendig ist, dass ich den Begriff, nach dem ich suche, in den passenden Sprachen kenne.

Hier das Ergebnis meines ersten Versuchs – ich habe gleich mehrere Suchmaschinen benutzt, da die Einstellungen zu Operaoren und Befehlen sich bei ihnen zum Teil sehr unterscheiden:

Suchmaschine Suchanfrage Ergebnis
Bing (site:en.wikipdia.org integral) OR (fr.wikipedia.org intégrale) OR (de.wikipedia.org Intergral) beliebige Ergebnisse der deutschen Wikipedia, in denen das Wort “integral” vorkommt – also nichts
DuckDuckGo (site:en.wikipdia.org integral) OR (fr.wikipedia.org intégrale) OR (de.wikipedia.org Intergral) beliebige Ergebnisse der englischen Wikipedia – also: nichts
Ecosia (site:en.wikipdia.org integral) OR (fr.wikipedia.org intégrale) OR (de.wikipedia.org Intergral) beliebige Ergebnisse der deutschen Wikipedia – also nichts
etools.ch (site:en.wikipdia.org integral) OR (fr.wikipedia.org intégrale) OR (de.wikipedia.org Intergral) beliebige Ergebnisse, teils au sder französischen Wikipedia – also nichts
Google (site:en.wikipdia.org integral) OR (fr.wikipedia.org intégrale) OR (de.wikipedia.org Intergral) nichts
Qwant (site:en.wikipdia.org integral) OR (fr.wikipedia.org intégrale) OR (de.wikipedia.org Intergral) beliebige Ergebnisse der deutschen Wikipedia – also nichts
Startpage (site:en.wikipdia.org integral) OR (fr.wikipedia.org intégrale) OR (de.wikipedia.org Intergral) nichts

Das Ergebnis “nichts” hab ich mal markiert …

Meine erste Idee war also falsch – mit “site:” war auf diesem Weg nichts zu holen. Doch es gibt ja mehrere Möglichkeiten, diesen Befehl zu nutzen. Wie sieht es ohne die Sprach-  resp. Länderkennungen aus? Zweiter Versuch  – zusätzlich mit Begriffen, die in den unterschiedlichen Sprachen auch unterschiedlich aussehen:

Suchmaschine Suchanfrage Ergebnis
Bing site:wikipedia.org (Lungenembolie OR Embolie pulmonaire OR Pulmoral embolism) recht beliebige Ergebnisse der deutschen Wikipedia, gesundheitsbezogen, “Lungenembolie” war dabei, aber auch Wilhelm II … – also nichts
DuckDuckGo site:wikipedia.org (Lungenembolie OR Embolie pulmonaire OR Pulmoral embolism) Ergebnisse aus der englischen Wikipedia v. a. zu Personen, die mal eine Lungenembolie hatten oder zu gesundheitlichen Themen, wo sie eine Rolle spielt; der Artikel mit dem Titel Pulmonary Embolism war nicht dabei; andere Wikipedien auch nicht – nichts
Ecosia site:wikipedia.org (Lungenembolie OR Embolie pulmonaire OR Pulmoral embolism) recht beliebige Ergebnisse der deutschen Wikipedia, gesundheitsbezogen, “Lungenembolie” war dabei, aber auch Wilhelm II … – also nichts
etools.ch site:wikipedia.org (Lungenembolie OR Embolie pulmonaire OR Pulmoral embolism) Unter den ersten vier Treffern die Hauptartikel zum Thema der deutschen, englischen und französischen Wikipedia, danach gemischte Ergebnisse verschiedener Wikipedien zu gesundheitlichen Themen. Quelle hier: Google.
Google site:wikipedia.org (Lungenembolie OR Embolie pulmonaire OR Pulmoral embolism) Unter den ersten vier Treffern die Hauptartikel zum Thema der deutschen, englischen und französischen Wikipedia, danach gemischte Ergebnisse verschiedener Wikipedien zu gesundheitlichen Themen
Qwant site:wikipedia.org (Lungenembolie OR Embolie pulmonaire OR Pulmoral embolism) je nach Ländereinstellung beliebige Ergebnisse der jeweiligen Wikiepdia – also nichts; zudem: Ländereinstellungen behindern Treffer aus anderen Ländern – gleichzeitige Suche in verschiedenen Wikipedien auf diesem Weg nicht gut erreichbar
Startpage site:wikipedia.org (Lungenembolie OR Embolie pulmonaire OR Pulmoral embolism) Unter den ersten fünf Treffern die Hauptartikel der deutschen, englischen und französischen Wikipedia; später dann auch die der russichen Wikipedi; sonst Treffer zu gesundheitlichen Themen, die auch Lungenembolie begünstigen

Die wichtigen Ergebnisse sind fett markiert.

So kann es gehen, mehrere Wikipedien gleichzeitig zu durchsuchen

Nutzen Sie “site:wikipedia.org” und dann in Klammern Ihre Suchbegriffe in den gesuchten Sprachen mit OR – besser mehrere als einen, außer es ist ein sehr spezieller Fachbegriff. Berücksichtigen Sie dabei, dass gerade im europäischen Sprachraum bei Fachbegriffen eine bestimmte Schreibweise zu verschiedenen Sprachen gehören kann. Je differenzierter Ihre Suchbegriffe sind, desto erfolgversprechender ist das Unternehmen. “OR” ist der Boole’sche Operator, um Synonyme usw. gleichzeitig zu berücksichtigen.

Aus den Tabellen wird sehr schön deutlich, dass in diesem Fall die Google-basierten Suchmaschinen (Google, Startpage, bei etools.ch ist Google integriert) besser funktionieren als die Bing-basierten (Bing, Ecosia).

Wie meine Studierenden mehrere Wikipedien durchsuchen …

Als es in diesem Semester im Rechercheseminar an der Uni um Befehle und Operatoren ging, habe ich meinen Studierenden diese Frage mal mit in ihre Testphase gegeben (immer wenn ich was neues vorgestellt habe, bekommen sie Zeit, das auszuprobieren). Und ein Student machte das ganz simpel:

“Recycling” – einmal auf Englisch, einmal auf Chinesisch – und dazu “Wikipedia”; nix Befehl oder Operator, einfach nur aufgereiht: Er bekam die entsprechenden Hauptartikel als erste Treffer angezeigt.

Oh, oh, – bin ich da meiner déformation proféssionelle aufgesessen? Geht es viel einfacher?

Bei europäischen Sprachen besteht bei solchen Wörtern das Problem, dass sie quasi “mehrsprachig” sind – ähnlich wie im ersten Beispiel “Integral”. Also haben wir es im Seminar mit unterschiedlicheren Wörtern versucht. Die erste Idee, “Verfassung Constitution Wikipedia” führte leider nicht weiter, da es auch in der deuschsprachigen Wikipedia eine Menge Artikel mit “Constitution” im Text gibt; wieder so ein mulitlingualer Begriff … Das ist ja die Krux: Wenn uns ein Begriff zu einem Thema einfällt, denken wir oft nicht daran, dass er in anderen Zusammenhängen auch auftauchen kann …

Leider war unsere Zeit dann rum. Also hab ich mich zu Hause noch mal dran gesetzt und mit “Farbenlehre” experimentiert:

Suchmaschine Suchanfrage Ergebnis
Bing Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia trotz “Wikipedia” erhielt ich eine Reihe von Treffern von pinterest oder aus Blogs; die Hauptartikel der deutschen und englischen Wikipedia waren aber unter den ersten vier; der Schwerpunkt der Treffer lag nicht bei Wikipedia – nicht gut. Auch “Wikipedia” brachte keine erhebliche Verbesserung
DuckDuckGo Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia hier kam als zweiter Treffer ein Wikipedia-Beitrag zu Goethes Farbenlehre aus der kabylischen Wikipedia …; ansonsten eine bunte Mischung aus Treffern – nichts
Ecosia Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia bunte Mischung aus Treffern aus allen denkbaren Quellen, auch nach der Umwandlung in “Wikipedia” – nichts
etools.ch Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia ebenfalls eine bunte Mischung, mit einem gewissena Schwerpunkt auf Wikipedia-Artikeln aus aller Welt – nicht gut
Google Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia hier war jetzt mal die französische Wikipedia recht weit vorne dabei – ansonsten die bunte Mischung – nichts
Qwant Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia die ersten drei Treffer waren englische und französische Wikipedia, danach die bunte Mischung; Ländereinstellung Deutschland; nicht gut
Startpage Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia Auch hier nur eine bunte Mischung – ohne “Wikipedia” sogar ein Nicht-Wikipedia-Artikel als erster Treffer – nichts

Die wichtigsten Punkte der Ergebnisse sind fett markiert.

Dieses Ergebnis hat mein Selbstbewusstsein wieder aufgebaut 😉 Doch auch hier: Ein Denkfehler (meinerseits …): Gebe ich alle Begriffe für Farbenlehre in den verschiedenen Sprachen einfach nebeneinander ein, suchen die Suchmaschinen – da die Grundeinstellung AND lautet – nach Seiten, die alle diese Begriffe enthalten. Es muss also doch ein Operator her, nämlich OR. Mein letzter Versuch:

Suchmaschine Suchanfrage Ergebnis
Bing Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia Beliebige Sieten – also nichts
DuckDuckGo Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia Beliebige Sieten – also nichts
Ecosia Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia Beliebige Sieten – also nichts
e-tools.ch Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia Andere Quellen als Google vorn – nichts
Google Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia Wechselnd englische und deutsche Wikipedia-Seiten zu Farbenlehre resp. Einzelakspekten. Die portugiesische Seite kommt an 8. Stelle – alles gefunden.
Qwant Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia ein Treffer zu Goethe recht weit oben, sonst nichts
Startpage Farbenlehre OR “Teoria das cores” OR “theory of colours” Wikipedia Hier kommt die portugiesische Seite früher – noch besser als Google, da Thema genauer berücksichtigt (weniger Einzelaspekte).

Wikipedia als Suchbegriff reicht nicht aus; auch in Anführungzeichen gesetzt, um den Begriff zu erzwingen – analog zur Phrasensuche -, kam dabei nichts Gescheites raus. Der Wechsel hin zum Operator OR hat bei den Goolge-basierten Suchmaschinen (Google und Startpage) was gebracht – hier geht es also. E-tools.ch hat bei diesem Versuch aber enttäuscht, auch wenn dort  bei mir Google als “normal” gewichtet ist.

Der Befehl “site:” hat also seine Berechtigung, wenn man mehrere Wikipedien gleichzeitig durchsuchen will. Ansonsten wirkt das Wort nur als normaler Suchbegriff und es reicht, wenn in einem Text auf Wikipedia hingewiesen wird. Der erfolgreiche Treffer des Studenten war wohl auf den großen Sprachunterschied zwischen Englisch und Chinesisch zurückzuführen. Außerdem habe ich nicht nachgeprüft, bzw. gefragt, ob auch bei der chinesischen Seite das Wort Recycling als englischer Begriff vorkam.

Einfach nur site:wwikipedia.org und ein Begriff kann helfen, um Personennamen in verschiedenen Wikipedien aufzufinden: “site:wikipedia.org Charlie Chaplin – da bekommen Sie eine Fülle an Treffern:

  • zur Person in verschiedenen Sprachen
  • zu einzelnen Filmen; welche Sprach- Versionen das sind, hängt von den Einstellungen der Suchmaschine ab

Fazit:

Wenn Sie mehrere Wikipedien durchsuchen wollen, nutzen Sie site: und dann eine sinnvolle mehrsprachige Kombination Ihrer Suchbegriffe.

Je nach Komplexität Ihrer Anfrage, können Sie Klammern setzen und die Suchbegriffe darin mit OR voneinander scheiden; die reine Aufzählung von Suchbegriffen – quasi die Nutzung des Operators AND – fordert ja, dass alle Suchbegriffe in den Treffern enthalten sind. Damit sind manche Treffer per se ausgeschlossen, wenn nur einer der Begriffe vorkommt.

Um mehrteilige Suchbegriffe zu nutzen, setzen Sie Anführungszeichen.

Die Google-basierten Suchmaschinen haben insgesamt bessser abgeschnitten. Wenn Sie datenschutzmäßig auf der sichereren Seite sein wollen, nehmen Sie Startpage.

Meine Testrecherchen basieren natürllich auf meinen Einstellungen für die Suchmaschinen und begrenzt auch auf dem, was sonst auf meinem Rechner so passiert.  Wenn Sie also selber Erfahrungen mit der Recherche in mehreren Wikipedien haben, freue ich mich auf Ihre Kommentare!

2 comments on “Mehrere Wikipedien gleichzeitig durchsuchen?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Ich akzeptiere