(Textauszüge aus dem PC-Professional 11/2003)

Professionelle Google Suche

Mit dem richtigen Know How und der Google-API lassen sich Suchanfragen an Google effizienter abwickeln. Auch wer keinen eigenen Webserver betreibt, kann von der Google-API profitieren. PCpro zeigt verschiedene Tipps und Tricks zur Optimierung der Suchanfragen und gibt einen Überblick, wie sich die Google-API nutzen lässt.

Günter Born

Mit über 2,4 Mrd. indizierten Webseiten Google und einem einfachen Benutzerinface ist Google der meistbesuchte Suchdienst im Internet. Es gibt kaum einen Websurfer, der noch nicht die Seite www.google.de aufgerufen und Suchanfragen über das angezeigte Formular abgesetzt hat. Allerdings schöpfen viele Benutzer nur einen Bruchteil der Möglichkeiten von Google aus. Dies führt zu unnötigem Zeitaufwand, da Anfragen sehr viele Treffer oder keine relevanten Ergebnisse liefern. Bereits mit wenig Know How lässt sich die Effizienz der Google-Suche eminent steigern. Wer sich gar eigene Suchformulare erstellt, dem steht eine gänzlich neue Google-Welt zur Verfügung.

Wie sag ich's meinem Google

Wie werden eigentlich Suchanfragen formuliert? Üblicherweise gibt der Benutzer einfach die relevanten Suchbegriffe im Google-Suchformular ein. Google verknüpft die einzelnen Suchbegriffe über AND, d.h., nur Webseiten, in denen alle Begriffe vorkommen, werden im Ergebnis aufgelistet. Die Suche nach dem Begriff »Google API« sollte also alle relevanten Webseiten als Ergebnis liefern.

Was logisch klingt, muss aber nicht immer auf schnellstem Wege zum Ziel führen. Google liefert zwar die Seiten, in denen die Suchbegriffe auftreten. Ob die relevanten Seiten aber am Anfang der Trefferliste stehen, hängt von der Reihenfolge der Suchbegriffe ab. Eine zweite Anfrage mit den Suchbegriffen »API Google« fördert erstaunliches zutage. Google sortiert die Trefferliste nach gänzlich anderen Kriterien.

Die Ursache liegt an der Art, wie Google Treffer bewertet. Kommt ein Begriff wie "Google API" in einer Seite vor, wird dieser in der Trefferliste höher bewertet als eine Kombination von Einzelworten, die über eine Seite verstreut sind. Liefert eine Abfrage nicht die gewünschte Resultate, sollte man gelegentlich die Reihenfolge der Suchbegriffe variieren. Dies lässt sich bei der Suche nach Begriffen gezielt nutzen, indem diese Begriffe in Anführungszeichen gesetzt werden. Die Suche nach »Günter Born« liefert fast 30.000 Einträge, während der Suchbegriff "Günter Born" die Trefferquote um den Faktor 10 auf ca. 2.500 Seiten reduziert.

Suchmaschinen-Spammer ausgetrickst!

Mittlerweile hat sich eine regelrechte Mafia gebildet, die Webseiten mit populären Stichwörtern spickt und Suchmaschinen mit allerlei Tricks in die Irre zu führt. Ziel ist es, bei möglichst vielen Suchanfragen im vorderen Teil der Ergebnisliste zu erscheinen. Bei Google lässt sich ein undokumentiertes Feature nutzen, um die Gewichtung des Page-Ranking bei der Anfrage zu beeinflussen: Geben Sie einfach den Suchbegriff mehrfach ein. Am Beispiel des Suchbegriffs Internet offenbart sich erstaunliches. Eine einfache Anfrage nach Internet liefert unter Google meist als ersten Link einen Verweis zu Microsoft. Wird dagegen als Suchbegriff »Internet Internet« eingegeben, reduziert dies die Trefferzahl von 150 Millionen Seiten auf gut 10 Millionen. Zudem taucht dann Yahoo am Anfang der Trefferliste auf.

weiterer Text: siehe Original-Artikel in PC-Professionell

Google für die eigene Homepage

Bei umfangreicheren Webpräsenzen ist es hilfreich, den Benutzern eine Suchfunktion über die eigenen Webseiten anzubieten. Viele Provider bieten hierzu interne Funktionen an. Wer lieber auf Google zurückgreift, kann dies mit wenigen HTML-Anweisungen tun. Google bietet unter http://www.google.de/intl/de/searchcode.html einen Ausschnitt aus dem benötigten HTML-Code. Dieser Code lässt sich mit ein paar Handgriffen so anpassen, dass die Suche auf die eigene Webpräsenz begrenzt wird. Das nachfolgende Codefragment enthält die relevanten Befehle, um ein Suchformular zu gestalten (das im Bild gezeigte Logo und die Überschrift wurden hier weggelassen).

<form action="http://www.google.de/search"    
  method="GET">

 <input type="hidden" name="hl" value="de">   
 <input type="hidden" name="as_sitesearch"    
    value="borncity.de">
 <input type="text" size="60" maxlength="255"
    name="q">
 <input type="submit" name="btnG"
   value="Suchen">
</form>

Die HTML-Anweisungen definieren ein einfaches Formular mit einem Textfeld und einer Schaltfläche Suchen. Über die Get-Methode des Form-Tags wird der Inhalt der Input-Felder an www.google.de/search übertragen. Auf der betreffenden URL sorgt dann ein Skript dafür, dass der im Textfeld q hinterlegte Suchbegriff als Anfrage bearbeitet wird. Der Pfiff an obigem HTML-Codeausschnitt steckt in den beiden als hidden bezeichneten Input-Tags. Der erste Tag definiert den Namen h1 und den Wert de, wodurch Google die Ergebnisse in deutscher Sprache zurückliefert. Der zweite Input-Tag begrenzt legt unter dem Namen as_sitesearch den Suchbereich auf borncity.de fest. Da beide Tags als hidden klassifiziert sind, erscheinen sie nicht im Eingabeformular.

In Konsequenz bedeutet dies, dass der Benutzer ein normales Google-Formular zur Eingabe der Suchanfrage vorfindet. Die Anfrage wird jedoch auf die Seiten der angegebenen Domain reduziert und in der gleichen Webseite ausgegeben. Das Beispiel für obiges Suchformular findet sich als SearchMySite.htm im Downloadbereich.

weiterer Text: siehe Original-Artikel in PC-Professionell

Suchen & Speichern mit Google

Wer die Ergebnisse einer Suchabfrage sichern möchte, ist bisher auf die Speicherfunktion des Browsers angewiesen. Diese hinterlegt aber die gesamte Ergebnisseite. Besser wäre es, nur die Liste der Suchergebnisse in einer Datei zu speichern. Die Anwendung Google Search & Store bietet ein Feld zur Eingabe eines Suchtexts und erlaubt die Suche im Web oder in Nachrichtengruppen. Über das Kontrollkästchen Googleseite anzeigen lässt sich die Originalseite mit den ersten 100 Suchergebnissen in einem Browserfenster abrufen. Dies erlaubt dem Benutzer die Abfrage im Browserfenster zu verfeinern oder weitere Suchergebnisse über die Hyperlinks am Seitenende abzurufen. Erst wenn das im Vordergrund eingeblendete Dialogfeld Google Search & Store über die OK-Schaltfläche geschlossen wird, sichert das Programm die Ergebnisliste in einer lokalen Datei und schließt dann das Browserfenster. Die Optionen im unteren Teil des Fensters erlauben Dateiname und Pfad vorzugeben sowie die Anzeige der Ergebnisdatei im Internet Explorer oder im Windows-Editor Notepad.

Das Ganze wurde mit wenigen VBScript-Anweisungen und etwas HTML-Code erzeugt. Da die HTML-Datei in SearchAndSave.hta, führt der Browser diese als HTML-Anwendung (wird ab IE 5 unterstützt) im lokalen Sicherheitskontext aus. Dadurch unterbleiben Sicherheitswarnungen wegen der erforderlichen Dateizugriffe.

weiterer Text: siehe Original-Artikel in PC-Professionell

Das Tool ist im Downloadbereich unter SearchAndSave.hta zu finden.

Tolle Sache, das Google API

Seit 2002 stellt Google registrierten Entwicklern eine eigene API zum Zugriff auf Teile des Datenbestands bereit. FAQs, ein Developer's Kit und weitere Informationen finden sich unter www.google.com/apis. Dort lässt sich auch ein kostenloser Account beantragen, der für Zugriffe auf die Google-API erforderlich ist. Das Google API befindet sich zur Zeit noch in der Beta-Phase und begrenzt die Zahl der Abfragen auf 1.000 pro Nutzer und Tag. Zudem empfiehlt sich ein aufmerksames Studium der restriktiven Nutzungs­bedingungen, da Verstöße gegen die Terms of Service (TOS) u.U. mit einem Ausschluss von Google Leistungen geahndet werden.

Das Google API ist als Webservice implementiert und wird über SOAP (Simple Object Access Protocol) angesprochen. SOAP verpackt die Anfrage in eine XML-Struktur und verschickt das Ganze an den Google-Server. Die vom Server zurückgelieferte XML-Struktur wird von SOAP angenommen und lässt sich auf dem Client auswerten. SOAP ermöglicht Google-Anfragen auch ohne Browser zu stellen. Sofern eine entsprechende SOAP-Unterstützung vorhanden ist, kann die Google API aus Perl, Phyton, PHP, JAVA, C# oder VB.NET angesprochen werden.

Selbst im Windows Script Host besteht die Möglichkeit, mit einigen Zeilen VBScript- oder JScript-Code, auf das Google API aufzusetzen.

weiterer Text: siehe Original-Artikel in PC-Professionell

Im Download-Bereich finden Sie Beispiele im WSH, in C# und VB.NET.

Lesefutter für Google Hacker

Für eine intensivere Beschäftigung mit der Materie sei auf das Buch »Google Hacks« verwiesen. In 8 Kapiteln haben die Herausgeber interessante und nützliche Tipps, Tricks sowie Hacks rund um Google zusammengetragen. Dies reicht von Hinweisen zur Google Oberfläche über die Google-Toolbar bis hin zu Tools von Drittherstellern zum Zugriff auf Webseiten. In zwei Kapiteln widmen sich der Google API, wobei ausgiebige Perl-Beispiele disktuiert werden - interessant für alle, die aus eigenen Webseiten auf die Google API zugreifen möchten und entsprechende Server­erweiterungen installieren können. Wer lieber in PHP, Pyton oder Java programmiert, wird ebenfalls bedient. Auch zwei Beispiele in C# sowie Visual Basic .NET finden sich im Buch. Wer sich also intensiver mit Google oder der API befassen möchte, findet in diesem Buch genügend Lesestoff.

Google Hacks, Tara Calishain, Rael Dornfest, O'Reilly, ISBN 3-89721-362-1, 320 Seiten, 28,- €

(c) by Günter Born & PC Professional Ausgabe 10/2003