PHP-Skript – DGS-Search
Eigener Suchroboter auf der Site

Office-AnwendungenSoftware

Einen Suchroboter kann man sich auch via Skript auf seinem eigenen Webserver installieren. Das folgende Beispiel erläutert die Implementierung des PHP-Skripts DGS-Search.

Skript DGS-Search ___

Das hier vorgestellte Skript DGS-Search basiert auf PHP und durchsucht nicht nur die HTML-Bereiche eines Servers, sondern durchforstet auf Wunsch auch die Inhalte von Datenbanken ? im Zeitalter dynamischer Webseiten ein unschätzbarer Vorteil. Das Skript ist Open Source und kann vom FTP-Server des Entwicklers Digital Genesis (www.digitalgenesis.com) geladen werden. Angesichts der Funktionsvielfalt ist der Konfigurationsaufwand bei DGS-Search natürlich um einiges höher als bei einer ASP-Lösung. Nach dem Entpacken des Skript-Archivs müssen Sie sich als Erstes mit einem geeigneten Editor das Skript config.php vornehmen. Es befindet sich in dem Unterverzeichnis config und enthält zahlreiche Parameter, über die sich DGS-Search individuell anpassen lässt. Zur besseren Übersichtlichkeit trägt die Einteilung in die Rubriken General Options, Filesystem Options, Database Options und Constants bei. Einige Parameter müssen angepasst werden, damit das Skript überhaupt lauffähig ist. Dazu gehört die Zeile

$config[‘installBase’]

in der Sie den Installationspfad des Skripts eingeben. Bei Shared-Hosting-Paketen, wie sie von 1&1, Strato und Co. angeboten werden, können Sie den absoluten Pfad über das PHPMiniskript

?php echo $DOCUMENT_ROOT; ?>

oder über die Service-Seiten des Providers herausfinden. Sinnvoll ist es auch, gleich die passende Sprachvariante in der Zeile

$config[‘language’]

einzubinden. Zur Auswahl stehen im Verzeichnis /libs/language/ ein englisches, deutsches und spanisches Sprachfile. Auch die Datumsanzeige sollten Sie aus Gründen der Optik über den Parameter

$config[‘dateFormat’]

von der amerikanischen in die mitteleuropäische Schreibweise konvertieren. Wichtig sind auch die ersten drei Zeilen im Abschnitt Filesystem Options der Konfigurationsdatei. Hier geben Sie in der ersten Zeile den URL Ihrer Site ein und in der zweiten deren absolute Adresse. Über die absolute Adresse in der dritten Zeile legen Sie fest, in welchem Verzeichnis der PHP-Suchroboter seine Aktivitäten entfalten soll. Damit lassen sich auch Teilindizierungen realisieren. Die übrigen Parameter sind optional und müssen für einen ersten Test nicht unbedingt angepasst werden. Übertragen Sie für einen Test das lokale Verzeichnis (voreingestellt: dgssearch) mit der angepassten config.php auf den Server. Die Verzeichnisstruktur muss dabei erhalten bleiben. Starten Sie dann das Skript über den Aufruf der Seite index.php im dgssearch-Verzeichnis. Der erste Eindruck unterscheidet sich nicht sehr von dem, was man von anderen Suchmaschinen gewohnt ist. In einem Eingabefeld kann der Anwender seinen Suchstring eingeben und mit paseinem Klick auf den Suchen-Button die Recherche starten. Über ein Pulldown-Menü kann er zudem die maximale Anzahl der Treffer festlegen, die angezeigt werden sollen. Einen Schönheitsfehler hat das Skript: Logische Verknüpfungen von mehreren Suchbegriffen sind nicht möglich.

Suche in Datenbanken
Dafür entschädigt DGS-Search an anderer Stelle. Es lassen sich nämlich nicht nur statische HTMLSeiten durchforsten, sondern auch die Inhalte von Datenbanken. Allerdings ist die Aktivierung dieser Option nicht ganz so trivial wie die Einrichtung der Basis-Suchfunktionen. Zuerst sollten Sie dazu wieder die Datei config.php aufrufen und die Parameter in der Rubrik Database Options anpassen.Wichtig sind vor allem die ersten sechs Zeilen, in denen Datenbanktyp, Server, Port, Zugangskennung, Passwort und Datenbankname definiert werden. Weiterhin sind die Tabellen und Felder anzugeben, die DGS-Search bei seiner Suche berücksichtigen soll. Es geht also nicht ohne genaue Kenntnis der Datenbankstruktur. Der dickste Brocken ist jedoch, dass für diese Datenbank-Recherche erst noch ein Ausgabe-Skript geschrieben werden muss. Dieses wird aktiviert, wenn der Benutzer den Link in der Trefferanzeige anklickt. Es ist klar, dass man dafür zum einen Programmierkenntnisse in PHP haben muss und außerdem genaue Informationen über den Aufbau der Datenbank, die durchsucht werden soll. Ohne ein passendes Datenbank-Administrations-Tool kommt man an diese Informationen nur schwer heran. Hilfreich für Programmierer sind auch die Erklärungen und Tipps zu den einzelnen Parametern, die man in der Datei install im dgssearch- Verzeichnis findet. Auf Wunsch können die gefunden Seiten über den Altavista-Service auch übersetzt werden. Komfort mit PHP: Das PHP-Skript durchsucht nicht nur statische Webseiten, sondern auch Datenbanken.

Autor: swasi
Anklicken um die Biografie des Autors zu lesen  Anklicken um die Biografie des Autors zu verbergen