Einleitung

Die phpMySearch Suchmaschine ist eine vollständige Internet-Suchsystem für eine einzelne Domain sowie das Intranet. Die Suchmaschine ersetzt aufkeinen Fall eine Leistungsstarke Suchmaschine wie Lycos, Infoseek, Webcrawler oder AltaVista. Sie soll lediglich dazu dienen einzelne Webseiten, Unterabteilungen oder spezielle Abteilungen zu durchsuchen.

 
System Voraussetznungen

Unix or Windows 95/98/NT als Betriebssystem

PHP 4.0.2 oder höher

MySQL 3.23.32 oder höher

CURL 7.0.2 oder höher  (sollte in der php.ini aktiviert werden)

 

 
Installation
  1. Entpacke die heruntergeladene Datei in einen Ordner, der für sinnvoll erscheint.
  2. Editiere die Datei DataBaseSettings.inc.php und ändere folgende Varibalen:

·         $DBName        Name der MySQL-Datenbank, welche phpMySearch verwenden darf

·         $DBUser          MySQL username

·         $DBPassword      MySQL password

·         $DBHost           MySQL server 

ACHTUNG Alle Tabellen werden automatisch angelegt.

 

 

Installation von CURL und CURL Unterstützung in php [Unix]

Lade aktuelle Version von CURL hier herunter http://curl.haxx.se/download.html

Akt. Version ist hier: http://curl.haxx.se/download/curl-7.8.tar.gz

 

Entpacke mit:

gunzip curl-7.x.tar.gz

tar xvf curl-7.x.tar.gz

 

ACHTUNG In der aktuellen Verision müssen einpaar Fehler korrigiert werden:

 

In der Datei lib/Makefile.am , muss das korrigiert werden:

Line #2

# $Id: Makefile.am,v 1.22 2001/05/29 19:17:03 bagder Exp $

 

änder mit:

# $Id: Makefile.am,v 1.22 2001/06/11 12:30:57  bagder Exp $

Line #19

libcurl_la_LDFLAGS = -version-info 2:0:1

change with

libcurl_la_LDFLAGS = -version-info 2:1:0

 

CURL installieren mit:

./configure

make

make install

 

Kompiliere CURL Unterstützung in PHP.

 

Gehe zum  PHP-sources Ordner und :

./configure --with-apxs --with-curl

make

make install

 

Lege einen Link  in /usr/lib an, nach libcurl.so.1

 

ln  -s /usr/local/lib/libcurl.so.1 /usr/lib/libcurl.so.1

 

 

Bei der 1. Installation von PHP – kompiliere Apache mit PHP als DSO-Modul:

cd ../apache_1.3.x

 ./configure --activate-module=src/modules/php4/libphp4.a

make

make install

 

Installiere PHP als CGI/Commandline somit kann PHP Kommandos von der Shell ausführen.

cd ../php-x.x.x

./configure --with-curl

make

make install

 

PHP wird dennoch als Modul installiert.

 

 

CURL Unterstützung in PHP [Win32]

Deaktiviere folgende Linie in der php.ini:

;extension=php_curl.dll

 

Suche folgende Dateien und kopiere sie in das Systemverzeichnis:

php4ts.dll,SSLEAY32.dll,php_curl.dll,MSVCRT.dll, libeay32.dll

and copy them to Windows\System

 

 

 

Administrations Oberfläche

Führe die Datei admin.php aus.

 

Standard Login und Passwort ist:

login:                admin

password:             admin

 

UNBEDINGT ÄNDERN!

 

 

Table 1-1: Felder und Optionen auf der Administrator Seite

Feld oder Option

Beschreibung

DB Main table name

In dieser Tabelle werden alle Informationen von den gespeicherten Webseiten gesammelt. Der Standardname ist _Pages

DB Settings table name

In dieser Tabelle werden alle Einstellungen der Suchmaschine gespeichert. Der Standardname ist settings

DB Spider state table name

In dieser Tabelle werden alle Einstellungen gespeichert die den Spider betreffen. Der Standardname ist spider

Search start URL's:

Die Liste der Webseiten die durchsucht werden sollen.

Um Webseiten hinzuzufügen, schreibe die Webseite in das Feld und drücke anschließend den ADD Button. Um eine Webseiten zu entfernen markiere die Webseiten und drücke den REMOVE Button.

Not indexed URL's (Black list)

Trage hier alle Webseiten ein die nicht gespeichert werden sollen. Um Webseiten hinzuzufügen, schreibe die Webseite in das Feld und drücke anschließend den ADD Button. Um eine Webseiten zu entfernen markiere die Webseiten und drücke den REMOVE Button.

Document extensions to index

Eine Liste der Dokumente die gespeichert werden sollen

Um neue Dokumententypen hinzuzufügen, schreibe den Typ in das Feld und drücke anschließend den ADD Button. Um Dokumententypen zu entfernen markiere die Webseiten und drücke den REMOVE Button.

Search depth

Die Suchtiefe teilt dem Spider mit, wie weit er Verzweigungen zu anderen Webseiten verfolgen soll.

 

0 – keine Verzweigungen verfolgen

1 – folge den Verzweigungen nur von der Startseite

2 – folge den Verzweigungen von der Startseite +1

3 – folge den Verzweigungen von der Startseite +2

...

Reparse all

Wenn dies angewählt ist, wird die Datenbank komplett geleert und beim nächsten “Spidern” gefüllt. Wenn nicht, wird die Datenbank einfach nur weiter aufgefüllt, ohne vorher zuleeren.

Automatic spider start

Dieses Kästchen ist angewählt, wenn man keinen Zugriff auf Cron unter *nix Systemen hat oder auf den Task scheduler unter Windowssystemen.

Falls aktiviert und ein Besucher benutzt die Suchmaschine, wird der Crawler ggf. automatisch gestartet.

Start time

Zeit um den Spider zustarten

Start spider each (days)

Anzahl in Tagen um den Spider zustarten.

Force crawling

Mit dem Start Spider Button startet der Spider bedingt.

Number of links per page

Soviele Verzweigungen werden pro Ausgabeseite angezeigt.

Max pages block

Soviele Seiten werden maximal in einem Block dargestellt.

Search Engine log file name

Zielpfad für Suchmaschinen-Log-Datei.

Spider Engine log file name

Zielpfad für Spider-Log-Datei.

Admin Tool log file name

Zielpfad für Admin-Log-Datei.

Templates path

Zielpfad für die Templates.

Admin Login

Name des Administrators.

Admin Password

Administratorpasswort.

Confirm Password

Sicherheitswiederholung des Administratorpasswort.

Submit

Mit diesem Buttons werden alle Änderungen gespeichert.

 

 

 

 

 

 

Suchen

Bei dem Suchen brauch man lediglich ein gewünschtes Wort eingeben und search drücken.

 

Außerdem kann man für gezieltes Suchen die Boolsche Algebra benutzen:

 

Table 2-1: Boolsche Logik.

Operator

Description

AND

Findet mit Erdnuss AND Butter alle Dokumente, die die Wörter Erdnuss und Butter enthalten.

OR

Findet mit Erdnuss OR Butter alle Dokumente, die die Wörter Erdnuss oder Butter enthalten.Die gefundeten Dokumente müssen aber nicht zwangsläufig beide Wörter enthalten.

AND NOT

Findet mit Erdnuss AND NOT Butter alle Dokumente die die Wörter Erdnuss und nicht Butter enthalten. NOT muss mit einem anderen Operator wie AND verwendet werden. Die Suchmaschine akzeptiert nicht 'Erdnuss NOT Butter', sondern Erdnuss AND NOT Butter.

OR NOT

Findet mit Erdnuss OR NOT Butter alle Dokumente die die Wörter Erdnuss oder nicht Butter enthalten.

“”

Die Anführungszeichen können benutzt werden um exakte  Wörter  oder Sätze zufinden. Zum Beispiel werden bei "New York Times" nur Dokumente angezeigt, die wirklich nur das zusammenhängende Wort New York Times enthalten.

{ }

Braces are used to denote folders. For example, a search on "CPAN/objects" will match only documents stored in www.servername.com/currentlocation/CPAN/objects

 

 

Weiter ist es möglich spezielle Ordner zu durchsuchen. Dabei brauch man nur das herunterklappbare Menü aufschlagen und den jeweiligen Ordern aussuchen. Mit der Option .. gerät man wieder einen Ordner nach oben.