Mit Yacy richten auch Einsteiger leicht eine eigene Suchmaschine ein, die alle wichtigen Google-Funktionen bietet.
YACY: Die freie Peer-to-Peer Suchmaschine
Als Altavista 1995 die erste Volltextsuche für das Web vorgestellt hat, steckte das Internet noch in den Kinderschuhen. Heute gehört Google zu den beliebtesten Webseiten und hat Altavista längst überholt. Im IT-Konzern arbeiten einige der besten Wissenschaftler, die es im Bereich des sogenannten Information Retrieval überhaupt gibt. Dennoch birgt es Gefahren, nur eine einzige große Suchmaschine im Netz zu haben.

Inhaltsverzeichnis
- 1Suchmaschine mit Java-Unterbau
- 2Gemeinsame P2P-Suchmaschine
- 3Mehr Kontrolle über den Crawler
- 4Seiten im Web und dem Intranet
- 5Suche nach Seiten und Medien
- 6Fazit
Für private Anwender kann es durchaus interessant sein, das Web mit einer eigenen Suche zu durchforsten. Dafür ist kein gigantisches Rechenzentrum wie bei Google nötig, sondern nur ein handelsüblicher PC und die Software Yacy. Hinter dem Projekt steckt der Entwickler Michael Christen, dessen Arbeit an der freien Suchmaschine vom Verein zur Förderung des freien Wissenszugangs mit Sitz in Hannover unterstützt wird.
Suchmaschine mit Java-Unterbau
Die aktuelle Windows-Version ist Yacy 0.95, für Systeme mit MacOS X oder Linux gibt es Yacy schon in Version 0.96 - diese birgt aber nur marginale Unterschiede gegenüber der älteren Ausgabe. Um die Suchmaschine zu installieren, benötigen Anwender eine aktuelle Version des Java Runtime Environment in Version 1.5 oder neuer. Die Software Yacy ist komplett in Java programmiert und läuft unabhängig vom Betriebssystem sehr stabil.
Das Programm selbst belegt nur circa 30 Megabyte, für den Index und Cache sind aber ein Gigabyte oder mehr auf der Festplatte nötig. Computer mit weniger als 512 Megabyte sind eine unnötige Bremse für die persönliche Suchmaschine. Yacy wurde optimiert für mehrere Kerne in modernen Prozessoren, was die Geschwindigkeit deutlich verbessert.
Nach dem Herunterladen der Software wird diese über einen Assistenten installiert. Wer mit MacOS X oder Linux arbeitet, muss lediglich eine Archivdatei entpacken. Im Wiki wird im Detail erklärt, wie man RPM- oder Debian-Pakete mit Yacy aus dritten Quellen bezieht. Um die Software das erste Mal zu starten, genügt auf allen Systemen der Start einer Skriptdatei - diese liegt in der Regel im Hauptverzeichnis der Yacy-Installation.
Freie Suchmaschine für den heimischen PC
Yacy unterstützt drei verschiedene Betriebsmodi, auch als Teil des großen Peer-to-Peer-Netzwerks.
In den Einstellungen kann jeder Nutzer überwachen, was im Yacy-Netzwerk gerade stattfindet.
Mittels einer Sperrliste werden Seiten auf Basis der Url oder eines Stichwort aus dem Index ausgeschlossen.
Der Anwender kann genau beeinflussen, wie Yacy das Ranking der Ergebnisse berechnet.
Über die reguläre Suchseite werden auf Wunsch nur Ergebnisse einer bestimmten Domain angezeigt.
Für Suchanfragen im Web greift Yacy auf die Indizes aller anderen Knoten im Peer-to-Peer-Netzwerk zurück.
Die Vergleichssuche zeigt, wie sich Yacy von Google, Bing & Co. unterscheidet.
Oberfläche im Webbrowser starten
Die grafische Oberfläche von Yacy wird im Browser bedient: Sobald der Dienst geladen ist, wird Yacy über die HTTP-Adresse localhost:8080 erreicht. Beim ersten Start begrüßt Yacy den Anwender mit einem gut verständlichen Assistenten für die Konfiguration: Als Sprache stehen Deutsch und Englisch zur Wahl. Hier sollte aus Sicherheitsgründen auch der Port von 8080 auf eine neue Zahl geändert werden. Praktisch ist die automatische Konfiguration des Routers, damit die eigene Suchmaschine von außen erreichbar ist.
Die Startseite dient aber hauptsächlich dazu, dem Nutzer die Wahl über eins der vorgegebenen Nutzungsszenarien zu überlassen: In der einfachsten Variante hilft Yacy dem Peer-to-Peer-Netzwerk aller Yacy-Betreiber dabei, eine alternative Websuche aufzubauen. Eine andere Variante indexiert nur eine persönliche Auswahl von Webseiten, ohne die Suchergebnisse mit anderen Nutzern zu teilen. Yacy kann aber auch eine Suche über das Intranet aufbauen und dabei nicht nur HTTP-Seiten sondern auch Netzwerkfreigaben indexieren.

Sagen Sie Ihre Meinung!