Mit Yacy richten auch Einsteiger leicht eine eigene Suchmaschine ein, die alle wichtigen Google-Funktionen bietet.

YACY: Die freie Peer-to-Peer Suchmaschine

Als Altavista 1995 die erste Volltextsuche für das Web vorgestellt hat, steckte das Internet noch in den Kinderschuhen. Heute gehört Google zu den beliebtesten Webseiten und hat Altavista längst überholt. Im IT-Konzern arbeiten einige der besten Wissenschaftler, die es im Bereich des sogenannten Information Retrieval überhaupt gibt. Dennoch birgt es Gefahren, nur eine einzige große Suchmaschine im Netz zu haben.

Statt mit einem zentralen Server arbeitet YACY nach dem Peer-to-Peer-Prinzip. (Quelle: Projektseite)
Statt mit einem zentralen Server arbeitet YACY nach dem Peer-to-Peer-Prinzip. (Quelle: Projektseite)

Inhaltsverzeichnis

  1. 1Suchmaschine mit Java-Unterbau
  2. 2Gemeinsame P2P-Suchmaschine
  3. 3Mehr Kontrolle über den Crawler
  4. 4Seiten im Web und dem Intranet
  5. 5Suche nach Seiten und Medien
  6. 6Fazit
Werbung

Für private Anwender kann es durchaus interessant sein, das Web mit einer eigenen Suche zu durchforsten. Dafür ist kein gigantisches Rechenzentrum wie bei Google nötig, sondern nur ein handelsüblicher PC und die Software Yacy. Hinter dem Projekt steckt der Entwickler Michael Christen, dessen Arbeit an der freien Suchmaschine vom Verein zur Förderung des freien Wissenszugangs mit Sitz in Hannover unterstützt wird.

Suchmaschine mit Java-Unterbau

Die aktuelle Windows-Version ist Yacy 0.95, für Systeme mit MacOS X oder Linux gibt es Yacy schon in Version 0.96 - diese birgt aber nur marginale Unterschiede gegenüber der älteren Ausgabe. Um die Suchmaschine zu installieren, benötigen Anwender eine aktuelle Version des Java Runtime Environment in Version 1.5 oder neuer. Die Software Yacy ist komplett in Java programmiert und läuft unabhängig vom Betriebssystem sehr stabil.

Das Programm selbst belegt nur circa 30 Megabyte, für den Index und Cache sind aber ein Gigabyte oder mehr auf der Festplatte nötig. Computer mit weniger als 512 Megabyte sind eine unnötige Bremse für die persönliche Suchmaschine. Yacy wurde optimiert für mehrere Kerne in modernen Prozessoren, was die Geschwindigkeit deutlich verbessert.

Nach dem Herunterladen der Software wird diese über einen Assistenten installiert. Wer mit MacOS X oder Linux arbeitet, muss lediglich eine Archivdatei entpacken. Im Wiki wird im Detail erklärt, wie man RPM- oder Debian-Pakete mit Yacy aus dritten Quellen bezieht. Um die Software das erste Mal zu starten, genügt auf allen Systemen der Start einer Skriptdatei - diese liegt in der Regel im Hauptverzeichnis der Yacy-Installation.

Freie Suchmaschine für den heimischen PC

Bild 1 von 7
Einrichten der Suche - Yacy unterstützt drei verschiedene Betriebsmodi, auch als Teil des großen Peer-to-Peer-Netzwerks.
Bild vergrößern

Yacy unterstützt drei verschiedene Betriebsmodi, auch als Teil des großen Peer-to-Peer-Netzwerks.

Bild 2 von 7
Admin Konsole - In den Einstellungen kann jeder Nutzer überwachen, was im Yacy-Netzwerk gerade stattfindet.
Bild vergrößern

In den Einstellungen kann jeder Nutzer überwachen, was im Yacy-Netzwerk gerade stattfindet.

Bild 3 von 7
Filter für Seiten - Mittels einer Sperrliste werden Seiten auf Basis der Url oder eines Stichwort aus dem Index ausgeschlossen.
Bild vergrößern

Mittels einer Sperrliste werden Seiten auf Basis der Url oder eines Stichwort aus dem Index ausgeschlossen.

Bild 4 von 7
Kriterien für Qualität - Der Anwender kann genau beeinflussen, wie Yacy das Ranking der Ergebnisse berechnet.
Bild vergrößern

Der Anwender kann genau beeinflussen, wie Yacy das Ranking der Ergebnisse berechnet.

Bild 5 von 7
Erweiterte Suche - Über die reguläre Suchseite werden auf Wunsch nur Ergebnisse einer bestimmten Domain angezeigt.
Bild vergrößern

Über die reguläre Suchseite werden auf Wunsch nur Ergebnisse einer bestimmten Domain angezeigt.

Bild 6 von 7
Suche im WorldWideWeb - Für Suchanfragen im Web greift Yacy auf die Indizes aller anderen Knoten im Peer-to-Peer-Netzwerk zurück.
Bild vergrößern

Für Suchanfragen im Web greift Yacy auf die Indizes aller anderen Knoten im Peer-to-Peer-Netzwerk zurück.

Bild 7 von 7
Blick auf die Konkurrenz - Die Vergleichssuche zeigt, wie sich Yacy von Google, Bing & Co. unterscheidet.
Bild vergrößern

Die Vergleichssuche zeigt, wie sich Yacy von Google, Bing & Co. unterscheidet.


Oberfläche im Webbrowser starten 

Die grafische Oberfläche von Yacy wird im Browser bedient: Sobald der Dienst geladen ist, wird Yacy über die HTTP-Adresse localhost:8080 erreicht. Beim ersten Start begrüßt Yacy den Anwender mit einem gut verständlichen Assistenten für die Konfiguration: Als Sprache stehen Deutsch und Englisch zur Wahl. Hier sollte aus Sicherheitsgründen auch der Port von 8080 auf eine neue Zahl geändert werden. Praktisch ist die automatische Konfiguration des Routers, damit die eigene Suchmaschine von außen erreichbar ist.

Die Startseite dient aber hauptsächlich dazu, dem Nutzer die Wahl über eins der vorgegebenen Nutzungsszenarien zu überlassen: In der einfachsten Variante hilft Yacy dem Peer-to-Peer-Netzwerk aller Yacy-Betreiber dabei, eine alternative Websuche aufzubauen. Eine andere Variante indexiert nur eine persönliche Auswahl von Webseiten, ohne die Suchergebnisse mit anderen Nutzern zu teilen. Yacy kann aber auch eine Suche über das Intranet aufbauen und dabei nicht nur HTTP-Seiten sondern auch Netzwerkfreigaben indexieren.

Forum

Eigenen Kommentar schreiben