Webcrawler: Unterschied zwischen den Versionen
Zur Navigation springen
Zur Suche springen
Stefan (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
Stefan (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
||
| Zeile 1: | Zeile 1: | ||
;Webcrawler: Programm, das durch rekursives Anfordern von Dokumenten, die auf Hyperlinks innerhalb dieser Dokumente basieren, automatisch das Web (bzw. ein Dateiverzeichnis-Baum) durchläuft. | |||
Synonyme: Spider | Definitionen: | ||
* Bevorzugter Begriff: Webcrawler. | |||
* Überbegriff: Crawler | |||
* Synonyme: Spider, Web-Bot (Bot), Robot, Page Locator, Wanderer... | |||
[[Geometa.info]] setzt einen Webcrawler ein namens GeometaBot. | Typen von Crawlern: | ||
* Webcrawler, z.B. GoogleBot | |||
* Desktop Crawler, z.B. Copernikus, Google Desktop, oder svizzer | |||
* Spezial-Crawler, z.B. zur Verbesserung oder als Antispam-Tool für Wikipedia | |||
Hinweise: | |||
* [[Geometa.info]] setzt einen Webcrawler ein namens GeometaBot. | |||
* Es gab eine Diplomarbeit an der HSR mit Publikation zum Thema "'Versus' - Comparing Methods for Near-Uniform URL Sampling", http://versus.integis.ch/ | |||
* For crawlers, the web is a graph! | |||
Version vom 22. August 2006, 08:56 Uhr
- Webcrawler
- Programm, das durch rekursives Anfordern von Dokumenten, die auf Hyperlinks innerhalb dieser Dokumente basieren, automatisch das Web (bzw. ein Dateiverzeichnis-Baum) durchläuft.
Definitionen:
- Bevorzugter Begriff: Webcrawler.
- Überbegriff: Crawler
- Synonyme: Spider, Web-Bot (Bot), Robot, Page Locator, Wanderer...
Typen von Crawlern:
- Webcrawler, z.B. GoogleBot
- Desktop Crawler, z.B. Copernikus, Google Desktop, oder svizzer
- Spezial-Crawler, z.B. zur Verbesserung oder als Antispam-Tool für Wikipedia
Hinweise:
- Geometa.info setzt einen Webcrawler ein namens GeometaBot.
- Es gab eine Diplomarbeit an der HSR mit Publikation zum Thema "'Versus' - Comparing Methods for Near-Uniform URL Sampling", http://versus.integis.ch/
- For crawlers, the web is a graph!