Internet-Crawler
Wir verfügen über Programme zum gezielten Einlesen von Daten aus dem Internet- So können bestimmte Seiten überwacht oder tägliche Nachrichten eingelesen werden. Das Aktualisieren der Datenbank erfolgt automatisch.
Es gibt folgende Einstellungsmöglichkeiten:
- Zu akzeptierende Dateitypen
- Zu ignorierende Dateitypen
- Nur nach unten verzweigen J/N
- URLs mit bestimmten Substrings einschließen
- URLs mit bestimmten Substrings ausschließen
- Nur Dateien akzeptieren, die ein bestimmtes Datum enthalten (z.B,. von heute oder gestern)
- Maximale Tiefe
- Maximale Anzahl an Dateien
- Maximale Anzahl an Bytes
- Maximale Crawlzeit
- Maximale Crawlzeit pro Seite
- An jedem Wochentag oder nur an bestimmten crawlen?
- Mindeste Dateigröße
- Die ersten x Zeichen ignorieren
- Die letzten x Zeichen ignorieren
- Zahl der Seiten, die synchron gecrawlt werden
- Zahl der Threads pro Crawler
Softwarehaus Graf &
Partner Wien
Säulengasse 17
A-1090 Wien
Tel. u. Fax.: +43/1/310 24 39
office@grafsoft.at |
|
Softwarehaus Graf &
Partner Salzburg
Grabenstrasse 19
A-5020 Salzburg
Tel. : +43/650/9201909
robert.coeln@grafsoft.at |