Regain 1.7.7-STABLE API

Package net.sf.regain.crawler.document

Bereitet Inhalte verschiedener Dokumentenformate für die Indizierung auf.

See:
          Description

Interface Summary
Preparator Prepares a document for indexing.
 

Class Summary
AbstractPreparator Abstract implementation of a preparator.
DocumentFactory Fabrik, die aus der URL und den Rohdaten eines Dokuments ein Lucene-Ducument erzeugt, das nur noch den, von Formatierungen gesäuberten, Text des Dokuments, sowie seine URL und seinen Titel enthält.
HttpDownloadThread Thread, der einen HTTP-Download übernimmt.
IteratorTokenStream A token stream reading tokens from an iterator.
PathElement Ein Element eines Pfades.
PreparatorFactory Loads and initializes the preparators.
RawDocument Enthält alle Rohdaten eines Dokuments.
 

Package net.sf.regain.crawler.document Description

Bereitet Inhalte verschiedener Dokumentenformate für die Indizierung auf.


Regain 1.7.7-STABLE API

Regain 1.7.7-STABLE, Copyright (C) 2004-2010 Til Schneider, www.murfman.de, Thomas Tesche, www.clustersystems.info