Regain 2.1.0-STABLE API

Package net.sf.regain.crawler.document

Bereitet Inhalte verschiedener Dokumentenformate für die Indizierung auf.

See:
          Description

Interface Summary
Pluggable Common interface of CrawlerPlugins and Preparators
Preparator Prepares a document for indexing.
WriteablePreparator Prepares a document for indexing.
 

Class Summary
AbstractPreparator Abstract implementation of a preparator.
DocumentFactory Fabrik, die aus der URL und den Rohdaten eines Dokuments ein Lucene-Ducument erzeugt, das nur noch den, von Formatierungen gesäuberten, Text des Dokuments, sowie seine URL und seinen Titel enthält.
HttpDownloadThread Thread, der einen HTTP-Download übernimmt.
IteratorTokenStream A token stream reading tokens from an iterator.
PathElement Ein Element eines Pfades.
PluggableFactory Loads and initializes the preparators.
PluggableFactory.ExtensionFilter  
PreparatorFactory Loads and initializes the preparators.
PreparatorProfilerPair Allow ordering by priority of Preparator.
RawDocument Enthält alle Rohdaten eines Dokuments.
 

Package net.sf.regain.crawler.document Description

Bereitet Inhalte verschiedener Dokumentenformate für die Indizierung auf.


Regain 2.1.0-STABLE API

Regain 2.1.0-STABLE, Copyright (C) 2004-2010 Til Schneider, www.murfman.de, Thomas Tesche, www.clustersystems.info