Regain 2.1.0-STABLE API

net.sf.regain.crawler.config
Class StartUrl

java.lang.Object
  extended by net.sf.regain.crawler.config.StartUrl

public class StartUrl
extends Object

enthält die Daten einer Start-URL.

Eine Start-URL ist ein Startpunkt an dem der Crawler-Proze� beginnt.

Author:
Til Schneider, www.murfman.de

Field Summary
private  boolean mShouldBeIndexed
          Gibt an, ob das Dokument indiziert werden soll.
private  boolean mShouldBeParsed
          Gibt an, ob das Dokument nach weiteren URLs durchsucht werden soll.
private  String mUrl
          Die URL des zu bearbeitenden Dokuments.
 
Constructor Summary
StartUrl(String url, boolean shouldBeParsed, boolean shouldBeIndexed)
          Creates a new instance of StartUrl.
 
Method Summary
 boolean getShouldBeIndexed()
          Gibt zurück, ob das Dokument indiziert werden soll.
 boolean getShouldBeParsed()
          Gibt zurück, ob das Dokument nach weiteren URLs durchsucht werden soll.
 String getUrl()
          Gibt die URL des zu bearbeitenden Dokuments zurück.
 
Methods inherited from class java.lang.Object
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

Field Detail

mUrl

private String mUrl
Die URL des zu bearbeitenden Dokuments.


mShouldBeParsed

private boolean mShouldBeParsed
Gibt an, ob das Dokument nach weiteren URLs durchsucht werden soll.


mShouldBeIndexed

private boolean mShouldBeIndexed
Gibt an, ob das Dokument indiziert werden soll.

Constructor Detail

StartUrl

public StartUrl(String url,
                boolean shouldBeParsed,
                boolean shouldBeIndexed)
Creates a new instance of StartUrl.

Parameters:
url - Die URL des zu bearbeitenden Dokuments.
shouldBeParsed - Gibt an, ob das Dokument nach weiteren URLs durchsucht werden soll.
shouldBeIndexed - Gibt an, ob das Dokument indiziert werden soll.
Method Detail

getUrl

public String getUrl()
Gibt die URL des zu bearbeitenden Dokuments zurück.

Returns:
Die URL des zu bearbeitenden Dokuments.

getShouldBeParsed

public boolean getShouldBeParsed()
Gibt zurück, ob das Dokument nach weiteren URLs durchsucht werden soll.

Returns:
Ob das Dokument nach weiteren URLs durchsucht werden soll.

getShouldBeIndexed

public boolean getShouldBeIndexed()
Gibt zurück, ob das Dokument indiziert werden soll.

Returns:
Ob das Dokument indiziert werden soll.

Regain 2.1.0-STABLE API

Regain 2.1.0-STABLE, Copyright (C) 2004-2010 Til Schneider, www.murfman.de, Thomas Tesche, www.clustersystems.info