Regain 2.1.0-STABLE API

net.sf.regain.crawler.config
Class UrlPattern

java.lang.Object
  extended by net.sf.regain.crawler.config.UrlPattern

public class UrlPattern
extends Object

enthält alle Daten eines URL-Pattern.

Ein URL-Pattern wird beim Durchsuchen von Dokumenten nach URLs dazu verwendet, URLs eines bestimmten Typs zu identifizieren.

Author:
Til Schneider, www.murfman.de

Field Summary
private  String mRegexPattern
          Der Regul�re Ausdruck, die eine URL findet.
private  int mRegexUrlGroup
          Die Gruppe des Regul�ren Ausdrucks, die die URL enthält.
private  boolean mShouldBeIndexed
          Gibt an, ob eine gefundene URL indiziert werden soll.
private  boolean mShouldBeParsed
          Gibt an, ob eine gefundene URL nach weiteren URLs durchsucht werden soll.
 
Constructor Summary
UrlPattern(String regexPattern, int regexUrlGroup, boolean shouldBeParsed, boolean shouldBeIndexed)
          Erzeugt eine neue UrlPattern-Instanz.
 
Method Summary
 String getRegexPattern()
          Gibt den Regul�re Ausdruck zurück, die eine URL findet.
 int getRegexUrlGroup()
          Gibt die Gruppe des Regul�ren Ausdrucks zurück, die die URL enthält.
 boolean getShouldBeIndexed()
          Gibt zurück, ob eine gefundene URL indiziert werden soll.
 boolean getShouldBeParsed()
          Gibt zurück, ob eine gefundene URL nach weiteren URLs durchsucht werden soll.
 
Methods inherited from class java.lang.Object
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

Field Detail

mRegexPattern

private String mRegexPattern
Der Regul�re Ausdruck, die eine URL findet.


mRegexUrlGroup

private int mRegexUrlGroup
Die Gruppe des Regul�ren Ausdrucks, die die URL enthält.


mShouldBeParsed

private boolean mShouldBeParsed
Gibt an, ob eine gefundene URL nach weiteren URLs durchsucht werden soll.


mShouldBeIndexed

private boolean mShouldBeIndexed
Gibt an, ob eine gefundene URL indiziert werden soll.

Constructor Detail

UrlPattern

public UrlPattern(String regexPattern,
                  int regexUrlGroup,
                  boolean shouldBeParsed,
                  boolean shouldBeIndexed)
Erzeugt eine neue UrlPattern-Instanz.

Parameters:
regexPattern - Der Regul�re Ausdruck, die eine URL findet.
regexUrlGroup - Die Gruppe des Regul�ren Ausdrucks, die die URL enthält.
shouldBeParsed - Gibt an, ob eine gefundene URL nach weiteren URLs durchsucht werden soll.
shouldBeIndexed - Gibt an, ob eine gefundene URL indiziert werden soll.
Method Detail

getRegexPattern

public String getRegexPattern()
Gibt den Regul�re Ausdruck zurück, die eine URL findet.

Returns:
Der Regul�re Ausdruck, die eine URL findet.

getRegexUrlGroup

public int getRegexUrlGroup()
Gibt die Gruppe des Regul�ren Ausdrucks zurück, die die URL enthält.

Returns:
Die Gruppe des Regul�ren Ausdrucks, die die URL enthält.

getShouldBeParsed

public boolean getShouldBeParsed()
Gibt zurück, ob eine gefundene URL nach weiteren URLs durchsucht werden soll.

Returns:
Ob eine gefundene URL nach weiteren URLs durchsucht werden soll.

getShouldBeIndexed

public boolean getShouldBeIndexed()
Gibt zurück, ob eine gefundene URL indiziert werden soll.

Returns:
Ob eine gefundene URL indiziert werden soll.

Regain 2.1.0-STABLE API

Regain 2.1.0-STABLE, Copyright (C) 2004-2010 Til Schneider, www.murfman.de, Thomas Tesche, www.clustersystems.info