Examples of WVTStemmer

edu.udo.cs.wvtool.generic.stemmer.WVTStemmer
This interface represents a mechanism to convert a stream of tokens to a stream of word stems. @author Michael Wurst @version $Id: WVTStemmer.java,v 1.3 2007/05/20 18:06:02 mjwurst Exp $

Examples of edu.udo.cs.wvtool.generic.stemmer.WVTStemmer

        WVTool wvt = new WVTool(false);


        // Initialize the configuration
        WVTConfiguration config = new WVTConfiguration();


        final WVTStemmer dummyStemmer = new DummyStemmer();
        final WVTStemmer porterStemmer = new PorterStemmerWrapper();


        config.setConfigurationRule(WVTConfiguration.STEP_STEMMER, new WVTConfigurationRule() {
            public Object getMatchingComponent(WVTDocumentInfo d) {


                if (d.getContentLanguage().equals("english"))
                    return porterStemmer;
                else
                    return dummyStemmer;
            }
        });


        WVTStemmer stemmer = new LovinsStemmerWrapper();


        config.setConfigurationRule(WVTConfiguration.STEP_STEMMER, new WVTConfigurationFact(stemmer));


        // Initialize the input list with two classes
        WVTFileInputList list = new WVTFileInputList(1);

View Full Code Here

Examples of edu.udo.cs.wvtool.generic.stemmer.WVTStemmer

        WVTool wvt = new WVTool(true);


        // Initialize the configuration
        WVTConfiguration config = new WVTConfiguration();


        final WVTStemmer dummyStemmer = new DummyStemmer();
        final WVTStemmer porterStemmer = new PorterStemmerWrapper();


        config.setConfigurationRule(WVTConfiguration.STEP_STEMMER, new WVTConfigurationRule() {
            public Object getMatchingComponent(WVTDocumentInfo d) {


                if (d.getContentLanguage().equals("english"))

View Full Code Here

Examples of edu.udo.cs.wvtool.generic.stemmer.WVTStemmer

        WVTDocumentLoader loader = null;
        WVTInputFilter infilter = null;
        WVTCharConverter charConverter = null;
        WVTTokenizer tokenizer = null;
        WVTWordFilter wordFilter = null;
        WVTStemmer stemmer = null;


        // Obtain an expanded list of all documents to consider
        Iterator inList = input.getEntries();


        // Get through the list
        while (inList.hasNext()) {


            WVTDocumentInfo d = (WVTDocumentInfo) inList.next();


            try {


                // Intialize all required components for this document


                loader = (WVTDocumentLoader) config.getComponentForStep(WVTConfiguration.STEP_LOADER, d);
                infilter = (WVTInputFilter) config.getComponentForStep(WVTConfiguration.STEP_INPUT_FILTER, d);
                charConverter = (WVTCharConverter) config.getComponentForStep(WVTConfiguration.STEP_CHAR_MAPPER, d);
                tokenizer = (WVTTokenizer) config.getComponentForStep(WVTConfiguration.STEP_TOKENIZER, d);
                wordFilter = (WVTWordFilter) config.getComponentForStep(WVTConfiguration.STEP_WORDFILTER, d);
                stemmer = (WVTStemmer) config.getComponentForStep(WVTConfiguration.STEP_STEMMER, d);


                // Process the document


                TokenEnumeration tokens = stemmer.stem(wordFilter.filter(tokenizer.tokenize(charConverter.convertChars(infilter.convertToPlainText(loader.loadDocument(d), d), d), d), d), d);


                while (tokens.hasMoreTokens()) {
                    wordList.addWordOccurance(tokens.nextToken());
                }

View Full Code Here

Examples of edu.udo.cs.wvtool.generic.stemmer.WVTStemmer

        WVTDocumentLoader loader = null;
        WVTInputFilter infilter = null;
        WVTCharConverter charConverter = null;
        WVTTokenizer tokenizer = null;
        WVTWordFilter wordFilter = null;
        WVTStemmer stemmer = null;
        WVTVectorCreator vectorCreator = null;
        WVTOutputFilter outputFilter = null;


        // Obtain an expanded list of all documents to consider
        Iterator inList = input.getEntries();


        // Get through the list
        while (inList.hasNext()) {


            WVTDocumentInfo d = (WVTDocumentInfo) inList.next();


            try {


                // Intialize all required components for this document


                loader = (WVTDocumentLoader) config.getComponentForStep(WVTConfiguration.STEP_LOADER, d);
                infilter = (WVTInputFilter) config.getComponentForStep(WVTConfiguration.STEP_INPUT_FILTER, d);
                charConverter = (WVTCharConverter) config.getComponentForStep(WVTConfiguration.STEP_CHAR_MAPPER, d);
                tokenizer = (WVTTokenizer) config.getComponentForStep(WVTConfiguration.STEP_TOKENIZER, d);
                wordFilter = (WVTWordFilter) config.getComponentForStep(WVTConfiguration.STEP_WORDFILTER, d);
                stemmer = (WVTStemmer) config.getComponentForStep(WVTConfiguration.STEP_STEMMER, d);


                vectorCreator = (WVTVectorCreator) config.getComponentForStep(WVTConfiguration.STEP_VECTOR_CREATION, d);


                outputFilter = (WVTOutputFilter) config.getComponentForStep(WVTConfiguration.STEP_OUTPUT, d);


                // Process the document


                TokenEnumeration tokens = stemmer.stem(wordFilter.filter(tokenizer.tokenize(charConverter.convertChars(infilter.convertToPlainText(loader.loadDocument(d), d), d), d), d), d);


                while (tokens.hasMoreTokens()) {
                    wordList.addWordOccurance(tokens.nextToken());
                }

View Full Code Here

Examples of edu.udo.cs.wvtool.generic.stemmer.WVTStemmer

        // Initialize pointers to components for the individual steps


        WVTCharConverter charConverter = null;
        WVTTokenizer tokenizer = null;
        WVTWordFilter wordFilter = null;
        WVTStemmer stemmer = null;
        WVTVectorCreator vectorCreator = null;


        WVTWordVector result = null;


        try {


            // Intialize all required components for this document


            charConverter = (WVTCharConverter) config.getComponentForStep(WVTConfiguration.STEP_CHAR_MAPPER, d);
            tokenizer = (WVTTokenizer) config.getComponentForStep(WVTConfiguration.STEP_TOKENIZER, d);
            wordFilter = (WVTWordFilter) config.getComponentForStep(WVTConfiguration.STEP_WORDFILTER, d);
            stemmer = (WVTStemmer) config.getComponentForStep(WVTConfiguration.STEP_STEMMER, d);


            vectorCreator = (WVTVectorCreator) config.getComponentForStep(WVTConfiguration.STEP_VECTOR_CREATION, d);


            // Process the document


            TokenEnumeration tokens = stemmer.stem(wordFilter.filter(tokenizer.tokenize(charConverter.convertChars(new StringReader(text), d), d), d), d);


            while (tokens.hasMoreTokens()) {
                wordList.addWordOccurance(tokens.nextToken());
            }

View Full Code Here

Examples of edu.udo.cs.wvtool.generic.stemmer.WVTStemmer

        WVTDocumentLoader loader = null;
        WVTInputFilter infilter = null;
        WVTCharConverter charConverter = null;
        WVTTokenizer tokenizer = null;
        WVTWordFilter wordFilter = null;
        WVTStemmer stemmer = null;


        // Obtain an expanded list of all documents to consider
        Iterator inList = input.getEntries();


        // Get through the list
        while (inList.hasNext()) {


            WVTDocumentInfo d = (WVTDocumentInfo) inList.next();
            listener.openNewDocument(d);


            try {


                // Intialize all required components for this document


                loader = (WVTDocumentLoader) config.getComponentForStep(WVTConfiguration.STEP_LOADER, d);
                infilter = (WVTInputFilter) config.getComponentForStep(WVTConfiguration.STEP_INPUT_FILTER, d);
                charConverter = (WVTCharConverter) config.getComponentForStep(WVTConfiguration.STEP_CHAR_MAPPER, d);
                tokenizer = (WVTTokenizer) config.getComponentForStep(WVTConfiguration.STEP_TOKENIZER, d);
                wordFilter = (WVTWordFilter) config.getComponentForStep(WVTConfiguration.STEP_WORDFILTER, d);
                stemmer = (WVTStemmer) config.getComponentForStep(WVTConfiguration.STEP_STEMMER, d);


                // Process the document


                TokenEnumeration tokens = stemmer.stem(wordFilter.filter(tokenizer.tokenize(charConverter.convertChars(infilter.convertToPlainText(loader.loadDocument(d), d), d), d), d), d);


                while (tokens.hasMoreTokens()) {
                    listener.processWord(tokens.nextToken());
                }

View Full Code Here

Examples of edu.udo.cs.wvtool.generic.stemmer.WVTStemmer

        WVTool wvt = new WVTool(false);


        // Initialize the configuration
        WVTConfiguration config = new WVTConfiguration();


        final WVTStemmer dummyStemmer = new DummyStemmer();
        final WVTStemmer porterStemmer = new PorterStemmerWrapper();


        config.setConfigurationRule(WVTConfiguration.STEP_STEMMER, new WVTConfigurationFact(new ToLowerCaseConverter()));


        // Initialize the input list with two classes
        WVTFileInputList list = new WVTFileInputList(0);

View Full Code Here

Examples of edu.udo.cs.wvtool.generic.stemmer.WVTStemmer

        WVTool wvt = new WVTool(false);


        // Initialize the configuration
        WVTConfiguration config = new WVTConfiguration();


        final WVTStemmer dummyStemmer = new DummyStemmer();
        final WVTStemmer porterStemmer = new PorterStemmerWrapper();


        config.setConfigurationRule(WVTConfiguration.STEP_STEMMER, new WVTConfigurationRule() {
            public Object getMatchingComponent(WVTDocumentInfo d) {


                if (d.getContentLanguage().equals("english"))
                    return porterStemmer;
                else
                    return dummyStemmer;
            }
        });


        WVTStemmer stemmer = new LovinsStemmerWrapper();


        config.setConfigurationRule(WVTConfiguration.STEP_STEMMER, new WVTConfigurationFact(stemmer));


        // Initialize the input list with two classes
        WVTFileInputList list = new WVTFileInputList(2);

View Full Code Here

Examples of edu.udo.cs.wvtool.generic.stemmer.WVTStemmer

        WVTool wvt = new WVTool(false);


        // Initialize the configuration
        WVTConfiguration config = new WVTConfiguration();


        WVTStemmer stemmer = new WordNetHypernymStemmer();


        config.setConfigurationRule(WVTConfiguration.STEP_STEMMER, new WVTConfigurationFact(stemmer));


        // Initialize the input list with two classes
        WVTFileInputList list = new WVTFileInputList(2);

View Full Code Here

Examples of edu.udo.cs.wvtool.generic.stemmer.WVTStemmer

        WVTool wvt = new WVTool(false);


        // Initialize the configuration
        WVTConfiguration config = new WVTConfiguration();


        final WVTStemmer dummyStemmer = new DummyStemmer();
        final WVTStemmer porterStemmer = new PorterStemmerWrapper();


        config.setConfigurationRule(WVTConfiguration.STEP_STEMMER, new WVTConfigurationFact(new ToLowerCaseConverter()));


        // Initialize the input list with two classes
        WVTFileInputList list = new WVTFileInputList(0);

View Full Code Here

0 1

TOP

All source code are property of their respective owners. Java is a trademark of Sun Microsystems, Inc and owned by ORACLE Inc. Contact coftware#gmail.com.