TextTokenizer tokenizer = new EnglishTokenizer();
List<String> d1 = tokenizer.tokenize(DATABASE_WIKI);
List<String> d2 = tokenizer.tokenize(NOSQL_WIKI);
List<String> d3 = tokenizer.tokenize(MYSQL_WIKI);
List<String> d4 = tokenizer.tokenize(FLOWER_WIKI);
List<String> d5 = tokenizer.tokenize(LILIUM_WIKI);
List<String> d6 = tokenizer.tokenize(ROSE_WIKI);
List<List<String>> training = Arrays.asList(d1, d2, d4, d5);
TFIDF tfidf = new TFIDF();