2009-09-27から1日間の記事一覧

NGramTokenizerの問題

ASF JIRAで、NGramTokenizerで検索すると、いくつか引っ掛かってきます。 #LUCENE-1227 NGramTokenizer to handle more than 1024 chars - ASF JIRA1024文字以降が扱われないといった問題。大きな文章を扱う場合に痛すぎますね。 #LUCENE-1225 NGramTokenize…