10-18
接上篇,我们使用Lucene Document Field IndexWrite 等方法创建了索引,现在,使用内建的搜索的方法进行检索。
代码如下:
- import java.io.*;
- import org.apache.lucene.index.Term;
- import org.apache.lucene.index.IndexReader;
- import org.apache.lucene.analysis.*;
- import org.apache.lucene.queryParser.QueryParser;
- import org.apache.lucene.search.*;
- public class Search
- {
- public static void main( String argv[] ) throws Exception
- {
- IndexReader reader = IndexReader.open("./index");
- Searcher searcher = new IndexSearcher(reader);
- SimpleAnalyzeranalyzer = new SimpleAnalyzer();
- QueryParser parser = new QueryParser("post_content", analyzer);
- Query query = parser.parse( argv[0] );
- Hits hits = searcher.search(query);
- System.out.println(hits.length() + "个结果");
- for(int i=0;i
- {
- System.out.println(hits.doc(i).get("guid"));
- }
- }
- }
编译后,我们在命令行进行查询:
E:\java>java Search php
40个结果
http://www.sunboyu.cn/?p=332
http://www.sunboyu.cn/?p=164
http://www.sunboyu.cn/?p=213
http://www.sunboyu.cn/?p=123
http://www.sunboyu.cn/?p=124
http://www.sunboyu.cn/?p=180
http://www.sunboyu.cn/?p=283
http://www.sunboyu.cn/?p=282
http://www.sunboyu.cn/?p=234
http://www.sunboyu.cn/?p=53
http://www.sunboyu.cn/?p=159
http://www.sunboyu.cn/?p=235
http://www.sunboyu.cn/?p=221
http://www.sunboyu.cn/?p=73
http://www.sunboyu.cn/?p=11
http://www.sunboyu.cn/?p=51
http://www.sunboyu.cn/?p=240
http://www.sunboyu.cn/?p=196
http://www.sunboyu.cn/?p=52
http://www.sunboyu.cn/?p=308
http://www.sunboyu.cn/?p=298
http://www.sunboyu.cn/?p=9
http://www.sunboyu.cn/?page_id=38
http://www.sunboyu.cn/?p=236
http://www.sunboyu.cn/?p=320
http://www.sunboyu.cn/?p=141
http://www.sunboyu.cn/?p=78
http://www.sunboyu.cn/?p=291
http://www.sunboyu.cn/?p=218
http://www.sunboyu.cn/?p=154
http://www.sunboyu.cn/?p=121
http://www.sunboyu.cn/?p=200
http://www.sunboyu.cn/?p=244
http://www.sunboyu.cn/?p=280
http://www.sunboyu.cn/?page_id=112
http://www.sunboyu.cn/?p=288
http://www.sunboyu.cn/?p=292
http://www.sunboyu.cn/?p=20
http://www.sunboyu.cn/?p=130
http://www.sunboyu.cn/?p=87
E:\java>
可以看到,当我们搜索关键词“php”,返回了所有存在php关键词的链接。
当然,这个只是个简单的演示,在创建索引的时候,我们使用了SimpleAnalyzer的方法,这个方法对中文,其实就是基于单字的分词,对于中文信息检索基本是没有意义的。Lucene提供了开发的源代码,因为,我们可以很方便得为其附加我们自己的中文分词方法。