网站站内搜索解决方案集锦
作者 : admin 于 2008年09月24日, 09:40:45
2008
09-24
09-24
1、小型网站:小的不能再小的,就是数据量很小的,使用select足矣。小网站流量不大,用户不多,数据库搜索是最简洁方便的模式。
2、中型网站:中型网站数据量不小,数据库规模在百万~千万级别,select显然不能应付,如果用数据库搜索,模糊检索是万万不能使用的,效率会很差。标签检索是个不错的方式,但这种方式需要编辑手工得添加标签,工作量巨大,非常浪费人工。使用一个小型的数据库爬虫进行分词检索是正道。推荐分词工具:lucene,ICTCLAS
3、大型网站:把大于千万数据级别的网站统归大型网站。这种网站必须提供非常好的分词与模糊查找机制,在速度,检索的准确度和相关度上都要有可使用性。在处理数据库信息上,使用数据库爬虫依然是不错的办法,而对于大量的文件,文件爬虫也相当重要。在这个级别的网站,推荐使用比较专业的商业软件,比如海量分词,或者一些专业的搜索解决方案。