英语轻松读发新版了,欢迎下载、更新

请教一个关于Lucene的问题

sbicrgw 发布于 2014年01月05日
无人欣赏。

去年年终提前两个月辞职了,老板太没水平了没法呆。回家没事做了个资源站,现在有三百多万条数据吧,很侥幸这个站今年给我赚了5万多块钱,今年又萌生了想自己干的念头了,准备把这站完善一下,可以保证做独立开发者不会饿死!

言归正传,搜索是用Lucene做的,我设了定时任务每两个小时用全量生成一个索引,再切换过来。不过一两个星期会死一次,没有去定位问题就直接改成12小时全量生成一次,问题貌似解决了。这里请教一下,这种情况是要用增量已是全量來生成?

共5条回复
akunamotata 回复于 2014年01月05日

不明白你指哪种情况,可真心觉得全量生成索引是效率极其低下的。

tinyfool 回复于 2014年01月05日

第一个说明下你是在搜索的时候死的,还是建索引的时候死的?你基本上没有重新全量的必要,完全不理解你为什么要这么做,如果有大量数据的删除,或者叫做更新,偶尔做一下全量对性能有好处,但是大多数一般情况下,增量的结果和全量相差无几。

sbicrgw 回复于 2014年01月06日

当时做全量是因为没有做实时索引的必要性,所以考虑每间格一断时间更新一次,全量方便。增量需要每次更新数据时都去做update,每次都需要做好几次库的切换才能保证当下的搜索正常进行,感觉麻烦很多。下个周末试试增量,看看效果再汇报。

sbicrgw 回复于 2014年01月06日

另:论坛用iPad air 更改头像,好像对不准的,取到的不是我想要的那个位置

emmetxu 回复于 2014年01月07日

7年前我接触lucene好像也是对索引的更新头疼不已,在尝试了很多办法后发现solr对这块支持挺好的,有没有尝试过呢。

登录 或者 注册