袋鼠空间 – Just One Eximious Yelling! 超凡者的呐喊!

Tag: full-text

越来越多“搜”主意-Spinx Search

发表于03.21, 2010, 作者:joey,栏目: 超凡呐喊

我看到很多IT经理人的案前,都有很多知名的书籍,《蓝海战略》、《长尾理论》、《维基经济学》,闲来无事,还分享一下《蓝海战略》的读书心得,然而自己却做年年月月地做个跟屁虫,克隆着网络上最流行的应用,我不敢批评蓝海战略之漏洞,只是在一个市场上,只有要专注的决心,不怕正面竞争。所以我最佩服的是Google,在当年搜索引擎林立,还能脱颖而出,我也不好意思说我当年在网易,还看到丁磊先生风风火火地让同事们在搜索引擎上下苦功,一定要把“边城浪子”找出来才作准,然而我们还是输了,连Yahoo都退而求次,更何况国内的公司。

Google的成功带动了所有人都趋之若鹜,都希望自己做搜索引擎,机器人、爬虫、蜘蛛、全文搜索更是开发者认为的点金石,纷纷下海研究起来,于是有了一片搜索热,当时让大家觉得“惊艳”的,一定要数Apache的项目Lucene,Lucene的名字是作者Doug Cutting的妻子的名字,所以我说惊艳是没错的,Lucene让我们建立自己的搜索引擎不再是梦想,它能支持TB级别的数据量,而其而搜索速度惊人,前段时间跟网易的开发人员聊天,他们也采用Lucene来提升数据库的查询效率,然而Lucene是一个JAVA项目,它的Solr能让JAVA开发人员得心应手,而对于PHP开发者,最终也有方案,让PHP开发者一尝心愿,连Zend Framework都有支持Lucene的类,不过对于我们热爱LAMP开发的人来说,本来不需要安装JDK,如果使用Lucene还是得乖乖地安装JDK去运行Lucene,心里总有不甘。

现在网上又有一个搜主意,那就是Spinx,Spinx名字很特别,因为它乃是大名鼎鼎埃及狮身人面像,我觉得这个名字寓意不错,Spinx项目在2001年已开始,到2009年末才提供稳定的版本下载,所以它算是新鲜出炉的香饽饽,来自俄罗斯的开发造诣,单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级)。Sphinx创建索引的速度为:创建100万条记录的索引只需 3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。

以下是Spinx跟主流全文搜索引擎对比图表:

(进入阅读全文)

v: 2668
[-JOEY BLOGGER - AD广告-]
爱瑟丽国际珠宝城,Aesiri Jewelry Dreamland
Leave a Comment :, , , , , more...

Email邮件订阅


每天12:00准时到达,请点击以下按钮,输入Email地址订阅啦!


RSS订阅