LinkedIn的线上搜索 — 分布式搜索相关

21 十月, 2010 (10:55) | lucene, 架构设计 繁体 English    DeliciOus    分享到新浪微博
作者: H.E. | 您可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址: http://www.javabloger.com/article/lucene-cluster-zoie-bobo-sensei.html
豆瓣读书 向你推荐有关 lucene架构设计、 类别的图书。

我的废话:
   某个项目缘故对分布式搜索的方式和技术的话题开始高度关注,看了不少资料,如 Apache Solr 和 Katta 。好东西大家应该分享, 最近看到LinkedIn 推出的新产品 LinkedIn Signal ,该产品在架构设计上和分布式搜索有着紧密的联系,LinkedIn搜索引擎架构师王坚 (John Wang) 在团队的blog上公布了一些产品内幕,这一资料让我得到了很多启发。
如图所示:


    * Zoie - Realtime indexing/search system. 
    * Bobo - Faceted Search Engine  
    * Sensei - distributed realtime searchable database with dynamic clustering. Leverages Zoie and Bobo.

以上几个东东 是LinkedIn 搜索团队自己开发的,来满足用户线上的搜索需求。

整篇详细内容如下:
http://sna-projects.com/blog/2010/10/linkedin-signal-a-look-under-the-hood

值得借鉴的几点:
    * 对于线上搜索的前端展现策略,结构的设计不可忽视
    * 如何利用多进程并行计算来提高计算效率,
    * 对大索引文件sharding 的存储策略,
    * 索引文件分布在不同集群机器的查询策略,
    * 数据库/数据源和索引库的实时同步机制。

口水:
    看的东西一多就容易忘,所以找个地方先记下来,怕忘。

–end–

豆瓣读书  向你推荐有关 lucene 架构设计、 类别的图书。



Creative Commons License
本文由J2ee企业顾问-黄毅创作,并已采用创作共用署名2.5中国大陆版许可证授权。

评论

评论也是有版权的!




7762