博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【技术性】Search知识
阅读量:6691 次
发布时间:2019-06-25

本文共 661 字,大约阅读时间需要 2 分钟。

持续更新。

  1. FB search框架
    Php写的Browse layer,负责同client对话以及param处理和passing等。
    C++写的backend,最大的一坨叫做TopAggregator,主要负责三件事 a)rewrite query to get better search results (e.g. force retrieval); b)和每个vertical的RackAggregator对话,比如posts,web,people等,从这些分支收集response; c)对response做twiddling,所以有一堆twiddlers比如web twiddler
    每个RackAggregator做的事主要就是和index对话,从各个shards拿结果(用reverse index做retrieval, top m, determined by static rank),以及score results(用forward index / docdata做ranking)。
    然后再返回php的middle tier,做caching, privacy check等等。
  2. Forward index和Reverse index
    f index主要是给id找doc,r index主要是给出terms找list<doc(id)>
  3. index build:
    也是分batch pipeline (base index build)和live update pipeline (realtime)。

转载地址:http://myeao.baihongyu.com/

你可能感兴趣的文章
字节流
查看>>
大型网站架构演变和知识体系
查看>>
抛砖引玉:Session和Cookie在WEB开发中的最佳实践
查看>>
一次小***处理
查看>>
Nginx配置文件nginx.conf中文详解
查看>>
linux anaconda kickstart基础
查看>>
DITA vs DocBook
查看>>
调整Outlook 2010的pst文件大小
查看>>
python笔记二 基础
查看>>
nohup /dev/null 2>&1 含义详解
查看>>
Micropython教程之TPYBoard DIY超声波测距仪实例演示
查看>>
我的友情链接
查看>>
mysqlbinlog 使用
查看>>
RHCS中GFS2共享存储扩容
查看>>
Excel如何把非打印区域设置成灰色
查看>>
条件语句整理
查看>>
Office365 SKU-1
查看>>
汉语国际传播思索
查看>>
TODO:排列组合问题:n个数中取m个
查看>>
27.chown更换所有者
查看>>