一、目的一个搜索引擎使用的时候必定需要排序这个模块,一般情况下在不选择按照某一字段排序的情况下,都是按照打分的高低进行一个默认排序的,所以如果正式使用的话,必须对默认排序的打分策略有一个详细的了解才可以,否则被问起来为什么这个在前面,那个在后面不好办,因此对 Elasticsearch 的打分策略详细的看了下,虽然说还不是了解的很全部,但是大部分都看的差……继续阅读 » dewbay 6年前 (2019-04-12) 2019浏览 0评论0个赞
本文档适用人员:研发和运维提纲:曾经的基于 MongoDB 的筛选+排序解决方案MongoDB 方案的缺陷看中了搜索引擎的 facet 特性看中了ES的简洁看中了ES的天生分布式设计窝窝的ES方案ES的几次事故和教训ES自身存在的问题 首先要感谢王超和胡耀华两位研发经理以严谨治学的研究精神和孜孜以求的工作态度给我们提……继续阅读 » dewbay 6年前 (2019-04-12) 2802浏览 0评论0个赞
1:ElasticSearch 的查询过程2:由 ES 查询模式引起的深度分页问题3:如何正确遍历索引中的数据ElasticSearch 的查询过程es 的数据查询分两步:第一步是的结果是获取满足查询条件的,分布于各个 shard 上的 _doc_id 及对应 _score;第二步是根据第一步获取的所……继续阅读 » dewbay 6年前 (2019-04-12) 2674浏览 0评论0个赞
背景: 最近在做日志收集,用到 Elasticsearch 作为存储层,因为日志量比较大,一天近 2T,所以每时每刻都会有大量的插入操作。又由于是给开发人员查日志使用,所以查询的量比较小。 受限于存储空间,目前仅保留 7 天的日志,多数为一个业务模块一个索引,按天切分索引。程序上怎么使用 Elasticsear 索引文档更有效率[1]官……继续阅读 » dewbay 6年前 (2019-04-12) 1960浏览 0评论0个赞
elasticsearch 查询(match 和 term)es 中的查询请求有两种方式,一种是简易版的查询,另外一种是使用 JSON 完整的请求体,叫做结构化查询(DSL)。由于 DSL 查询更为直观也更为简易,所以大都使用这种方式。DSL 查询是 POST 过去一个 json,由于 post 的请求是 json 格式的,所以存在很多灵活性,也有……继续阅读 » dewbay 6年前 (2019-04-12) 2023浏览 0评论1个赞
搜索引擎的索引1.单词——文档矩阵 单词-文档矩阵是表达两者之间所具有的一种包含关系的概念模型,图 3-1 展示了其含义。图 3-1 的每列代表一个文档,每行代表一个单词,打对勾的位置代表包含关系。 ……继续阅读 » dewbay 6年前 (2019-04-12) 1985浏览 0评论0个赞
在进行Lucene的搜索过程解析之前,有必要单独的一张把Lucene score 公式的推导,各部分的意义阐述一下。因为Lucene的搜索过程,很重要的一个步骤就是逐步的计算各部分的分数。Lucene的打分公式非常复杂,如下:在推导之前,先逐个介绍每部分的意义:t:Term,这里的 Term 是指包含域信息的 Term,也……继续阅读 » dewbay 6年前 (2019-04-12) 1998浏览 0评论0个赞
本来没有这篇文章,在公司分享 ES 的时候遇到一个问题,使用 boost 的时候,怎么从评分score中知道 boost 的影响。虽然我们从查询结果可以直观看到,boost 起了应有的作用,但是在 explain 的时候,找了很久也不明白,boost 去哪了?这个问题花了点时间,不过还是挺值得。由于没有直接用过 lucene,也从没想过到 luce……继续阅读 » dewbay 6年前 (2019-04-12) 2370浏览 0评论0个赞
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/kexinmei/article/details/45869041遇到了和这位题主类似的问题:假如某文档中已经有三个附件(作为内部对象保存),我想增加第四个附件怎么办?ES 本身并没有提供这个功能,需要我们编写 script 来完成。相关……继续阅读 » dewbay 6年前 (2019-04-12) 2427浏览 0评论0个赞
GET usernested/_search{ "query": { "nested": { "path": "tags", "query": { "bool": { "must": [ { "term": { ……继续阅读 » dewbay 6年前 (2019-04-12) 4798浏览 0评论0个赞