• 键值型非关系型数据库Redis使用说明大全

    2023-01-06 NoSQL 1 ℃
    0 介绍 Redis是一个开源的key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是...
  • 5.ElasticSearch系列之文档的基本操作

    2023-01-06 NoSQL 0 ℃
    1. 文档写入 # create document. 自动生成 _id POST users/_doc { "user" : "shenjian", "post_date" : "2022-08-07T14:12:12", "message" : "trying out Kibana" } # 创建指定ID文档,存在则替换 POST users/_doc/1...
  • 6.ElasticSearch系列之倒排索引

    2023-01-06 NoSQL 0 ℃
    1. 倒排索引简介 对于书通过目录查找对应章节内容的方式属于正排索引,而对于想查询文本,如我爱中国在书籍中出现的次数与具体位置,则是倒排索引的范畴。 2. 倒排索引核心组成 * 单词词典(Term Dictionary) 记录所有文档的单词,记录单词到倒排列表的关联关系。单词词典一般比较大,可以通过B+树或哈希拉链法实现,以满足高性能的插入和查询 * 倒排列...
  • 14.ElasticSearch系列之分布式特性及分布式搜索机制(三)

    2023-01-06 NoSQL 4 ℃
    1. 刨析分布式查询及相关性算分 1.1 分布式搜索的运行机制 * ElasticSearch的搜索,会分为两阶段进行 * 第一阶段 Query * 第二阶段 Fetch * Query Then Fetch 1.2 QUERY阶段 * 用户发出搜索请求到ES节点。节点收到请求后,会已Coordinating节点的身份,在6个主副中随机选择3个分片,发送查询...
  • 8.ElasticSearch系列之索引模板与索引

    2023-01-06 NoSQL 0 ℃
    1. 索引模板创建索引 可以通过kibana工具进行创建索引模板 也可以自定义语句,如创建poi索引模板 POST _index_template/poi { "index_patterns": ["poi*"], "template" : { "settings" : { "index" : { "number_of_shards" : "1", "num...
  • 16.ElasticSearch系列之深入聚合分析

    2023-01-06 NoSQL 0 ℃
    深入理解聚合分析原理及精确性问题 1. METRIC AGGREGATION * 单值分析,只输出一个分析结果 * min max avg sum * cardinality (类似distinct count) * 多值分析,输出多个分析结果 * stats extended stats * percentile, percentile rank * to...
  • 17.ElasticSearch系列之快照备份还原

    2023-01-06 NoSQL 0 ℃
    1. SSHFS挂载 * 上传Elasticsearch\fuse-2.9.2-11.el7.x86_64.rpm至ES所在三台机器 * 上传Elasticsearch\fuse-libs-2.9.2-11.el7.x86_64.rpm至ES所在三台机器 * 上传Elasticsearch\fuse-sshfs-2.10-1.el7.x86_64.rpm至E...
  • 9.ElasticSearch系列之聚合

    2023-01-06 NoSQL 3 ℃
    1. 聚合分类 * Bucket Aggregation:系列满足特定条件的文档的集合,如term range GET kibana_sample_data_flights/_search { "size": 0, // 只显示聚合结果 "aggs": { "flight_dest": { "terms": { "field": "DestCountry"...
  • 18. ElasticSearch系列之批量插入与更新

    2023-01-06 NoSQL 3 ℃
    本文介绍工作中Python版常用的高效ES批量插入、更新数据方式 1. 批量插入 import pandas as pd from elasticsearch import helpers actions = list() count = 0 for index, item in merged_df.iterrows(): // 过滤nan值 filted_...
  • 10.ElasticSearch系列之深入搜索

    2023-01-06 NoSQL 0 ℃
    1. 基于词项与全文的搜索 1.1 基于TERM的搜索 * term的重要性:term是表达语义的最小单位 * 特点: * 包括term query\range query\exists query\prefix query\wildcard query * term查询,对输入不做分词 * 可以通过constant score将查询转换成一个FILTERI...