11-23 03:48 阅读 239

Elasticsearch 汇总数据

汇总作业是一项周期性任务，它汇总索引模式指定的索引中的数据，并将其汇总到新索引中。在下面的示例中，我们创建了一个名为sensor的索引，该索引具有不同的日期时间戳。然后我们创建一个rollup作业，使用cron job周期性地从这些索引中汇总数据。

PUT /sensor/_doc/1{
   "timestamp": 1516729294000,
   "temperature": 200,
   "voltage": 5.2,
   "node": "a"}

在运行上面的代码时，我们得到以下结果-

{
   "_index" : "sensor",
   "_type" : "_doc",
   "_id" : "1",
   "_version" : 1,
   "result" : "created",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0   },
   "_seq_no" : 0,
   "_primary_term" : 1}

现在，为其他文档添加第二个文档，依此类推。

PUT /sensor-2018-01-01/_doc/2{
   "timestamp": 1413729294000,
   "temperature": 201,
   "voltage": 5.9,
   "node": "a"}

创建汇总作业

PUT _rollup/job/sensor
{
   "index_pattern": "sensor-*",
   "rollup_index": "sensor_rollup",
   "cron": "*/30 * * * * ?",
   "page_size" :1000,
   "groups" : {
      "date_histogram": {
         "field": "timestamp",
         "interval": "60m"      },
      "terms": {
         "fields": ["node"]
      }
   },
   "metrics": [
      {
         "field": "temperature",
         "metrics": ["min", "max", "sum"]
      },
      {
         "field": "voltage",
         "metrics": ["avg"]
      }
   ]
}

cron参数控制作业的激活时间和激活频率。当汇总作业的cron计划触发时，它将从上次激活后从上次中断的地方开始汇总

在作业运行并处理了一些数据之后，我们可以使用DSL查询进行一些搜索。

GET /sensor_rollup/_rollup_search
{
   "size": 0,
   "aggregations": {
      "max_temperature": {
         "max": {
            "field": "temperature"         }
      }
   }
}

推荐资源

玩转图论算法大神带你从入门到精通(bobo老师爆款) 完整版唐Sir说直播必修专栏+直播录屏专栏，解析平台、流量、岗位、货品、场景的直播底层逻辑。网课变现特训营，0基础，0经验也能把知识变成钱建筑课堂安装GQI-高永明价值2159元-最适合你的安装多专业造价课程 2020年主管护师《健康护理、感染护理、护理管理》精讲班视频教程 Selinu技术文档 SELinux(Security-Enhanced Linux) 强制访问控制教材零基础做出万粉公众号，3个月从不到10人做到了4W+粉，业余月入3000-8000元(完结) 知乎好物带货培训班：月佣金5W+简单易懂的实操方法分享 2022玩转手机影像全系课，零基础的小白也能进阶成为手机摄影专业人士苏博士2021淘宝无货源课程资料教程全