elasticsearch海量数据使用简述

author author     2023-03-25     421

关键词:

参考技术A 应用场景当中经常会遇到模糊查询或多条件匹配查询,数据量较小的情况下通过简单的数据库模糊查询是可以解决的,但是对于数据量庞大的情况,数据库模糊查询就会出现性能问题。这种情况下的一种解决方案就是根据查询内容构建反向索引,借助搜索引擎进行查询,提升查询性能。

目前使用比较多的分布式搜索引擎是ElasticSearch。那么项目中如何使用ES?如何保证ES的数据更新?下面简单做个描述。

Elasticsearch使用可以简单分为两个阶段。数据初始化阶段、数据更新阶段。

数据初始化阶段。数据初始化常见的方式如下:

一、通过应用程序手动将数据库中的数据,调用ES接口API插入ES索引库中。

二、同过数据迁移工具将数据初始化到ES数据库。目前常用的ES同步工具有logstash-input-jdbc、DataX。通过同步迁移工具可以全量将数据库数据初始化到ES索引库中。

数据更新阶段。数据更新阶段常见的处理方式如下:

一、通过应用服务直接调用ES更新接口。这种方式实现比较简单但是对业务侵入性比较大。

二、对于实时性要求不高的可以采用定时任务监控数据表变化然后调用ES接口实现数据更新。

三、业务应用中通过发送消息异步更新数据。

四、通过DataX同步工具定时将修改的数据同步到ES库中。

上述是ElasticSearch使用的简单描述。使用的关键还是数据库与ES间的数据同步。能否用的好关键也是数据间的同步。

elasticsearch+hbase实现海量数据秒回查询

---------------------------------------------------------------------------------------------[版权申明:本文系作者原创,转载请注明出处] 文章出处:http://blog.csdn.net/sdksdk0/article/details/53966430作者:朱培  &nbs 查看详情

elasticsearch+hbase实现海量数据秒回查询

---------------------------------------------------------------------------------------------[版权申明:本文系作者原创,转载请注明出处] 文章出处: http://blog.csdn.net/sdksdk0/article/details/53966430作者:朱培 &nbs 查看详情

elasticsearch+hbase实现海量数据秒回查询(代码片段)

...---------首先祝大家2017新年快乐,我今天分享的是通过ElasticSearch与hbase进行整合的一个搜索案例,这个案例涉及的技术面比较广,首先你得有JAVAEE的基础,要会SSM,而且还要会大数据中的hdfs、zookeeper、hbase以及ElasticS... 查看详情

海量日志数据存储用elasticsearch和hbase哪个好

从基本功能来说这两个确实有相似性,但是根据业务需求不同,我觉得有几点可以考虑:1.查询复杂度:HBase支持简单的行或者range查询,比如给一个PK查该行的数据,或者给一个begin/end查这个范围的数据,如果想完成更复杂的功... 查看详情

elasticsearch腾讯elasticsearch海量规模背后的内核优化剖析

1.概述转载:腾讯Elasticsearch海量规模背后的内核优化剖析 查看详情

elasticsearch性能优化实战指南

...架构和并行处理机制的大数据工具所才能实现这些功能。Elasticsearch是响应如前所述大多数用例的最热门的开源数据存储引擎之一。Elasticsearch是一种分布式数据存储和搜索引擎,具有 查看详情

elasticsearch:如何在django中使用elasticsearch(代码片段)

...级需求时,此解决方案可能会很慢且有问题。这就是Elasticsearch的用武之地。这是Django的Elasticsearch教程,可帮助你在项目中充分利用这个方便的搜索引擎。为什么要使用Elasticsearchÿ 查看详情

elasticsearch:如何在django中使用elasticsearch(代码片段)

...级需求时,此解决方案可能会很慢且有问题。这就是Elasticsearch的用武之地。这是Django的Elasticsearch教程,可帮助你在项目中充分利用这个方便的搜索引擎。为什么要使用Elasticsearchÿ 查看详情

海量日志下的日志架构优化:filebeat+logstash+kafka+elk(代码片段)

...如果业务每天会产生海量的日志,就有可能引发logstash和elasticsearch的性能瓶颈问题。因此改善这一问题的方法就是filebeat+logstash+kafka+ELK,也就是将存储从elasticsearch转移给消息中间件,减少海量数据引起的宕机,降低elasticsearch的... 查看详情

分布式爬虫之elasticsearch基础1(代码片段)

一:搜索引擎elasticsearch介绍  Elasticsearch 是一个全文搜索引擎,可以快速地储存、搜索和分析海量数据。二:应用场景海量数据分析引擎站内搜索引擎数据仓库三:安装我们可以到Elasticsearch的官方网站下载Elasticsearch... 查看详情

小白学es01-elasticsearch的基础概念

目录1Elasticsearch概述1.1Elasticsearch是什么1.2Elasticsearch的优点1.3Elasticsearch的相关产品1.4Elasticsearch的使用场景2Elasticsearch的功能概述2.1分布式的搜索引擎和数据分析引擎2.2全文检索结构化检索数据分析2.3海量数据的近实时处理3Elasticse... 查看详情

009-elasticsearch示例数据导入uri查询方式简介querydsl简介查询简述_sourcematchmustshould等过滤器聚合(代码片段)

一、简单数据客户银行账户信息,json"account_number":0,"balance":16623,"firstname":"Bradshaw","lastname":"Mckenzie","age":29,"gender":"F","address":"244ColumbusPlace","employer":"Euron","email":"[email protected 查看详情

elasticsearch核心技术与实战(代码片段)

1、ES概念ElasticSearch是一个分布式,高性能、高可用、可伸缩的搜索和分析系统,支持海量数据搜索与分析,可以用于电商网站、门户网站、企业IT系统等各种场景下的搜索引擎,也可以用于对海量的数据进行近实时(秒级)的数... 查看详情

[elasticsearch实战]snapshotrestore备份还原

参考技术A长期运维elasticsearch时,你可能会遇到一个非常实用的需求:elasticsearch集群的存储空间有限,而每天都有海量的日志数据流入集群中。但是旧数据往往使用频率极低,那么是不是可以定期将过期数据从集群中移除,当必... 查看详情

elasticsearch入门简介(代码片段)

...fieldmapping5.其他重要概念clusternodeshardreplica参考文献1.简介Elasticsearch(ES)是一个基于ApacheLucene开源的分布式、高扩展、近实时的搜索引擎,主要用于海量数据快速存储,实时检索,高效分析的场景。通过简单... 查看详情

67-日志分析系统elk-elk架构简述

ELK概述ELK是三个项目的简称,分别是Elasticsearch、Logstash和KibanaElasticsearch是一个实时的全文搜索,存储库和分析引擎。Elasticsearch是一个分布式的免费开源搜索和分析引擎,适用于包括文本、数字、地理空间、结构化和非结构化数据... 查看详情

2021年大数据elk:elasticsearch简单介绍

...;帮助大家回顾前面的知识重点。目录系列历史文章 一、Elasticsearch简介1、介绍2、创始人二、Elasticsearch可以做什么1、信息检索2、企业内部系统搜索3、数据分析引擎三、Elasticsearch特点1、海量数据处理2、开箱即用 3、作为传统... 查看详情

elasticsearch入门

ElasticSearch简介什么是ElasticSearch基于ApacheLucene构建的开源搜索引擎采用Java编写,提供简单易用的RESTFulAPI轻松的横向扩展,可支持PB级的结构化或非结构化数据处理应用场景可用应用场景海量数据分析引擎站内搜索引擎数据仓库&nb... 查看详情