elasticsearch实战(二十六)-ik中文分词器

张志翔ۤ 张志翔ۤ     2023-01-05     722

关键词:

        为什么要在elasticsearch中要使用ik这样的中文分词?因为 ES 提供的分词是英文分词,对于中文的分词就做的非常不好了,因此我们需要一个中文分词器来用于搜索和使用。

一、安装

        我们可以从 官方github上下载该插件,我们下载对应于我们使用的es的版本的ik,并且我们能够看到具体的安装步骤,可以有两种安装方法。

        这里我们选择第一种方式。

        由于IK分词器和ES版本需要兼容,因为我们这个专栏的ES集群版本是7.x,所以我们这边用IK也使用最新的7.x版本,图示如下:

   

《自然语言处理实战入门》文本检索----文本查询实例:elasticsearch配置ik分词器及使用

...配。我们在文本检索过程中,主要使用倒排索引进行,但Elasticsearch默认的分词器将汉语文本直接分成了单个的汉字,正如第五小节代码清单显示的那样,这就会对检索结果产生影响,那么如何在Elasticsearch中引入汉语分词器,使... 查看详情

elasticsearch实战(二十三)-数据删除

本文主要讲解ElasticSearch数据删除,帮助大家打好ElasticSearch基础。——continue 查看详情

elasticsearch实战(二十二)-数据写入

本文主要讲解ElasticSearch数据写入,帮助大家打好ElasticSearch基础。——continue 查看详情

elasticsearch实战(二十)-使用别名索引设计

本文主要讲解ElasticSearch使用别名索引设计,帮助大家打好ElasticSearch基础。——continue 查看详情

elasticsearch中文分词(ik)

ElasticSearch安装官网:https://www.elastic.co1.ElasticSearch安装1.1.下载安装公共密钥rpm--importhttps://artifacts.elastic.co/GPG-KEY-elasticsearch1.2.在 /etc/yum.repos.d/目录下建立 elasticsearch.repo文件vim/etc/yum 查看详情

elasticsearch安装中文分词器(代码片段)

发车   为什么要在elasticsearch中要使用ik这样的中文分词呢,那是因为es提供的分词是英文分词,对于中文的分词就做的非常不好了,因此我们需要一个中文分词器来用于搜索和使用。今天我们就尝试安装下IK分词。上... 查看详情

在elasticsearch中使用ik中文分词插件

...一个自带IK的版本,下载即用,https://github.com/xlb378917466/elasticsearch5.2.include_IK 添加了IK插件意味着你可以使用ik_smart(最粗粒度的拆分)和ik_max_word(最细粒度的拆分)两种analyzer。 你也可以从下面这个地址获取最新的IK源... 查看详情

docker安装elasticsearch的中文分词器ik(代码片段)

主要问题一定要保证ElasticSearch和ElasticSearch插件的版本一致我是用的是ElasticSearch是5.6.11版本对应elasticsearch-analysis-ik-5.6.11安装插件在线安装进入容器dockerexec-itelasticsearch/bin/bash在线下载并安装./bin/elasticsearch-plugininstallhttps://github.co... 查看详情

elasticsearch实战(二十一)-使用模板助力索引设计

本文主要讲解ElasticSearch使用模板助力索引设计,帮助大家打好ElasticSearch基础。——continue 查看详情

centos7elasticsearch+ik中文分词+kibana

一、关于elasticsearch、ik、kibana安装包的下载:1.ik中文分词的下载地址为:https://github.com/medcl/elasticsearch-analysis-ik/releases   查看和下载对应的ik版本    2.elasticsearch、kibana安装包的而下载地址:https://www.elas... 查看详情

elasticsearch中文分词(代码片段)

...hobby","text":"听音乐"     中文分词:  IK分词器Elasticsearch插件地址:https://github.com/medcl/elasticsearch-analysis-ik  安装方法:将下载到的elasticsearch-analysis-ik-6.5.4.zip解压到elasticsearch/plugins/ik目录下即可。    unzipelastics... 查看详情

elasticsearch之中文分词器插件es-ik

 前提什么是倒排索引?Elasticsearch之分词器的作用Elasticsearch之分词器的工作流程Elasticsearch之停用词Elasticsearch之中文分词器Elasticsearch之几个重要的分词器       elasticsearch官方默认的分词插件  1、el... 查看详情

dockerfile构建elasticsearch镜像安装ik中文分词器插件(代码片段)

DockerFile构建ElasticSearch镜像安装IK中文分词器插件为什么要安装IK中文分词器?ES提供的分词是英文分词,对中文做分词时会拆成单字而不是词语,非常不好,因此索引信息含中文时需要使用中文分词器插件。一、环境及文件准备... 查看详情

elasticsearch速学-ik中文分词器远程字典设置

...词的,我们可以丰富这个词库。 IK分词器(IKAnalysisforElasticsearch)给了我们一个基本的配置: https://github.com/medcl/elasti 查看详情

elasticsearch搜索引擎安装配置中文分词器ik插件(代码片段)

一、IK简介ElasticSearch(以下简称ES)默认的分词器是标准分词器Standard,如果直接使用在处理中文内容的搜索时,中文词语被分成了一个一个的汉字,因此引入中文分词器IK就能解决这个问题,同时用户可以配置自己的扩展字典、... 查看详情

elasticsearch实战(二十四)-数据更新过程与单条数据更新方式

本文主要讲解ElasticSearch数据更新过程与单条数据更新方式,帮助大家打好ElasticSearch基础。——continue 查看详情

elasticsearch实战(二十五)-数据更新并发与条件式更新

本文主要讲解ElasticSearch数据更新并发与条件式更新,帮助大家打好ElasticSearch基础。——continue 查看详情

elasticsearch安装中文分词插件ik

Elasticsearch默认提供的分词器,会把每一个汉字分开,而不是我们想要的依据关键词来分词。比如:curl-XPOST"http://localhost:9200/userinfo/_analyze?analyzer=standard&pretty=true&text=我是中国人"我们会得到这种结果:{tokens:[{token:textstart_offs... 查看详情