如何在elasticsearch中安装中文分词器(ik)和拼音分词器?

张发财的博客 张发财的博客     2022-09-01     111

关键词:

  声明:我使用的Elasticsearch的版本是5.4.0,安装分词器前请先安装maven

一:安装maven

https://github.com/apache/maven

说明:

安装maven需要java1.7+

编译安装分词器时,可能会报错,报错信息如下:

[ERROR] COMPILATION ERROR :
[INFO] -------------------------------------------------------------
[ERROR] No compiler is provided in this environment. Perhaps you are running on a JRE rather than a JDK?

解决方法:下载一个最新版的JDK就可以了,下载链接如下

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

 

二:安装中文分词器IK

https://github.com/medcl/elasticsearch-analysis-ik

 

三:安装拼音分词器pinyin

https://github.com/medcl/elasticsearch-analysis-pinyin

安装方法和安装中文分词器的方法一样

 

如何开发自己的搜索帝国之安装ik分词器

   Elasticsearch默认提供的分词器,会把每个汉字分开,而不是我们想要的根据关键词来分词,我是中国人 不能简单的分成一个个字,我们更希望“中国人”,“中国”,“我”这样的分词,这样我们... 查看详情

elasticsearch中文分词器详解(代码片段)

1.es安装中文分词器官网:https://github.com/medcl/elasticsearch-analysis-ik1.1.安装中文分词器安装中文分词器的要求:​1.分词器的版本要与es的版本一直​2.所有es节点都需要安装中文分词器​3.安装完分词器需要重启1.在线安装[root@elastics... 查看详情

elasticsearch如何自定义扩展词库?

Elasticsearch实战项目中势必会用到中文分词,而中文分词器的选型包含但不限于如下开源分词器:IK分词器https://github.com/medcl/elasticsearch-analysis-ikAnsj分词器https://github.com/NLPchina/elasticsearch-analysis-ansjjieba分词器https://gi 查看详情

elasticsearch中文分词器对比

参考技术A对以上分词器进行了一个粗略对比:截止到目前为止,他们的分词准确性从高到低依次是:结合准确性来看,选用中文分词器基于以下考虑:截止目前,IK分词器插件的优势是支持自定义热更新远程词典。IK分词器的github... 查看详情

elasticsearch之中文分词器插件es-ik

 前提什么是倒排索引?Elasticsearch之分词器的作用Elasticsearch之分词器的工作流程Elasticsearch之停用词Elasticsearch之中文分词器Elasticsearch之几个重要的分词器       elasticsearch官方默认的分词插件  1、el... 查看详情

elasticsearch安装elasticsearch-analysis-ik中文分词器(代码片段)

1,讲分词器的文件夹放入es安装包的plugins,重新启动elasticsearch//查询es运行中的进程pidps-aux|grepelasticsearch//杀死进程kill-9pid//使用es账户启动nohup./elasticsearch&2,重启es,然后在新建index的type表结构时,需要指定将来可能要使用... 查看详情

elasticsearch安装elasticsearch-analysis-ik中文分词器(代码片段)

1,讲分词器的文件夹放入es安装包的plugins,重新启动elasticsearch//查询es运行中的进程pidps-aux|grepelasticsearch//杀死进程kill-9pid//使用es账户启动nohup./elasticsearch&2,重启es,然后在新建index的type表结构时,需要指定将来可能要使用... 查看详情

elasticsearch安装中文分词器插件smartcn

原文:http://blog.java1234.com/blog/articles/373.htmlelasticsearch安装中文分词器插件smartcn elasticsearch默认分词器比较坑,中文的话,直接分词成单个汉字。我们这里来介绍下smartcn插件,这个是官方推荐的,中科院搞的,基本能满足需求... 查看详情

为elasticsearch添加中文分词,对比分词器效果

http://keenwon.com/1404.htmlElasticsearch中,内置了很多分词器(analyzers),例如standard (标准分词器)、english(英文分词)和chinese (中文分词)。其中standard 就是无脑的一个一个词(汉字)切分,所以适用范围广,但是精... 查看详情

elasticsearch搜索引擎安装配置中文分词器ik插件(代码片段)

一、IK简介ElasticSearch(以下简称ES)默认的分词器是标准分词器Standard,如果直接使用在处理中文内容的搜索时,中文词语被分成了一个一个的汉字,因此引入中文分词器IK就能解决这个问题,同时用户可以配置自己的扩展字典、... 查看详情

elasticsearch实战(二十六)-ik中文分词器

        为什么要在elasticsearch中要使用ik这样的中文分词?因为ES提供的分词是英文分词,对于中文的分词就做的非常不好了,因此我们需要一个中文分词器来用于搜索和使用。一、安装   &... 查看详情

dockerfile构建elasticsearch镜像安装ik中文分词器插件(代码片段)

DockerFile构建ElasticSearch镜像安装IK中文分词器插件为什么要安装IK中文分词器?ES提供的分词是英文分词,对中文做分词时会拆成单字而不是词语,非常不好,因此索引信息含中文时需要使用中文分词器插件。一、环境及文件准备... 查看详情

elasticsearch中文分词器比对表

1.概述分词器分词粒度出错情况支持处理字符新词识别词性标注认证方法接口BosonNLP多选择无识别繁体字有有TokenRESTfulIKAnalyzer多选择无兼容韩文日文有无无JarNLPIR多选择中文间隔符未知有有无多语言接口SCWS多选择无未知有有无PHP... 查看详情

elk----elasticsearch使用ik中文分词器(代码片段)

...的是IK分词器。注意,下载分词器的时候,版本必须要与Elasticsearch安装的版本一致,否则会出现不可描述的错误。下载地址: https://github.com/medcl/elasticsearch-analysis-ik/releases注意: es-ik分词插件版本一定要和es安装的版本对应... 查看详情

elasticsearch安装中文分词器(代码片段)

发车   为什么要在elasticsearch中要使用ik这样的中文分词呢,那是因为es提供的分词是英文分词,对于中文的分词就做的非常不好了,因此我们需要一个中文分词器来用于搜索和使用。今天我们就尝试安装下IK分词。上... 查看详情

elasticsearch7.8.0版本进阶——ik中文分词器(代码片段)

...IK中文分词器下载地址下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v7.8.02.2、ES引入IK中文分词器将IK中文分词器安装包解压,然后把解压后的文件夹放入ES根目录下的plugins目录下,重启ES即可使用。注意&... 查看详情

最近在学习elasticsearch,想请问中文分词器有比ik更好用的吗?像阿里这些大厂都是用啥分词。

参考技术AHanLP也可以 查看详情

elasticsearch速学-ik中文分词器远程字典设置

...词的,我们可以丰富这个词库。 IK分词器(IKAnalysisforElasticsearch)给了我们一个基本的配置: https://github.com/medcl/elasti 查看详情