nlp汉语自然语言处理入门基础知识介绍

dashuju2018 dashuju2018     2023-01-10     142

关键词:

NLP汉语自然语言处理入门基础知识介绍

自然语言处理定义:

自然语言处理是一门计算机科学、人工智能以及语言学的交叉学科。虽然语言只是人工智能的一部分(人工智能还包括计算机视觉等),但它是非常独特的一部分。这个星球上有许多生物拥有超过人类的视觉系统,但只有人类才拥有这么高级的语言。

自然语言处理的目标是让计算机处理或说“理解”自然语言,以完成有意义的任务,比如订机票购物或QA等。完全理解和表达语言是极其困难的,完美的语言理解等效于实现人工智能。

自然语言处理涉及的几个层次:技术分享图片

 

作为输入一共有两个来源,语音与文本。所以第一级是语音识别和OCR或分词(事实上,跳过分词虽然理所当然地不能做句法分析,但字符级也可以直接做不少应用)。接下来是形态学,援引《统计自然语言处理》中的定义:形态学(morphology):形态学(又称“词汇形态学”或“词法”)是语言学的一个分支,研究词的内部结构,包括屈折变化和构词法两个部分。由于词具有语音特征、句法特征和语义特征,形态学处于音位学、句法学和语义学的结合部位,所以形态学是每个语言学家都要关注的一门学科。

Hanlp自然语言处理开发包:

从事大数据方面工作的人对自然语言处理必然都是不陌生的,在Github上用户量最多的开源汉语自然语言处理工具是HanLP。HanLP的初始版本是在2014年初开发的,3月份的时候开始在Github上开源。2015年的时候集成在了大快搜索的DKNLP中,目前大快已经把DKNLP技术成果已经开源,并且整体装如HanLP项目,HanLP的版本已经到了V1.50。

Hanlp自然语言处理技术优势:

支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词调、词性标注),命名实体识别(中国人民、音译人民、日本人民,地名,实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxEnt依存句法分析、神经网络依存句法分析)。提供Lucene查件,兼容Solr和ElasticSearch。

 技术分享图片

 

Hanlp自然语言处理应用领域:

Hanlp已经被广泛应用于Lucene、Solr、ElasticSearch、hadoop、android、Resin等平台,有大量开源作者开发各种查件与拓展,并且被包装或移植到Python、C#、R、JavaScript等语言上去。

技术分享图片

 

 

 

《nlp汉语自然语言处理原理与实践》结构图

后续博客会根据上面的图结合一些其他资料更新自然语言处理的朋友多多交流 查看详情

自然语言处理nlp快速入门(代码片段)

自然语言处理NLP快速入门 https://mp.weixin.qq.com/s/J-vndnycZgwVrSlDCefHZA  【导读】自然语言处理已经成为人工智能领域一个重要的分支,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。本文提供了... 查看详情

《自然语言处理实战入门》:汉语语言学简介

文章大纲1汉语与汉字的起源2汉字的统一与演变3印欧语系与汉藏语系4语言区别对于NLP的影响参考文献汉语语言学语言学是以语言为研究对象的科学。它研究的对象是人类语言,它的任务是通过研究、描写语言的结构、功能及其... 查看详情

nlp老司机带你入门自然语言处理

自然语言处理是一门用于理解人类语言、情感和思想的技术,被称为是人工智能皇冠上的明珠。 随着深度学习发展,自然语言处理技术近年来发展迅速,在技术上表现为BERT、GPT等表现极佳的模型;在应用中表现为chatbot、知... 查看详情

《自然语言处理实战入门》----nlp方向:面试笔试题集

文章大纲数学基础线性代数实践经验参考文献本文按照自然语言处理的基本逻辑分类组织一批笔试面试常见问题,并给出最本质的核心回答。希望你能用keyword抓住面试官的心。本篇内容主要包括:数学基础数学基础线性... 查看详情

nlp老司机带你入门自然语言处理

自然语言处理是一门用于理解人类语言、情感和思想的技术,被称为是人工智能皇冠上的明珠。 随着深度学习发展,自然语言处理技术近年来发展迅速,在技术上表现为BERT、GPT等表现极佳的模型;在应用中表现为chatbot、知... 查看详情

《自然语言处理实战入门》----nlp方向:面试笔试题集

文章大纲自然语言处理基础知识自然语言处理与机器学习、深度学习文本的表示技术序列标注关系抽取知识图谱参考文献本文按照自然语言处理的基本逻辑分类组织一批笔试面试常见问题,并给出最本质的核心回答。希望你能用... 查看详情

自然语言处理(nlp)学习路线总结(代码片段)

目录自然语言处理概述自然语言处理入门基础自然语言处理的主要技术范畴自然语言处理基本点特征处理模型选择NLP常用工具NLP语言模型快速入门NLP方法自然语言处理学习资料1、自然语言处理概述自然语言处理(NaturalLanguage... 查看详情

产品经理如何入门自然语言处理(nlp)?

参考技术A自然语言处理,顾名思义即自然语言处理的技术,通常用缩写NLP指代。各类产品经理日常的工作中,会遇到大量自然语言处理的应用场景。以智能推荐为例,在待推荐物文本分类、主题分类等场景中都会用到。本篇以... 查看详情

汉语语法

为了更好的促进自然语言处理的发展:包括分词、文本分类、命名实体识别、句法分析、信息抽取、知识库构建、主题词识别、自动摘要、智能问答、语义理解、对话生成、话题推荐、语言模型、机器翻译、语义表示等方面在中... 查看详情

nlp书单

自然语言处理入门基础1数学基础(1)线性代数向量、矩阵、距离计算(余弦距离、欧式距离、曼哈顿距离、明可夫斯基距离、切比雪夫距离、杰卡德距离、汉明距离、标准欧式距离、皮尔逊相关系数)(2)概率论随机试验、条... 查看详情

aipm应该懂的自然语言处理(nlp)知识

...题”三个方面来简单介绍下NLP。一.什么是NLPNLP,中文叫自然语言处理,简单来说,是一门让计算机理解、分析以及生成自然语言的学科,大概的研究过程是:研制出可以表示语言能力的模型——提出各种方法来不断提高语言模... 查看详情

datawhale之nlp学习-打卡(代码片段)

...赛题名称:零基础入门NLP之新闻文本分类赛题目标:入门自然语言处理,接触NLP的预处理、模型构建和模型训练等知识点赛题任务:对新闻文本进行分类2.学习目标理解赛题背景与赛题数据3.赛题数据报名比赛后即可下载相应数... 查看详情

自然语言处理入门(代码片段)

自然语言处理NLP( naturallanguageprocess)是这几年越来越火了,kaggle上的比赛有关NLP的也日渐多起来了.NLP的应用场景很多,情感分析,邮件过滤,ai客服,机器翻译等等等等,就像这几年越来越火有成为BAT之后第四极的今日头条,为什么能... 查看详情

nlp循环神经网络基础(代码片段)

循环神经网络和自然语言处理介绍1.文本的tokenization1.1概念和工具的介绍1.2中英文分词的方法2.N-garm表示方法3.向量化3.1one-hot编码3.2wordembedding3.3wordembeddingAPI3.4数据的形状变化1.文本的tokenization1.1概念和工具的介绍tokenization就是通... 查看详情

《自然语言处理实战入门》----nlp方向:面试笔试题集

...纲文本预处理文本的表示技术序列标注参考文献本文按照自然语言处理的基本逻辑分类组织一批笔试面试常见问题,并给出最本质的核心回答。希望你能用keyword抓住面试官的心。本篇主要包含的内容有:文本预处理文本的表示... 查看详情

nlp中语言模型的建立及平滑算法介绍

以下内容全部来自宗成庆博士的《统计自然语言处理(中文信息处理)》一书的第五章(部分)。 还有许多其他的平滑方法,不介绍了。最后,总结一下:  查看详情

《nlp的相关资料推荐》

...,《keras深度学习实践》,TF和keras的官方文档NLP:《统计自然语言处理》,刘兵的《情感分析》,《基于深度学习的自然语言处理》,多看博客+公众号+论文中所提到的模型   gensim等NLP工具+动手实践   深蓝学院的相... 查看详情