java中的文本分类库

     2023-03-12     305

关键词:

【中文标题】java中的文本分类库【英文标题】:library for text classification in java 【发布时间】:2012-02-21 14:04:56 【问题描述】:

我有一组分类的文本文件。我想对另一组大型文本文件进行分类以用于我的研究。有没有比较好的方法?

我认为基于 SVM 的方法很有用,但是否有使用此类算法的简单且文档化的库?

【问题讨论】:

Weka 有 SVM 以及其他分类算法。 【参考方案1】:

Mallet 是另一个值得研究的很棒的库。它有很好的命令行工具来帮助您入门,并且一旦您开始将它与系统的其余部分集成,它还有一个 Java API。

【讨论】:

【参考方案2】:

我对 SVM 了解不多,但 LingPipe 可能对你很有帮助。 link 是专门关于文档分类(自动或引导)的教程。

此外,请查看相互关联的搜索产品 Lucene(搜索库)、Solr(搜索服务器应用程序)和 Carrot2(用于“聚类”搜索结果)。在那个空间里应该有一些有趣的工作适合你。

【讨论】:

Weka 中的不同分类结果:GUI vs Java 库

】Weka中的不同分类结果:GUIvsJava库【英文标题】:DifferentclassificationresultsinWeka:GUIvsJavalibrary【发布时间】:2015-06-1519:51:36【问题描述】:在将WekaGUI分类结果与我的Java程序进行比较时遇到一些问题,使用iris数据集执行树(J48)。如... 查看详情

文本分类成类别

】文本分类成类别【英文标题】:TextClassificationintoCategories【发布时间】:2011-12-2912:24:21【问题描述】:我正在研究一个文本分类问题,我正在尝试将一组单词分类,是的,有很多库可用于分类,所以如果您建议使用它们,请不... 查看详情

java示例代码_我如何将文本中的一个单词按名称、数字、金钱、日期等进行分类

java示例代码_我如何将文本中的一个单词按名称、数字、金钱、日期等进行分类 查看详情

如何使用 sklearn 库使用朴素贝叶斯执行文本分类?

】如何使用sklearn库使用朴素贝叶斯执行文本分类?【英文标题】:Howtoperformtextclassificationwithnaivebayesusingsklearnlibrary?【发布时间】:2015-07-1503:04:51【问题描述】:我正在尝试使用朴素贝叶斯文本分类器进行文本分类。我的数据采... 查看详情

在java中使用朴素贝叶斯(weka)进行简单的文本分类

】在java中使用朴素贝叶斯(weka)进行简单的文本分类【英文标题】:Simpletextclassificationusingnaivebayes(weka)injava【发布时间】:2017-06-1513:38:12【问题描述】:我尝试在我的java代码中做文本分类朴素贝叶斯weka库,但我认为分类的结... 查看详情

如何评估我自己的文本分类器

...还在我的Golden标准语料库上使用了NB分类器,并使用Python中的Sci-kit学习库评估了它的性能。但是,我正在努力弄清楚如何评估我自己的分类器的性能。:S我非常感谢您 查看详情

将 SVM 分类器从 sklearn 导出到 Java 代码库 [关闭]

...核的SVC类),我对结果非常满意。现在我需要将production中的分类器导出 查看详情

在 Java 中构建/运行流式 Weka 文本分类器

...息。所以对于新消息,我们需要对消息进行标记,将消息中的标记与用于为模型构建词 查看详情

Matlab中的KNN文本分类

】Matlab中的KNN文本分类【英文标题】:KNNTextCategorizationinMatlab【发布时间】:2015-07-1310:30:52【问题描述】:我正在使用聚类和KNN算法进行我的项目文本分类。但我的分类工作不正常。我只是使用每个字母的ASCII值进行分类。在我... 查看详情

利用人工智能(magpie开源库)给一段中文的文本内容进行分类打标签(代码片段)

...里介绍的Magpie则属于人工智能领域里语义理解、机器学习中的一个具体的实现技术。&n 查看详情

用于文本分类的 SkLearn 模型

】用于文本分类的SkLearn模型【英文标题】:SkLearnmodelfortextclassification【发布时间】:2020-08-1116:19:50【问题描述】:我有一个分类器多类,使用Sklearn库提供的LinearSVC模型进行训练。该模型提供了一个decision_function方法,我将其与nu... 查看详情

文本分类/分类算法[关闭]

】文本分类/分类算法[关闭]【英文标题】:Textclassification/categorizationalgorithm[closed]【发布时间】:2011-04-0419:26:55【问题描述】:我的目标是[半]自动将文本分配到不同的类别。有一组用户定义的类别和每个类别的一组文本。理想... 查看详情

sklearn:文本分类交叉验证中的向量化

】sklearn:文本分类交叉验证中的向量化【英文标题】:sklearn:vectorizingincrossvalidationfortextclassification【发布时间】:2014-05-0512:43:51【问题描述】:我有一个关于在sklearn的文本分类中使用交叉验证的问题。在交叉验证之前对所有数... 查看详情

对文本文件中制表符分隔列中的文本进行分类

】对文本文件中制表符分隔列中的文本进行分类【英文标题】:Classifytextfromtabseparatedcolumnsintextfile【发布时间】:2017-08-0419:03:26【问题描述】:我有一个像this这样的文本文件:EducationJune2007BachelorsofScienceinBusinessAdministrationORGANIZAT... 查看详情

weka中的一元类文本分类?

】weka中的一元类文本分类?【英文标题】:unaryclasstextclassificationinweka?【发布时间】:2012-05-1019:09:04【问题描述】:我有一个特定类别(比如癌症)的训练数据集(文本)。我想在weka中为这个类训练一个SVM分类器。但是,当我... 查看详情

解决文本分类的监督学习中的同义词

】解决文本分类的监督学习中的同义词【英文标题】:AddressingsynonymsinSupervisedLearningforTextClassification【发布时间】:2017-02-1600:30:41【问题描述】:我正在使用scikit-learn监督学习方法进行文本分类。我有一个包含输入文本字段及其... 查看详情

bert-多标签文本分类实战之五——bert模型库的挑选与transformers(代码片段)

·请参考本系列目录:【BERT-多标签文本分类实战】之一——实战项目总览·下载本实战项目资源:>=点击此处=<[1]BERT模型库  从BERT模型一经Google出世,到tensorflow与pytorch版本的BERT相继发布,再到不同... 查看详情

bert-多标签文本分类实战之五——bert模型库的挑选与transformers(代码片段)

·请参考本系列目录:【BERT-多标签文本分类实战】之一——实战项目总览·下载本实战项目资源:>=点击此处=<[1]BERT模型库  从BERT模型一经Google出世,到tensorflow与pytorch版本的BERT相继发布,再到不同... 查看详情