Py之nltk：nltk包的简介、安装、使用方法、代码实现之详细攻略

callone 2022-09-19 15:39:33  64327

分类专栏：资讯

nltk包的简介

NLTK is a leading platform for building Python programs to work with human language data. It provides easy-to-use interfaces to over 50 corpora and lexical resources such as WordNet, along with a suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning, wrappers for industrial-strength NLP libraries, and an active discussion forum.

NLTK是构建用于处理人类语言数据的Python程序的领先平台。它为超过50个语料库和词汇资源（如WordNet）提供了易于使用的界面，以及一套用于分类、标记化技术、词干、标记、解析和语义推理的文本处理库、工业级NLP库的包装器以及一个活跃的讨论论坛。

用Python进行自然语言处理为语言处理的编程提供了一个实用的介绍。它由NLTK的创建者编写，指导读者完成编写python程序、使用语料库、对文本进行分类、分析语言结构等的基础知识。这本书的在线版本已经为python 3和nltk 3进行了更新。

自然语言工具包（NLTK）是用于自然语言处理的Python包。NLTK需要python 2.7、3.4、3.5、3.6或3.7。

NLTK(Natural Language ToolKit)，是时下非常流行的在Python解释器环境中用于自然语言处理的工具包。对于NLTK的使用者而言，它就像是一名极其高效的语言学家，为您快速完成对自然语言文本的深层处理和分析。

Natural Language Toolkit官网
nltk Package API

nltk包的安装

pip install nltk

nltk包的使用方法


from nltk.corpus import treebank
t = treebank.parsed_sents('wsj_0001.mrg')[0]
 
t.draw()

_images/tree.gif

nltk包的代码实现


import nltk
sentence = """At eight o'clock on Thursday morning
tokens = nltk.word_tokenize(sentence)
print(tokens)
tagged = nltk.pos_tag(tokens)
print(tagged )

网站声明：如果转载，请联系本站管理员。否则一切后果自行承担。

本文链接：https://www.xckfsq.com/news/show.html?id=3343

赞同 0

评论 0 条

Py之nltk：nltk包的简介、安装、使用方法、代码实现之详细攻略

nltk包的简介

nltk包的安装

nltk包的使用方法

nltk包的代码实现

相关文章

关注我们