Py之SnowNLP:SnowNLP中文处理包的简介、安装、使用方法、代码实现之详细攻略
目录
snowNLP是国人开发的python类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的。
snownlp主要可以进行中文分词(算法是Character-Based Generative Model)、词性标注、情感分析、文本分类(原理是朴素贝叶斯)、转换拼音、繁体转简体、提取文本关键词(原理TextRank)、提取摘要(原理TextRank)、分割句子、文本相似(原理BM25)。官网还有更多关于该库的介绍。
github:SnowNLP: Simplified Chinese Text Processing
snownlp pypi
pip install snownlp
文章推荐
NLP之TEA:基于SnowNLP实现自然语言处理之对输入文本进行情感分析(分词→词性标注→情感分析→测试)
现在提供训练的包括分词,词性标注,情感分析,而且都提供了我用来训练的原始文件 以分词为例 分词在snownlp/seg
目录下
- from snownlp import seg
- seg.train('data.txt')
- seg.save('seg.marshal')
- from snownlp import tag
- tag.train('199801.txt')
- tag.save('tag.marshal')
- from snownlp import sentiment
- sentiment.train('neg.txt', 'pos.txt')
- sentiment.save('sentiment.marshal')
网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。
添加我为好友,拉您入交流群!
请使用微信扫一扫!