情感分析是自然语言处理(NLP)领域的一类任务,又称倾向性分析,意见抽取,意见挖掘,情感挖掘,主观分析等,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。具体到数据新闻领域,文本情感分析不仅可以提供一个新的数据分析方向,也可以弥补数据新闻“用数据说话”,缺乏情感考察的缺陷。
本期推送为大家带来了两个python包,SnowNLP和BaiduSenta,都适用于自然语言处理中的文本情感分析模块。通过导入文本信息,python将帮你分析语言中的褒义、贬义成分,并给出相应的分数。利用生成的情感分数,可以制作相应的数据图表来反映舆论场中人们的情感倾向。01
少量文本测试
对于希望测试这一功能而处理文本量不大的使用者来说,SnowNLP和百度开发的Senta项目分别提供了公众号测试功能与试用网页,在下载python包之前,使用者可以先行测试这两个包是否符合自身的需求。
使用者可以首先关注公众号“AINLP”,然后在对话框中输入前缀“中文情感分析”+所需要分析的语句。公众号将会提供BaiduSenta和SnowNLP两个情感分析项目所提供的分析结果。如下图所示。除此之外,百度还提供了专门的试用网页,这一试用功能在百度大脑的AI开发平台页面上,网址为:http://22j.co/bSkk
如果使用者所需要分析的文本不多,可以使用试用网页或公众号,毕竟python包的安装需要大量前置工作,耗费时间较长,如果不是长