前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
近日,绿地集团爆出了一个大瓜,一个微博名为@VS生生不息的网友在5月11日发布了一封实名举报信,举报“绿地陈军与其合法妻子、绿地现任员工张雨婷发生不正当男女关系以及严重经济违纪”。
在5月16日晚间,绿地控股集团纪检监察室发布官方声明。
5月17日晚间,疑为举报人妻子深夜爆料称:“遭丈夫威胁恐吓勒索,索赔500万元,还有过家暴…”并表示“在一起期间花费了丈夫60万~70万元”…
我们再来用Python抓取下相关新闻的评论看看吃瓜群众都说什么?
原文地址:https://news.163.com/20/0518/09/FCTBESKH00019B3E.html
通过这张词云图可以看出,大部分吃瓜群众关注基本上都是出轨、绿地、新人、高管、不要脸、老公、老婆等。
我们再来看看吃瓜群众都是来自哪些地区。
通过这张图可以得知吃瓜群众来自地区TOP3的为广东、江苏、山东。哈哈,吃瓜大省依然是广东,另外山东有冒头的趋势喔。
那这些地区的网友评论是否有区别呢?
首先是广东吃瓜群众词云图
TOP10关键词依次为:出轨、孩子、女人、男人、老公、绿地、这女、信任、老婆、婚内。
然后是江苏吃瓜群众词云图
TOP10关键词依次为:出轨、老公、这女、女人、信任、孩子、勒索、受害者、爱情、男方。勒索、受害者相对突出点
最后是山东吃瓜群众词云图
TOP10关键词依次为:出轨、这女、孩子、绿地、无耻、女人、同居、毕业、夫妻、高管,发现没有,多了无耻,果然有儒家文化发源地风范。
我们再来看看各条评论的情感分析
sentiment表示情感极性分类结果,0:负向,1:中性,2:正向
positive_prob表示属于积极(正向)类别的概率
negative_prob表示属于消极(负向)类别的概率
所以我们可以统计所有评论情感极性分类结果:
可以看到统计结果,负向共1259条评论,占了所有评论的约75%。
还可以再统计所有评论的平均负向概率0.76。当然也可以统计下各个地区网友的平均负向概率
不管你是零基础还是有基础都可以获取到自己相对应的学习礼包!包括Python软件工具和2020最新入门到实战教程。加群695185429即可免费获取,资料在群文件里放着哟~