豆瓣电影爬虫,爬取评论情况并进行分析,使用echart进行可视化
爬虫方面,豆瓣电影评论方面只有10页左右是可以直接爬取的,在这之后的评论需要登录获取
有一个需要注意的地方,使用echart进行可视化生成html文件的时候,直接双击打开文件的时候不一定能够正常显示,其主要原因是因为这里生成的html文件里面调用的js文件是网络路径,但是受限于网络原因不一定能够访问,所以我这里的做法是通过下载echart.min.js然后更改本地位置进行处理。点击html文件查看源码修改src就行
另外,词云的部分我没有做stopword,所以会出现一些无用词“的、了”之类的