一个有趣的灵魂W
首先,什么是桑基图
桑基图(Sankey),主要还是音译的结果。
这是一幅别人文章里的图,大致的意思就是左边和右边之间的联系,最大的作用就是看着舒服,至于看的清不清楚我是真不知道。
然后,网上常见教程
网上最常用的是一个国人开发的库(pyecharts),开发者原话:
Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。
我承认我低估了它。主要遇见的问题后述。以下是网上常见的安装方式(附带了一些问题的解决方法)
2、准备工作
由于当时尝试时,单一方式一直保存不了,所以干脆两种方式全部安装。结果能够正常保存了。
两种方法一起准备,就是下载selenium与phantomjs。
2.1、安装snapshot-selenium & seleniumpip install seleniumpip install snapshot-selenium
2.2、安装snapshot-phantomjs & phantomjspip installsnapshot-phantomjs
下载地址:http://phantomjs.org/download.html
添加路径:
找到phantomjs文件下的bin文件夹,将其路径设为系统path路径(添加系统路径,好处就不说了,就很爽就是啦):
3、报错3.1、下载chromedriver下载完成后运行时报错
:'chromedriver_X64.exe' executable needs to be in PATH查询相关资料后发现需要下载chromedriver,chromedriver下载地址。需要下载对应chrome版本的chromedriver,ChromeDriver与Chrome版本
对应参照表
。或者直接在下载页面中查看notes.txt查看对应的版本。
查看对应版本
3.2、配置环境变量
将chromedriver.exe拷贝至谷歌浏览器目录(如 C:\Program Files\Google\Chrome\Application)
以及python根目录(C:\Python3.7)。
将谷歌浏览器环境变量添加到path
(C:\Users\HD003\AppData\Local\Google\Chrome\Application)。
至此,就可以解决 ‘chromedriver’ executable needs to be in PATH问题了。
你以为这就结束了吗?并没有!!!
问题来了,我的chrome浏览器的版本是:版本 83.0.4103.97(正式版本) (64 位)
上面有个chromedriver.exe的下载(一个淘宝的镜像,淘宝是万能的么?):
它并没有我这个chrome的版本,所以它会持续报错(我保证我下载的是83.0.4103.XX版本的)!
我想可能是32位和64位的问题吧(存疑)。。。
你以为到这里就结束了吗?我换了一个做桑基图的库(pysankey)
安装方式是通过pip安装:
pip install pysankey
这个库用的matplotlib画图,应该比较好上手。好了,安装好后,
试一试他们的测试代码吧:
import pandas as pdfrom pysankey import sankeypd.options.display.max_rows = 8df = pd.read_csv( 'pysankey/fruits.txt', sep=' ', names=['true', 'predicted'])colorDict = { 'apple':'#f71b1b', 'blueberry':'#1b7ef7', 'banana':'#f3f71b', 'lime':'#12e23f', 'orange':'#f78c1b'}sankey( df['true'], df['predicted'], aspect=20, colorDict=colorDict, fontsize=12, figureName="fruit123")
emmmm图不是很好看,看样子代码有优化空间啊。。。好了,拜拜。
测试数据我放在网盘了,需要的关注:一个有趣的灵魂W
回复关键词:sankey
回复关键词:sankey
回复关键词:sankey
最后,图长这样:
微信号:一个有趣的灵魂W
关注我们,了解更多