[英]Scatter plot density in python from data in csv
我有一个非常庞大的18000名玩家数据集。 每个玩家都有一个功能整体和完成例如,我想制作散点密度图,因为“正常”情节我不能在哪里更多,哪里是更少的球员。
正常的散点图代码看起来像这样......
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
DATA_LOCATION = "main_players.csv"
FIRST_ATTRIBUTE = "Finishing"
SECOND_ATTRIBUTE = "Overall"
datas = pd.read_csv(DATA_LOCATION)
x = datas[[FIRST_ATTRIBUTE]]
y = datas[[SECOND_ATTRIBUTE]]
plt.scatter(x, y, color='r')
plt.xlabel('Finishing')
plt.ylabel('Overall')
plt.title('Odnos overall i finishinga')
plt.show()
我在互联网上看,我找到了一个代码来执行以下操作:
# libraries
import matplotlib.pyplot as plt
import numpy as np
# create data
x = np.random.normal(size=50000)
y = x * 3 + np.random.normal(size=50000)
# Big bins
plt.hist2d(x, y, bins=(50, 50), cmap=plt.cm.jet)
#plt.show()
# Small bins
plt.hist2d(x, y, bins=(300, 300), cmap=plt.cm.jet)
#plt.show()
# If you do not set the same values for X and Y, the bins aren't square !
plt.hist2d(x, y, bins=(300, 30), cmap=plt.cm.jet)
#plt.show()
而且我只用x替换它们x,而且y也是,但它不起作用。
我希望输出(密度图)看起来像这样:
使用列名列表查询数据框,如代码中所示:
x = datas[[FIRST_ATTRIBUTE]]
y = datas[[SECOND_ATTRIBUTE]]
产生pd.Dataframes,plt.hist2d无法处理
尝试:
x = datas[FIRST_ATTRIBUTE]
y = datas[SECOND_ATTRIBUTE]
获得pd.Series。 这些你应该可以用plt.hist2d绘图
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.