熊貓/ pyplot着色散點圖的狀況

Question

大家一天的美好時光！ 我正在研究一個用於質量分析的簡單腳本，該腳本將原始樣本和重復樣本進行比較，並在散點圖中進行繪制。

到目前為止，我已經能夠創建所需的繪圖：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

'''read file'''

duplicates_file = 'C:/Users/cherp2/Desktop/duplicates.csv'
duplicates = pd.read_csv(
            duplicates_file, usecols=['SAMPLE_NUMBER','Duplicate Sample Type'
                                      ,'FE', 'P','SIO2','AL2O3'
                                      ,'Orig. Sample Type', 'FE.1', 'P.1'
                                      ,'SIO2.1','AL2O3.1'])

'''calculate standard deviations for grades'''

grades = ['FE','P','SIO2','AL2O3']

for grade in grades:
    grade_std = duplicates[grade].std()

    '''create scatter plots for all grades'''

    ax = duplicates.plot.scatter(f'{grade}', f'{grade}.1')
    ax.set_xlabel('Original sample')
    ax.set_ylabel('Duplicate sample')

但是現在我想按一種條件對點進行着色：如果原始樣本和重復樣本之間的等級差小於一個標准偏差點，則應為綠色；如果介於2和3 stdev之間，則應為橙色和紅色；如果大於那。

我一直在嘗試在線查找解決方案，但到目前為止沒有任何效果。 我有一種感覺，我需要在這里使用一些lambda函數，但是我不確定語法。

Answer 1

您可以將顏色參數傳遞給繪圖調用（通過c= ），並使用pandas.cut為基於std的不同類別生成必要的顏色代碼。

In [227]: df
Out[227]: 
           a         b
0   0.991415 -0.627043
1   1.365594 -0.036651
2  -0.376318 -0.536504
3   1.041561 -2.180642
4   1.017692 -0.308826
5  -0.626566  1.613980
6  -1.302070  1.258944
7  -0.453499  0.411277
8  -0.927880  0.439102
9  -0.282031  1.249862
10  0.504829  0.536641
11 -1.528550  1.420456
12  0.774111 -1.086350
13 -1.662715  0.732753
14 -1.038514 -1.987912
15 -0.432515  3.104590
16  1.682876  0.663448
17  0.287642 -1.038507
18 -0.307923 -2.340498
19 -1.024045 -1.948608

In [228]: change = df.a - df.b

In [229]: df.plot(kind='scatter', x='a', y='b',
                  c=pd.cut(((change - change.mean()) / (change.std())).abs(), [0, 1, 2, 3], labels=['r', 'g', 'b']))

熊貓/ pyplot着色散點圖的狀況

問題描述

1 個解決方案

解決方案1
1 2019-09-09 03:38:20

熊貓/ pyplot着色散點圖的狀況

問題描述

1 個解決方案

解決方案1 1 2019-09-09 03:38:20

解決方案1
1 2019-09-09 03:38:20