Pandas 行颜色分配

在本文中，我们将介绍在Pandas中如何分配行颜色。Pandas是一个强大的Python数据分析库，可用于数据操作和清理，同时也包含了数据可视化的功能。如果您需要在数据可视化时对行进行标识，那么在Pandas中分配行颜色将非常有用。

Pandas中的DataFrame样本数据

首先，我们将创建一个Pandas的DataFrame示例，以便演示如何对其行进行颜色分配。

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
        'Age': [25, 30, 35, 40, 45],
        'Country': ['China', 'US', 'Japan', 'UK', 'France'],
        'Gender': ['Female', 'Male', 'Male', 'Male', 'Female'],
        'Score': [80, 75, 90, 85, 95]}

df = pd.DataFrame(data)

此时我们已经有了一个包含了姓名、年龄、国家、性别和分数的数据表，如下：

	Name	Age	Country	Gender	Score
0	Alice	25	China	Female	80
1	Bob	30	US	Male	75
2	Charlie	35	Japan	Male	90
3	David	40	UK	Male	85
4	Eva	45	France	Female	95

通过CSS字典分配颜色

要在Pandas中为行分配颜色，可以使用CSS字典。这个CSS字典包含键值对，每个键是表示行类别的字符串，每个值是带有CSS样式的字符串。例如，以下CSS字典为”Female”类别的行设置了红色背景颜色，为”Male”类别的行设置了绿色背景颜色。

css = {'Female': 'background-color: red', 'Male': 'background-color: green'}

我们可以使用Pandas的.style属性来使用CSS字典分配颜色。默认情况下，.style属性不会修改数据。它只是用CSS样式重新呈现表格，以便我们可以在查看数据时为不同的行分配颜色。

df.style.set_properties(subset=['Name'], **{'width': '180px'}).background_gradient(cmap='YlGnBu', vmin=0, vmax=100).applymap(lambda x: css.get(df['Gender'].loc[x], ''))

此代码通过使用.background_gradient()方法中cmap参数设定颜色映射，使得分数高的人背景颜色变深。而对于性别为“Female”的行，使用了CSS字典中的red值，对于性别为“Male”的行则使用了CSS字典中的green值。

根据数值分配颜色

除了使用CSS字典之外，我们还可以根据数值分配颜色。这是一种根据数据对行进行颜色编码的方法。例如，在下图中，我们对“Score”列进行了颜色编码，使得在评分高于平均分时的行颜色更深。

center = df['Score'].mean()

df_mean_color = df.style.set_properties(subset=['Name'], **{'width': '180px'}).background_gradient(cmap='YlGnBu', vmin=0, vmax=100, subset=['Score']).applymap(lambda x: x if x < center else f'background-color: #ff69b4')

此代码使用了.background_gradient()方法中subset参数，使得只有”Score”列使用颜色映射。在.applymap()方法中，我们使用了一个lambda函数，将评分高于平均分的行的背景颜色设为粉色。