在Python中使用Seaborn创建计数图
在这篇文章中,我们将讨论如何使用seaborn库创建计数图,以及如何使用不同的参数从我们的数据集特征中推断结果。
Seaborn库
seaborn库被数据分析师广泛使用,它包含的各种图形能够以最佳的方式呈现我们的数据。
可以使用以下代码将seaborn库导入我们的工作环境:
import seaborn as sns
现在让我们讨论为什么要使用countplot以及其参数的重要性。
计数图
计数图用于表示分类变量中出现(计数)的观察次数。
它使用条形图的概念进行可视化。
参数-
创建计数图时可以指定以下参数,让我们对它们有一个简要的了解-
- x和y- 该参数指定我们用于表示的数据,然后观察突出的模式。
- color- 该参数指定可以使我们的绘图具有良好外观的颜色。
- palette- 它接受调色板的值。它主要用于显示色调变量。
- hue- 该参数指定列名。
- data- 该参数指定我们希望用于表示的数据框。例如,数据可以是一个数组。
- dodge- 该参数是一个可选参数,接受布尔值作为输入。
- saturation- 该参数接受浮点值。当我们指定此值时,可以观察到颜色强度的变化。
- hue_order- 参数hue_order以字符串作为输入。
- kwargs- 参数kwargs指定键和值的映射关系。
- ax- 参数ax是可选的,用于创建绘图的轴。
- orient- 参数orient是可选的,指示我们需要的绘图的方向,水平或垂直。
现在让我们看看表示属性的不同方法。
在第一个示例中,我们将为单个变量创建一个计数图。我们采用数据集“tips”来实现相同的目的。
1. 单个变量的值计数
示例
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'tips'
df=pd.read_csv("/content/tips.csv")
#plotting the graph
sns.countplot(x='sex',data=df)
plt.show()
输出:
在下一个示例中,我们将使用hue参数创建一个记数图。
以下程序说明了相同的内容-
2. 使用hue参数表示两个分类变量
示例
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'tips'
df=pd.read_csv("/content/tips.csv")
#plotting the graph
sns.countplot(x='sex',hue='smoker',data=df)
plt.show()
输出:
在下一个示例中,我们将考虑y轴并创建一个水平的countplot。
以下程序演示相同的事情-
3. 创建水平的图表
示例
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'tips'
df=pd.read_csv("/content/tips.csv")
#plotting the graph
sns.countplot(y='sex',hue='smoker',data=df)
plt.show()
输出:
现在让我们来看一下色彩调色板如何提升我们数据的展示。
在下一个示例中,我们将使用参数“palette”。
下面的程序示例了相同的情况-
4. 使用色彩调色板
输入-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'tips'
df=pd.read_csv("/content/tips.csv")
#plotting the graph
sns.countplot(x='sex', data=df, palette='Set1')
plt.show()
输出:
在下一个示例中,我们将使用参数color并看看它是如何工作的?
下面的程序说明了相同的情况-
5. 使用参数’color’
示例
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'train'
df=pd.read_csv("/content/train.csv")
#plotting the graph
sns.countplot(x='Pclass',hue='Sex', data=df, color='green')
plt.show()
输出:
现在我们将使用参数“饱和度”来看看它如何影响我们数据的表示。
下面的程序说明了这一点-
6. 使用参数“饱和度”
示例
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'train'
df=pd.read_csv("/content/train.csv")
#plotting the graph
sns.countplot(x='Pclass',data=df, color='green', saturation=0.1)
plt.show()
输出:
最后,在最后一个示例中,我们将使用参数 linewidth 和 edgecolor。
- 使用matplotlib.axes.Axes.bar()
示例
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'train'
df=pd.read_csv("/content/train.csv")
sns.countplot(x='Sex', data=df, color="green", facecolor=(0,0,0,0), linewidth=5, edgecolor=sns.color_palette("BrBG",2))
plt.show()
输出: