Pandas的value_counts()函数
Pandas的value_counts()函数是计算频数的重要函数。它可以计算每个值在Series对象中的出现次数。以下代码演示了如何使用value_counts()函数计算“fruit”列的值的出现次数:
import pandas as pddf = pd.DataFrame({ 'fruit': ['apple', 'banana', 'pear', 'apple', 'banana', 'apple']})fruit_counts = df['fruit'].value_counts()print(fruit_counts)PythonCopy
你会在控制台上看到如下输出:
apple 3banana 2pear 1Name: fruit, dtype: int64PythonCopy
这里输出了每个水果出现的次数,按降序排序。
Pandas的plot()函数
我们可以使用Pandas的plot()函数将频率计数可视化。对于上面的水果例子,使用如下代码可视化水果列表中出现的次数:
import pandas as pddf = pd.DataFrame({ 'fruit': ['apple', 'banana', 'pear', 'apple', 'banana', 'apple']})fruit_counts = df['fruit'].value_counts()fruit_counts.plot(kind='bar')PythonCopy
这会输出一个条形图,其x轴表示每种水果,y轴表示它们在数据集中出现的次数。
使用plot()函数的参数
plot()函数有许多可用的选项。这里有一些实用的参数:
kind: 可以是 “line”, “bar”, “barh”, “hist” 等,用于指定绘制图表的类型。
title: 图表的标题
alpha: 图表的透明度
figsize: 图表的大小
以下是一个示例,演示如何使用这些参数来自定义图表:
import pandas as pddf = pd.DataFrame({ 'fruit': ['apple', 'banana', 'pear', 'apple', 'banana', 'apple']})fruit_counts = df['fruit'].value_counts()fruit_counts.plot( kind='bar', title='Fruit Counts', alpha=0.5, figsize=(10, 7))