Pandas 时间类型数据中提取年份和月份
在本文中,我们将介绍如何在Pandas中提取时间类型数据中的年份和月份。
在Pandas中,时间类型数据是一种重要的数据类型。在处理这种数据类型时,要经常进行年份和月份的提取操作。
我们可以使用Pandas的.dt方法从时间类型数据中提取年份和月份。
如果我们有以下的时间类型数据:
import pandas as pd
df = pd.DataFrame({
'date': ['2020-01-01', '2020-02-01', '2020-03-01', '2020-04-01', '2020-05-01'],
})
df['date'] = pd.to_datetime(df['date'])
我们可以按如下方式提取年份和月份:
df['year'] = df['date'].dt.year # 提取年份
df['month'] = df['date'].dt.month # 提取月份
这将在df数据表中添加year和month两列数据。
我们也可以在创建数据表时就提取年份和月份,例如:
import pandas as pd
df = pd.DataFrame({
'date': ['2020-01-01', '2020-02-01', '2020-03-01', '2020-04-01', '2020-05-01'],
'year': pd.to_datetime(['2020-01-01', '2020-02-01', '2020-03-01', '2020-04-01', '2020-05-01']).year,
'month': pd.to_datetime(['2020-01-01', '2020-02-01', '2020-03-01', '2020-04-01', '2020-05-01']).month,
})
这将在df数据表中添加year和month两列数据。
我们还可以使用Pandas的.apply()方法和.strftime()方法来提取年份和月份。例如:
import pandas as pd
df = pd.DataFrame({
'date': ['2020-01-01', '2020-02-01', '2020-03-01', '2020-04-01', '2020-05-01'],
})
df['date'] = pd.to_datetime(df['date'])
df['year'] = df['date'].apply(lambda x: x.strftime('%Y'))
df['month'] = df['date'].apply(lambda x: x.strftime('%m'))
这将在df数据表中添加year和month两列数据。
阅读更多:Pandas 教程
总结
在本文中,我们介绍了如何在Pandas中提取时间类型数据中的年份和月份。我们可以使用.dt方法、在创建数据表时提取、或者.apply()方法和.strftime()方法来实现。这些方法都可以帮助我们更好地处理时间类型数据。
极客笔记