pandas 提取年份

pandas 提取年份

pandas 提取年份

在数据分析和处理中,经常会遇到需要从日期数据中提取年份的情况。而使用Python中的pandas库可以很方便地实现这一功能。本文将详细介绍如何使用pandas来提取年份,并给出一些实例来帮助读者更好地理解。

1. 使用pandas提取年份

在pandas中,可以使用.dt属性来访问日期时间数据的各种组成部分,包括年份。下面是一个简单的示例:

import pandas as pd

# 创建一个包含日期数据的DataFrame
df = pd.DataFrame({'date': ['2022-05-15', '2021-12-31', '2020-08-20']})

# 将日期数据转换为pandas的日期时间格式
df['date'] = pd.to_datetime(df['date'])

# 提取年份
df['year'] = df['date'].dt.year

print(df)

上面的代码首先创建了一个包含日期数据的DataFrame,然后使用pd.to_datetime将日期数据转换为pandas的日期时间格式。接着使用.dt.year来提取年份,将结果存储在新的列中,并打印输出整个DataFrame。

2. 示例

接下来,我们将通过几个示例来演示如何在实际数据中使用pandas提取年份。

示例1:提取订单日期的年份

假设有一个包含订单日期的数据集,我们想要提取订单日期的年份。下面是一个示例:

import pandas as pd

# 创建一个包含订单日期的DataFrame
data = {'order_date': ['2022-05-15', '2021-12-31', '2020-08-20']}
df = pd.DataFrame(data)

# 将订单日期转换为pandas的日期时间格式
df['order_date'] = pd.to_datetime(df['order_date'])

# 提取订单日期的年份
df['order_year'] = df['order_date'].dt.year

print(df)

输出如下:

  order_date  order_year
0 2022-05-15        2022
1 2021-12-31        2021
2 2020-08-20        2020

示例2:提取生日的年份

假设有一个包含用户生日的数据集,我们想要提取生日的年份。下面是一个示例:

import pandas as pd

# 创建一个包含用户生日的DataFrame
data = {'birthday': ['1990-03-25', '1985-11-10', '1978-09-05']}
df = pd.DataFrame(data)

# 将生日转换为pandas的日期时间格式
df['birthday'] = pd.to_datetime(df['birthday'])

# 提取生日的年份
df['birth_year'] = df['birthday'].dt.year

print(df)

输出如下:

    birthday  birth_year
0 1990-03-25        1990
1 1985-11-10        1985
2 1978-09-05        1978

3. 总结

本文介绍了如何使用pandas来提取日期数据中的年份。通过学习本文,读者可以掌握如何使用pandas中的.dt.year属性来提取年份,并在实际数据处理中灵活运用。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程