Pandas 如何在读取CSV文件时跳过行
Python有一个内置的方法read_csv,可以在使用Pandas读取CSV文件时设置跳过行。CSV代表逗号分隔值,是一个包含数据库的文件扩展名。这个技术可以在涉及从CSV文件读取和处理数据的任何应用程序中使用。可以使用各种应用程序,如数据过滤、Excel工具等。
语法
在示例中使用以下语法:
read_csv('file_name.csv', skiprows= set the condition according to user choice)
这是pandas模块的内置函数,可以读取CSV文件的数据。它接受两个参数 –
- filename.csv – csv是文件扩展名的简单表示。
-
skiprows – 这个参数允许用户根据条件跳过/删除行。
示例1
在下面的示例中,我们将通过导入名为pandas的模块并将引用对象命名为pd来开始程序。然后初始化一个名为df的变量,它通过内置的read_csv()方法存储值,该方法接受两个参数 – demo.csv(文件的名称)和skiprows(设置特定索引行)。skiprows使用列表推导式设置行。最后,我们只使用变量df以表格形式获取数据。
#skip multiple rows
import pandas as pd
df = pd.read_csv('demo.csv',skiprows=[1,5,12])
df
输出
示例2
在下面的示例中,我们将展示如何跳过数据中的单行。首先,导入pandas模块,它有助于设置读取数据的操作。将pd作为对象引用导入,将与read_csv一起使用进行赋值。通过使用这个内置函数,它接受两个参数- ‘demo.csv’(文件名)和skiprows(设置为值1,从表格中删除第一行)。
#skip only single rows
import pandas as pd
df = pd.read_csv('demo.csv',skiprows=1)
df
输出
示例3
在下面的示例中,我们首先导入pandas模块,该模块可用于处理名为pd的对象引用。 接下来,我们将将值存储为内置方法read_csv与pd一起使用,该方法接受两个参数- ‘demo.csv’(文件名)和skiprows(设置偶数条件的值)。 最后,使用变量df获取输出。
# skip rows based on even condition
import pandas as pd
df = pd.read_csv('demo.csv', skiprows=lambda x:x%2!=0)
# print the months in even order
df
输出
示例4
在下面的示例中,首先通过导入名为pandas的模块开始程序。然后使用内置方法read_csv来设置两个参数-‘demo.csv’(文件名)和skiprows(将值设置为lamda x:x>5,仅设置前五行)。接下来,使用变量df获取5行的数据。
# skip rows based on certain rows
import pandas as pd
df = pd.read_csv('demo.csv', skiprows= lambda x:x>5)
df
输出
示例5
在以下示例中,程序从pandas模块开始,并将对象引用设置为pd。然后,通过使用内置方法初始化名为df的变量,并使用三个参数存储值- ‘demo.csv’(文件名)、skiprows(在列表中将值整数2和10设置为删除表中的数据)和nrows(将值设置为10,表示只有10行可用)。
import pandas as pd
df = pd.read_csv('demo.csv', skiprows=[2,10],nrows=10)
df
输出
结论
我们通过对skiprows应用不同条件来讨论了其概念。我们使用了skiprows条件来跳过单行、跳过多行、基于偶数条件跳过行、基于特定条件跳过行以及跳过CSV文件中的特定行。