Python写入CSV文件|极客笔记

Python写入CSV文件

CSV文件

CSV代表“逗号分隔值”，它定义了一种使用特定结构排列表格数据的简单文件格式。它以纯文本形式存储表格数据，如电子表格或数据库，并具有标准的数据交换格式。CSV文件打开后可以导入excel表格，行和列数据定义了标准格式。

Python的CSV模块函数

CSV模块的工作是处理CSV文件，读取/写入并从指定列中获取数据。有不同类型的CSV函数，如下所示：

csv.field_size_limit – 它返回解析器允许的当前最大字段大小。
csv.get_dialect – 返回与名称关联的方言。
csv.list_dialects – 返回所有已注册方言的名称。
csv.reader – 从CSV文件读取数据。
csv.register_dialect – 将方言与名称相关联，名称必须是字符串或Unicode对象。
csv.writer – 将数据写入CSV文件。
csv.unregister_dialect – 从方言注册表中删除与名称关联的方言。如果名称不是注册的方言名称，则会引发错误。
csv.QUOTE_ALL – 指示写入对象引用所有字段。
csv.QUOTE_MINIMAL – 指示写入对象仅引用包含特殊字符（如引号字符、分隔符等）的字段。
csv.QUOTE_NONNUMERIC – 指示写入对象引用所有非数字字段。
csv.QUOTE_NONE – 指示写入对象不引用字段。

编写CSV文件

我们也可以使用csv.writer()模块在Python中编写任何新的和现有的CSV文件。它类似于csv.reader()模块，也有两种方法，即 writer 函数或 Dict Writer 类。

它提供了两个函数，即 writerow() 和 writerows() 。writerow()函数只写入一行，而writerows()函数写入多行。方言

它被定义为一个允许您创建、存储和重用各种格式化参数的构造。它支持多个属性，最常用的属性有：

Dialect.delimiter： 此属性用作字段之间的分隔字符。默认值为逗号（,）。
Dialect.quotechar： 此属性用于引用包含特殊字符的字段。
Dialect.lineterminator： 用于创建新行，默认值为’\r\n’。

让我们将以下数据写入CSV文件。

data = [{'Rank': 'B', 'first_name': 'Parker', 'last_name': 'Brian'},   
{'Rank': 'A', 'first_name': 'Smith', 'last_name': 'Rodriguez'},  
{'Rank': 'C', 'first_name': 'Tom', 'last_name': 'smith'},  
{'Rank': 'B', 'first_name': 'Jane', 'last_name': 'Oscar'},   
{'Rank': 'A', 'first_name': 'Alex', 'last_name': 'Tim'}]

示例 –

import csv  

with open('Python.csv', 'w') as csvfile:  
    fieldnames = ['first_name', 'last_name', 'Rank']  
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)  

    writer.writeheader()  
    writer.writerow({'Rank': 'B', 'first_name': 'Parker', 'last_name': 'Brian'})  
    writer.writerow({'Rank': 'A', 'first_name': 'Smith',  
                     'last_name': 'Rodriguez'})  
    writer.writerow({'Rank': 'B', 'first_name': 'Jane', 'last_name': 'Oscar'})  
    writer.writerow({'Rank': 'B', 'first_name': 'Jane', 'last_name': 'Loive'})  

print("Writing complete")

输出：

Writing complete

它返回名为’Python.csv’的文件，其中包含以下数据:

first_name,last_name,Rank  
Parker,Brian,B  
Smith,Rodriguez,A  
Jane,Oscar,B  
Jane,Loive,B

将CSV写入字典

我们还可以使用类 DictWriter 将CSV文件直接写入字典。

一个名为python.csv的文件包含以下数据：

Parker, 会计, 十一月

Smith, IT, 十月

示例 –

import csv  
with open('python.csv', mode='w') as csv_file:  
    fieldnames = ['emp_name', 'dept', 'birth_month']  
    writer = csv.DictWriter(csv_file, fieldnames=fieldnames)  
    writer.writeheader()  
    writer.writerow({'emp_name': 'Parker', 'dept': 'Accounting', 'birth_month': 'November'})  
    writer.writerow({'emp_name': 'Smith', 'dept': 'IT', 'birth_month': 'October'})

产出：

emp_name,dept,birth_month
Parker,Accounting,November
Smith,IT,October

使用Pandas编写CSV文件

Pandas被定义为建立在Numpy库之上的开源库。它提供快速的分析、数据清洗和数据准备功能。

使用Pandas读取CSV文件就像读取一样简单。您需要创建DataFrame，它是一个二维、异构的表格数据结构，由数据、列和行三个主要组件组成。这里，我们将读取一个稍微复杂一些的文件，名为hrdata.csv，其中包含了公司员工的数据。

Name,Hire Date,Salary,Leaves Remaining  
John Idle,08/15/14,50000.00,10  
Smith Gilliam,04/07/15,65000.00,8  
Parker Chapman,02/21/14,45000.00,10  
Jones Palin,10/14/13,70000.00,3  
Terry Gilliam,07/22/14,48000.00,7  
Michael Palin,06/28/13,66000.00,8

示例 –

import pandas  
df = pandas.read_csv('hrdata.csv',   
            index_col='Employee',   
            parse_dates=['Hired'],  
            header=0,   
            names=['Employee', 'Hired', 'Salary', 'Sick Days'])  
df.to_csv('hrdata_modified.csv')

输出:

Employee, Hired, Salary, Sick Days
John Idle, 2014-03-15, 50000.0,10
Smith Gilliam, 2015-06-01, 65000.0,8
Parker Chapman, 2014-05-12, 45000.0,10
Jones Palin, 2013-11-01, 70000.0,3
Terry Gilliam, 2014-08-12 , 48000.0,7
Michael Palin, 2013-05-23, 66000.0,8