-
2.9 Python csv模块(读写文件)
-
CSV 文件又称为逗号分隔值文件,是一种通用的、相对简单的文件格式,用以存储表格数据,包括数字或者字符。CSV 是电子表格和数据库中最常见的输入、输出文件格式。通过爬虫将数据抓取的下来,然后把数据保存在文件,或者数据库中,这个过程称为数据的持久化存储。本节介绍 Python 内置模块 CSV 的读写操作。
1) csv.writer()
csv 模块中的 writer 类可用于读写序列化的数据,其语法格式如下:
writer(csvfile, dialect='excel', **fmtparams)
参数说明:
csvfile:必须是支持迭代(Iterator)的对象,可以是文件(file)对象或者列表(list)对象。
dialect:编码风格,默认为 excel 的风格,也就是使用逗号,分隔。
fmtparam:格式化参数,用来覆盖之前 dialect 对象指定的编码风格。
示例如下:
import csv # 操作文件对象时,需要添加newline参数逐行写入,否则会出现空行现象 with open('eggs.csv', 'w', newline='') as csvfile: # delimiter 指定分隔符,默认为逗号,这里指定为空格 # quotechar 表示引用符 # writerow 单行写入,列表格式传入数据 spamwriter = csv.writer(csvfile, delimiter=' ',quotechar='|') spamwriter.writerow(['www.duidaima.com'] * 5 + ['how are you']) spamwriter.writerow(['hello world', 'web site', 'www.duidaima.com'])
eggs.csv 文件内容如下:
www.duidaima.com www.duidaima.com www.duidaima.com www.duidaima.com www.duidaima.com |how are you| |hello world| |web site| www.duidaima.com
其中,quotechar 是引用符,当一段话中出现分隔符的时候,用引用符将这句话括起来,以能排除歧义。如果想同时写入多行数据,需要使用 writerrows() 方法,代码如下所示:
import csv with open('aggs.csv', 'w', newline='') as f: writer = csv.writer(f) # 注意传入数据的格式为列表元组格式 writer.writerows([('hello','world'), ('I','love','you')])
aggs.csv文件内容:
hello,world I,love,you
2) csv.DictWriter()
当然也可使用 DictWriter 类以字典的形式读写数据,使用示例如下:
import csv with open('names.csv', 'w', newline='') as csvfile: #构建字段名称,也就是key fieldnames = ['first_name', 'last_name'] writer = csv.DictWriter(csvfile, fieldnames=fieldnames) # 写入字段名,当做表头 writer.writeheader() # 多行写入 writer.writerows([{'first_name': 'Baked', 'last_name': 'Beans'},{'first_name': 'Lovely', 'last_name': 'Spam'}]) # 单行写入 writer.writerow({'first_name': 'Wonderful', 'last_name': 'Spam'})
name.csv 文件内容,如下所示:
first_name,last_name Baked,Beans Lovely,Spam Wonderful,Spam
CSV文件读取
1) csv,reader()
csv 模块中的 reader 类和 DictReader 类用于读取文件中的数据,其中 reader() 语法格式如下:
csv.reader(csvfile, dialect='excel', **fmtparams)
应用示例如下:
import csv with open('eggs.csv', 'r', newline='') as csvfile: spamreader = csv.reader(csvfile, delimiter=' ', quotechar='|') for row in spamreader: print(', '.join(row))
输出结果:
www.duidaima.com, www.duidaima.com, www.duidaima.com, www.duidaima.com, www.duidaima.com, how are you hello world, web site, www.duidaima.com
2) csv.DictReader()
应用示例如下:
import csv with open('names.csv', newline='') as csvfile: reader = csv.DictReader(csvfile) for row in reader: print(row['first_name'], row['last_name'])
输出结果:
Baked Beans Lovely Spam Wonderful Spam
- 留下你的读书笔记
- 你还没登录,点击这里
-
用户笔记留言