python处理表格数据csv
1.CSV 就是(Comma-Separated Values)即逗号分隔值,可以用Excel打开查看。 由于是纯文本,任何编辑器也都可打开。与Excel文件不同,CSV文件中:1)值没有类型,所有值...
2024.11.22工作中经常会遇到一些每天都要进行的重复操作,没一点技术含量,做起来却费时费力,还时不时出点小错。为应对这种情况,有些人会用VBA进行处理。但编辑了VBA功能的文件通用性不好,遇到领导、同事的excel未开启宏,就用不了。其实,用Python处理excel数据,比VBA更高效,而且还简单。我们来看看如何用Python处理excel数据:
一、Python处理Excel的方式python对excel的操作是通过导入相应的功能库,然后利用库里的模块写代码实现的。与excel有关的库一般包括:xlrd、xlwt、xlutils、openpyxl、xlsxwriter,这五个库用法各异,综合来说,优先推荐opengyxl,不建议全部导入有备无患的想法。各库功能用法说明如下:
1、xlrd:读取excel文件的库导入后,执行对excel文件打开、读取数据操作。比如:
import xlrd # 导入xlrd库wb = xlrd.open_workbook(r"e:\test.xls")sht = wb.sheets()[0]aa = sht.namebb = sht.cell_value(1, 1)print(aa, bb)代码解析:
1、导入xlrd库
2、打开e:\test.xls文件,wb代表该打开的工作薄
3、sht代表wb工作薄里第一个表单
4、aa代表sht表单的表单名
5、bb代表sht表单里第2行第2列单元格的值
6、在终端输出aa、bb,检验运行效果。
此时,若想修改bb单元格的值,是不可以的,因为导入的xlrd库只支持读取,不支持写入、修改。
2、xlwt:向excel表格写入数据的库导入后,执行创建新表格,写入数据操作,比如:
import xlwtwb = xlwt.Workbook()sht = wb.add_sheet("表1")sht.write(0, 0, ‘测试数据‘)wb.save(r"e:\python\创建表.xls")代码解析:
1、导入xlwt库
2、wb代表刚创建的工作薄
3、sht代表在wb工作薄中创建表单,表单名为“表1”
4、在sht表单中的a1单元格写入“测试数据”
5、保存工作薄路径及文件名为:"e:\python\创建表.xls"
3、xlutils:修改excel文件的库导入后,执行打开既有excel表格数据的修改等操作,比如:
import xlrdimport xlutils as cpwb = xlrd.open_workbook(r"e:\test.xls")aa = cp.copy.copy(wb)sht = aa.get_sheet(0)sht.write(1, 1, "xxx")aa.save(r"e:\test.xls")代码解析:
1、2、导入xlrd库和xlutils库
3、打开"e:\test.xls"文件
4、aa代表复制刚才打开的文件
5、sht代表复制的文件第一个表单
6、向sht表单第2行第2列写入“XXX”
7、还是用原名保存文件,完成文件内容的修改。
以上三个库第一次使用时可能会提示报错:提示未找到xlrd库
这是因为系统里没有对应的xlrd库造成的,我们用pip方式先给系统里安装库:打开cmd命令,输入
pip install xlrd回车,开始安装。稍等片刻,出现下面的界面即完成安装:
再回到vscode界面,提示已经没问题了。
同理,通过pip install xlwt,ipip install xlutils完成xlwt库和xlutils库的导入,就可以放心使用了。
以上库存在的不足:
1、三个库分别有各自的功能,一般需要同时使用才能满足实际使用,用起来比较麻烦。
2,xlwt库和xlutils库写入和修改操作,都只能保存为.xls格式,若保存为.xlsx格式,则打开文件时会提示格式错误。
3、写入操作后,未保存文件时读取不到刚写入的数据,读取的还是未写入之前的数据,只有保存后在读取才能得到正确结果。
4、openpyxl库用opengyxl库操作excel,则能轻松解决上面三个库的不足,且代码更符合excel使用习惯。
import openpyxlwb = openpyxl.load_workbook("e:\dest.xlsx")sht = wb[‘sy‘]print(sht[‘a2‘].value)sht[‘a2‘].value = "新名字"print(sht[‘a2‘].value)wb.save("e:\dest.xlsx")代码解析:
1、导入openpyxl库
2、打开e:\test.xls文件,wb代表该打开的工作薄
3、sht代表wb工作薄里名字为sy的表单
4、读取输出sht表单a2单元格的内容
5、给sht表单a2单元格写入数据“新名字”
6、再次读取输出sht表单a2单元格的内容,会发现本次输出的就是刚才写入的"新名字"
7、保存文件,不更改文件名。
不足之处:不能操作.xls文件。
5、xlsxwriter库:可在excel文件里写入并设置图表的库,有图表要求的,后期专题学习。6、com调用Excel的API库:通过COM调用,实现Python对excel操作的方法,写法与VBA非常相似,个人认为还不如python的openpyxl好用,且设置过程相对复杂,以后有机会再介绍。理论结合实际,我们用一个真实案例来体验一下python处理excel数据的感觉:文件“删除最小值.xlsx”中,(A:D)四列数据,希望删除每行的最小值,保留三个值,写入到后面(F:H)列中。
删除最小值.xlsx
1、导入openpyxl库来处理:
import openpyxl2、打开文件,定义表单:
wb = openpyxl.load_workbook("e:\删除最小值.xlsx")sht = wb[‘数据‘]3、数据处理(请自动忽略粗糙的逻辑思路)
for i in range(2, 8): minnum = sht.cell(i,1).value if sht.cell(i, 2).value < minnum: minnum = sht.cell(i,2).value if sht.cell(i,3).value < minnum: minnum = sht.cell(i,3).value if sht.cell(i, 4).value < minnum: minnum = sht.cell(i, 4).value k = 0 for j in range(1, 5): if sht.cell(i, j).value > minnum: k += 1 sht.cell(i, k+5).value = sht.cell(i, j).value print(sht.cell(i, k+5).value, end=‘ ‘) print()4、保存文件:
wb.save("e:\python\删除最小值.xlsx")运行后通过print代码在终端显示了结果:
打开表格,数据已经完成了填入:
总结:
总的来说,用openpyxl库让python处理excel还是比较容易的,符合python容易上手的特点,让大家把精力多放在问题解决思路上,而不是浪费在学习代码写法规则上。
1.CSV 就是(Comma-Separated Values)即逗号分隔值,可以用Excel打开查看。 由于是纯文本,任何编辑器也都可打开。与Excel文件不同,CSV文件中:1)值没有类型,所有值...
2024.11.22最近在做一些数据处理和计算的工作,因为数据是以.CSV格式保存的,因此刚开始直接用Excel来处理。但是做着做着发现重复的劳动,其实并没有多大的意义,于是就想着写个小工具帮着处理。以前正好在一本书上看...
2024.11.22前记:这是分享和记录我个人自动化办公技能的一系列文章,意在让职场的小伙伴们看后能够有所帮助和成长。我们都不是专业的程序员,文中尽量使用通俗易懂的语言讲解,即使没有任何编程基础也能够明白。每天花5-10...
2024.11.22既然 pandas 的 merge 方法是按照关系数据库表连接设计的,那么自然有数据库中的"关系验证"功能:merge 设置参数 validate=‘1:1‘ ,表示1对1关系(匹配表1条记录只能匹配...
2024.11.22# 1. 前言最近在用 Python 写一个小工具,这个工具主要就是用来管理各种资源的信息,比如阿里云的 ECS 等信息,因为我工作的电脑使用的是 LINUX,所以就想着用 python 写一个命令行...
2024.11.22