标题 | python在日常工作处理中的应用 |
范文 | 马珊珊 摘要:论文介绍了利用python进行日常excel表格批量处理的方法,并以员工福利采购统计数据为例,编程实现了excel文件的批量读取、切片、计算、合并等功能。结果表明,采用python进行批量处理文件,简单高效,大大提高了办公的效率。 关键词:excel数据处理;python;pandas 中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)01-0228-02 随着办公无纸化、信息网络化的兴起,工作中绝大多数工作都由计算机来处理。对于在办公室工作的同志来讲,日常工作多是搜集、整理、计算数据。这些日常收集的数据以Excel表格为主,往往格式统一、处理任务单一,如果依靠手工来完成,任务量较大,且容易出错。Excel自带了一些批处理功能,但是功能有限,不能满足工作中各种各样的文件批处理要求。本文以常见的excel数据为例,采用python程序设计语言,介绍了采用python语言进行数据批量处理的方法。python语言语法简单,简单的几行代码就可以完成复杂的任务,适合办公室工作人员使用。 1 问题描述 以某单位年终福利采购为例。某单位拟年终采购一批物品作为职工福利,需要采集的物品有6种,每种的价格如表1所示,员工需要填写的统计表格如表2所示,其中员工的名字体现在统计表格的文件名字中,如图1所示。 现在办公室需要搜集整个公司每位员工的统计表,根据数量和单价计算出相应的金额,并计算出总价填写在相应的位置,并把所有人员的购物数据汇总到一个excel表中。 2 解决该问题的基本思路与方法 该问题是办公室日常工作中的典型问题,搜集到的数据是excel表格文件,每位员工对应着一个excel文件,编程时需要对每一个文件进行遍历,提取出员工的姓名及填写的数据,根据员工填写的数据及商品的价格,计算出总价,并合并表格。 采用编程解决,可以归结为如下几类问题: 1) 文件遍历: python中有关文件夹与文件的查找,删除等功能 在os模块中实现。使用时需先导入OS模块,OS模块中的os.listdir(path)可以列出path目录下的所有文件,存放在一个列表中,对该列表进行遍历,即可以实现文件的遍历。使用該方法需要首先导入OS模块。 2) excel文件处理 pandas是python的数据分析包,它读取数据简单高效,有独特的数据类型DataFrame,在数据处理中十分常用[1]。本文采用pandas读写并处理excel文件。本例中,主要涉及的操作有:文件的读取、数据区域的筛选、求和计算、数据的拼接。 l 文件的读取:panmdas支持许多格式数据的读取。其中excel数据读取代码为: df=pd.read_excel(fullname) 其中fullname代表要读取文件的全名。读入数据后,存放在df中。df是一个dataframe类型的变量。 l 数据区域的选择: 读入的数据是一个dataframe类型的变量,本质上是一个二维表格。excel数据的选择对应着dataframe类型变量的切片操作。dataframe类型变量的切片方法如下: 选取一行数据:df.ix[i,:] 选择第i行数据 选择多行数据:df.ix[a:b,:] 选择第a行开始到b-1行结束的数据 选择某行某列数据:df.ix[a:b,m:n] 选择a行开始到b-1行,m列到n-1列的数据 l 求和计算 pandas提供了数据求和函数,sum函数。具体使用方法参考下面文中的实现代码 l 数据的拼接:采用append方法。 本例中的完整代码如下: import pandas as pd #导入pandas模块进行excel文件的读写预处理 import os #导入OS模块对文件进行遍历 path,name,data =[],[],[] for i in os.listdir(path1):# path1是存放excel数据的路径名 ifi[0]=='2': path.append(path1+'/'+i) name.append(i[10:-4])#读取员工的姓名信息 for j in path: #对路径中的excel文件进行遍历 f=pd.read_excel(j)#读取文件 sp=f.ix[4,2:13:2]*pd.Series([159,158,288,178,180,368],index=f.ix[4,2:13:2].index)#计算每种商品的价格 sp.index=f.ix[4,3:14:2].index f.ix[4,3:14:2]=sp选择每种商品的价格 f.ix[4,14]=sp.sum()计算每位员工的总价 data.append(f.ix[4,2:15])#合并数据 f.ix[4:4+len(os.listdir(path1)),2:15]=data f.ix[4: 4+len(os.listdir(path1),1]=name f.to_excel('/Users/neo/Desktop/demo.xls',index=False)#将结果保存成excel文件 3) 结果 运行以上程序,得到的结果如表3所示。从表3可以看出,每位员工的采购物品的价格都已被计算出来并合并起来,达到了我们想要的结果。对本文的代码稍加改进,就可以完成其他的表格处理工作。大大提高了办公效率。 3 结论 本文介绍了利用python处理excel数据,主要包括采用OS模块对文件进行遍历,采用pandas模块实现excel数据存取、选择、运算。从论文的实例可见,采用python进行excel文件处理工作,简单方便,大大提高了工作效率。 参考文献: [1] 王全胜. Python在校园数据分析中的应用——以一卡通消费为例[J].电脑知识与技术,2017,13(9):1-2,6. [2] 张雷. Python与Spark集群在收费数据分析中的应用[J].中国交通信息化,2017(3):122-123,132. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。