使用python把Excel表格由一个分隔成多个

2017年12月17日 1724次浏览

站长现在工作的地方,最近经常用到Excel导入数据,公司的网站是PHP做的,型号价格的更新每次都是通过Excel导入。

一次性两万条记录的导入勉强可以,数据量再大就超时了。而有些产品的价格表格在5万以上,此时导入的时候就需要拆分成几个数据量少于2万的表格。每个类型码有多个Excel表,靠手工来操作不是程序员该干的事情,于是我用起了不是很熟练的Python来解决。

代码如下,希望给新手一个帮助。(其实我也是python新手^^)

Excel表格放在同目录下的file目录,并新建一个new文件夹存放拆分后的Excel表格。字段我是写死了两行的,实际使用需要修改。

# -*- coding: utf-8 -*-
import os
import math
import xlrd
import xlwt

dir = os.getcwd()+'\\file\\'


def get_file_list(file_dir):   
    for root,dirs,files in os.walk(file_dir):  
        return files

def split_xls(name):		
	limit = 10000
	print(name)
	limit = int(limit)
	data = xlrd.open_workbook(dir+name)
	# 获取sheet
	table = data.sheets()[0]
	# 行数
	nrows = table.nrows
	print('总行数{}'.format(nrows))
	# 列数
	ncols = table.ncols
	sheets = math.ceil(nrows / limit)
	print('拆分文件数量:{}'.format(sheets))
	workbook = xlwt.Workbook(encoding='ascii')
	for i in range(int(sheets)):
		if i == 0:
			start_row = 0
		else:
			start_row = i*limit
		if i == sheets-1:
			end_row = nrows
		else:
			end_row = (i+1)*limit
		#print(start_row)
		#print(end_row)
		
		new_arr = []
		new_arr.append(['型号','未含税价'])
		for row in range(start_row,end_row):
			if i == 0 and row == 0:
				continue
			sku = table.cell_value(row,0)
			price = table.cell_value(row,1)
			new_arr.append([sku,price])
		#print(new_arr)	
		
		new_workbook = xlwt.Workbook()
		new_worksheet = new_workbook.add_sheet('Sheet1',cell_overwrite_ok=True) 
		for new_row in range(0,len(new_arr)):
			new_worksheet.write(new_row,0,new_arr[new_row][0])  
			new_worksheet.write(new_row,1,new_arr[new_row][1])
		
		old_name = name.split('.')
		new_name = old_name[0]+'-'+str(i)+'.xls'
		new_workbook.save(os.getcwd()+'\\new\\'+new_name)
	print('************************************')
		

if __name__ == '__main__':
	file_list = get_file_list(dir)
	for name in file_list:
		split(name)
Tags: pythonexcel