需求描述:广汽儿童节,调查问卷中,有一批是员工自己填写购卖的礼品数量,需要统计分类,以便,在礼品装箱时以及派放的过程中,更加便利
步骤一:读取并查看数据
#读取excel文档
import numpy as np
import pandas as pd
df = pd.read_excel('儿童调查问卷.xlsx','原始问卷')
df.head()
df.columns
步骤二:更改列名
#更改列名
df = df.rename(columns = {
'1.“一路童行”多功能儿童旅行箱+贴纸\n原价:128 尝鲜闪购价:98\n* 研究院小朋友的专属行李箱,一路拉风,你就是全场最闪亮的娃!\n* ABS+PC箱体材质,合金拉杆。\n* 18寸,色彩中性,短途旅行生力军,长途旅行小帮手。\n* 360度顺滑万向轮,更稳更顺更耐用。\n* 贴纸分为车车篇、建筑篇、恐龙美食篇;贴纸袋也可以作为票证收纳袋。\n\n您订购数量:\n(单选)':
'旅行箱+贴纸',
'2.“童心合力”收纳袋(大中小三个一套)\n原价:38 尝鲜闪购价:28\n* 三种尺寸,培养小朋友的收纳能力,自己的事情自己做。\n* 牛津布,大:37*27cm,中:27*19cm,小:17*13cm。\n\n您订购数量:(单选)':
'收纳袋',
'3.“因爱之名”行李牌\n原价:18 尝鲜闪购价:12 \n* 配信息卡,写上小朋友名字,妥妥的小主人感,谁也不许拿错哦。\n* 与众不同的圆形设计,辨识度高。\n\n您订购数量: \n(单选)':
'行李牌',
'4.“缤fun团聚”野餐垫 \n原价:78 尝鲜闪购价:58 \n* 缤纷画面,仿佛置身恐龙时代,即使下雨也能铺在客厅,“你若安好,就是晴天”,说的就是野餐垫。\n* 防水防潮牛津布,软硬适中且易清洗,大人和宝宝都能开心玩耍和吃喝。\n* 145*145,一体式收纳,轻松便携。\n\n您订购数量:\n(单选)':
'野餐垫',
'5.“永远‘撑’你”儿童雨伞\n原价:88 尝鲜闪购价:68 \n* 易开收设计,使用更称手,让小朋友感受大能力。\n* 防戳伤圆角设计,安全反光条加持,在挡风遮雨的同时,给小朋友更多贴心关爱。\n* 晴雨两用,晴天阻挡紫外线,雨天强效拒水。\n* 专属图案设计,让您家小朋友与众不同。\n\n您订购数量(单选)':
'雨伞',
'6.“快高长大”恐龙趣味身高贴\n原价:38 尝鲜闪购价:28\n* 利用峨眉龙长脖子的特点,夸张的形式更具趣味性,每天量一量,感觉自己很快可以去玩过山车啦!\n* 尺寸:约280cm;材质:PP\n\n您订购数量:(单选)':
'身高贴'})
df.head()
步骤三:清洗数据
#空值填空为‘0’
df = df.fillna('0')
#数据查看
df.index
#清洗数据
for i in range(df.index.start, df.index.stop):
for j in range(4, 10): #遍历产品所在列
if df.iloc[i,j] == '0':
pass
elif df.iloc[i,j][0:2] == '更多':
tem = df.iloc[i,j].split('(')
df.iloc[i,j] = tem[len(tem) - 1][0:-1]
else:
df.iloc[i,j] = df.iloc[i,j][0:-1]
df
df['总数'] = ''
cc = list(df.columns)
for i in range(df.index.start, df.index.stop):
ans = ''
for j in cc[4:10]:
if df.loc[i,j] != '0':
ans += j + df.loc[i,j] + ' '
df.loc[i, '总数'] = ans
步骤四:统计数据
#分类统计不同情况的数量
tem_df = df.value_counts('总数')
tem_df
步骤五:输出数据到excel表中
把结果输出excel表
tem_df.to_excel('儿童.xlsx')
df.to_excel('儿童.xlsx')