※ 引述《os653 ()》之铭言:
: 有很多个月份的 Excel 想要做比较,基本上每个月一份 Excel
: 内容大概是某某东西某某月销售多少,想计算销售成长率
: 问题是资料有点杂
: 像是东西的名字不太固定,同月份的珍奶跟珍珠奶茶应该要并计
: 或是贩售的场所名字略有不同,XX豆浆跟XX豆浆大王其实指的是同个东西
: 我自己想了两个处理办法
: 1. 不管内容,全部参在一起做成撒尿牛丸
: 直接把资料都读进数据库,像这样
: 2015/03 XX豆浆大王 珍奶 100
: 2015/03 XX豆浆 珍奶 200
: 2015/04 XX豆浆大王 珍珠奶茶 300
: 2015/04 XX豆浆 珍珠奶茶 400
: 之后再回头慢慢把同义不同名的资料合并
: 2. 先设计好数据库,每一份 Excel 单独写一个 parser 去处理
: parser 要负责把同义不同名的资料修正后再丢进数据库
: 请问这两个做法那个比较好?或是有其他更适当的做法?
: 我自己觉得两个做法都有点别扭,还请各位提供点意见,感谢
当然是先parse再进数据库,
不过没说你资料量有多少,
读进数据库只要几秒的量,
什么做法也没差了。
不过为什么一个档案一个parse,
每个档案资料名称差异很大吗?
个人作法应该会是整个parse写好,
自动open excel档parse完直接塞数据库,
就是一次写完就放给它全自动完成,
不过重点还是在于parse做的准不准确吧。