《人人做得到的网络资料整理术》写在文末
网志图文版:
http://www.b88104069.com/archives/4281
资料分析有两个层面:先取得相关资料、后进行有意义的分析。一方面取得网页资料的技
术大部份人比较不熟悉,另方面资料处理是一般Excel书籍的重点,因此这本书会侧重于
借助Excel VBA取得网站资料,第一章到第六章介绍某特定类型的网站如何获取资料,到
了第七章和第八章是综合运用,总承前面几章所学技巧,批次取得所需要的完整资料,接
著进行有意义分析,依照情况还可以透过Outlook发送结果,所以七八章不但是补充前面
章节不足的部分,同时也是就全书内容做个总复习。
针对这本书的VBA技术三点补充:
首先,从做中学永远是最快的!赞赞小屋无论是Excel或者VBA,皆紧密与实际应用相结合
,作为讲解说明的出发点。“首张同名专辑”《会计人的Excel小教室》票房口碑不错,
感谢各位读者捧场,其独门特色便是以会计实务个案为核心,介绍工作上最常用函数指令
,到了《会计人的Excel VBA小教室》,虽然有一半是关于VBA介绍,但一来篇幅有限,二
来会计非得用到VBA的情况不多,所以 《会计人的Excel VBA小教室》最多仅能让读者对
于VBA有基础概念,操作一些简单范例,算是初学者的简单入门。
如今到了赞赞小屋第三本书:《Excel VBA大数据分析》,主要内容为如何取得网页资料
,技术上以VBA来说至少是进阶水平,各个网站的状况架构不一样,可能需要不同类型的
程式代码处理,书里面各个章节的VBA范例非常多,有心研读完这本书,每个范例程式如
果都能够融会贯通,可以算是VBA达人中级了。
第二点,VBA和Excel应当是相辅相成。学习VBA容易陷入一种执著,苦心钻研VBA技术,力
求让后台的程式代码全面取代前台的Excel操作、达到全面自动化境界。这个技术上可行
,VBA正是把所有Excel操作以程式方式编写成指令,其强项微软官网写的很清楚:一方面
把好几个重复步骤合在一起,写成像是一键懒人包,方便相同对象再次执行一二三步骤;
另一方面,就有规则可循的不同Excel对象,也可以一个一个分别执行类似的多步骤操作
。
至于VBA弱点,和它的强项正是一体两面,Excel本来是应用软件,所有操作于本质上即为
电脑程式,所以一定能以代码形式呈现,不过随之而来是较高的学习门槛。
个人电脑发展史一路从Dos进化到Windows,不正是从程式代码转换成图像按钮,才能如此
普及深化。一般人熟悉了Excel快捷便利的前台操作,一下子要跳到后台写程式让Excel动
起来,可想而知会遇到诸多困难。赞赞小屋学习和出书的历程和大家一样,都是先熟悉
Excel再进阶到VBA,两者并行不悖,在本书的许多范例,Excel和VBA都是相辅相成,需要
的时候一定要VBA,但也不至于什么都是VBA,很多情况直接操作Excel才是王道,这一点
过来人经验,提供有心读者参考。
第三点,既然是取得网页资料,对于网页技术必然须具备基本了解,如同书本所示,
ExcelVBA有两种方法取得网页资料:Query.table和Application.object。其中
Query.table可设置取得整个网页或网页中表格,如此有两种极端情形,倘若想要资料在
网页已经以表格形式写好了,取资料时相当方便,直接下来便是所需资料,而且是Excel
表格形式。然而,假使网页没有表格、或者目标并非表格形式,事情变得棘手,势必要下
载整个网页,然后运用种种Excel技巧,将相关资料撷取出来。
另一个VBA取得网页的方法为Application建立物件,它比较灵活,是透过Excel开启IE浏
览器,用纯粹浏览器方式抓取网页资料,最好对于网页技术有基础了解,了解远端服务器
以什么格式传送资料给浏览器,至少关键的HTML DOM结构模型下点功夫,便能很精准设计
VBA程式代码,告诉IE浏览器抓取哪一个网页节点的资料,如此Application.object可以
做到Query.table不容易完成的任务。
以上三点补充,相信可以给读完这本书的读者一些参考借镜。
本书命名为《Excel VBA大数据分析》,其实所谓大数据是因应如今资讯爆炸的时代,所
累积起来的电子资料量,已经大于传统电脑或软件足以胜任的情况,企业、政府、科学家
必须考虑以更为先进的方法处理资料,其中一个方法将资料化整为零,打散到各个处理器
分别运算,最后才将结果集中汇总。以这本书所提到的各类型网页而言,再怎样不会达到
真正大数据程度,然而所有道理是一贯相通,对于个人而言,工作生活中只要有涉及到资
料分析,都可以像大数据分析一样,平时便将资料以电子形式储存起来,有需要撷取某部
份资料出来,根据需求加以分析,可谓是属于个人应用层面的大数据,其中如何以Excel
VBA的方法完成此任务,便是这本书主要核心内容,如同赞赞小屋一脉相传的特色,书中
所有范例皆源自于实务案例,和实务紧密关连,每个人都有自己特殊的状况和需求,希望
这本书抛砖引玉,帮助读者进行专属个人的大数据分析。
再次感谢各位读者。
延伸阅读:
《人人做得到的网络资料整理术》序
http://www.b88104069.com/archives/4276
《会计人的Excel VBA小教室》序
http://www.b88104069.com/archives/4215
《会计人的Excel小教室》 序
http://www.b88104069.com/archives/4128