[心得] 淘宝技术这十年

楼主: descent (“雄辩是银,沉默是金”)   2016-12-01 10:25:17
( https://goo.gl/2El9AG )20130819 订购于三民网络书局, 20130830 拿到, 费用 224
nt/45 rmb。
我曾经很迷恋类似的书籍, 我买过 amazon, yahoo, apple, netscape, aol,
microsoft, ibm, intel (呃 ... intel 的没有, 但有到图书馆借过 Intel 创新之秘,
这本很精彩, 可以得知 intel 历史, intel cpu, intel 技术开发的相关内容) ... 之类
的书籍, 都是赫赫有名的 it 产业相关公司 (要不然怎么会去买), 最近有出版
facebook, google 的书籍 (这两间更有名了), 不过我现在已经不买这些书了, 他们的成
功不见得能一直维持下去, 看看 netscape, aol, yahoo, 目前的困境 (netscape 则已经
消失)。浪潮之巅则是类似的书籍, 剖析不少大公司, 其内容很精彩, 目前有第二版(还是
没买)。这些是我认为会过时的书籍。不过我的确好奇, 想看看这些公司的成长故事, 就
像大多的小说一样, 我想看故事, 但我不想买 (所以这时候就得好好运用图书馆资源)。
这本会让我掏钱的原因除了公司故事外 (我本身对淘宝没什么好奇, 并不会想特别了解这
家公司), 主要还有提到的技术, 我对大型网站开发没什么概念, 里头介绍淘宝如何改用/
开发新的技术来应付日益庞大的流量, 让我理解超大型网站是如何解决这样的问题, 也对
于怎么迅速开发一个网站是怎么办到的(答案很简单, 先去买个可用的来改), 我是技术
人, 重视技术含量也是很合理的。
一翻开书就有着奇怪的感觉, 说不上的怪, 排版看来不算难看, 阅读几章之后, 终于察觉
到了问题, 这本书的字比较大, 特地找其他的简体中文书籍来对照, 真的大了一点, 行距
也大了一些, 字大一点在排版来说不一定就舒适、好看, 侯捷的书是 9 号字, 你觉得难
看吗? 排版的功夫在视觉上占了较大的比重, 我怀疑是拿来灌水用的, 这本书并不厚。图
片则是另外的问题, 由于没有引用图形编号, 使得文字里头只能用上下图, 左图之类的词
句, 而不是图一、图二这种用法, 我觉得纳闷, 这排版还真的有点怪怪的, 简直是 word
初学者的程度。排版不难看, 但不是很专业, 这是要卖的书籍, 不是学校的报告, 看来是
蒐集 blog 文章剪贴就出书了, 希望是我搞错了。45 rmb 以文字量/技术含量/厚度来
看, 实在贵了不只一点。
20030407 ~ 20030510 完成了最早版本的淘宝, 为了能这么快速完成, 他们的策略是购买
一个可用的版本 (phpauction), 在慢慢修改所需要的功能。
第 0 章简单的介绍淘宝网所使用的技术, 这些技术均是用来克服大量的网页需求, 读过
一遍之后我吓了一跳, 我知道大型网站不简单, 但我没想到是这么的“不简单”。
对于输入搜寻的中文字 (注意: 强调的是中文词据) 淘宝做了分词的解析动作, 这能提高
搜寻的准确性。而一些数据分析系统, 则能细到分析你是谁, 喜欢什么, 真是令人担心害
怕。对于浏览器端的资源 (javascript, css, 图片 ...) 同时存取的能力, 淘宝也下了
一番功夫, 要能对抗光棍节的庞大需求, 果然不是简单的事情。而贴心的网页快照则提供
了卖家无法反悔的证据, 这是用来提供买家当时买的拍卖资讯, 因为卖家可以修改拍卖资
讯, 这又让难度提升了好几个等级, 台湾的拍卖服务实在差太多了。
没有书的朋友可以搜寻这篇文章一探究竟: 才在淘上了一件西
800Gbps 这是 20111111 那年的最高流量, 果真骇人。
为了稳定性, 淘宝有过需要重新启动程式的经历, 每天早上要重启, 晚上也要重启, 真把
这些工程师折腾到剩下半条命。
“任何牛 B 的人物,都必须有一段苦 B 的经历。”听起来像是玩笑话, 你能体会里头的
辛苦吗? 在自己有了一段痛苦的学习体验后, 我能理解这句话背后的努力。为了完成支付
宝, 里头有位工程师办了所有银行的卡片, 一一的测试支付宝的付款功能, 为什么要这么
辛苦完成这功能, 就是为了防止诈骗的卖家, 买家转了帐没拿到货, 淘宝知道这功能的重
要性, 参考了 paypal, qq 币, 不过我不知道为什么书上说 paypal 不能解决这问题,
paypal 不就是那来解决这问题的吗? 台湾的拍卖则对这问题视而不见, “我们只提供平
台, 买卖纠纷我们不介入”这类混帐话你是不是很生气, 我因为这原因不是很喜欢用台湾
的拍卖, 等淘宝再更介入台湾后, 你们等著完蛋吧!
第 3 章提到为了应付网站流量, 将 php 改成 java (想到就觉得恐怖), 请来 sum 工程
师帮忙, 将 php 转换到他们最熟悉 java, sum 工程师还帮 ebay 干了类似的事情, 不过
是把 c++ 换成了 java, c++ 讨人厌的事情多了一件。
facebook 则是用了另外的技术来改善流量变大的问题, 将 php 程式码转成 c++, 不过目
前改变了一点作法。ref:https://goo.gl/8S475h (
http://zh.wikipedia.org/wiki/HipHop_for_PHP )
第 4 章在解释淘宝自己开发的一些技术, 有 tabao file system, 除了拿来自己用之
外, 还 open source, source code:https://goo.gl/zku2Gs (
http://code.taobao.org/p/tfs/src/ ) 真是不简单, tair 则是另外一套 open source
的系统。他们知道开放的力量, 在目前的趋势中, 开放算是个主流。
第五章是比较难读的一章, 里头的技术含量较高, 读来没那么轻松, 这可是淘宝几年的改
进, 的确不简单。将原本的服务拆成好几个小模组, 导入中间层, 开了一些自己的架构,
HSF, Notify, TDDL, session framework, 提供 API 让开发者使用, 读过一遍之后, 让
我这个不了解大型网站开发的麻瓜, 有了大体上的认识, 要考虑/处理的细节可不少, 难
怪我们常看到台铁, iphone 订购, 这么容易就垮了, 这可需要不少的努力才能成事。大
原则就是切割, 将所有的功能分散出来, 用讲的很简单, 怎么把这些分散的模组好好的相
互合作, 速度还不能慢, 这可就是大问题了。淘宝也是被逼的开发这些技术, 因为市场上
所能买到的技术/硬件已经不能符合他们的需求了。
第六章就是作者自己的经历, 当淘宝的故事看看, 很轻松, 有些东西在之前的章节有提
过, 看来好像真的把 blog 文章集合就出书了, 因为从排版看来, 好像是直接把网页的格
式转成书本页面。
对于作者提到有人来挖他我不太能理解, 同一个公司或集团能算挖角吗? 他被从淘宝旅行
“挖到”测试团队, 我觉得这不能算挖角吧!
作者搞了个淘宝大学, 这当然不是真的大学, 而是淘宝的培训单位, 用来培训进入淘宝的
新人, 这是台湾企业比较少有的单位, 当然中国本身的企业也少有。p 158 提到的数据,
美国人均培训时间 19 小时, 淘宝是 14 小时, 中国企业平均不到 5 小时, 不知道台湾
的数据是多少?为什么要搞这个, 因为学校教的东西不可能有淘宝用的技术阿! 这些技术
都是淘宝自己开发的。
第七章是一些淘宝上的技术人员访谈, 和第六章一样, 这两章我比较没什么兴趣, 这些人
所研究的领域是我比较陌生的东西, 我也不熟悉这些大牛, 读来没有什么共鸣, 提到的技
术我都很陌生, 但我相信网站开发人员应该会有所心得。
我记得露天拍卖刚开始也是和淘宝有类似的问题, 买/卖家变多了之后, 网站无法负荷
了, 也是花了不少时间才稳定下来, 不知道他们是不是也是和淘宝有着相同的奋斗经验。
这本书竟然有繁体中文版本:
淘宝,技术为王:这群工程师如何打败eBay,用10年建立中国网购江山
http://www.books.com.tw/products/0010617962
真是煽情的书名。
ref:
有人整理了网络相关文章 (看这个应该就够了):
http://blog.longwin.com.tw/2013/11/taobao-origin-story-history-2013/
作者子柳, 我不知道是不是书上所有内容都有在这里:
http://blog.sina.com.cn/s/blog_633219970100x9cc.html ( https://goo.gl/RnJm9 )
放翁:https://goo.gl/zWvc3G ( http://blog.csdn.net/cenwenchu79 )
完美商店 (ebay 的故事):https://goo.gl/I69s7j (
http://book.douban.com/subject/1128908/ ) 28 rmb, 你就知道为什么我说这本贵了不
只一点。

引言
第一章:网站
以理想准
第二章:速成
豆袋公仔到名足球
第三章:努力型
注入新血,成真正的公司
第四章:座岌岌可危
auctionuniverse和onsaleexchange激烈
第五章:公上市
一切准就,朝1998年9月24日挺
第六章:ebay效
泡沫包、泡菜瓶、志都可以大
第七章:面危机
混中摸索出序
看来和一般介绍公司经历成长的书籍一样, 没有技术含量的部份。
// 本文使用 Blog2BBS 自动将Blog文章转成缩址的BBS纯文字 http://goo.gl/TZ4E17 //
blog 原文
http://descent-incoming.blogspot.tw/2013/12/books.html
作者: runningmalt (runningmalt)   2016-12-01 12:57:00
谢谢分享
作者: Tribute (Tribute)   2016-12-02 11:06:00
推(被烧到了)^^

Links booklink

Contact Us: admin [ a t ] ucptt.com