Re: [请益]高流量网站和资料结构 alihue PTT批踢踢实业坊

Re: [请益]高流量网站和资料结构

楼主: alihue (wanda wanda) 2021-08-22 15:54:24

高流量应用你没定义好需求根本无法讨论怎么设计
1. 资料一致性要求? 持久性要求?
如果一定要用到交易，基本上一致性和持久性就一定要，
就直接用掉 CAP 定理的 Consistency，算是最常见的瓶颈
2. 如果是写 log 系统，这种 QPS 要破万比网站容易多了，也很常见
在台湾，台面下 QPS 破万的 log 系统应该比台面上的"网站"多
但这种系统通常送出 request 就不理他了，
因此后端可以用 kafka 之类的大量接收至于要怎么写 log 与写到哪 (通常是 HDFS)
是另一段需求
3. 如果一致性不重要，基本上就尽量设计成可以无脑 Scale out
但如果系统有做 sharding，那 Scale out 的数量非常惊人，
因此如何撑爆单台的资源就变得重要
4. 根据情境，还需要判断 bare metal server 的重要性。
例如你程式用到 file system cache 等
5. 事情没这么单纯，还有 latency/SLA 要求，如 95% percentile < 100ms 等
6. 外加 request payload 大小多大
7. 其实这些系统会再划分好几个子团队，例如搞 storages、搞整合(dependencies)测试
真正搞大流量设计的是核心中的核心
其中因为系统通常包含非常多 components，整合测试规模可能会很复杂
我觉得还有很多我没列到的毕竟大流量系统的情境多元，
即使同样的需求，不同团队讨论出的设计也不尽相同
因此在讨论"大流量"没先说好需求，那讨论基本上会过于发散
如果你是静态网站那就 CDN 设好就能撑 QPS 一万惹
要进大流量系统的团队不一定要需要先做过
即使考系统设计也只是想知道你对于每个 Componennt 抉择的逻辑合理性
实务上设计因为需求会更 tricky
因此建议:
a. 基本知识弄好: OS 算法资料结构 multithreads 写程式基本功
语言也要够深，知道怎么做 Memory/CPU profiling
如果有用到如 JVM 的技术，也要知道 GC 算法与怎么分析与调整参数
b. 找出大流量团队在哪，不是你进 google 就能搞这个

楼主: alihue (wanda wanda) 2021-08-22 16:05:00

补充，以购物网站就有不同的流量主题：搜寻订单成交商品库存推荐系统使用者前端log

作者: jason2641668 (钢球智者) 2021-08-22 16:05:00

有没有经验啊静态网站QPS才1万https://i.imgur.com/1Tw8bRl.png随便挑台大学维护的系网站压一下这样都能发文哦真的完全在打脸自己基本功的部份系网站不是商用机器一般pchome买的到的commodity

作者: FlowerKnight (美少女花骑士) 2021-08-22 16:32:00

Lushen人格跑出来了

作者: brucetu (sec) 2021-08-22 16:56:00

请问jason大大的系网站每个request是多少流量？

作者: acgotaku (otaku) 2021-08-22 17:39:00

推一致性的问题真的是高并发的难题

作者: drajan (EasoN) 2021-08-22 17:39:00

HDFS? 直接放到S3不是更简单？

作者: MoonCode (MoonCode) 2021-08-22 18:17:00

QPS 还要看同时连线数量吧？你单机可以模拟十万个 tcpconnection?Lushen 是谁

楼主: alihue (wanda wanda) 2021-08-22 18:28:00

你捅过的乡民，只是 ip 刚好跟 jason 一样

作者: MoonCode (MoonCode) 2021-08-22 18:30:00

你认错人了我不是版主

楼主: alihue (wanda wanda) 2021-08-22 18:32:00

抱歉认错人

作者: MoonCode (MoonCode) 2021-08-22 18:32:00

对了我好奇 jason 是测试哪个网站我可以用 wrk -t1-c10000 -d180 跑跑看

作者: sammythekid (山米乐其得) 2021-08-22 20:17:00

但后续资料整合就知道了。目前就在收s3的锅

作者: GGFACE (ggface) 2021-08-23 10:34:00

.............

继续阅读

Re: [请益]高流量网站和资料结构yfr [心得] 2021面试心得分享idok [请益] 读在职硕效益如何?prott Re: [请益] 不同市场取向的产品职缺annedoo Re: [请益] 只有高中毕业要怎么进入软件业jason2641668 Re: [请益]高流量网站和资料结构drajan [请益]高流量网站和资料结构ntpuisbest Re: [请益] 想海外工作，刷题or在职硕?alihue [请益] 该跳巢还是咬牙拼完硕士?GGinin0614 [请益] 只有高中毕业要怎么进入软件业yuidzeon