Re: [心得] Similarweb | SEMrush | GA 哪个最不准?

楼主: GALINE (天真可爱CQD)   2022-07-20 11:43:10
※ 引述《danceofdie (zong)》之铭言:
: 1. 对于资料流量来源的总结,两家公司都以隐私为由不公开资料来源,所以看完官方文件后也是不知道实际的来源是什么。
https://www.similarweb.com/corp/ourdata/
https://www.semrush.com/kb/998
虽然很模糊,但这两家其实有大概讲一下资料来源
- 拿一堆关键字丢搜寻引擎的结果页面看结果
- 跟上面类似,不过是去拉维基百科之类的大型公开资料
- 跟第三方买各种资料
- 第一方资料(不过说能拿到 GA 资料但不讲怎么拿到 GA 资料,毛毛的)
这种大规模资料搜集有时候生意不是那么好端上台面。
自己没做过,但古早有听人讲过“到处下广告,然后用广告成效估计网站用量”之类的招
这招现在应该没有五年十年前这么好用,但大概还是有把戏能变?
另外 similarweb 直接在网站上提到他们会跟 ISP 买资料。
某个程度上满吓人的...
总之,他们的主要资料大~概~不是实际用量数据。
而是各种侧面资料,加上一部分流量资料来作为估计用的基准。
这样估计出来的资料光是能落在同一个数量级就很了不起了。
GA 直接用 JavaScript 测量网站使用状况,品质会好得多
但也不会是百分之百准确
- Firefox 某些情况下会挡 GA,Brave 应该也会挡
- 跑在客户端的 code 本来就不可能完全可信
- 会各种被塞(黑帽 SEO?)资料
作者: Boston (Boston)   2022-07-20 17:48:00
我印象中 similarweb 是透过网络封包分析(跟 ISP 买资料
楼主: GALINE (天真可爱CQD)   2022-07-20 20:58:00
如果是 shared host 或云端服务,分析能力还是有限现在HTTPS几乎标配,除非环境污染 MITM,不然打穿机率不高自己的机器或固定外部IP应该就能抓很准了突然想到DNS那个方向应该还是有招...
作者: guanting886 (Guanting)   2022-07-21 01:00:00
正常环境不会有MITM数据资料可以一鱼多吃 当你使用平台的服务就同意他们可以怎么使用你的资料 而且赔偿是有上限的有些数据也不一定需要ISP 那边买当你拉进那些免费的字体、JS、服务就是帮别人收集资料完善他们的服务举例说 SEMRUSH 可以知道某网站数据状况,上面的数据缺很意外跟 GA 上的资料接近,即使有误差。可是那个网站呢用的AWS、Cloudfront + Cloudflare 的服务其他就是一些常见的 GA、FB PIXEL、BING 追踪转换、成效的东西还有 Google Font你说究竟是谁出卖了这个网站的呢 不知道 但是一开始你同意了服务条款,他们也得到你的授权,他只要适当的去掉可以识别的资料他们怎么用你也拿他们没什么办法 毕竟免费服务麻像某家卖IP Geo 资料的业者,他们怎么可以抓到很准确的 Country/City 可以思考一下他们以前推了什么服务给网友XD还有一些数据平台资料锁很紧,爬虫还不一定爬得稳,不是合作伙伴我是不相信啦XD
楼主: GALINE (天真可爱CQD)   2022-07-21 15:04:00
“正常”是不应该有...(望向 superfish 案CDN 业者拿到的资料品质应该也不错这年头资料都被卖来卖去的啊....

Links booklink

Contact Us: admin [ a t ] ucptt.com