※ 引述《danceofdie (zong)》之铭言:
: 1. 对于资料流量来源的总结,两家公司都以隐私为由不公开资料来源,所以看完官方文件后也是不知道实际的来源是什么。
https://www.similarweb.com/corp/ourdata/
https://www.semrush.com/kb/998
虽然很模糊,但这两家其实有大概讲一下资料来源
- 拿一堆关键字丢搜寻引擎的结果页面看结果
- 跟上面类似,不过是去拉维基百科之类的大型公开资料
- 跟第三方买各种资料
- 第一方资料(不过说能拿到 GA 资料但不讲怎么拿到 GA 资料,毛毛的)
这种大规模资料搜集有时候生意不是那么好端上台面。
自己没做过,但古早有听人讲过“到处下广告,然后用广告成效估计网站用量”之类的招
这招现在应该没有五年十年前这么好用,但大概还是有把戏能变?
另外 similarweb 直接在网站上提到他们会跟 ISP 买资料。
某个程度上满吓人的...
总之,他们的主要资料大~概~不是实际用量数据。
而是各种侧面资料,加上一部分流量资料来作为估计用的基准。
这样估计出来的资料光是能落在同一个数量级就很了不起了。
GA 直接用 JavaScript 测量网站使用状况,品质会好得多
但也不会是百分之百准确
- Firefox 某些情况下会挡 GA,Brave 应该也会挡
- 跑在客户端的 code 本来就不可能完全可信
- 会各种被塞(黑帽 SEO?)资料