Re: [新闻] 搜寻议会直播网站跑出简体字 黄郁芬质疑

楼主: philxiao (Sting)   2021-07-07 17:27:37
1.用"site:"当google搜寻工具,不是什么奇怪的用法,算一个小技巧而已。
举例,google "site:ptt.cc"(即https://www.google.com/search?q=site:ptt.cc)
可以看到google抓到的ptt.cc这个网域下面的网页内容,也可再用空格加关键字,
所以假如google "gossiping site:ptt.cc" 就会看到很多八卦版网页。
若有人用这个方法搜寻北市议会影音,合理理解是要找某个特定内容关键字的影音。
2.稍微看了一下google cache内容video.tcc.gov.tw内容出错(有简体字的部分),
最早有5月左右的纪录:
https://tinyurl.com/5uypnu8z
注意最上面google说“这是该网页于 2021年5月13日 00:47:53 GMT 显示时的快照”
然后下面简体字的内容也是5月13日,同天;
这个同天的情形几乎出现在所有库存网页上。
3.看一下网页原始码,有个的发现:
所有库存页面简体字网页的原始码,都有用到这个网域的图片:
“www.gd.gov.cn”
gov的!这是什么网站呢?是广东省人民政府门户网站
4.但我进入www.gd.gov.cn,用这篇错文的简体字去搜寻,并没有找到相关资料,
拿错文的内文“原标题:台湾客商重视东北亚博览会平台”google,找到中国新闻:
https://news.sina.cn/2019-08-24/detail-ihytcern3292895.d.html
再拿其他篇错文去google,同样也在中国新闻可以找到(多家不同的新闻网站)
5.另外,搜寻过程中也发现,bibliosalut这网站的google页库存盘有同样的错误情形,
https://tinyurl.com/2z5xk7nr 不过这个网站看不懂原始在做啥,建议没必要要点
6.我没有结论,但目前资讯,我大概会先怀疑问题是google cache的问题?
然后,这些库存页面都是中国新闻随意抓取(且新闻标题和内文还不符),
不确定跟SEO有没有关系?

Links booklink

Contact Us: admin [ a t ] ucptt.com