我不是统计专业,好奇发问
: 假设想要设计一个好的模型应该是:
: 找到你的Y,Y应该是“球员排名”
: 换言之没有先透过一个大规模问卷
: 或是多个问卷进行meta analysis的话
做统计问卷会遇到一样的问题,你抽样的群众数量中太多X因子
比方美国的州人数、年纪、种族、国籍……等等
感觉又绕回到一样的困境
: 很难有一个有统计意义的公式
: 接下来要找到一堆x
: 这部分我觉得原PO的设计概念就会有很大帮助
: 不过要靠观球的经验法则做一个Empirical model太难了
: 我想用简单的logit(实际分析可以order logit)
: 下面用原本的公式当作X假想实验
所以我的想法是绕开这些问题
如果我做一个网页,在数据库里面先存放200个可能的历史百大球员的数据
(透过累计权威媒体的名单,或是类似原原Po之类的公式,
反正我只要大约的前200球员的名单,不必"正确")
每次点进去,就出现两个人的比较数据
重点是不亮名,即参与投票的使用者不知道这两球员是谁
(个别巨星球员可能容易被猜出来,但是大多数一般用户应该不会去记)