是这样的啦
最近在Kaggle遇到了一个问题
资料很复杂 稍微简化一下 方便举例
现在有5个变量:
1. 消费额
2. 消费的时间(时间轴)
3. 顾客id
4. 网页点击次数
5. 所在城市
目标是 针对不同的顾客id
去预测其未来的消费额
既然要预测未来的话
第一个想到是用时间序列来解
但问题来了
给定未来的时间
当然 可以预测未来的消费额
但再多给个顾客id怎么办?
可以只拿两个变量 去预测消费额吗?
我的意思是
时间序列 是单纯给时间这1个变量去预测
回归 是给全部的4个变量 去预测消费额
那可以只给2个 或3个变量 来预测吗?
又 顾客id这个字段 要当成类别变量吗?
转成dummy感觉完全没意义
另外 这种问题 多变量时间序列
要用哪种模型来跑?
Vector AutoRegression?
Linear Mixed Model?
还是用随机森林?
有没有大神可以帮忙解惑的
十分感谢