本人之前都是用 SQL + Mining tools (例如MS-SQL Analysis service , SPSS Modeler)
之前大部分是用 SQL 整理资料
之后再用 mining Tools run mining (包含调参数等等)
例如我们做一个罗吉斯回归,去预测信用卡客户是否会变呆卡
或用 CART 去做回应率分析
现在关于 R 我有一些问题:
1. R的mining 函数支援到那些算法?
例如:分群,类神经网络,CART 等等?
2. R有办法调参数吗?
例如分群时分几群,CART的切点,等等 (这部分在mining tools 都有很强的支援)
3. R怎样做Mining前的资料处理?
SQL 强的地方在于下语法可以做很多资料预处理
例如:资料中只有生日要转换成年龄,还有一些更复杂要套公式转换的部份等等
SQL 的资料可以存很多资料
R 在预处理部分的强度如何?
总不能一直读EXCEL的资料吧?
我要表达的是,在资料面SQL 数据库有很强大的SQL语法,跟储存面
R 的方式?
4. 这张图
![]()
是否过誉?
以MS-SQL mining 而言,建构好一个预测模型,可以利用MDX等等
去对这个Model 做一些处理,例如输入资料做预测等等
而且也有很多图形接口的输出
以上几点问题