本人之前都是用 SQL + Mining tools (例如MS-SQL Analysis service , SPSS Modeler)
之前大部分是用 SQL 整理资料
之后再用 mining Tools run mining (包含调参数等等)
例如我们做一个罗吉斯回归,去预测信用卡客户是否会变呆卡
或用 CART 去做回应率分析
现在关于 R 我有一些问题:
1. R的mining 函数支援到那些算法?
例如:分群,类神经网络,CART 等等?
2. R有办法调参数吗?
例如分群时分几群,CART的切点,等等 (这部分在mining tools 都有很强的支援)
3. R怎样做Mining前的资料处理?
SQL 强的地方在于下语法可以做很多资料预处理
例如:资料中只有生日要转换成年龄,还有一些更复杂要套公式转换的部份等等
SQL 的资料可以存很多资料
R 在预处理部分的强度如何?
总不能一直读EXCEL的资料吧?
我要表达的是,在资料面SQL 数据库有很强大的SQL语法,跟储存面
R 的方式?
4. 这张图 http://i.imgur.com/iMTOAoG.jpg
是否过誉?
以MS-SQL mining 而言,建构好一个预测模型,可以利用MDX等等
去对这个Model 做一些处理,例如输入资料做预测等等
而且也有很多图形接口的输出
以上几点问题
R绝对可以,但前提是有coding 的 senseR是很强物件导向的weak type语言
作者: obarisk (OSWALT) 2016-03-04 18:59:00
r的物件导向真心不推...
作者:
JX660 (JX)
2016-03-04 23:34:00个人用过R SAS SPSS 比较图中六项 R毫无疑问是完胜阿不是六项 是八项 不过SAS SPSS有其他方面的好处就是了
o大 虽然R写物件很麻烦,但他基础型态是以物件式管理的所以相对很多问题变很好解
作者: clickhere (It's time to go home.) 2016-03-05 09:43:00
2/29 R 刚刚满 8000 个 packages...这图要更新了这还不含 BioC 和 archived 的 packages.R的基础型态不是以物件式管理的...
???我之前看原文网站有强调所有资料都是一个物件 ???我一开始用的时候觉得他资料有些部分默认的方式很像物件 , 后来看到网站写那段原网站我要再找一下,不过当时是主要查询class用法,然后系列文章有从物件切入,然后有一段直接写,实质上所有元素都是物件,然后再开始介绍怎么去自己另外写一个物件会需要另外写主要是我有需求开发特殊物件
作者:
andrew43 (讨厌有好心推文后删文者)
2016-03-05 18:31:00物件式管理和它是不是物件应该不是同义的。
感谢A大,能否多分享一点相关资讯?我最近还在研究,想问有经验的人的人一些比较详细的知识
作者:
andrew43 (讨厌有好心推文后删文者)
2016-03-05 22:45:00我不是专家。R确实让所有的型态都是物件,但它和主流的物件导向语言的特色还是差距不少。在主流的S3和S4,继承、多型、封装都有点半调子。
作者:
andrew43 (讨厌有好心推文后删文者)
2016-03-05 22:50:00前面c大提到的R6有很大的进展,它至少把最基本物件导向该有的特征都有了。很物件导向的朋友可以研究R6下去。又例如S3或S4连私有成员都没有,实在很不“物件导向”。
作者: clickhere (It's time to go home.) 2016-03-06 09:17:00
继承、多型、封装都是在S3/S4之后才逐渐成形的.光能用在函数和变量中用"."就够C++和java使用者头痛了就甭说管理或导向了...S3/4当年可是很先进的咧.
作者:
andrew43 (讨厌有好心推文后删文者)
2016-03-06 12:05:00谢谢补充这段历史先后顺序。
作者: obarisk (OSWALT) 2016-03-07 19:21:00
学完s4,换rc,现在是r6