[请益] 资料分析 R or Python ?

楼主: f496328mm (为什么会流泪)   2017-07-15 11:08:57
想请教从事 资料分析、ML 相关工作的各位,
比较常用 R 还是 Python ?
因为我上网搜寻相关工作,比较常看到必备需求中包含 Python ,几乎没有 R
因为 R 比较偏向学术吗?
我上网GOOGLE到这几篇
R, Python Duel As Top Analytics, Data Science software – KDnuggets 2016
Software Poll Results
https://goo.gl/DQNEvq
SAS, R, or Python Survey 2016: Which Tool Do Analytics Pros Prefer?
https://goo.gl/sJUubT
R vs Python for Data Science: The Winner is
http://www.kdnuggets.com/2015/05/r-vs-python-data-science.html
都是 R 使用率大于 Python
所以想请教各位,谢谢
作者: ruokcnn (Dean)   2017-07-15 11:14:00
都有人用啦 只是派森商品化能力强些
作者: johnny78615 (Johnny)   2017-07-15 11:23:00
Python
作者: besmartAE (*无敌海滩男孩*)   2017-07-15 11:58:00
Python
作者: CaptainH (Cannon)   2017-07-15 12:54:00
R是垃圾
作者: Murasaki0110 (麦当劳欢乐送)   2017-07-15 12:55:00
python没有对手
作者: Morphee (千磨万击还坚劲)   2017-07-15 13:11:00
Python
作者: xsssxxzz (阿群)   2017-07-15 13:16:00
R是垃圾?怎么会有人下这种评语?
作者: red0210 (My Name Is Red)   2017-07-15 14:00:00
Python
作者: vfgce (小兵)   2017-07-15 14:27:00
R就不好入门,和传统程式语言差异很大,且非常不建议用循环..对于写惯循环的人,非常不顺手,python接近一般程式语言,且
作者: Rocker5566 (摇滚56)   2017-07-15 14:29:00
python比较潮
作者: vfgce (小兵)   2017-07-15 14:29:00
程式效率也比R好些,自然用的人多一点...用于资料分析,R语法简洁许多,因为本来就是为统计分析设计..内建就是向量式计算及内建矩阵运算...
作者: testPtt (测试)   2017-07-15 14:46:00
一边学校多教spss,lisrel
作者: grimmq427532 (Legend)   2017-07-15 14:50:00
有人开释啦,这种评语不是大神就是蠢才
作者: seallol (carl)   2017-07-15 15:25:00
两个都学,先学python再学R
作者: Wush978 (拒看低质媒体)   2017-07-15 15:38:00
看领域:资工人偏P,统计人偏R。这里资工人偏多吧,业界资讯部门也是资工人比较多
作者: Telemio (Telemio)   2017-07-15 15:45:00
python开源的资源比R多很多啊 你现在用pandas numpy做分析 ML DL的套件也几乎都是用python开发 R现在的优势很小吧 而且python很多才多艺 又好写
作者: Wush978 (拒看低质媒体)   2017-07-15 15:49:00
R的开源资源也不小呀,没必要贬R吧。我觉得R开源界推的tidyverse概念整理资料很漂亮ggplot2也是R的开源界推出在资料视觉化很有影响力的套件Rstudio也是与R整合的很好的IDEPython的开源界虽大,但是不像R的开源界专注在资料处理上,因此一些资料应用在工具上的创新,R不一定比Puthon慢
作者: testUI (毫无反应,就是条鱿鱼)   2017-07-15 16:00:00
Python
作者: yenyu0304   2017-07-15 16:14:00
有必要这么偏低R吗?个人觉得R避开循环,用矩阵运算取代,速度并不会比python慢喔
作者: vfgce (小兵)   2017-07-15 16:38:00
呃,R的速度严格来说还是比优化的numpy要差.....R最大的优势是语法简洁,及统计方面的功能强大,
作者: Wush978 (拒看低质媒体)   2017-07-15 16:40:00
是吗?有更换R的默认blas再比较吗?
作者: vfgce (小兵)   2017-07-15 16:41:00
对于同时有统计及机器学习需求的人,R是不错的选择...换过了,资料一大,R就慢了下来....
作者: Wush978 (拒看低质媒体)   2017-07-15 16:43:00
R core team在选用运算套件上,正确性的权重比速度大很多
作者: dreamnook (亚龙)   2017-07-15 16:43:00
看来又要变成不要删文讨论串了XD
作者: drak4dd (drak4dd)   2017-07-15 16:45:00
Python,你学 R 后会了解,你终究要学 Python
作者: Wush978 (拒看低质媒体)   2017-07-15 16:49:00
不过R的函数只能pass by value,所以资料量一大,没注意到这点速度就慢了。我自己看过两者底层的C资料结构,不觉得两者的效能会差很大。通常原因在别的地方。
作者: vfgce (小兵)   2017-07-15 16:55:00
R就偏functional language,不去变动原始资料,计算完传回新的,内存耗用大,资料大一点就变慢了
作者: Wush978 (拒看低质媒体)   2017-07-15 17:31:00
针对原Po来说,我强烈建议你学一学Python,对你的视野与职涯都会有很大的帮助。你会看到一些与R不同的工具与观点况且以现代来说,R+Python 会比 R or Python 来的有竞争力以深度学习来说,像Rstudio包的那些关于keras的R套件你就可以不用碰了,直接学Python/keras就好了。这未来都会比只坚守R来的更好
作者: vallwesture (vallwesture)   2017-07-15 18:06:00
R太慢了
作者: rodion (r-kan/reminder)   2017-07-15 18:11:00
泛用选python 专精选R不过学python根本不须那么多考虑 因为python太简单好学了
作者: vfgce (小兵)   2017-07-15 18:26:00
data.table格式不是R原生,很多套件不援.有时还是得再转成data.frame,用到类神经这种,R真的太吃力..python类神经跑mnist识别几分钟就跑完了,R的类神经来跑....要一到两小时.数据不大时,用R真的很享受...但数据大时....还是考虑一下python.我现在也是两个用,虽然比较爱用R.
作者: lukelove (午睡)   2017-07-15 19:09:00
不管你是cs/math都建议学一下python 不然就像上面所说面试就先被cs喷R太慢 虽然事实上R也能做的很高效 如wush大之前文章所示 但如果没有很懂R底层应该做不到
作者: Philcat (a cat)   2017-07-15 19:35:00
长知识
作者: roymond   2017-07-15 19:42:00
R的套件远比python来得丰富也多很多....DL的部分Tensorflow & keras也有R的package可以使用使用哪个语言做分析,主要看自己的熟悉度与适应程度比较哪个语言好,实在没有必要,有些人的发言实在是....
作者: eddy50811 (红领巾)   2017-07-15 20:43:00
各有优缺点 如果要靠这行吃饭的话就两个都学吧楼楼上 有些人的言论就别在意了 到哪都有这种人的
作者: celestialgod (天)   2017-07-15 21:51:00
用台湾的相关工作要求来看R or Python??那些老板跟人资也根本不懂到底R跟Python区别就去问IT的,IT当然回Python阿(摊手而且你出去工作,老板只care你有没有产出吧管你用什么工具....除非他是一间有规模的公司,里面已经有既有的架构了但是你如果能够fit既有架构,要用什么也不是问题
作者: nfsong (圖書館我來了)   2017-07-15 22:43:00
https://juejin.im/post/59647aac5188250d9208813bPython 为何能坐稳 AI 时代头牌语言facebook这个 http://pytorch.org/ 有支援GPU运算感觉实用上应该只有python了 除非nvidia 也有开发Rhttps://github.com/pytorch/pytorchhttps://goo.gl/aWnLxs wiki Comparison_of_deep_learnin
作者: a9601268787 (SoHentai)   2017-07-16 00:15:00
我觉得学py可以跨领域做很多事情 选R路太窄了
作者: artopll (命运)   2017-07-16 11:46:00
R 跟Python 都只是工具 在业界不要被工具侷限
作者: profiles (pforileS)   2017-07-16 12:49:00
学C++不好吗?各领域都能用
作者: red0210 (My Name Is Red)   2017-07-16 13:19:00
没有各领域吧,资料分析有人用 C++ 吗
作者: fantasywater (prepare myself)   2017-07-16 13:28:00
以实务来说 R很难拿来和企业内部的系统介接,一个不能production的东西,实在是频频被企业打枪,还是学python吧!!如果学R还要搞懂底层,那你到底是做分析还是做工程,cs也不会为为了你去搞懂R底层,R没有不好,只是实务上太多工程问题很难解..
作者: Wush978 (拒看低质媒体)   2017-07-16 15:02:00
R 为什么很难跟企业内部的系统介接? 很多人这么说,但我还没听过真正的理由,好像只是因为台湾懂R的人少?
作者: fantasywater (prepare myself)   2017-07-16 15:47:00
真要说原因的话 R 原本就不是为了和其他系统整合介接设计的语言 当其他的语言介接的套件都很成熟 R可能还要从基本的轮子开始造起 又时间是重要的资源通常不会等 R 去发展这些基本的介接模组
作者: primary   2017-07-16 17:23:00
python进步速度很快也好上手但data viz和cluster之类的我都会用R
作者: Wush978 (拒看低质媒体)   2017-07-16 19:56:00
你能举例嘛?我串过很多服务到R, 都很顺阿资安方面有openssl / digest 等套件直接套用web 方面 oauth 2.0 也有httr等套件可以直接调用database方面,有RJDBC/RODBC等套件可以直接串听你们的论述,我觉得台湾业界觉得R不好串是因为台湾业界对R不熟悉可能大家的印象还停留在2010 年前后的R吧,那时候的R的确缺很多串系统需要的工具。但现在是2017,有许多商业公司帮助R补上这一段了
作者: truehero (wek)   2017-07-16 21:29:00
我有现成系统 当然是看R或python谁比较好接不会反过来以rR为主体来往外接阿
作者: fantasywater (prepare myself)   2017-07-16 22:06:00
实际上我们选择的时后也不是只有比较有没有套件可以用这么简单而已,更进一步还会比较套件是否成熟,是否好维运,还有大家是否容易接受等等更多的原因,很遗憾的 现实的环境就是不会等R来慢慢证明他的能耐,有更好用更成熟的工具可以选择,为什么要为了R而R呢?更多的情况是专案刚起步用R提案就被客户打枪了..
作者: polola6212 (Polo)   2017-07-16 22:07:00
python cp值高太多了
作者: fantasywater (prepare myself)   2017-07-16 22:11:00
我的建议是,既然R的强项是分析, 就把分析的部分包装起来让其他的语言调用就好,其他的部分让更适合的语言及工具来发挥,才更能发挥综效我不是很喜欢评断语言的优劣,因为本来就各擅胜场,我们公司在world wide也是要求 junior 在 R python至少要会一种,senior 就是都要会,我出自良心的建议,如过是工作导向,我强烈建议先学python,因为我在台湾看到的状况就是先学 python 比较不吃亏
作者: Wush978 (拒看低质媒体)   2017-07-17 11:32:00
我觉得你们讨论的好怪。如果客户的分析团队就是用R,那当然就是要串R阿,怎么会有所谓“等R证明能耐”的问题呢?总之我是期待你们具体指出R那部份不好串,而不是这样打高空,一下说要重新造轮子,一下又说套件不成熟,没有具体事蹟...
作者: benson1212 (Da)   2017-07-19 20:45:00
其实我想问 无经验非新鲜人有可能转到资料科学领域吗?感觉都要有经验或相关研究硕博士…
作者: tsoahans (ㄎㄎ)   2017-07-23 03:28:00
很难吧 这领域很重视理论和数学,除非你有一些比赛经验

Links booklink

Contact Us: admin [ a t ] ucptt.com