Re: [分享] sparklyr

楼主: pk790127 (<>)   2016-11-24 22:59:51
※ 引述《celestialgod (天)》之铭言:
: [关键字]: sparklyr
: [出处]: http://spark.rstudio.com/index.html
: [重点摘要]:
: 烦请移驾到我的部落格观看:http://goo.gl/SSor3y
: 最近花了点时间研究Spark
: 终于研究到了一个段落
: 回来研究一下自己最爱的R
: 而且又看到rstudio释出了sparklyr就手痒想说试试看了
: 于是就有这篇心得了XD
: 只是我还没去测试machine learning相关的东西
: 就留给其他人慢慢赏玩了
感谢celestialgod大大 无私分享这个关于spark的套件
小弟目前着手研究这个套件,并搭配出处原文参考
但是在安装的时候发现了一些问题
例如说是
Error:
To run Spark on Windows you need a copy of Hadoop winutils.exe:
1. Download Hadoop winutils.exe from:
2. Copy winutils.exe to
C:\Users\XXXXXX
这个问题网络上问的人蛮多的,只要将winutils放入指定路径即可
但是衍生成别的问题 就找不到解法,想请教大大
问题如下:
> library(sparklyr)
> sc <- spark_connect(master = "local")
Error in start_shell(master = master, spark_home = spark_home, spark_version
= version, :
Failed to launch Spark shell. Ports file does not exist.
Path: C:\spark-2.0.0-bin-hadoop2.7\bin\spark-submit.cmd
Parameters:
楼主: pk790127 (<>)   2016-11-24 23:04:00
备注 我是只要在local端执行运算即可
作者: celestialgod (天)   2016-11-24 23:11:00
你可以试试看直接用最新版的rstudio + sparklyr就好不要自己设置HADOOP跟SPARK路径用sparklyr的install_spark成功机率应该会比较高很多自己设定的东西 跑掉是不好找的(摊手除非你真的对R, 系统, Spark都很熟
作者: clansoda (小笨)   2016-11-24 23:13:00
对 sparlyr已经建在rstudio上了,只要你有安装sparklyr他就会跟git一样出现在environment那边,很容易可以使用
作者: celestialgod (天)   2016-11-24 23:14:00
在linux玩这个套件还是我最推荐的方式拉(摊手windows = 浪费时间现在架一个,用rstudio server不用太久/vm
作者: Edster (Edster)   2016-11-25 02:18:00
真的windows=浪费时间,我今天花一天时间处理big5跟unicod混用的档名,在windows下真的很讨厌。看来该要跳槽linux了
作者: andrew43 (讨厌有好心推文后删文者)   2016-11-25 04:01:00
急的话用virtualbox安装个顺手热门的linux distro吧
楼主: pk790127 (<>)   2016-11-26 15:14:00
感谢各位的回复 问题可能倾向板本问题

Links booklink

Contact Us: admin [ a t ] ucptt.com