[问题] 投影寻踪相关问题

楼主: elegantnight (elegantnight)   2015-11-15 23:00:52
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
不好意思打扰,我有个台湾去北京大学唸书的朋友,遇到一份需要使用R的作业,希望可以
请大家帮忙 >"< 他是第一次写R的新手,完全不知道该怎么处理,
所以希望可以得到一点建议或是方向,谢谢大家!
问题如下:
4. 探索性数据分析部分
在loan data中,自选合适的定量变量,通过投影寻踪来研究影响grade的因素。要求:
(1)指出你所选择的投影指标,并说明理由;
(2)给出投影向量,你是否能通过投影向量说明哪些变量对grade的影响比较大?
(3)在投影结果中,对不同grade的样本点进行染色,说明投影结果是否能够反应grade变量的分组情况
(4)数据中是否存在特异点?如果有,请指出来。
会需要用到REPPlab中的函数
3. 统计制图部分
在loan data中,自选合适的变量,绘制以下图形:
(1)分面的风玫瑰图,玫瑰叶片的颜色至少三种;
(2)某一个连续型变量的分布直方图,并加入拟合分布线,直方图的组距和组数自己设定
(不要使用默认的),并且每个柱子里面填上相应的组的频数,整个图片加上一个蓝色的
外框,并且图的底色为深色,柱子为浅色;
(3)某两个连续型变量的密度图,并且在图中找出一个部分加上一个方框与其他部分区
别开来(比如说,密度最高或者最低的区域,用一个矩形的方框加以标示);
(4)挑选多个连续型变量,进行聚类,并且绘制相应的热图(可以不用全部样本)。
要求:以上所有图表都要求有图表名称、图例、行标题、列标题等要素。
data 如下:https://www.dropbox.com/s/t7madvx8dmj4ai6/LoanStats3d.csv.zip?dl=0
因为我也完全不会R,但是朋友希望我可以帮他问问看,如果有不洽当的地方,
再麻烦跟我说,我会自己删文,拜托大家了,谢谢! >"<
作者: Wush978 (拒看低质媒体)   2015-11-15 23:22:00
请建议你朋友把R 学起来之后再尝试看看。可以参考置底也欢迎试试看我最近写的教材:https://github.com/wush978/DataScienceAndR
楼主: elegantnight (elegantnight)   2015-11-15 23:49:00
谢谢W大,但是因为她明天就得交,所以还是希望得到一些方向的建议 >"<
作者: Wush978 (拒看低质媒体)   2015-11-16 01:13:00
对于完全不懂R 的新手,我觉得除了学R 以外的建议都多余

Links booklink

Contact Us: admin [ a t ] ucptt.com