[问题] dataframe运作embed及修正timedelay首栏

楼主: paranoia5201 (迈向研究生)   2019-03-26 11:09:46
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
【原始资料型态】
> tao_b %>%
+ select(乡镇市区, 交易标的, 建物型态, 交易日期, 单价元平方公尺) %>%
+ arrange(乡镇市区, 交易标的, 建物型态, 交易日期, 单价元平方公尺)
# A tibble: 86,181 x 5
乡镇市区 交易标的 建物型态 交易日期 单价元平方公尺
<chr> <chr> <chr> <dttm> <dbl>
八德区 房地(土地+建物)~ 住宅大楼(11层含以上有~ 2012/6/18 36178
八德区 房地(土地+建物)~ 住宅大楼(11层含以上有~ 2012/7/2 29795
八德区 房地(土地+建物)~ 住宅大楼(11层含以上有~ 2012/7/6 30798
八德区 房地(土地+建物)~ 住宅大楼(11层含以上有~ 2012/7/9 35814
八德区 房地(土地+建物)~ 住宅大楼(11层含以上有~ 2012/7/15 30679
八德区 房地(土地+建物)~ 住宅大楼(11层含以上有~ 2012/7/18 25065
八德区 房地(土地+建物)~ 住宅大楼(11层含以上有~ 2012/7/20 52635
八德区 房地(土地+建物)~ 住宅大楼(11层含以上有~ 2012/7/23 33718
八德区 房地(土地+建物)~ 住宅大楼(11层含以上有~ 2012/7/23 33805
八德区 房地(土地+建物)~ 住宅大楼(11层含以上有~ 2012/7/24 27712
# ... with 86,171 more rows
【所欲资料样貌】
乡镇市区 交易标的 建物型态 交易日期 单价元平方公尺 timedelay [后两项相减]
(略) (略) (略)(略)  
36178 33805 2373
29795 36178 -6383
30798 29795 1003
35814 30798 5016
30679 35814 -5135
25065 30679 -5614
52635 25065 27570
33718 52635 -18917
33805 33718 87
27712 33805 -6093
【遭遇问题】
1. 单独用embed()拿到字段timedelay字段可以,但是要在档案tao_b里面新增这个字段,
不知道该如何是好。
embed(tao_b$单价元平方公尺, 2)
2. 由于资料排序之下会有不同的乡镇市区、交易标的和建物型态,每项条件相同的
第一栏timedelay应修正为0,该如何用简单指令找到该字段并取代为0?
(也就是上表显示为'2373'的字段)
3. 从上表来看,由于同条件下,2012-07-23的资料有两笔,想要直接合并变成一笔,
期待结果为:
八德区 房地(土地+建物)~ 住宅大楼(11层含以上有~ 2012-07-23 33761.5
=median(c(33718, 33805))
由于资料量大,如果逐步清理资料会很花时间,想请教有无聪明的作法。
还先感谢大家~
[环境叙述]:
> sessionInfo()
R version 3.5.1 (2018-07-02)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)
[关键字]:
embed()
timedelay
资料整合
作者: locka (locka)   2019-03-26 18:01:00
请问 embed 是什么 function啊?
作者: andrew43 (讨厌有好心推文后删文者)   2019-03-27 02:56:00
不是非常肯定是不是你要的 https://ideone.com/Aj4IX9

Links booklink

Contact Us: admin [ a t ] ucptt.com