不好意思,想再请问一个问题QQ 问题不太好描述,容我用举例的@@
USERID .... COLUMNA
A 10
A 20
A 30
A 40
A 80
B 20
B 30
B 40
我想问的是 我想给columnA设一个门槛值,根据UserID去区分达到门槛的比例
假设我设的门槛是一个array{20,40,80},然后回传一个DataFrame,如下所列
USERID THRESHOLD<=20 THRESHOLD<=40 THRESHOLD=80
A 2/5=0.4 4/5=0.8 5/5=1
B 1/3=0.33 3/3=1 3/3=1
. . . .
. . . .
. . . .
一个column会写,但多个column只能暴力解一直join,有没有比较简洁的用法
一个column的写法是
df.groupby('USERID').apply( lambda x: ((x['COLUMNA']<=20).sum())/len(x))
如果可以的话,尽量不要用到for,用for的效率比较差,但有for的解法也可以啦XD