Re: [问题] for + if 优化问题 Brahms5566 PTT批踢踢实业坊

Re: [问题] for + if 优化问题

楼主: Brahms5566 (Brahms) 2019-04-29 23:50:06

感谢TuCH大大的code! 成功了超快!
但又出现一个问题..如果说原本code的以下标记^的部分
改成df['B'][i] + 1 请问要怎么写会比较好呢？
就像excel中, 符合条件的字段, 则B2=B1+1, 如果B1=1, 则B2 = 2
然后往下拉, 依序是3, 4, 5...直到下一个不合条件的值为原本的1,
接着再2, 3, 4..持续下去
谢谢！
: : for i in range(len(df)):
: if df['A'][i+1] == df['A'][i]:
: df['B'][i+1] = df['A'][i] + 1
^^^^^^^^^^
改成=>df['B'][i] + 1
: else:
: df['B'][i+1] = 1
※ 引述《TuCH (谬客)》之铭言：
: 一千万笔大约0.6秒给您参考看看
: import pandas as pd
: import numpy as np
: # 随机产生测试资料
: data = np.random.randint(1,9,10000000)
: # pandas 读取
: df = pd.DataFrame(data)
: # column 取名
: df.columns = ['A']
: # column B 初始化
: df['B'] = 1
: # 计算
: df.loc[df['A'].diff()==0,'B'] = df['A'].shift()+1

楼主: Brahms5566 (Brahms) 2019-04-30 21:18:00

刚刚尝试用group然后for enumerate转numpy顺利得到想要的结果了～谢谢大家指引迷津

作者: BlgAtlfans (BLG_Eric) 2019-04-30 12:40:00

其实全部换成list操作比较好尽量不要用pandas跑循环

作者: TuCH (谬客) 2019-04-30 08:17:00

这个每一个值都跟前一个值有关系看来要用循环了

作者: sherees (ShaunTheSheep) 2019-04-30 11:10:00

如果条件判断不会随着B栏的值更动产生变化用前面Tu大的写法应该就可以了

作者: jp956956 (储备里长伯) 2019-05-02 03:06:00

list操作什么意思？？先list做完再给pandas处理吗？

继续阅读

[问题] 确认 packet 的 protocol type (学校作业HairBand [问题] 请教各位关于函数里面长度的指定shineline Re: [问题] for + if 优化问题TuCH [问题] for + if 优化问题Brahms5566 [问题] 想请问此程式中某两行的意思qzxwec789 [问题] Mac上用brew安装opencvBrothre23 [问题] 游戏函式重新开始玩的写法qzxwec789 [问题] 请问如何理解网页结构以抓资料alubasteve Re: [问题] thread-safe queuesuhang Re: [问题] thread-safe queueYshuan