PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] Sequential Pattern Mining 问题
楼主:
icqmsn
2024-01-09 12:45:44
如下面简易数字
客户1于 2021_2 重复购买 产品A 3次
并于 2022_2 购买 产品B 1次
请问这样在 Python 里面做资料整理时
是要做成哪一种?
1. <{A},{A},{A},{B}>
2. <{A},{B}>
MemberID 产品 Year_Month
1 A 2021_2
1 A 2021_2
1 A 2021_2
2 C 2022_10
3 B 2022_1
4 C 2023_1
1 B 2022_2
2 C 2023_1
谢谢各位
作者:
Hsins
(翔)
2024-01-09 13:15:00
你的资料服务的对象是你后续的处理机制,要整理成什么形式是看你后续要做什么,不是看使用的是哪一种语言。比如 (2) 的格式看不出客户 1 购买了 A 几次,如果用途是要看哪些商品有被购买,而不重视购买次数,那就 (2) 就足够了,而 (1) 的格式既保留了购买次数也保留了商品,甚至先后。有时候先后次序不重要,你也可以用 {'A': 3, 'B': 1} 呀
作者:
lycantrope
(阿宽)
2024-01-10 09:21:00
不是都没差,而是商业逻辑有没有要考虑顺序先后加起来不是一,有没有重复算,分母有一样吗
楼主:
icqmsn
2024-01-10 12:39:00
回L大:有的,顺序很重要!这样才能预估下一代产品有多少人会再购买!计算方式我是使用 CSPADE 算法,不知道哪边可再细调 @@
继续阅读
[问题] 自动点击在远端主机上
interactive
[问题] flask 可以引导到aspx吗?
lidii
[教学] FB粉丝专页爬文
sharon9193
[问题] 可以背景执行同时还可用Console吗?
koow
[问题] windows工作排程器无法产生log
dandanwo
[问题] 中文字内容的utf-8编码xml档之处理
kino818
[资讯] 大型语言模型python专题实作读书会
seiching
[问题] 想捞传输到打印机的文件资料
misimisu
Re: [心得] 我的GPIB程式
a9202507
[问题] windows python连到mongodb
kino818
Links
booklink
Contact Us: admin [ a t ] ucptt.com