[问题] Sequential Pattern Mining 问题

楼主: icqmsn   2024-01-09 12:45:44
如下面简易数字
客户1于 2021_2 重复购买 产品A 3次
并于 2022_2 购买 产品B 1次
请问这样在 Python 里面做资料整理时
是要做成哪一种?
1. <{A},{A},{A},{B}>
2. <{A},{B}>
MemberID 产品 Year_Month
1 A 2021_2
1 A 2021_2
1 A 2021_2
2 C 2022_10
3 B 2022_1
4 C 2023_1
1 B 2022_2
2 C 2023_1
谢谢各位
作者: Hsins (翔)   2024-01-09 13:15:00
你的资料服务的对象是你后续的处理机制,要整理成什么形式是看你后续要做什么,不是看使用的是哪一种语言。比如 (2) 的格式看不出客户 1 购买了 A 几次,如果用途是要看哪些商品有被购买,而不重视购买次数,那就 (2) 就足够了,而 (1) 的格式既保留了购买次数也保留了商品,甚至先后。有时候先后次序不重要,你也可以用 {'A': 3, 'B': 1} 呀
作者: lycantrope (阿宽)   2024-01-10 09:21:00
不是都没差,而是商业逻辑有没有要考虑顺序先后加起来不是一,有没有重复算,分母有一样吗
楼主: icqmsn   2024-01-10 12:39:00
回L大:有的,顺序很重要!这样才能预估下一代产品有多少人会再购买!计算方式我是使用 CSPADE 算法,不知道哪边可再细调 @@

Links booklink

Contact Us: admin [ a t ] ucptt.com