专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
爱可可-爱生活  ·  【(免费书稿)The Math ... ·  昨天  
新智元  ·  清华姚班校友等揭Transformer致命缺 ... ·  2 天前  
黄建同学  ·  其实 DeepSeek ... ·  3 天前  
量子位  ·  奥特曼再谈DeepSeek:肯定开源模型巨大 ... ·  4 天前  
爱可可-爱生活  ·  【[1.5k星]Ophiuchi-Deskt ... ·  4 天前  
51好读  ›  专栏  ›  机器学习研究会

利用Python进行市场购物篮分析——入门篇

机器学习研究会  · 公众号  · AI  · 2017-07-31 21:03

正文

python分析师可以使用许多数据分析工具,但知道在哪些情况下使用哪些数据分析工具可能很困难。一种有用的(但却被忽视)的技术称为关联分析,它尝试在大型数据集中查找相关商品之间的关联。一个具体的应用通常称为市场篮子分析。最经典引用的市场篮子分析的例子是所谓的“啤酒和尿布”案例。基本的故事是,大型零售商能够挖掘他们的交易数据,并找到一个意想不到的购买啤酒和婴儿尿布的购买模式。



不幸的是,这个故事很可能是一个数据城市传奇。然而,它是挖掘事务数据可以获得的商业价值的示例。


如果你对Python数据科学有一些基本的了解,可能你的第一个倾向就是考虑scikit学习一个现成的算法。然而,scikit-learn不支持这种算法。幸运的是,Sebastian Raschka 提供了非常有用的具有Apriori算法的MLxtend库的,以方便我们进一步分析我们所掌握的数据。


接下来我将演示一个使用此库来分析相对较大的在线零售数据集的示例,并尝试查找有趣的购买组合。在本文结尾处,我希望你能掌握将其应用于你自己的数据集的基本方法。


为什么是关联分析?








请到「今天看啥」查看全文