本文共 511 字,大约阅读时间需要 1 分钟。
关联规则挖掘:
从事务数据库,关系数据库和其他信息存储中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性。应用:
购物篮分析、分类设计、捆绑销售等给定:
项的集合:I={i1,i2,…,in} 任务相关数据D是数据库事务的集合,每个事务T则是项的集合,使得 每个事务由事务标识符TID标识; A,B为两个项集,事务T包含A当且仅当 则关联规则是如下蕴涵式: 其中 并且 ,规则 在事务集D中成立,并且具有支持度s和置信度c项的集合 I={A,B,C,D,E,F}
每个事务T由事务标识符TID标识,它是项的集合 比如:TID(2000)={A,B,C} 任务相关数据D是数据库事务的集合k-项集:包含k个项的集合
例:{牛奶,面包,黄油}是个3-项集项集的频率是指包含项集的事务数
如果项集的频率大于(最小支持度×D中的事务总数),则称该项集为频繁项集大型数据库中的关联规则挖掘包含两个过程: