关键词:
一、计划进度
时间 |
内容 |
4.9-4.15 |
开始写毕业论文,继续编写毕设代码。 |
4.16-4.22 |
大致程序可以运行。 |
4.23-4.29 |
继续编写毕设程序,修改细节部分,完成毕业论文初稿。 |
4.30-4.29 |
完善毕业论文和毕业设计 |
4.30-5.6 |
完善毕业设计和论文 |
5.6-5.12 |
毕业论文定稿和准备答辩 |
二、本周研究内容。
Apriori算法
def createC1( dataSet ):
‘‘‘‘‘
构建初始候选项集的列表,即所有候选项集只包含一个元素,
C1是大小为1的所有候选项集的集合
‘‘‘
C1 = []
for transaction in dataSet:
for item in transaction:
if [ item ] not in C1:
C1.append( [ item ] )
C1.sort()
#return map( frozenset, C1 )
#return [var for var in map(frozenset,C1)]
return [frozenset(var) for var in C1]
def scanD( D, Ck, minSupport ):
‘‘‘‘‘
计算Ck中的项集在数据集合D(记录或者transactions)中的支持度,
返回满足最小支持度的项集的集合,和所有项集支持度信息的字典。
‘‘‘
ssCnt = {}
for tid in D: # 对于每一条transaction
for can in Ck: # 对于每一个候选项集can,检查是否是transaction的一部分 # 即该候选can是否得到transaction的支持
if can.issubset( tid ):
ssCnt[ can ] = ssCnt.get( can, 0) + 1
numItems = float( len( D ) )
retList = []
supportData = {}
for key in ssCnt:
support = ssCnt[ key ] / numItems # 每个项集的支持度
if support >= minSupport: # 将满足最小支持度的项集,加入retList
retList.insert( 0, key )
supportData[ key ] = support # 汇总支持度数据
return retList, supportData
def aprioriGen( Lk, k ): # Aprior算法
‘‘‘‘‘
由初始候选项集的集合Lk生成新的生成候选项集,
k表示生成的新项集中所含有的元素个数
‘‘‘
retList = []
lenLk = len( Lk )
for i in range( lenLk ):
for j in range( i + 1, lenLk ):
L1 = list( Lk[ i ] )[ : k - 2 ];
L2 = list( Lk[ j ] )[ : k - 2 ];
L1.sort();L2.sort()
if L1 == L2:
retList.append( Lk[ i ] | Lk[ j ] )
return retList
def apriori( dataSet, minSupport = 0.5 ):
C1 = createC1( dataSet ) # 构建初始候选项集C1
#D = map( set, dataSet ) # 将dataSet集合化,以满足scanD的格式要求
#D=[var for var in map(set,dataSet)]
D=[set(var) for var in dataSet]
L1, suppData = scanD( D, C1, minSupport ) # 构建初始的频繁项集,即所有项集只有一个元素
L = [ L1 ] # 最初的L1中的每个项集含有一个元素,新生成的
k = 2 # 项集应该含有2个元素,所以 k=2
while ( len( L[ k - 2 ] ) > 0 ):
Ck = aprioriGen( L[ k - 2 ], k )
Lk, supK = scanD( D, Ck, minSupport )
suppData.update( supK ) # 将新的项集的支持度数据加入原来的总支持度字典中
L.append( Lk ) # 将符合最小支持度要求的项集加入L
k += 1 # 新生成的项集中的元素个数应不断增加
return L, suppData # 返回所有满足条件的频繁项集的列表,和所有候选项集的支持度信息
def calcConf( freqSet, H, supportData, brl, minConf=0.7 ): # 规则生成与评价
‘‘‘‘‘
计算规则的可信度,返回满足最小可信度的规则。
freqSet(frozenset):频繁项集
H(frozenset):频繁项集中所有的元素
supportData(dic):频繁项集中所有元素的支持度
brl(tuple):满足可信度条件的关联规则
minConf(float):最小可信度
‘‘‘
prunedH = []
for conseq in H:
conf = supportData[ freqSet ] / supportData[ freqSet - conseq ]
if conf >= minConf:
print(freqSet - conseq, ‘-->‘, conseq, ‘conf:‘, conf)
brl.append( ( freqSet - conseq, conseq, conf ) )
prunedH.append( conseq )
return prunedH
def rulesFromConseq( freqSet, H, supportData, brl, minConf=0.7 ):
‘‘‘‘‘
对频繁项集中元素超过2的项集进行合并。
freqSet(frozenset):频繁项集
H(frozenset):频繁项集中的所有元素,即可以出现在规则右部的元素
supportData(dict):所有项集的支持度信息
brl(tuple):生成的规则
‘‘‘
m = len( H[ 0 ] )
if len( freqSet ) > m + 1: # 查看频繁项集是否足够大,以到于移除大小为 m的子集,否则继续生成m+1大小的频繁项集
Hmp1 = aprioriGen( H, m + 1 )
Hmp1 = calcConf( freqSet, Hmp1, supportData, brl, minConf ) #对于新生成的m+1大小的频繁项集,计算新生成的关联规则的右则的集合
if len( Hmp1 ) > 1: # 如果不止一条规则满足要求(新生成的关联规则的右则的集合的大小大于1),进一步递归合并,
#这样做的结果就是会有“[1|多]->多”(右边只会是“多”,因为合并的本质是频繁子项集变大,
#而calcConf函数的关联结果的右侧就是频繁子项集)的关联结果
rulesFromConseq( freqSet, Hmp1, supportData, brl, minConf )
def generateRules( L, supportData, minConf=0.7 ):
‘‘‘‘‘
根据频繁项集和最小可信度生成规则。
L(list):存储频繁项集
supportData(dict):存储着所有项集(不仅仅是频繁项集)的支持度
minConf(float):最小可信度
‘‘‘
bigRuleList = []
for i in range( 1, len( L ) ):
for freqSet in L[ i ]: # 对于每一个频繁项集的集合freqSet
H1 = [ frozenset( [ item ] ) for item in freqSet ]
if i > 1:# 如果频繁项集中的元素个数大于2,需要进一步合并,这样做的结果就是会有“[1|多]->多”(右边只会是“多”,
#因为合并的本质是频繁子项集变大,而calcConf函数的关联结果的右侧就是频繁子项集),的关联结果
rulesFromConseq( freqSet, H1, supportData, bigRuleList, minConf )
else:
calcConf( freqSet, H1, supportData, bigRuleList, minConf )
return bigRuleList
三、你本周的体会及需要改进地方。
在数据处理中遇到一些bug和问题,有些部分思路有些混乱,正在解决,所以没有代码。
参考文献:
https://github.com/asaini/Apriori
http://www.jianshu.com/p/00103435ef89
第五次作业——软件设计
第五次作业——软件设计在开始软件设计之前,首先确定软件设计中的各个模块需要考虑的任务,绘制概要图如下: 下面根据上述各个模块,逐层进行软件设计: 一、概要设计 首先,概要设计的目的是确定软件... 查看详情
第五次任务计划书
一、计划进度 计划安排时间计划完成内容是否完成 2017.4.2---2017.4.8尝试进行代码实现,并进行小规模数据集作为输入,进行测试 2017.4.9---2017.4.15完善具体代码,并着手进行毕业论文撰写 2017.4.16---2017.4.22进... 查看详情
第五次写博客
我们是GCO团队,由7人组成。而我和我的搭档是做框架设计。我和我搭档擅长图的设计和绘制,因此由我们来担任这个任务。在这次的设计中,为了存储学生信息,我们需要一个studentInfo的具体类,为了存储校园卡账户信息,我们... 查看详情
alpha第五次dailyscrummeeting
一、本次会议为第五次meeting会议二、时间:9:35AM—9:50AM 地点:禹州三、会议站立式照片 四、今日任务安排成员昨日任务今日任务林清青学习并了解微信程序相关方面知识,为小组后续系统开发提供另一条道路... 查看详情
第五次例行报告
psp类型任务开始时间结束时间中断时间delta时间立会确定项目,确定任务2017.10.13 18:042017.10.13 18:340min30min准备工作查阅相关资料,制定计划2017.10.13 19:252017.10.13 21:0020min75min立会指定每个人的任务,确定项目名称2017.1... 查看详情
第五次毕业设计
一、计划进度计划安排时间计划完成内容是否完成2017.4.2-4.10完成数据集参数的整理挑选。完成matlab下的神经网络程序编写完成2017.4.11-4.17研究怎么不使用工具箱,自己实现神经网络的核心算法 2017.4.18-4.25基本能够完成核心算... 查看详情
第五次迭代会议
第五次迭代会议一、本次会议时间地点 会议于五号楼下召开,时间约为30分钟二、本次会议内容1.制定接下来的计划,以便于更好的进行计划的冲刺第五次开发进展成员前三天任务后三天任务姬龙龙修复bug,添加教师端实时推... 查看详情
alpha阶段第五次scrummeeting
每日任务1.本次会议为第五次Meeting会议;2.本次会议在上午09:35,大课间休息时间在陆大召开,召开本次会议为20分钟,汇报自己的任务和讨论接下来的任务; 一、今日站立式会议照二、每个人的工作 三、工作中... 查看详情
gamma阶段第五次scrummeeting
【Gamma阶段】第五次ScrumMeeting每日任务内容今日工作任务明日待完成任务配合前端调整评论页面的样式课程列表页针对移动端进行调整戴荣Gamma阶段后测试点样例编写移除部分tag、log语句,更新部分文档赵智源调整评论页面的样... 查看详情
系统分析与设计-第五次作业
系统分析与设计-第五次作业a.阅读Asg_RH文档,按用例构建领域模型。按Task2要求,请使用工具UMLet,截图格式务必是png并控制尺寸说明:请不要受PCMEF层次结构影响。你需要识别实体(E)和中介实体(M... 查看详情
第五次课
本章首先讲解如何使用Vim编辑器来编写、修改文档,然后通过逐个配置主机名称、系统网卡以及Yum软件仓库参数文件等实验,帮助读者加深Vim编辑器中诸多命令、快捷键、模式切换方法的理解。然后把前面章节中讲解的Linux命令... 查看详情
软件工程第五次作业——例行报告
一、本周PSP,类型、任务、开始时间、结束时间、中断时间,delta时间。要求开始和结束时间包括日期。二、本周进度条:代码行博文字数四、用到的知识点五、累积进度图本周PSP饼状图,按任务类别分类,给出时间所占比例 查看详情
第五次作业
1.项目目的设计一个能为长沙学院在校大学生的生活提供多重便利的web网站2.项目总设计需求我们设计的这个web网站主要实现以下几个功能a.可以根据评分、距离最近、价格最实惠等标准来查找学校周边的美食、KTV、电影院、... 查看详情
beta阶段第五次scrummeeting
情况简述BETA阶段第二次ScrumMeeting敏捷开发起始时间2016/12/1500:00敏捷开发终止时间2016/12/1600:00会议基本内容摘要平稳推进参与讨论人员全体参与讨论时长2016/12/1423:00-23:2020M特别说明无 任务分配及完成情... 查看详情
第五次作业
设计有效界面的原则Tognozzi界面设计原则预测:系统应该能够预测出用户的下一个步骤。传达:界面应该能够传达由用户启动的任何活动的状态。传达可以是明显的,也可以是隐含的。界面也应该在内容层次中传达用户的状态。... 查看详情
第五次会议
第五次会议内容:本次会议为第五次会议会议在禹洲楼0304召开本次会议召开时间为15:40,召开时长约30分钟,探讨了本次完成的工作第一次开发进展:成员前三天任务一览许建土整合及完善代码邹杰整合及完善代码毛君豪根据... 查看详情
alpha阶段第五次scrummeeting
情况简述Alpha阶段第四次ScrumMeeting敏捷开发起始时间2016/10/2600:00敏捷开发终止时间2016/10/2700:00会议基本内容摘要汇报各自完成的任务,制定新任务,后端websocket实现突破式进展,解决了之前的疑问,之前的付出都慢慢体现在了回... 查看详情
第五次作业
Github项目地址:https://github.com/Moonlightlight/szysPSP表格解题思路:1.了解四则运算是指加法、减法、乘法和除法四种运算。2.先做设计,四则运算需具备加法,减法,乘法和除法。学习需要用到的类库。3.了解效能分析等工具,并且... 查看详情