您现在的位置是:网站首页> 新闻快讯> 软件使用 新闻快讯

jar游戏下载(jar游戏包)

小玉2023-07-05软件使用 215人已围观

简介什么是规则,就像在大数据里寻宝,所谓“寻宝”其实等同于找寻规则,规则类似于这样的表达:“如果…那么…”,前半部分为条件,后半部分为结果。比如在一

jar游戏下载(jar游戏包)

最后更新:2023-07-05 01:34:35

推荐指数

什么是规则,就像在大数据里寻宝,所谓“寻宝”其实等同于找寻规则,规则类似于这样的表达:“如果…那么…”,前半部分为条件,后半部分为结果。比如在一个有3000个顾客的购物清单数据中,经过统计有723人同时购买了速冻食品和奶油饼干,其中有788人只买了速冻食品,那么该算法产生的规则形如:frozenfoods=t788==>breadandcake=t723conf:(0.92),conf表示在购买速冻食品的人中有92%的人会同时购买奶油饼干。其次,什么规则会感兴趣,假设有两个事件甲和乙,按照兴趣度从高到低,分为以下四种情况:甲经常发生,发生的时候乙伴随发生的概率很高。甲很少出现,但是一旦出现乙出现的概率很高。甲经常发生,发生的时候乙伴随发生的概率一般。甲很少出现,出现之后乙出现的概率一般。数据挖掘具体步骤如下:(1)下载并安装weka,然后打开分析软件。(2)点击Explorer按钮,并选择应用于算法的数据,weka安装完毕后在其安装目录下提供了一些样本数据,这些数据格式都是ARFF(Attribute￾RelationFileFormat)文件,这是一种ASCII文本文件。这里选择Supermarket.arff数据样本,这个数据集合是大型超市顾客购买记录的样本集:选择感兴趣的属性,这些属性未来会出现在最终产生的规则中。(3)选择Associate选项进行Apriori算法的支持度和置信度等参数设置,这里设置最小值支持度为0.17,最小置信度为0.9,参数可以在该界面调整。(4)点击start按钮,weka工具将运用apriori算法进行关联规则挖掘,结果在右边显示。运行结果中,看到一共产生了6条规则。第一条规则含义:biscuits=tfruit=ttotal=high954==>breadandcake=t866conf:(0.91),代表有954人购买了水果和饼干,其中866人同时购买了面包、水果和饼干,也可以理解为在购买水果和饼干的前提下,又去购买面发生的条件概率是91%,即算法中定义的置信度,这个值大于设置的0.9,所以显示出来。需要注意:支持度和置信度的设置不能随意给出,更不能说支持度和置信度设置的越高就越好,这个跟数据所处的行业有关,必要时可能需要行业专家的辅助。比如要分析癌症发病和地域,生活习惯,性别等等的关系,支持度就应该设置的很低,因为病人当中癌症发病率很低,关心的是置信度,来判断与那个因素关联密切,这当中的价值显而易见。Java语言比较容易调用Weka,主要是因为Weka本身就是基于Java开发的。如果Java项目中需要集成weka,只需在项目中导入weka.jar,然后调用后者的API即可。上面的分析实例用Java实现代码如下:publicclassWekaDemo{publicstaticvoidmain(String[]args)throwsException{//loaddataFileinputFile=newFile("C:\\ProgramFiles\\Weka-3-6\\data\\supermarket.arff");//数据样本文件ArffLoaderatf=newArffLoader();atf.setFile(inputFile);Instancesdata=atf.getDataSet();//读入数据文件data.setClassIndex(-1);//设置分类属性,由于这并非分类算法可以设置为-1//buildassociatorAprioriapriori=newApriori();apriori.setClassIndex(data.classIndex());apriori.setLowerBoundMinSupport(0.17);//设置最小支持度apriori.setMinMetric(0.9);//设置最小置信度apriori.buildAssociations(data);//开始根据设置参数进行挖掘//outputassociatorSystem.out.println(apriori);//打印关联规则}}运行结果和直接用Weka得到的结果一致。#能源化工装置运行数据挖掘技术##开源软件##计算机辅助化工装置选型设计#

很赞哦! (0)

文章评论

来说两句吧...

验证码: