首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,这种分析方法属于(39)。
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,这种分析方法属于(39)。
admin
2018-05-08
24
问题
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,这种分析方法属于(39)。
选项
A、关联分析
B、序列模式分析
C、分类分析
D、聚类分析
答案
C
解析
本题考查数据挖掘基础知识。数据挖掘就是应用一系列技术从大型数据库或数据仓库中提取人们感兴趣的信息和知识,这些知识或信息是隐含的,事先未知而潜在有用的,提取的知识表示为概念、规则、规律、模式等形式。也可以说,数据挖掘是一类深层次的数据分析。无论采用哪种技术完成数据挖掘,从功能上可以将数据挖掘的分析方法划分为四种,即关联分析、序列模式分析、分类分析和聚类分析。
①关联分析(Associations):目的是为了挖掘出隐藏在数据间的相互关系。若设R={Al,A2,…,AP)为{0,1)域上的属性集,r为R上的一个关系,关于r的关联规则表示为
X一*B,其中X∈R,B∈R,且XCIB =¤。关联规则的矩阵形式为:矩阵r中,如果在行X的每一列为1,则行B中各列趋向于为1。在进行关联分析的同时还需要计算两个参数,最小置信度(Confidence)和最小支持度(Support)。前者用以过滤掉可能性过小的规则,后者则用来表示这种规则发生的概率,即可信度。
②序列模式分析(Sequential Pattems):目的也是为了挖掘出数据之间的联系,但它的侧重点在于分析数据间的前后关系(因果关系)。例如,将序列模式分析运用于商业,经过分析,商家可以根据分析结果发现客户潜在的购物模式,发现顾客在购买一种商品的同时经常购买另一种商品的可能性。在进行序列模式分析时也应计算置信度和支持度。
③分类分析(Classifiers):首先为每一个记录赋予一个标记(一组具有不同特征的类别),即按标记分类记录,然后检查这些标定的记录,描述出这些记录的特征。这些描述可能是显式的,如一组规则定义;也可能是隐式的,如一个数学模型或公式。
④聚类分析(Clustering):聚类分析法是分类分析法的逆过程,它的输入集是一组未标定的记录,即输入的记录没有作任何处理。目的是根据一定的规则,合理地划分记录集合,并用显式或隐式的方法描述不同的类别。
在实际应用的DM系统中,上述四种分析方法有着不同的适用范围,因此经常被综合运用。
转载请注明原文地址:https://jikaoti.com/ti/Tyx7FFFM
本试题收录于:
数据库系统工程师上午基础知识考试题库软考中级分类
0
数据库系统工程师上午基础知识考试
软考中级
相关试题推荐
某信息系统项目将项目预测与评估的过程描述如下:①聘请多领域专家采取背对背的方式进行;②借助问卷获取专家的评估结论;③汇总问卷结果并在专家间传阅;④专家调整各自评估结论;⑤通过多轮征询获得专家对项目评估的一致见解。那么该项目的评估采用的方法是(273)。
在项目风险识别中使用信息收集技术,依据系统的程序,专家之间采用匿名发表意见的方式,不发生横向联系,只与调查人员发生关系,通过多次调查专家对问卷所提问题的看法,经过反复征询、归纳、修改,最后汇总成专家一致的看法作为预测的结果,此种风险识别的方法称为(269)
以下关于项目沟通原则的叙述中,(249)是不正确的。
配置管理中有一项工作是变更控制,其中配置状态的过程如下图所示。在这个状态变化过程中,图中的(1)、(2)、(3)三个状态依次为(318)。
做自制或外购的决定时需要考虑(305)。对于系统集成企业而言,在进行项目核算时,一般可将需求开发费用、设计费用、实施费用、验收费用列入项目生命周期间发生的直接成本。
根据《GB/T12504-90计算机软件质量保证计划规范》的规定,为了确保软件的实现满足需求,需要的基本文档不包括(69)。
软件的质量需求是软件需求的一部分,根据《软件工程产品质量第1部分:质量模型GB/T16260-1-2006》,软件产品质量需求的完整描述要包括(62),以满足开发者、维护者、需方以及最终用户的需要。
项目范围管理包括确保项目成功所需的全部工作过程。()是范围管理流程的正确顺序。①定义范围②核实范围③收集需求④控制范围⑤创建工作分解结构
在项目风险识别中使用信息收集技术,依据系统的程序,专家之间采用匿名发表意见的方式,不发生横向联系,只与调查人员发生关系,通过多轮次调查专家对问卷所提问题的看法,经过反复征询、归纳、修改,最后汇总成专家们都认可的、基本一致的看法作为预测的结果。此种风险识别的
通过收集和分析计算机系统或网络的关键节点信息,以发现网络或系统中是否有违反安全策略的行为和被攻击的迹象的技术被称为()。
随机试题
稳定型战略的特点
患者,男性,56岁。主诉尿流缓慢、尿频、尿急、排尿不尽2个月余,近期加重入院。为明确诊断进行血清前列腺特异性抗原(PSA)检查,怀疑其患有前列腺癌的PSA临界值是
患者,男,60岁。近期发现右胸锁乳突肌上段前缘处有一个无痛性、逐渐增大的淋巴结,约1.0cm×1.5cm大小,质地中等偏硬,活动度尚可,无压痛。伴盗汗,无发热、无消瘦。血象及骨髓象均正常。该例的诊断要考虑
安全预评价的内容主要包括()。
导游口头语言运用的原则为()
下列关于肖像权的表述中,不正确的是()。
甲、乙、丙、丁分别购买了某住宅楼(共四层)的一至四层住宅,并各自办理了房产证。下列哪一说法是不正确的?()
A.3~6个月B.1~2岁C.9~11岁D.4~6岁E.16岁以后语音评价及语音治疗的时间()。
债权人的撤销权,应当自知道或者应当知道撤销事由之日起()内行使。
设z=f(x,y)由方程z一y—x+xez-y-x=0确定,求dz.
最新回复
(
0
)