首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,这种分析方法属于(39)。
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,这种分析方法属于(39)。
admin
2018-05-08
29
问题
数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果需要一个示例库(该库中的每个元组都有一个给定的类标识)做训练集时,这种分析方法属于(39)。
选项
A、关联分析
B、序列模式分析
C、分类分析
D、聚类分析
答案
C
解析
本题考查数据挖掘基础知识。数据挖掘就是应用一系列技术从大型数据库或数据仓库中提取人们感兴趣的信息和知识,这些知识或信息是隐含的,事先未知而潜在有用的,提取的知识表示为概念、规则、规律、模式等形式。也可以说,数据挖掘是一类深层次的数据分析。无论采用哪种技术完成数据挖掘,从功能上可以将数据挖掘的分析方法划分为四种,即关联分析、序列模式分析、分类分析和聚类分析。
①关联分析(Associations):目的是为了挖掘出隐藏在数据间的相互关系。若设R={Al,A2,…,AP)为{0,1)域上的属性集,r为R上的一个关系,关于r的关联规则表示为
X一*B,其中X∈R,B∈R,且XCIB =¤。关联规则的矩阵形式为:矩阵r中,如果在行X的每一列为1,则行B中各列趋向于为1。在进行关联分析的同时还需要计算两个参数,最小置信度(Confidence)和最小支持度(Support)。前者用以过滤掉可能性过小的规则,后者则用来表示这种规则发生的概率,即可信度。
②序列模式分析(Sequential Pattems):目的也是为了挖掘出数据之间的联系,但它的侧重点在于分析数据间的前后关系(因果关系)。例如,将序列模式分析运用于商业,经过分析,商家可以根据分析结果发现客户潜在的购物模式,发现顾客在购买一种商品的同时经常购买另一种商品的可能性。在进行序列模式分析时也应计算置信度和支持度。
③分类分析(Classifiers):首先为每一个记录赋予一个标记(一组具有不同特征的类别),即按标记分类记录,然后检查这些标定的记录,描述出这些记录的特征。这些描述可能是显式的,如一组规则定义;也可能是隐式的,如一个数学模型或公式。
④聚类分析(Clustering):聚类分析法是分类分析法的逆过程,它的输入集是一组未标定的记录,即输入的记录没有作任何处理。目的是根据一定的规则,合理地划分记录集合,并用显式或隐式的方法描述不同的类别。
在实际应用的DM系统中,上述四种分析方法有着不同的适用范围,因此经常被综合运用。
转载请注明原文地址:https://jikaoti.com/ti/Tyx7FFFM
本试题收录于:
数据库系统工程师上午基础知识考试题库软考中级分类
0
数据库系统工程师上午基础知识考试
软考中级
相关试题推荐
以下关于项目沟通原则的叙述中,(249)是不正确的。
需求规格说明书的内容不应当包括(350)。
以下有关基线的叙述,错误的是(329)。
某项目工期为一年,项目经理对负责项目工作分解结构编制的小张提出了如下要求或建议,其中(72)是不妥当的。
2005年12月,ISO正式发布了①作为IT服务管理的国际标准;2007年10月,ITU接纳②为3G标准;2005年10月,ISO正式发布了③作为信息安全管理的国际标准。①、②和③分别是(35)。
GB/T12504.1990标准中对计算机软件质量保证计划进行了规范,要求():必须指明成功运行该软件所需要的数据、控制命令以及运行条件等信息;必须指明所有的出错信息、含义及其修理方法;还必须描述将用户发现的错误或问题通知项目承办单位或项目委
信息系统工程监理活动的()是控制工程建设的投资、进度、工程质量、变更处理;进行工程建设合同管理、信息管理和安全管理;协调有关单位问的工作关系。所以被概括为“四控、三管、一协调”。
某软件开发项目拆分成3个模块,项目组对每个模块的开发量(代码行)进行了估计(见下表),该软件项目的总体规模估算为()代码行。
下图中从A到E的最短路线是(66),其长度是(67)。(67)
(2012上项管)入侵检测通过对计算机网路或计算机系统中的若干关键点收集信息并进行分析,发现网络系统中是否有违反安全策略的行为和被攻击的迹象。进行入侵检测的软件和硬件的组合就构成了入侵检测系统。______是入侵检测系统的核心。
随机试题
只有人类才有语言。人类语言与其他动物鸣叫系统的区别:________,用处更大,能够创造。
资本主义国家政治生活的基本价值取向是()
A、CMS-NaB、CMCNaC、PVAD、CAPE、PLA羧甲基纤维素钠()。
(2017年)在水平夹层中的自然对流换热,根据热面处于上下的位置分别进行计算,下列处理方法正确的是()。
根据中国《失业保险条例》的规定:失业保险费包括()两部分
2018年7月23日,小米正式发布家电新品“米家互联网空调”(以下简称米家空调)。这款产品的发布除了丰富小米产品线外,也意味着小米正式向传统白电领域发起冲击。而此时白色家电行业的竞争已经异常激烈。格力、美的、海尔等龙头企业凭借其规模经济、品牌、技术、渠道和
标准成本中心需要承担的责任是()。
()是一战后的分赃协议。
公务员被辞退的情形不包括()。
党政机关宣布重要事项时的文种是()。
最新回复
(
0
)