在大数据关键技术中,Hadoop的分布式文件系统HDFS属于大数据( )。

admin2019-09-25  36

问题 在大数据关键技术中,Hadoop的分布式文件系统HDFS属于大数据(    )。

选项 A、存储技术
B、分析技术
C、并行分析技术
D、挖掘技术

答案A

解析 大数据所涉及的技术很多,主要包括数据采集、数据存储、数据管理、数据分析与挖掘四个环节。在数据采集阶段主要使用的技术是数据抽取工具ETL。在数据存储环节主要有结构化数据、非结构化数据和半结构化数据的存储与访问。结构化数据一般存放在关系数据库,通过数据查询语言(SQL)来访问;非结构化和半结构化数据一般通过分布式文件系统的NoSQL进行存储。大数据管理主要使用了分布式并行处理技术,比较常用的有MapReduce,编程人员借助它可以在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。数据分析与挖掘是根据业务需求对大数据进行关联、聚类、分类等钻取和分析,并利用图形、表格加以展示,与ETL一样,数据分析和挖掘是以前数据仓库的范畴,只是在大数据中得以更好地利用。
    在最流行的开源大数据Hadoop中,Hadoop分布式文件系统HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上。
转载请注明原文地址:https://jikaoti.com/ti/diK7FFFM
0

相关试题推荐
最新回复(0)