首页
下载
赚积分
充值
当前位置:
首页
>
所有资源
>
《大数据技术导论》所有资源
>
国家开放大学11480《大数据技术导论》期末考试题库及答案(课程号:04397)
国家开放大学11480《大数据技术导论》期末考试题库及答案(课程号:04397)2025年春
下载打印版题库
适用科目:《大数据技术导论》 课程号:04397 试卷号:11480
(点击下列按钮即可跳转对应的题型位置)
单选(178)
简答(69)
判断(195)
应用(8)
[单选]
1. 增量数据抽取方式只抽取()的数据。
[单选]
2. 增量数据抽取方式只抽取()?
[单选]
3. 噪声是指测量数据中的()?
[单选]
4. 在增量数据抽取中,以下()策略无法确定被更新的数据。
[单选]
5. 在样本数据较大的情况下,随机性越(),效果越好。
[单选]
6. 在大数据抽取中,可以分为初始化转移阶段和增量转移阶段。初始化转移阶段采用()的方式.
[单选]
7. 在MapReduce模型中,Map函数以()作为输入.
[单选]
8. 在MapReduce模型编程中,不属于其步骤的是()?
[单选]
9. 在Hadoop中,作业服务器被称为()?
[单选]
10. 在Hadoop中,将每一次计算请求称为一个()?
[单选]
11. 在Hadoop中,将每个作业拆分为若干个()?
[单选]
12. 由于数据随着时间而变化,可以将()变化可视化,然后解释导致数据变化的原因。
[单选]
13. 以下哪种数据不是来自于互联网世界?( )
[单选]
14. 以下()是结构化数据。
[单选]
15. 以下()不是数据集成的核心问题。
[单选]
16. 以下()不是大数据可视化的主要特点。
[单选]
17. 小数定标规范化方法中,其小数点移动的位数依赖于()?
[单选]
18. 下面属于结构化数据的是()?
[单选]
19. 下面是数据科学的主要研究内容的是()?
[单选]
20. 下面仅属于大数据在线处理模式的是()?
[单选]
21. 下面不属于数据流技术应用的方式是()?
[单选]
22. 下面不属于企业大数据应用成功的考虑因素是()?
[单选]
23. 下面不属于判断大数据应用成功的指标是()?
[单选]
24. 下面不属于流式数据源的是()?
[单选]
25. 下面不属于流式数据的特点的是()?
[单选]
26. 下面不属于互联网大数据的是()?
[单选]
27. 下面不属于大数据在通讯行业的应用是()?
[单选]
28. 下面不属于大数据离线处理特点的是()?
[单选]
29. 下面不属于大数据计算模式的类型的是()?
[单选]
30. 下面不属于大数据的特性是()?
加载更多
[简答]
1. 指数平滑法中平滑常数的选取规则是?
[简答]
2. 增量数据抽取的特点是?
[简答]
3. 在大数据的可视分析中,用户界面与交互设计需要考虑的因素有哪些?
[简答]
4. 移动平均法的定义是?
[简答]
5. 一个银行有上亿个储户,如果银行希望找到最高的存储金额是多少,结合下图,说明基于MapReduce模型的寻找最大值的过程。
[简答]
6. 相关分析与回归分析的基本区别是?
[简答]
7. 下图是19名学生完成满分18分题的答题结果,请计算:
[简答]
8. 下图是15名学生完成满分18分题的答题结果,请计算:
[简答]
9. 图像数字化的定义?
[简答]
10. 同构异质数据库的定义是?
[简答]
11. 通用网络爬虫的局限性?
[简答]
12. 说明MapReduce分布编程模型的工作过程。
[简答]
13. 数据质量有哪四个要素?
[简答]
14. 数据约简的定义是?
[简答]
15. 数据清洗算法的衡量标准主要包含哪些方面?
[简答]
16. 数据科学可以细化为12个主要领域,请写出其中的5种
[简答]
17. 数据科学的定义?
[简答]
18. 数据加工的定义?
[简答]
19. 数据集成的含义是什么?主要开展什么活动?
[简答]
20. 数据规范化的定义和作用是?
[简答]
21. 数据分析与数据挖掘的主要区别是?
[简答]
22. 什么是相关分析?
[简答]
23. 什么是网站数据采集?
[简答]
24. 什么是特征约简?
[简答]
25. 什么是数值约简?数值约简技术可以分为哪两类?
[简答]
26. 什么是数据质量?简述数据质量的四要素。
[简答]
27. 什么是数据约简?约简后的完整性如何?
[简答]
28. 什么是数据抽取?说出两种常用的数据抽取方式。
[简答]
29. 什么是模型?模型由哪三个部分组成?
[简答]
30. 什么是聚类?聚类与分类有何不同。
加载更多
[判断]
1. 准确性、完整性、一致性和及时性称为数据质量的四要素。
[判断]
2. 指数平滑法适用于中短期发展趋势预测。
[判断]
3. 指数平滑法是预测中常用的方法,这种方法的依据是时间序列的态势具有稳定性或规则性,所以时间序列可顺势推延。
[判断]
4. 只有通过清洗之后,才能通过分析与挖掘得到可信的、可用于支撑决策的信息。
[判断]
5. 只要进行数据转换,即使改变了数据原本的形态,也是成功的。
[判断]
6. 证实性数据分析可以评估观察到的模式或效应的再现性。
[判断]
7. 增量数据抽取机制能够将业务系统中的变化数据按一定的频率准确地捕获到,同时不能对业务系统造成太大的压力,也不能影响现有业务。相对全量数据抽取,增量数据抽取的设计更简单。
[判断]
8. 噪声是指测量数据中的随机错误和偏差,通过数据平滑技术可以除去噪声。
[判断]
9. 在数据比较的可视化展现中,可以对数据集中突出的不同方面给出一个有力的叙述与说明。
[判断]
10. 在进行高维数据分析时,存在的两个主要困难分别是欧氏距离问题和维数膨胀问题。
[判断]
11. 在互联网营销中,用户反馈承担的核心任务是为产品收集用户舆情信息。
[判断]
12. 在单词计数中,Reduce方法的输入参数key为单个单词,而value是由各Mapper类上对应单词的计数值所组成的列表,所以只要遍历value并求和,即可得到某个单词出现的总次数。
[判断]
13. 在单词计数的Map过程中需要将文件进行按列分割。
[判断]
14. 在大数据抽取之前,无需清楚数据源的类型和数据的类型,可直接抽取。
[判断]
15. 在MapReduce程序执行过程中,由Master负责分配任务,分配的原则是Master选择空闲的Worker并为其分配一个Map任务或一个Reduce任务
[判断]
16. 在MapReduce程序执行过程中,用户程序中的MapReduce类库首先将输入文档进行分割,用户也可以通过设置参数对其大小进行控制
[判断]
17. 在MapReduce程序执行过程中,Map和Reduce函数接收的都是键值对。
[判断]
18. 在Hadoop中,将每一次计算请求称为一个作业。
[判断]
19. 在Hadoop系统中,负责存储与管理数据的是NTFS。
[判断]
20. 与分布式文件系统相比,MapReduce框架可定制性强。
[判断]
21. 余弦值越接近0,就表明夹角越接近0°,也就是两个向量越相似,称为余弦相似性。
[判断]
22. 由于数据随着时间而变化,可以将数据变化可视化,然后解释导致数据变化的原因。
[判断]
23. 由于集群模式和单节点模式运行Hadoop系统都需要使用SSH登录,因此在安装Hadoop系统之前,首先需要安装配置SSH协议。
[判断]
24. 由大及小的可视化展现方式是:先给出一个整体的画面,可以引导阅读者具体深入到一个聚焦的点。
[判断]
25. 移动平均法是预测将来某一时期的平均预测值的一种方法,该方法对过去若干历史数据求算术平均数,并把该数据作为以后的预测值。
[判断]
26. 移动平均法分为一次移动平均法、混合移动平均法和多次移动平均法。
[判断]
27. 一幅图画最伟大的价值莫过于它能够使我们实际看到的内容比期望看到的内容丰富得多。
[判断]
28. 一次移动平均法一般适用于时间序列数据为水平型变动的预测,也适用于明显的长期变动趋势和循环型变动趋势的时间序列预测。
[判断]
29. 一次移动平均法仅适用于没有明显的迅速上升或下降趋势的情况,如果时间数列呈直线上升或下降趋势,则需要使用二次移动平均法。
[判断]
30. 研究数据仅仅包括数据采集和数据分析。
加载更多
[应用分析题]
1. 最小-最大规范化方法可以对原始数据进行线性转换。假定MaxA与MinA分别表示属性A的最大值与最小值,将属性A的值v映射到区间[a,b]上的v'中的计算公式如下:v'=(v-MinA)/(MaxA-MinA)X(new_MaxA-new_MinA)+ new_MinA假定某属性x的最小和最大值分别为12000和98000,将52500映射到[0,1]中的值为多少?(保留2位小数即可)
[应用分析题]
2. 利用极坐标进行数据可视化,下面是我国部分城市中心的一室月租费的分布:
[应用分析题]
3. 假设有9、24、15、41、7、10,18、67、25共9个数,分为3箱,各箱的数据分配如下;
[应用分析题]
4. 根据图中所示网络爬虫工作原理,说明①~⑤的含义。
[应用分析题]
5. 该图表达了大一学生主要课程的成绩。请回答以下问题:
[应用分析题]
6. 对某地观察连续8天的天气状况,如图所示:
[应用分析题]
7. 对某地观察连续8天的天气状况,如图所示
[应用分析题]
8. (1)根据大数据可视化技术,此图称为(), (2)此图属于以下哪类可视化技术?() A.多维数据可视化 B.时空数据可视化 C.非结构化数据视化 (3)用户使用热度最高的三个词汇是,()
加载更多