大数据概论(上海商学院)智慧树知到章节测试答案
第一章测试
1、下列哪个表述是错误的?
A、在芯片里运行的程序可以是汇编语言编写。
B、在芯片里运行的程序可以是C语言编写。
C、在芯片里运行的程序可以是面向对象语言编写。
D、在芯片里运行的程序可以是二进制语言编写。
我的答案:C
2、以下哪一种不是计算机操作系统?
A、Linux
B、Oracle
C、iOS
D、Android
我的答案:C
3、微软对Windows界面的开发主要受到哪家公司的启发?
A、苹果
B、施乐
C、3M
D、IBM
我的答案:A
4、Windows和Linux或者iOS和Android之间的最大区别在于什么?
A、思想:前者封闭后者开源
B、速度:前者快后者慢
C、用户体验:前者优后者差
D、价格:前者贵后者便宜
我的答案:A
5、医疗领域如何利用大数据?
A、个性化医疗
B、临床决策支持
C、社保资金安全
D、用户行为分析
我的答案:ABCD
6、现在非结构化数据已经占人类数据量的25%。
我的答案:X
7、大数据与云计算结合起来将给世界带来一场深刻的管理技术革命与社会治理创新。
我的答案:√
8、Python是一种面向对象、()计算机程序设计语言。
A、编译型
B、解释型
我的答案:B
9、ASCII码使用一个字节编码。
我的答案:√
10、GBK是只用来编码汉字的,GBK全称《汉字内码扩展规范》,使用双字节编码。
我的答案:√
第二章测试
1、人类科学主要经过了经验科学、理论科学、计算科学、数据科学四个阶段。
我的答案:√
2、大数据的利用过程是()。
A、采集-挖掘-清洗-统计
B、采集-清洗-挖掘-统计
C、采集-清洗-统计-挖掘
D、采集-统计-清洗-挖掘
我的答案:C
3、信息只有通过反思、启发和学习等过程被每个个体予以有效处理,才能有用。
我的答案:√
4、数据是作为信息的重要来源,信息经过加工转化为知识。
我的答案:√
5、在大量知识积累基础上,总结成原理和法则,就形成了智慧。
我的答案:√
6、信息是有时效性的。
我的答案:√
7、在一个系统中,()贯穿整个系统,对信息的管理和控制使系统的运行更加有序。
A、系统
B、信息
C、消息
D、信息流
我的答案:C
8、系统测试的步骤是()。
A、单元测试、子系统测试、系统测试、验收测试
B、系统测试、子系统测试、单元测试、验收测试。
C、验收测试、系统测试、子系统测试、单元测试
D、单元测试、系统测试、子系统测试、验收测试
我的答案:A
9、知识阶层中最底层也是最基础的是()。
A、数据
B、信息
C、知识
D、智慧
我的答案:A
10、信息的主要形式维度有()。
A、声音
B、文本
C、视频
D、动画
E、图表
我的答案:ABCDE
第三章测试
1、数据分析的三个层次是()。
A、描述分析
B、预测分析
C、定性分析
D、规范分析
我的答案:ABD
2、数据分析的第一步是()。
A、需求分析
B、数据获取
C、数据预处理
D、数据建模分析
我的答案:A
3、收集的数据在处理之前必须经过预处理的步骤。
我的答案:√
4、()是指通过对比分析、分组分析、交叉分析、回归分析
A、模型评估
B、模型优化
C、数据预处理
D、数据建模分析
我的答案:D
5、把()溶入数据挖掘过程是数据挖掘成功的关键。
A、统计决策
B、业务经验
C、需求分析
D、预测分析
我的答案:C
6、从概念的范围大小来说,下列正确的排序是()。
A、深度学习>机器学习>人工智能
B、机器学习>深度学习>人工智能
C、人工智能>机器学习>深度学习
D、人工智能>深度学习>机器学习
我的答案:C
7、按照训练的数据有无标签,可以将机器学习方法分为监督学习算法和无监督学习算法。
我的答案:√
8、一般将所有数据分为训练集、验证集和测试集。
我的答案:√
9、预测数据如果是连续的,则这种预测模型属于回归模型。
我的答案:√
10、在评估多分类模型(多于2个以上的分类)可以采用()
A、混淆矩阵
B、查全率
C、查准率
D、F1
我的答案:A
第四章测试
1、HDFS是一个()文件系统。
A、分布式
B、随机访问
C、集中式
D、实时性
我的答案:A
2、HDFS采用的是()结构
A、Client/Server
B、Master/Slave
C、Browser/Server
D、Node/Node
我的答案:B
3、()是海量数据处理的并行编程模式。
A、MapReduce
B、HDFS
C、HIVE
D、PIG
我的答案:A
4、大数据计算模式有()。
A、批量计算模式
B、流式计算模式
C、交互式计算模式
D、图计算模式
我的答案:ABCD
5、交通领域智能交通的大数据计算模式属于()。
A、批量计算模式
B、流式计算模式
C、交互式计算模式
D、图计算模式
我的答案:B
6、下列属于关系型数据库系统软件的有()。
A、SQL Server
B、Oracle
C、MySQL
D、NoSQL
我的答案:ABC
7、()是基于列存储技术的内存数据库。
A、MonetDB
B、SQL Server
C、Oracle
D、MySQL
E、NoSQL
我的答案:A
8、关系代数中,从两个关系中找出相同元组的运算称为()运算。
A、并
B、交
C、差
D、合
我的答案:B
9、计算字段累加和的函数是()。
A、sum
B、add
C、count
D、map
我的答案:A
10、用于数据库恢复的文件是()。
A、数据库文件
B、索引文件
C、日志文件
D、备注文件
我的答案:C
第五章测试
1、编程语言有()。
A、机器语言
B、汇编语言
C、高级语言
D、注释语言
我的答案:ABC
2、下列属于面向对象编程语言的有()。
A、Java
B、Python
C、C
D、C++
我的答案:ABD
3、对各种脏数据进行对应方式的处理,得到标准、干净、连续的数据,提供给数据统计、数据挖掘等使用的方法称为()。
A、数据清洗
B、数据归一
C、数据挖掘
D、数据集成
我的答案:A
4、设置日期字段格式为 “2019-10-10”,属于满足数据清洗中的()。
A、数据完整性
B、数据合法性
C、数据一致性
D、数据唯一性
E、数据权威性
我的答案:B
5、通过身份证号来补全性别、年龄、籍贯等属于满足数据清洗中的()。
A、数据完整性
B、数据合法性
C、数据一致性
D、数据权威性
我的答案:A
6、数据库中设置按主键去除重复的方法属于满足数据清洗中的()。
A、数据完整性
B、数据合法性
C、数据一致性
D、数据唯一性
E、数据权威性
我的答案:D
7、数据集的类别分布不均被称为()。
A、数据不平衡
B、过采样
C、欠采样
D、数据饱和
我的答案:A
8、下列属于特征降维的方法有()。
A、PCA
B、LDA
C、One-Hot
D、Code-Decode
我的答案:AB
9、指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串称为()。
A、正则表达式
B、通配符
C、字符集
D、语法
我的答案:A
10、元字符\d表示()。
A、匹配一个数字字符
B、匹配字母或数字或下划线
C、匹配除换行符以外的任意字符
D、匹配任意的空白符
我的答案:A
第六章测试
1、人工智能的要素有()。
A、计算能力
B、大数据
C、学习算法
我的答案:ABC
2、AlphaGo之所以能够打败人类是因为它依靠了()。
A、严密的逻辑推理
B、大数据和智能算法
C、计算机
D、专家系统
我的答案:B
3、人工智能所需的条件有()。
A、清晰的领域界限
B、自动标注数据
C、超大计算量
D、海量数据
E、AI专家
我的答案:ABCDE
4、现在的自动驾驶系统最高可以达到()级别。
A、L1
B、L2
C、L3
D、L4
E、全自动
我的答案:D
5、交通大数据的信息种类包括出行者、位置、车辆、交通流、气象、舆情、活动、用地。
我的答案:√
6、基于大数据的税务稽查方法有()。
A、定性分析模型
B、统计分析模型
C、数据挖掘模型
D、深度学习模型
我的答案:ABCD
7、()是深度学习模型的一种,全称为卷积神经网络。
A、CNN
B、LSTM
C、RNN
D、GRU
我的答案:A
8、可以通过分词、计数、规范化和加权将文本转化为数值向量。
我的答案:√
9、在输出层不能使用以下()激活函数来分类图像。
A、Sigmod
B、Tanh
C、ReLU
D、If
我的答案:D
10、在神经网络中,每个参数可以有不同的学习率。
我的答案:√