注意:因为学习平台题目是随机,选择题选项也是随机,一定注意答案对应的选项,同学们在本页按“Ctrl+F”快捷搜索题目中“关键字”就可以快速定位题目,还是不懂的话可以看这个:快速答题技巧
江苏开放大学数据科学导论形考作业二选择题
1、下列关于数据治理的表述错误的是()
A、数据治理可理解为对数据管理的管理
B、数据治理关注组织架构、制度、流程这些管理要素的整合和执行
C、数据质量管理是数据治理核心模块之一,影响数据资产的应用价值
D、在数据治理中,数据标准模块主要负责确保隐私、保密性和适当的访问权限等
正确答案:D 学生答案:D
2、我们对性别字段(取值为“M”,“F”和“unknown”)进行编码:
gender={“M”,“F”,“unknown”}——>gender={0,1,2}
上述使用的特征编码类型是()
A、One-Hot编码
B、哑变量编码
C、数值编码
D、变量编码
正确答案:C 学生答案:C
3、在Pandas中,使用下列哪个函数实现等距离散化()
A、cut()
B、Binarizer()
C、qcut()
D、LabelEncoder()
正确答案:A 学生答案:A
4、下列选项中关于异常值处理叙述错误的是()
A、若确定异常值对分析的影响是负面的,删除异常值是最简便的方法
B、可将异常值视为缺失值处理
C、欺诈检验中,若异常值存在,应将其删除
D、并不是所有的异常值都是无意义的,部分数据工作就是围绕异常值
正确答案:C 学生答案:C
5、Python中,调用Sklearn的哪个函数可以填补缺失值()
A、StandardScaler()
B、qcut()
C、MinMaxScaler()
D、Imputer()
正确答案:D 学生答案:D
6、在Python中,Pandas模块中的qcut()方法可以用于()
A、等频离散化
B、标准化
C、二值化
D、等距离散化
正确答案:A 学生答案:A
江苏开放大学数据科学导论形考作业二多选题
1、下列关于填补法的表述错误的是()
A、若数据集中某一样本或者特征缺失不多,可用特定值替代缺失值
B、当列特征是离散值时,应采用平均数填充、中位数填充、回归模型填充
C、当列特征是连续值时,应采用列特征的众数填充
D、当列特征前后取值有关联时,可采用向前填充、向后填充
正确答案:B;C 学生答案:B;C
2、下列选项属于数据缺失机制类型的有()
A、完全随机缺失
B、随机缺失
C、连续随机缺失
D、非随机缺失
正确答案:A;B;D 学生答案:A;B;D
3、下列选项属于判断异常值的方法的是()
A、散点图
B、3σ法则
C、箱线图
D、线性回归
正确答案:A;B;C 学生答案:A;B;C
4、数据稽核主要是指对数据质量评估标准的哪些指标进行检查()
A、完整性
B、一致性
C、准确性
D、及时性
正确答案:A;B 学生答案:A;B
5、下列哪些因素会影响数据的质量()
A、信息因素
B、流程因素
C、技术因素
D、管理因素
正确答案:A;B;C;D 学生答案:A;B;C;D
6、下列哪些选项属于数据治理的目标()
A、提高数据质量
B、保证数据安全
C、实现数据资源在各组织机构部⻔的共享
D、从数据中获取最优的价值
正确答案:A;B;C;D 学生答案:A;B;C;D
7、下列选项属于数据离散化方法的是()
A、二值化
B、等距法
C、等频法
D、映射法
正确答案:A;B;C 学生答案:A;B;C
未经授权,禁止转载,发布者:形考达人,出处:https://www.xingkaowang.com/8168.html
本站不对内容的完整性、权威性及其观点立场正确性做任何保证或承诺!内容仅供研究参考,付费前请自行鉴别。
免费答案:形考作业所有题目均出自课程讲义中,可自行学习寻找题目答案,预祝大家上岸成功