数据科学与大数据技术
-
2024年春江苏开放大学机器学习综合大作业:基于分类算法的肝病诊断
作业要求: 一.实验内容: 本案例基于UCI公开的肝病患者诊断数据,从患者生理指标和医疗检测指标出发,使用单一分类器和集成方法对患者是否患肝病进行预测分析。首先,我们对数据进行了预处理和探索性分析,挖掘出数据的内在联系;之后,借助sklearn中的各种分类模块进行预测;最后,比较不同分类器下的预测效果。 下载数据集indian_liver_patient.c…
-
2024年春江苏开放大学机器学习实验及技能训练(四):根据学习者在学习活动中的特征预测学生的成绩等级
实验四:根据学习者在学习活动中的特征预测学生的成绩等级 1. 实践目标: 掌握主流的分类模型的实现方法,包括逻辑回归、K近邻、决策树、朴素贝叶斯、支持向量机等。 2. 实践内容: 根据学习者在学习活动中的特征预测学生的成绩等级。 3. 实践操作: 在虚拟实验平台完成对应实验,并撰写实验报告在此处上传。 参考范文两篇,自行修改,防…
-
2024年春江苏开放大学机器学习实验及技能训练(二):共享单车时租数量预测
实验二:共享单车时租数量预测 1. 实践目标: 掌握数据预处理的基本方法,包括缺失值异常值处理、标准化、离散化、特征编码等。 2. 实践内容: 利用城市当天的天气、温度、湿度和风速等环境信息对自行车的租借数量进行有效预测,预测每小时内租用的自行车总数。 3. 实践操作: 在虚拟实验平台完成对应实验,并撰写实验报告在此处上传。 参…
-
2024年春江苏开放大学机器学习形考作业一高分答案
一、2024年春江苏开放大学机器学习形考作业一单选题答案 1、如果我们说“线性回归”模型完美地拟合了训练样本(训练样本误差为零),则下面哪个说法是正确的? A、测试样本误差不可能为零 B、以上答案都不对 C、测试样本误差始终为零 D、不确定 学生答案:B 2、下列模型中属于回归模型的是? A、线性回归 B、DBSCAN C、逻辑回归 D、ID3 学生答案:A…
-
2024年春江苏开放大学机器学习形考作业二高分答案
一、2024年春江苏开放大学机器学习形考作业二单选题答案 1、下列关于软投票说法错误的是? A、投票表决器可以组合不同的基分类器 B、使用概率平均的⽅式来预测样本类别 C、可以对每个基分类器设置权重,⽤于对预测概率求进⾏加权平均 D、软投票过程中每个基分类器都预测⼀个类别 学生答案:D 2、下列有关词袋表示法的理解有误的是() A、将每个⽂本对应词表转化为特…
-
江苏开放大学数据采集与预处理BBS2:请你谈谈数据清洗的目的何在,你是如何理解数据清洗这一概念的,结合一个实例说明数据清洗的主要内容是什么?
请你谈谈数据清洗的目的何在,你是如何理解数据清洗这一概念的,结合一个实例说明数据清洗的主要内容是什么? 评判依据: 1.按要求进行讨论,内容充分、合理,为有效帖,得分; 2.如讨论内容与主题无关,或字数欠缺,或复制他人发帖,为无效帖,不得分。 参考答案:数据清洗是数据预处理的重要环节,它的主要目的在于提高数据的质量和准确性,使得数据更适用于进一步的分析、建模…
-
江苏开放大学数据采集与预处理BBS1:请你结合实例谈谈大数据处理过程有哪些,并说明数据采集和数据预处理在大数据处理过程中的地位和作用?
在当今的大数据时代,请你结合实例谈谈大数据处理过程有哪些,并说明数据采集和数据预处理在大数据处理过程中的地位和作用? 评判依据: 1、按要求进行讨论,内容充分、合理,为有效帖,得分; 2、如讨论内容与主题无关,或字数欠缺,或复制他人发帖,为无效帖,不得分。) 参考答案:在当今的大数据时代,大数据处理已经成为企业和组织至关重要的一项任务。大数据处理主要包括以下…
-
江苏开放大学数据采集与预处理形成性综合大作业
青少年社交网络信息数据预处理 一、实验目的 1. 掌握数据清洗的典型流程和方法。 2. 掌握数据缺失值和异常值的处理方法。 3. 掌握特征编码和特征标准化的特征处理方法。 二、实验内容 随着 Facebook、Twitter等社交网络平台的流行,越来越多的青少年用户会在这些平台发布消息。请使用Pandas包和sklearn的预处理…
-
江苏开放大学数据采集与预处理第四次形考作业高分参考答案
江苏开放大学数据采集与预处理第四次形考选择题 1、下列选项中,关于groupBy()方法说法不正确的是( )。 A、分组键可以是列表或数组,但长度不需要与待分组轴的长度相同 B、可以通过DAtAFrAme中的列名的值进行分组 C、可以使用函数进行分组 D、可使用series或字典分组 正确答案:A 学生答案:A 2、下列选项中,关于A…
-
江苏开放大学数据采集与预处理第三次高分参考答案含代码
江苏开放大学数据采集与预处理第三次选择题 1、下列选项中,( )是评价数据质量的核心准则。 A、完整性 B、准确性 C、适用性 D、简洁性 正确答案:C 学生答案:C 2、下列说法中,关于清洗重复值的说法正确的是( ) A、清洗重复值的基本思想是“分而合之” B、清洗重复值的基本思想是“排序” C、清洗重复值的基本思想是“排序和合井”…