数据科学与大数据技术
-
2024年春江苏开放大学机器学习形考作业一高分答案
一、2024年春江苏开放大学机器学习形考作业一单选题答案 1、如果我们说“线性回归”模型完美地拟合了训练样本(训练样本误差为零),则下面哪个说法是正确的? A、测试样本误差不可能为零 B、以上答案都不对 C、测试样本误差始终为零 D、不确定 学生答案:B 2、下列模型中属于回归模型的是? A、线性回归 B、DBSCAN C、逻辑回归 D、ID3 学生答案:A…
-
2024年春江苏开放大学机器学习形考作业二高分答案
一、2024年春江苏开放大学机器学习形考作业二单选题答案 1、下列关于软投票说法错误的是? A、投票表决器可以组合不同的基分类器 B、使用概率平均的⽅式来预测样本类别 C、可以对每个基分类器设置权重,⽤于对预测概率求进⾏加权平均 D、软投票过程中每个基分类器都预测⼀个类别 学生答案:D 2、下列有关词袋表示法的理解有误的是() A、将每个⽂本对应词表转化为特…
-
江苏开放大学数据采集与预处理BBS2:请你谈谈数据清洗的目的何在,你是如何理解数据清洗这一概念的,结合一个实例说明数据清洗的主要内容是什么?
请你谈谈数据清洗的目的何在,你是如何理解数据清洗这一概念的,结合一个实例说明数据清洗的主要内容是什么? 评判依据: 1.按要求进行讨论,内容充分、合理,为有效帖,得分; 2.如讨论内容与主题无关,或字数欠缺,或复制他人发帖,为无效帖,不得分。 参考答案:数据清洗是数据预处理的重要环节,它的主要目的在于提高数据的质量和准确性,使得数据更适用于进一步的分析、建模…
-
江苏开放大学数据采集与预处理BBS1:请你结合实例谈谈大数据处理过程有哪些,并说明数据采集和数据预处理在大数据处理过程中的地位和作用?
在当今的大数据时代,请你结合实例谈谈大数据处理过程有哪些,并说明数据采集和数据预处理在大数据处理过程中的地位和作用? 评判依据: 1、按要求进行讨论,内容充分、合理,为有效帖,得分; 2、如讨论内容与主题无关,或字数欠缺,或复制他人发帖,为无效帖,不得分。) 参考答案:在当今的大数据时代,大数据处理已经成为企业和组织至关重要的一项任务。大数据处理主要包括以下…
-
江苏开放大学数据采集与预处理形成性综合大作业
青少年社交网络信息数据预处理 一、实验目的 1. 掌握数据清洗的典型流程和方法。 2. 掌握数据缺失值和异常值的处理方法。 3. 掌握特征编码和特征标准化的特征处理方法。 二、实验内容 随着 Facebook、Twitter等社交网络平台的流行,越来越多的青少年用户会在这些平台发布消息。请使用Pandas包和sklearn的预处理…
-
江苏开放大学数据采集与预处理第四次形考作业高分参考答案
江苏开放大学数据采集与预处理第四次形考选择题 1、下列选项中,关于groupBy()方法说法不正确的是( )。 A、分组键可以是列表或数组,但长度不需要与待分组轴的长度相同 B、可以通过DAtAFrAme中的列名的值进行分组 C、可以使用函数进行分组 D、可使用series或字典分组 正确答案:A 学生答案:A 2、下列选项中,关于A…
-
江苏开放大学数据采集与预处理第三次高分参考答案含代码
江苏开放大学数据采集与预处理第三次选择题 1、下列选项中,( )是评价数据质量的核心准则。 A、完整性 B、准确性 C、适用性 D、简洁性 正确答案:C 学生答案:C 2、下列说法中,关于清洗重复值的说法正确的是( ) A、清洗重复值的基本思想是“分而合之” B、清洗重复值的基本思想是“排序” C、清洗重复值的基本思想是“排序和合井”…
-
江苏开放大学数据采集与预处理第一次作业证券之星数据爬取
爬取证券之星数据 一、实验目的 掌握使用urllib库访问目标网址,BeautifulSoup库解析网页,获得网页静态加载的数据信息的方法。 二、实验内容 创建一个爬虫项目StockStar,用于爬取证券之星的部分信息,主要包括代码、简称、流通市值(万元)、总市值(万元)、流通股本(万元)、总股本(万元),h…
-
江苏开放大学计算机科学数学BBS2:以单个正态分布为背景,自选一例,确定均值μ的95%的置信区间
以单个正态分布为背景,自选一例,确定均值μ的95%的置信区间(σ²已知或未知均可)。 要求: 1.请在规定时间内按时提交,否则会影响成绩哦! 2.请独立作答,雷同帖一律无成绩。 参考答案: 假设我们有一个正态分布的数据集,并且我们想要确定该分布的均值μ的95%置信区间。这里我们假设σ²已知,因为如果我们不知道σ²,我们通常会使用一个更加复杂的方法来估计它。 …
-
江苏开放大学计算机科学数学BBS1:两个向量的夹角如何求解?如何判断两个向量是否正交?
通过一、二单元的学习,你对向量和矩阵是否有了新的认识?试从以下两个问题中任选一问作答,可以 举例说明。 1.两个向量的夹角如何求解?如何判断两个向量是否正交? 2.线性方程组的解有哪几种情况?如何判断? 要求: 1.请在规定时间内按时提交,否则会影响成绩哦! 2.请独立作答,雷同帖一律无成绩。 参考答案:两个向量正交的计算是它们的内积(点积)为零。因此,可以…