西南财经大学《数据挖掘综合》2023年硕士研究生招生考试大_院校考研大纲_院校考研大纲考研网 - 启航考研院校库

公司logo

西南财经大学

211

联系方式:028-87092244

  • 地区:四川
  • 类型:财经类
  • 隶属:教育部

学科建设:硕士点:一级11,二级108 博士点:一级5,二级57

院校排名:综合排名:102 财经类:4

地址:成都市温江区柳台大道东段555号

首页

西南财经大学《数据挖掘综合》2023年硕士研究生招生考试大

2023年硕士研究生考试大纲

2023-02-06

3357

各位2023年考生请注意,目前各大院校的考研大纲公告已经发布,为了方便考生们查阅,小编整理了【西南财经大学2023年硕士研究生考试大纲】,希望对大家有所帮助哦~

西南财经大学招收硕士生考试说明及考试大纲

适用专业:大数据管理

考试科目:《数据挖掘综合》

第一部分:考试内容及要求

一. 数据挖掘概述

考试内容

数据挖掘的概念 知识发现过程 数据挖掘数据类型 数据挖掘功能和模式 数据挖掘可利用的技术 数据挖掘应用 数据挖掘的主要问题

考试要求

1.了解数据库系统技术的演变过程;理解数据挖掘的概念;掌握知识发现过程的7个步骤。

2.掌握数据挖掘的数据类型;掌握数据挖掘功能和模式;理解数据挖掘与统计学、机器学习的联系和区别;了解数据挖掘的应用领域;了解数据挖掘的主要问题。

二. 数据预处理

考试内容

数据属性 数据基本描述统计 数据预处理概述 数据质量 数据预处理的主要步骤 数据清理 数据集成 数据变换 数据规约 数据离散化

考试要求

1.了解数据对象与属性类型。

2.理解数据的基本统计描述,掌握均值、中位数、众数、极差、四分位数、方差、标准差和四分位数极差的概念和计算方法;了解数据基本统计描述的图形显示;了解度量数据的相似性和相异性。

3.了解进行数据预处理的原因及其重要性;了解数据质量涉及的因素;掌握数据预处理的主要步骤。

4.了解数据清理的概念;了解处理数据缺失值的方法;了解处理噪音数据的方法。

5.理解数据集成的概念;掌握冗余和相关性分析的方法(

检验,Pearson积矩系数)。

 

6.了解数据变换的策略;掌握数据规范化的计算方法(最小-最大规范化、z分数规范化、按小数定标规范化)。

7.理解数据归约的概念;了解数据归约的策略;了解线性回归、对数线性模型、直方图、聚类、抽样等数据归约方法。

8.理解数据离散化和概念分层的概念;了解数据离散化的方法(分箱、直方图分析、聚类分析、相关分析)。

三.数据仓库和联机分析处理

考试内容

数据仓库基本概念 OLTP和OLAP 数据立方体 数据仓库的数据模型 概念分层 典型的OLAP操作 数据仓库的设计 数据仓库的实现 数据仓库和数据挖掘

考试要求

1.理解数据仓库的概念和关键特征;了解OLTP和OLAP的概念和主要区别。

2.了解数据仓库模型的种类;了解元数据库的概念以及与其他数据的区别。

3.理解数据立方体的概念;了解数据仓库的数据模型(星型模式、雪花模式、事实星座模式);了解典型的OLAP操作方法。

4.了解数据仓库设计的四种视图, 了解数据仓库的设计过程和步骤;了解OLAP查询处理的步骤。

5.了解三类数据仓库应用;了解多维数据挖掘的重要性。

四. 挖掘频繁模式、关联和相关性

考试内容

频繁项集概念 频繁项集挖掘方法 Apriori算法 FP-growth算法

考试要求

1.理解项集、闭项集、频繁项集和关联规则的概念 ;了解规则兴趣度的两种度量(支持度和置信度)。

2.了解关联规则挖掘的步骤。

3.了解Apriori算法的步骤;了解FP-growth算法的步骤和优缺点;掌握相关性度量提升度(lift)的计算方法。

五. 分类和预测

考试内容

数据分类和预测的概念 判定树归类算法 信息增益 树剪枝 回归分析 分类法的准确性 组合分类器 类不平衡问题

考试要求

1.理解数据分类的概念;了解分类的两个过程;理解监督学习和非监督学习的区别;了解分类和预测的数据预处理方法;掌握评估分类和预测方法的标准。

2.了解决策树的概念和优缺点;了解决策树归分类的主要步骤;了解常用的属性选择度量,掌握信息增益度量的求法;理解两种常用的树剪枝方法。

3.了解评估分类器性能的度量;了解评估分类和预测准确率的方法(混淆矩阵、灵敏度和特小型、F度量)。

4.了解K-折交叉验证和自助法的基本思想;了解ROC曲线的概念和特点。

5.了解组合分类器的概念和常用的组合分类方法;了解装袋和提升的基本思想以及两者的区别;了解随机森林的基本思想。

6.了解类不平衡问题的概念;了解提高类不平衡数据分类准确率的一般方法。

六. 聚类分析

考试内容

聚类分析的概念 聚类方法的分类 算法方法的距离度量 划分方法 层次方法 基于密度的方法 基于网格的方法 聚类评估

考试要求

1.理解聚类分析的概念;了解聚类分析的应用领域;了解比较聚类方法的标准;了解数据挖掘对聚类的典型要求;了解比较聚类方法的各个方面。

2.理解划分方法的概念和一般特点,以及典型算法;理解层次方法的概念和一般特点,以及典型算法;理解基于密度的聚类方法的概念和一般特点,以及典型算法;理解基于网格的聚类方法的概念和一般特点,以及典型算法;

3.理解K-均值算法的步骤和优缺点;

4.了解算法方法的距离度量。

5.了解聚类评估概念和主要任务;了解测定聚类质量的方法。

第二部分:考试方法和考试时间

数据挖掘综合考试采用闭卷、笔试形式,考试时间为180分钟。

第三部分:试卷结构及参考书目

(一)题分:试卷满分为150分

(二)题型比例:

选择题与判断题 约40%

简答题和计算题 约60%

(三)参考书目:

1. 《数据挖掘 概念与技术》(原书第3版),作者:Jiawei Han(韩家炜),出版社:机械工业出版社。

2. 《机器学习》,周志华著,清华大学出版社,2016。

3. 《统计学习方法》,李航著,清华大学出版社,2012。

原标题:2023年硕士研究生入学考试自命题科目考试大纲

文章来源:https://yz.swufe.edu.cn/web/info/1009/2195.htm

【26考研辅导课程推荐】:26考研集训课程,VIP领学计划,26考研VIP全科定制套餐(公共课VIP+专业课1对1) , 这些课程中都会配有内部讲义以及辅导书和资料,同时会有教研教辅双师模式对大家进行教学以及督学,并配有24小时答疑和模拟测试等,可直接咨询在线客服老师领取大额优惠券。

END

涵盖31省,862所院校,756个专业

为考研学子提供院校咨询专业咨询备考咨询

使用声明:

1.本查询系统的信息主要来源于各研招单位招生网及对外公开的数据、国家官网公布的数据

2.本平台历年高校数据仅供考生参考,如各招生数据与院校公布数据不一致,请以各高校正式公布的数据为准。

 一对一答疑

获取一对一答疑

首页 | 研究生兼职 | 付款方式 | 集训基地 | 关于我们  | 产品合作  | 网站地图

Copyright©1998-2020 jixun.iqihang.com 京ICP备16065416号-7

北京市启航世纪科技发展有限公司 服务热线:400-108-7500

京公网安备 11010802028430号