CPDA 数据分析师考试大纲 (试行)
第一部分考试介绍
一、考试目标
数据分析师专业技术考试主要测试考生是否具备数据分析基础知识,是否了解数据分析工作流程及数据分
析技术, 是否具备利用数据分析知识解决实际业务问题的能力。
侧重考查考生对数据分析知识的掌握和应用,借助数据分析知识解决实际数据分析工作和企业决策工作的
能力,根据企业决策的需要,对各种相关数据进行分析和评估能力。
考点涉及数据分析统计基础、数据获取、数据预处理、数据可视化、数据算法模型及客户数据分析、产品 数据分析、营销数据分析、采购数据分析、物流数据分析、生产制造数据分析、智能供应链及投资收益风险分 析等。
二、考试科目及考试形式
考试分为理论机考和实操笔试,考试时限分别为 90 分钟和 120 分钟,满分都为 100 分。
科目 | 考试方式 | 题型 | 总分 | 及格分 | 考试时长 |
数据分析理论知识 | 机考 | 选择、填空、判断题 | 100 分 | 60 分 | 90 分钟 |
数据分析算法与模型 | 笔考 | 操作计算题 | 100 分 | 60 分 | 120 分钟 |
数据分析应用 | 笔考 | 应用分析题 (操作+分析) | 100 分 | 60 分 | 120 分钟 |
CPDA 数据分析师的认证考核采取全国统一时间, 每年四次。具体时间, 请查询官方网站 |
三、教材与资料
《数据分析基础》 《营销数据分析》《供应链优化与投资分析》 《战略管理》《面授讲义》是数据分析师考生
必修必考教材与资料。
四、知识点要求注释
识记:要求掌握概念、熟悉理论、重点考试要求范围;
理解:要求应知应会, 非重点考试要求范围;
应用:掌握实际使用方法, 运用计算工具或分析软件进行实际操作和分析,考试要求范围;
了解:拓展性知识,非考试要求范围。
第二部分 考试内容
根据数据分析师专业技术考试的考试目标、 科目和考试形式等要求, 数据分析师专业技术考试科目要点包括 但不限于以下内容:
一、 数据分析理论知识
数据分析理论知识是对考生数据分析基础知识的掌握程度的测试。数据分析基础主要从数据分析的整个流 程去考查学生知识,其中涵盖了数据获取、数据预处理、数据可视化、数据分析算法与模型以及数据分析结论 建议等方面的知识内容。考试题型主要是客观题, 包含单项选择题、多项选择题、判断题, 以机考形式考核。
数据分析理论知识考试内容:
1.数据分析整体流程考察, 以及各个环节常用方式方法。
(1) 数据及其分类。
(2) 数据分析基础知识:概率统计基本概念、参数估计、假设检验、数据分析基本方法等。
(3) 数据分析工具。
2.数据获取
(1) 内部数据获取: 数据库基本理论、关系型数据库、非关系型数据库、大数据存储和获取、数据仓库。
(2) 外部数据获取: 网络爬虫、物联网数据获取、行业数据获取、政府数据获取、外购交易数据、 API 数 据获取等。
(3) 抽样调查技术: 抽样调查基本概念、抽样方法、抽样误差和精度描述、抽样实施步骤等。
3. 数据预处理
数据预处理的意义、方法、以及各种预处理方法的适用条件。
(1) 数据的描述性分析: 集中趋势测度、离散趋势测度等。
(2) 数据清洗:缺失数据、 异常数据等。
(3) 数据集成。
(4) 数据转换:数据标准化、数据的代数运算、数据的离散化等。
(5) 数据规约:变量规约、数值规约等。
4.数据可视化
(1) 基本图表及其使用技巧。
(2) 可视化工具优缺点及适用情况和意义。
5.数据分析技术—机器学习基础
监督学习算法中回归和时间序列算法, 分类算法中逻辑回归、决策树、贝叶斯算法、神经网络算法、 SVM
算法等原理及简单计算。
非监督算法中各种聚类算法,降维算法, 以及关联规则算法、文本挖掘中基本算法原理及简单计算。
6.数据分析应用
(1) 战略研究、市场研究、消费者使用习惯与态度研究、品牌诊断、新产品研究、广告研究、渠道研究等。
(2) 客户数据分析应用: 用户画像的方法、维度分解和模型应用的简单分析与计算等。
(3) 产品数据分析应用: 产品定位、产品设计阶段数据分析模型原理、产品运营数据分析模型原理等。
(4) 营销数据分析应用: 市场预测模型原理、价格模型原理、促销广告模型原理等。
(5) 供应链优化数据分析应用: 大数据智能供应链、采购模型原理、生产模型原理、物流模型原理等。
(6) 投资数据分析应用: 量化投资概念和特点、实业投资技术选择方法、数据编制与估算、收益与风险数 据分析等。
二、 数据分析算法与模型
数据分析算法与模型主要考查学员对所学算法与模型的宏观掌握情况, 考查学员对数据分析基本知识的掌 握程度以及对于数据分析算法的理解以及应用算法的建模能力。 考试题型主要是通过算法模型进行案例分析, 题量在 4-5 个左右。以计算结果正误和解题思路步骤为考核标准。
数据分析算法与模型考试内容:
1.机器学习算法
监督学习算法中回归和时间序列算法, 分类算法中逻辑回归、决策树、贝叶斯算法、神经网络算法、 SVM 算法等。
非监督算法中各种聚类算法,降维算法, 以及关联规则算法,文本挖掘基本算法。
2.应用模型
KANO 模型、 PSM 模型、巴斯模型、规划求解、层次分析法、节约里程法、经济生产(订货) 模型、收益评 价指标计算、 盈亏平衡分析 、敏感性分析 、风险概率分析。
三、 数据分析应用
数据分析应用主要考查学员在实战中运用分析原理、选择合适的分析方法和决策的思维解决实际业务问题 的能力。考试题型主要是通过数据分析流程、分析业务背景辨别适合应用的分析算法模型, 并综合评估分析结
果,对实际问题进行分析、预测并提出解决方案。
考试题型是大案例分析,题量在 2-4 个左右。 以分析思路步骤和预测结果与真实数据误差项为考核标准。
数据分析应用考试内容:
1. 数据获取
(1) 结构化数据获取方式和方法。
(2) 非结构化数据获取方式和方法。
2. 数据预处理
(1) 数据的描述性分析: 集中趋势测度、离散趋势测度等。
(2) 数据清洗:缺失数据、异常数据等。
(3) 数据集成。
(4) 数据转换:数据标准化、数据的代数运算、数据的离散化等。
(5) 数据规约:变量规约、数值规约等。
3.数据可视化
(1) 基本图表及其使用技巧。
4.数据分析技术—机器学习基础
(1) 方法选择;监督学习算法中回归和时间序列算法, 分类算法中逻辑回归、决策树、贝叶斯算法、神经网络 算法、 SVM 算法等。
非监督算法中各种聚类算法,降维算法, 以及关联规则算法、文本挖掘中基本算法等。
(2) 方法评估
5.数据分析应用
(1) 战略研究、市场研究、消费者使用习惯与态度研究、品牌诊断、新产品研究、广告研究、渠道研究等。
(2) 客户数据分析应用: 用户画像的方法、维度分解和模型应用等。
(3) 产品数据分析应用: 产品定位、产品设计阶段数据分析、产品运营数据分析等。
(4) 营销数据分析应用: 市场预测模型、价格模型、促销广告模型等。
(5) 供应链优化数据分析应用:大数据智能供应链、采购模型、生产模型、物流模型等。
(6) 收益与风险数据分析应用等。
第三部分 考核目标
考 点 | 要求 | 题目难易程度比例分配(难、中等、易) |
数据及分类的相关知识 | 识记 | 易 50%,中等 25%,难 25% |
概率统计相关知识(数据分布、参数估计、假设 检验等) | 识记 | 易 25%,中等 50%,难 25% |
数据分析工具 | 理解、应用 | 易 25%,中等 50%,难 25% |
结构化数据获取(数据库基础理论知识、 SQL 语言 相关知识) | 识记 | 易 50%,中等 25%,难 25% |
非结构化数据获取(非结构化数据获取方式和相 关概念) | 识记 | 易 50%,中等 25%,难 25% |
抽样调查技术 | 理解 | 易 50%,中等 25%,难 25% |
数据分析基础指标(集中趋势、离散趋势等指标) | 识记 | 易 25%,中等 50%,难 25% |
数据预处理方法(数据清洗、数据转换等方法) | 识记、应用 | 易 25%,中等 50%,难 25% |
数据可视化(各种图表相关知识和应用场景) | 识记、应用 | 易 25%,中等 50%,难 25% |
数据分析各种算法(监督学习算法与非监督学习 算法) | 识记、应用 | 易 25%,中等 50%,难 25% |
产品分析模型和应用(各种算法应用,以及kano 模型, PSM 模型等) | 识记、应用 | 易 25%,中等 50%,难 25% |
客户分析模型和应用(客户画像分析流程及应用) | 识记、应用 | 易 25%,中等 50%,难 25% |
营销分析模型和应用(市场预测模型、价格模型、 促销广告模型等) | 识记、应用 | 易 25%,中等 50%,难 25% |
供应链优化(大数据智能供应链、采购模型、生 产模型、物流模型) | 识记、应用 | 易 50%,中等 25%,难 25% |
投资分析(收益和风险分析等) | 识记、应用 | 易 50%,中等 25%,难 25% |
发表评论 取消回复