您的当前位置：首页 CPDA考试真题含答案

CPDA考试真题含答案

来源：保捱科技网

精品文档

一、判断题

1.样本容量是指从总体中抽取的个体。

正确答案： ×

2.品质数据既可以用整数值表示，也可以用连续值表示。

正确答案： √

3.需求弹性大的产品价格与销售收入反向变化。

正确答案： √

4.一般而言，定量预测方法在满足下列三个条件时才能使用：一是能够知道待测变量的过去值，二是信息可以量化，三是过去的变动形式将持续到未来是一个合理的假设。

正确答案： √

5.在对不同项目进行风险衡量时，可以用标准差作为标准，标准差越大，方案风险水平越高。

正确答案： ×

6.在一定时期和一定产销量范围内，固定成本与产品的产销量多少没有关系，只有可变成本才与产品产销量的增减变化发生关系。

正确答案： √

7.如果两个变量不，那这两者的相关系数必然不等于0。

正确答案： ×

8.数据库类型是按照数据存取的方法来划分的。

正确答案： ×

9.SQL语言中，条件年龄 BETWEEN 15 AND 35，表示年龄在15至35之间，且包括15岁但不包括35岁。

正确答案： ×

10.资本成本就是资金的时间价值。

正确答案： ×

精品文档

11.一组数据排序后处于25%和75%位置上的值称为四分位数。

正确答案： √

12.企业购并处于竞争地位的同类型企业形成企业集团称为集团多角化。

正确答案： ×

13.内部收益率考虑了资金时间价值，受折现率高低的影响。

正确答案： ×

14.边际收入是指每增加1单位销量所带来的总收入的增加额度。

正确答案： √

15.分类预测时，准确率和召回率存在矛盾关系，不能同时增大，所以要考虑他们的综合影响，即F1-Score。

正确答案： ×

二、单选题

1.当所有观测值都落在回归直线上，则这两个变量之间的相关系数为（）

A、1 B、-1

C、+1或-1 D、0

正确答案： C

2.表示职称为副教授、性别为男的表达式为（）

A、职称='副教授' OR 性别='男' B、职称='副教授' AND 性别='男' C、BETWEEN '副教授' AND '男' D、IN ('副教授','男')

正确答案： B

3.对于下列实验数据： 1 , 108 , 11 , 8 , 5 , 6 , 8 , 8 , 7 , 11 ，描述其集中趋势用（）最为适宜，其值是（）。

A、平均数，14.4 B、中位数，8.5

精品文档

C、众数， 8 D、以上都可以

正确答案： C

4.（）是进行项目投资效益评价的最终依据。

A、现金流量 B、盈亏平衡点 C、净现金流量 D、现金流入量

正确答案： C

5.有一组数据其均值是 20 ，对其中的每一个数据都加上 10 ，那么得到的这组新数据的均值是（）。

A、20 B、10 C、15 D、30

正确答案： D

6.分类变量使用以下哪个统计量进行缺失值填补较合适

A、均值 B、最大值 C、众数 D、中位数

正确答案： C

7.假设{BCE}为一频繁项目集(Frequent Itemset)，则根据Apriori Principle以下何者不是子频繁项目？

A、BC B、CE C、C D、CD

正确答案： D

8.请问以下何者属于时间序列的问题？

精品文档

A、信用卡发卡银行侦测潜在的卡奴

B、基金经理人针对个股做出未来价格预测 C、电信公司将人户区分为数个群体 D、以上均不是

正确答案： B

9.数据正规化(Data Normalization)是在知识发掘处理(Knowledge Discovery Process)中的哪一个阶段进行？

A、数据清洗 B、数据选择 C、数据编码 D、数据扩充

正确答案： C

10.已知事件A的概率P(A)＝0.6，U为必然事件，则 P(A+U)＝1，P(ＡＵ)＝_______

A、0.4 B、0.6 C、0 D、1

正确答案： B

11.当时间序列数据点的一阶差分近似为一常数,可配合以下哪种预测模型（）

A、直线

B、二次抛物线 C、三次抛物线 D、指数曲线

正确答案： A

12.变量的量纲比如以厘米或者米为单位对下面哪种方法会有影响（）

A、方差分析 B、回归分析 C、聚类分析 D、主成分分析

正确答案： C

精品文档

13.若数据量较大,下面哪种方式比较适合（）

A、系统聚类

B、快速聚类（k-means） C、A和B都可以 D、A和B都不可以

正确答案： B

14.在建立线性回归(Linear Regression)之前我们可以利用何种方法挑选重要属性，以降低模型的复杂度？

A、皮尔森相关系数 B、卡方检定 C、T-检定 D、Z-Score

正确答案： A

15.ROC曲线凸向哪个角，代表模型越理想？

A、左上角 B、右上角 C、左下角 D、右下角

正确答案： A

16.决策树中的Information Gain的计算是用来？

A、剪枝 B、使树成长

C、处理缺失值和异常值 D、砍树

正确答案： B

17.当不知道数据所带标签时，可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离？

A、分类 B、聚类

C、关联分析

精品文档

D、隐马尔可夫链

正确答案： B

18.开始将Ｎ个样品各自作为一类，将规定样品之间的距离和类与类之间的距离，然后将距离最近的两类合并成一个新类，计算新类与其他类的距离，重复进行两个最近类的合并，每次减少一类，直至所有的样品合并

为一类，此种聚类方法是（）

A、Ｋ－means B、SOM聚类 C、系统聚类 D、有序聚类

正确答案： C

19.关于回归分析，下列说法中错误的是（）

A、作回归分析的变量之间要有实际意义，不能把毫无关联的两种现象随意进行回归分析，要结合专业知识对两事物之间是否存在因果关系作出合理解释和结论。

B、在进行线性回归分析进行的数据准备的时候，要求因变量y和自变量x都是符合总体正态的随机变量。

C、回归直线不要随意外延

D、所有非线性回归都可以转化为线性回归

正确答案： D

20.下列说明错误的是（）

A、性别=“男”=> 职业=“司机”，是布尔型关联规则

B、性别=“女”=> avg（收入）=2300，是一个数值型关联规则 C、肝炎=> ALT（丙氨酸转氨酶）升高，是一个单层关联规则 D、性别=“女”=> 职业=“秘书”，是关联规则

正确答案： C

21.在ID3算法中信息增益是指（）

A、信息的溢出程度 B、信息的增加效益 C、熵增加的程度最大 D、熵减少的程度最大

精品文档

正确答案： D

22.如下哪个不是最近邻分类器的特点（）

A、它使用具体的训练实例进行预测，不必维护源自数据的模型 B、分类一个测试样例开销很大

C、最近邻分类器基于全局信息进行预测 D、可以生产任意形状的决策边界

正确答案： C

23.关于混合模型聚类算法的优缺点，下面说法正确的是（）

A、当簇只包含少量数据点，或者数据点近似协线性时，混合模型也能很好地处理。 B、混合模型比K均值或模糊C均值更一般，因为它可以使用各种类型的分布。 C、混合模型很难发现不同大小和椭球形状的簇。 D、混合模型在有噪声和离群点时不会存在问题。

正确答案： B

24.关于K均值和DBSCAN的比较，以下说法不正确的是（）

A、K均值丢弃被它识别为噪声的对象，而DBSCAN一般聚类所有对象。 B、K均值使用簇的基于原型的概念，而DBSCAN使用基于密度的概念。

C、K均值很难处理非球形的簇和不同大小的簇，DBSCAN可以处理不同大小和不同形状的簇。

D、K均值可以发现不是明显分离的簇，即便簇有重叠也可以发现，但是DBSCAN会合并有重叠的簇。

正确答案： A

25.检测一元正态分布中的离群点，属于异常检测中的基于（）的离群点检测

A、统计方法 B、邻近度 C、密度

D、聚类技术

正确答案： A

26.倒传递神经网络（BP神经网络）的训练顺序为何？( A:调整权重; B:计算误差值; C:利用随机的权重产生输出的结果)

A、BCA

精品文档

B、CAB C、BAC D、CBA

正确答案： D

27.假设检验中，拒绝域的边界称为（）

A、临界值 B、临界点 C、置信水平 D、边际值

正确答案： A

28.在有关数据仓库测试，下列说法不正确的是（）

A、在完成数据仓库的实施过程中，需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试

B、当数据仓库的每个单独组件完成后，就需要对他们进行单元测试

C、系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试 D、在测试之前没必要制定详细的测试计划

正确答案： D

29.某项目预计运行5年后的净现值为4500万元，如折现率为16％，其终值应为（）万元（说明：结果保留两位小数）

A、8045.86 B、6996.21 C、9451.54 D、7000.02

正确答案： C

30.迈克尔·波特的“五力模型”中，五种竞争力量中不包括( )

A、新进入者

B、供应商议价能力

C、其他利益相关者力量 D、行业中现有竞争者

正确答案： C

精品文档

三、多选题

1.敏感性分析的计算指标有（）

A、盈亏平衡点 B、敏感度系数 C、临界点 D、净现值

正确答案： BCD

2.在Excel 中，要选定A到E列单元格，操作正确的是（）

A、用鼠标左键单击列号A，然后向右拖动鼠标至列号E，再释放鼠标左键

B、左键单击列号A，再按下shift 键不放并用鼠标左键单击列号E，最后释放shift键

C、单击列号A，然后先按下Ctrl 键不放，再用鼠标单击B，C，D，E 列号，最后释放Ctrl 键

D、按shift键不放，用鼠标左键单击A，B，C，D，E的每个列号

正确答案： ABC

3.季节变动主要是由（ )引起的。

A、自然灾害 B、政治事件

C、制度、法律、习俗 D、自然界的季节变化

正确答案： CD

4.货币时间价值用相对值来表示时，在数量上应当理解为扣除（）后的社会平均利润率。

A、时间因素 B、通货膨胀因素 C、纯粹利率 D、风险因素

正确答案： BD

5.概率分析中，应计算出（ )表明该风险因素的风险程度。

A、变异系数 B、期望值 C、方差

D、标准差

正确答案： ABCD

6.定基发展速度与环比发展速度的关系有（ )。

A、各环比发展速度之和等于相应的定基发展速度 B、各环比发展速度之积等于相应的定基发展速度 C、两个环比发展速度之商等于相应的定基发展速度 D、两个定基发展速度之商等于相应的环比发展速度

正确答案： BD

7.促销预算的方法主要有（）。

A、量入为出法 B、竞争对等法 C、销售比例法 D、目标任务法

正确答案： ABCD

8.行业分析数据采集方法有（）。

A、一手资料 B、实地考察法 C、专家访谈法 D、收集媒体信息

正确答案： ABCD

9.决策树法分析问题的主要步骤包括（）。

A、结构化问题

B、设计可能结果发生的概率 C、设计结果的得益 D、分析问题

正确答案： ABCD

10.能消除时间序列中的不规则变动和季节变动的方法是（

A、移动平均法 B、指数平滑法

精品文档

）精品文档

C、时间序列乘法模型 D、季节指数

正确答案： AD

11.确定一个投资方案可行的必要条件是( ）。

A、净现值大于零 B、现值指数大于1

C、投资回收期小于1年 D、内部报酬率较高

正确答案： AB

12.随机对比实验的调查方法的优点是( ）

A、能够测算实验误差

B、可以提高实验结果的可靠性 C、可以节省分析过程和时间 D、费用开支小

正确答案： AB

13.下列说法中不正确的是（）

A、任何两个变量都具有相关关系 B、人的知识与其年龄具有相关关系 C、散点图中的各点是分散的没有规律

D、根据散点图求得的回归直线方程都是有意义的

正确答案： ACD

14.相关分析的任务有（ )

A、判定现象之间有无关系 B、判定现象之间关系的方向 C、判定相关关系的紧密程度

D、说明现象之间联系的具体形式

正确答案： ABCD

15.在比较不同预测方法的精确度时，通常采用（ )等误差指标来衡量预测误差的大小。

A、绝对误差

精品文档

B、相对误差 C、平均误差 D、随机误差

正确答案： ABC

16.如果自变量有连续型变量，则适用的分类预测方法有（）

A、逻辑回归 B、神经网络 C、SVM算法 D、C4.5算法

正确答案： ABC

17.KANO模型定义的顾客需求层次有（）

A、兴奋型需求 B、喜爱型需求 C、基本型需求 D、期望型需求

正确答案： ACD

18.下面有关HAVING子句的说法中正确的是( )

A、HAVING子句必须与GROUP BY子句同时使用，不能单独使用 B、使用HAVING子句的同时不能使用WHERE子句 C、使用HAVING子句的同时可以使用WHERE子句 D、使用HAVING子句的作用是限定分组的条件

正确答案： ACD

19.在有关数据仓库测试，下列说法中正确的是（）

A、在完成数据仓库的实施过程中，需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试

B、当数据仓库的每个单独组件完成后，就需要对他们进行单元测试

C、系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试 D、在测试之前可以不制定详细的测试计划，测试过程中实时调整。

正确答案： ABC

20.对于计算期不等的项目（方案）比选，可采纳的决策方法有 ( )

精品文档

A、最小公倍数法 B、内部收益率法 C、等年值法 D、获利指数法

正确答案： AC

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文