当前位置:首页 >> 公务员考试 >>

《探索性数据分析》2013测验试卷参考答案

《探索性数据分析》测验试卷
班级: 姓名: 学号:

1.(15 分)你所知道的数据类型有哪些?请至少举出四种,并说明这 些数据类型的特点。 2.(共 15 分) (1). 请叙述矩估计和极大似然估计的定义。 ( 2 ) . 设 总 体 X ~ N (?,? 2 ) , X 1 ,? ? ? X n 为 来 总 体 的 样 本 , 求 使
P( X ? t ) ? 0.05的点 t 的极大似然估计。

解: 假设 ?(?) 为标准正态分布的分布函数,则,
P( X ? t ) ? 1 ? P( X ? t ) ? 1 ? ?( t??

由已知可得, ? ( 数,则
t??

t??

?

)

?

) ? 0.95 . 令 t 0.05 为标准正态分布的上侧 0.05 分位

?

? t 0.05 . 于是,由极大似然估计的不变性可知, t 的极大似

? ,其中 X ? 然估计为, t? ? X ? t 0.05 S n

1 n ? ? ? Xi , S n n i ?1

1 n (X i ? X )2 . ? n i ?1

(3). 矩估计唯一吗?是,请证明;否,请举反例。 答: 矩估计不唯一,例如泊松分布均值的估计。具体的说,假设总体 X 服从参数为 ? 的泊松(Poisson)分布,由于 E( X ) ? Var( X ) ? ? ,故由
? ? 1 ( X ? X ) 2 都可作为参数 ? 的矩估计量, ? ? X ,? 矩估计法知: ? ? i 2 1 n
i ?1 n

然而样本均值是总体均值的无偏估计, 且比样本二阶中心矩的阶数低, 故优先选取样本均值作为参数的矩估计.

3.

(10

分) 设 X 和Y的方差都存在, 证明 | cov( X ,Y )|2 ? Var( X ) ?Var(Y ) .

解: (该题是证明相关系数介于-1,1 之间的理论依据,所以其实严格 来讲由相关系数的取值范围来推得这个命题的做法是错误的) 。令
EX ? ? X , EY ? ?Y ,t 为任一实数,则 [( X ? ? X ) ? t (Y ? ?Y )]2 ? 0 ,由积分 2 的性质可知 E[(X ? ? X ) ? t (Y ? ?Y )] ? 0 ,另一方面,

E[( X ? ? X ) ? t (Y ? ?Y )]2 ? E ( X ? ? X ) 2 ? 2tE[( X ? ? X )(Y ? ?Y )] ? t 2 E (Y ? ?Y ) 2 ? VarX ? 2tCov( X , Y ) ? t 2VarY 2 上式为 t 的二次函数,故 4[Cov( X , Y )] ? 4Var( X )Var(Y ) ? 0 ,得证.

4.(20 分)已知T与C独立,且 X ? T ? C, ? ? I (T ? C) ,设 T 与 C 的分 布函数分别为 F 和 G,已知 E{m(T ,? )} ? 0 ,其中 m(.)为已知函数,假 设观察样本为 X1, ???? X n ,?1, ???, ?n ,试证明: (1) E{

1? G(T )

?

m(T ,? )} ? 0

(2)请用观察样本给出 θ 的一个合适估计。 (1)证明: 利用条件期望的性质可得:
? ? ? m(T ,? ) ? ? ? E{ m(T ,? )} ? E ?E[ m(T ,? ) | T ]? ? E ? E[? | T ]? ? E[m(T ,? )] ? 0 1 ? G(T ) ? 1 ? G(T ) ? ?1 ? G(T ) ?

(2)解: 由(1)可知
? ? ? E? m( X ,? )? ? 0 ?1 ? G( X ) ?

<1>

于是,我们可以用估计方程方法给出 ? 的一个估计。上式的样本类似 为
?i 1 n m( X i ,? ) ? n i ?1 1 ? G( X i )

<2>



?i 1 n m( X i ,? ) ? 0 , 由该方程解出来的估计 ?? 称为估计方程估 ? n i ?1 1 ? G( X i )

计,且在一些正则条件下,该估计是相合和渐近正态的. 5. (15 分,请附程序,否则不予评分)某航空公司为了解旅客对公司 服务态度的满意程度, 对 50 名旅客作调查, 要求他们写出对乘机服务、 机上服务和到达机场服务的满意程度。满意程度的评分从 0 到 100, 分数越大满意程度越高,收集到的数据如下表,要求: (1)对 50 名旅客关于乘机服务的满意程度数据作描述性统计分析 ; (2)对 50 名旅客关于机上服务的满意程度数据作描述性统计分析; (3 ) 对 50 名旅客关于到达机场服务的满意程度数据作描述性统计分析; (4)对 50 名旅客关于这三方面服务的满意程度数据作一个综合比较 的描述性统计分析。
表:50 名旅客对乘机服务、机上服务和到达机场服务的满意程度的评分
乘机服务 机上服务 到达机场服务 乘机服务 机上服务 达到机场服务

71 84 84 87 72 72 72 63 84 90 72 94 84 85 88 74 71 88 90 85 79

49 53 74 66 59 37 57 48 60 62 56 60 42 56 55 70 45 49 27 89 59

58 63 37 49 79 86 40 78 29 66 55 52 66 64 52 51 68 42 67 46 41

72 71 69 90 84 86 70 86 87 77 71 75 74 76 95 89 85 65 82 82 89

76 25 47 56 28 37 38 72 51 90 36 53 59 51 66 66 57 42 37 60 80

37 74 16 23 62 59 54 72 57 51 55 92 82 54 52 62 67 68 54 56 64

72 88 77 64

60 36 60 43

45 47 75 61

74 82 90 78

47 49 76 52

63 91 70 72

解:所谓描述性统计分析是指: 对有关数据做统计性描述,可以 包括对数据的频数分析,数据的集中趋势分析(例如:均值,分 位数,众数等) ,离散程度分析(例如:离差,方差等) ,数据的 分布(例如:偏度,峰度,是否正态等) ,以及一些基本的统计图 形(例如:直方图,茎叶图,箱线图等) 。具体 R 语句请参考相关 书籍。

6. (15 分,请附程序,否则不予评分)为检验两种燃料添加剂对客 车每加仑汽油行驶里程数的影响是否不同,随机挑选 12 辆车,让 每一辆车都先后使用这两种添加剂,12 辆车使用这两种添加剂每 加仑汽油行驶里程数的检测结果如下: 车辆 添加剂 1 1 2 3 4 5 6 22.32 25.76 24.23 21.35 23.43 26.97 2 21.25 23.97 24.77 19.26 23.12 26.00 7 8 9 10 11 12 车辆 1 18.36 20.75 24.07 26.43 25.41 27.22 添加剂 2 19.40 17.18 22.23 23.35 24.98 25.90

7.(10 分,请附程序,否则不予评分)在一个 24 小时的试验中,以 小时为单位记录实验室中的一群昆虫产卵的数量,要检验
H 0 : 24 个产卵数量组成 24 个同分布随机变量的观测值

备择假设:
H1 : 产卵数量在下午 2:15 达到最小,逐渐增加直到凌晨 2:15

增大到最大值,再减少直到下午 2:15. 每小时产卵数量的记录如下
时间
上午 9 点 上午 10 点 上午 11 点 中午 12 点 下午 1 点 下午 2 点 下午 3 点 下午 4 点

卵的数量
151 119 146 111 63 84 60 109

时间
下午 5 点 晚上 6 点 晚上 7 点 晚上 8 点 晚上 9 点 晚上 10 点 晚上 11 点 晚上 12 点

卵的数量
83 166 143 116 163 208 283 296

时间
凌晨 1 点 凌晨 2 点 凌晨 3 点 凌晨 4 点 凌晨 5 点 早上 6 点 上午 7 点 上午 8 点

卵的数量
286 235 223 176 176 174 139 137


相关文章:
《探索性数据分析》2013测验试卷参考答案.doc
《探索性数据分析》2013测验试卷参考答案 - 《探索性数据分析》测验试卷 班级
数据分析师常见的7道笔试题目及答案.doc
笔试题目频道小编搜集的范文“数据分析师常见的7道笔试题目及答案”,供大家阅读参考,查看更多相关笔试题目 ,请访问笔试题目频道。 导读:探索性数据分析侧重于在数据...
数据挖掘考试习题 2有答案.doc
数据挖掘考试习题 2有答案_理学_高等教育_教育专区...(A) A. 探索性数据分析 B. 建模描述 C. 预测...在上题中,属于定量的属性类型是:(C) A 标称 B ...
11级GIS空间分析试题参考答案_图文.doc
11级GIS空间分析试题参考答案_从业资格考试_资格考试...探索性空间数据分析的目标与方法空间数据层出不穷...因此检验数据是否符合正态分布, 就决定了它们是否能...
盐城数据挖掘考试-内部选拔考题及答案.doc
盐城数据挖掘考试-内部选拔考题及答案_信息与通信_...数据挖掘考试-内部选拔考题一、单选题(每题 0.5 ...(A) A. 探索性数据分析 B. 建模描述 C. 预测...
北师大统计学作业答案.doc
北师大统计学作业答案。北京师范大学网络教育 《统计...第一部分为“客观题部分” ,由 15 个选择题组成,...绝对差 北京师范大学网络教育 11、探索性数据分析的...
2007年初级统计专业知识和实务试卷及答案.doc
2007 年初级统计专业知识和实务试卷及答案 注意事项 ...整理数据包括“探索性数据分析”和“数据的分组汇总...年修订并发布的《国民经济行业分类》共分为( A.20...
更多相关标签: