|京ICP备14027590号-282

对外经济贸易大学统计学院《432统计学》历年考研真题及详解

本书收录了对外经济贸易大学统计学院“432统计学[专业硕士]”2015~2018年的考研真题,全部真题提供答案及详解。本书历年真题的答案及详解由高分考生根据本科目考研的参考教材和相关教师的授课讲义等精心编写而成,解题思路清晰、答案翔实,突出难度分析,对常考知识点进行了归纳整理。

2015年对外经济贸易大学432统计学[专业硕士]考研真题

2015年对外经济贸易大学432统计学[专业硕士]考研真题及详解

一、单项选择题(每小题2分,共20分)

1下面哪个图形保留了原始数据的信息(  )。

A.直方图

B.茎叶图

C.条形图

D.箱线图

【答案】B查看答案

【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是由数字组成的。ABC三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。

2为了了解消费者的网上购物支出,通过在街头拦访过路行人进行调查的抽样方式属于(  )。

A.简单随机抽样

B.分层抽样

C.判断抽样

D.方便抽样

【答案】D查看答案

【解析】A项,简单随机抽样是从包括总体N个单位的抽样框中随机地、一个一个地抽取n个单位作为样本,每个单位入样的概率是相等的;B项,分层抽样是将抽样单位按某种特征或

某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本;C项,判断抽样指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本;D项,方便抽样是指调查过程中由调查员依据方便的原则,自行确定入抽样本的单位。题中的抽样方式属于方便抽样。

3已知P(A)=a,P(B)=b,P(A∪B)=c,则P(AB(_))为(  )。

A.a(1-b)

B.a-b

C.c-b

D.a(1-c)

【答案】C查看答案

【解析】P(AB(_))=P(A)-P(AB)=P(A)-[P(A)+P(B)-P(A∪B)]=a-(a+b-c)=c-b。

4设总体X~N(2,σ2),X1,…,X16是来自总体X的样本,

则(4X(_)-8)/σ服从的分布是(  )。

A.t(15)

B.t(16)

C.χ2(15)

D.N(0,1)

【答案】D查看答案

【解析】由题可知样本均值X(_)~N(2,σ2/16),则

即(4X(_)-8)/σ~N(0,1)。

5设X1,…,Xn是来自总体X的样本,则可以作为总体均值无偏估计量的是(  )。

A.

B.

C.

D.

【答案】D查看答案

【解析】A项

B项

C项

D项

所以,D项

是总体均值的无偏估计量。

6抽取样本容量为100的随机样本对总体的均值进行检验,检验的假设为H0:μ≤μ0,H1:μ>μ0,显著性水平α=0.05,zc为检验统计量的样本值,那么P值为(  )。

A.P(z>zc)

B.P(z<zc)

C.P(z>1.96)

D.P(z<-1.96)

【答案】A查看答案

【解析】题中,样本量n=100≥30,σ2未知,在给定的显著性水平α下,对于右单侧检验而言,P值为检验统计量的值大于由样本所计算出的检验统计量的值的概率,即P值=P(z>zc)。

7五月份的商品销售额为60万元,该月的季节指数为120%,则消除季节因素影响后,该月的商品销售额为(  )万元。

A.72

B.50

C.60

D.51.2

【答案】B查看答案

【解析】消除季节因素影响后的商品销售额=该月商品实际销售额/该月季节指数=60/120%=50(万元)。

8产量(X,台)与单位产品成本(Y,元/台)之间的回归方程为Y(∧)=248-2.6X,下列解释合理的是(  )。

A.产量每增加一台,单位产品成本增加248元

B.产量每增加一台,单位产品成本减少2.6元

C.产量每增加一台,单位产品成本平均增加245.4元

D.产量每增加一台,单位产品成本平均减少2.6元

【答案】D查看答案

【解析】题中,回归方程的回归系数为-2.6,其含义是:产量每增加一台,单位产品成本平均减少2.6元。

9以Y表示实际观测值,Y(∧)表示回归估计值,则普通最小二乘法估计参数的准则是使(  )。

A.∑(Yi-Y(∧)i)=0

B.∑(Yi-Y(∧)i)2=0

C.∑(Yi-Y(∧)i)为最小

D.∑(Yi-Y(∧)i)2为最小

【答案】D查看答案

【解析】普通最小二乘法是使因变量的观察值Y与估计值Y(∧)之间的离差平方和达到最小,从而估计参数βj,j=0,1,2…的方法,即使∑(Yi-Y(∧)i)2为最小。

10对于Yi=β0+β1X1i+β2X2i+…+βkXki+ei,检验H0:βi=0(i=0,1,…,k)时,所用的统计量

服从(  )。

A.t(n-k-1)

B.t(n-k-2)

C.t(n-k+1)

D.t(n-k+2)

【答案】A查看答案

【解析】在多元线性回归方程回归系数的检验中,统计量

是回归系数β(∧)i的抽样分布的标准差。

二、判断题(每小题2分,共20分,正确的打√,错误的打×)

1一组数据的中位数和平均数不会受到极端值的影响。

【答案】×查看答案

【解析】中位数是一组数据排序后处于中间位置上的变量值,它是一个位置代表值,不受极端值的影响;平均数也称为均值,它是由一组数据相加后除以数据个数所得的结果,会受到极端值得影响。

2一组数据的偏态系数大于0,说明该组数据的分布呈现右偏。

【答案】√查看答案

【解析】偏态系数的表达式为

当SK=0,正负离差可相互抵消,可判断为对称分布;当SK为正值时,表示正离差值较大,可以判断为正偏或右偏;反之,当SK为负值时,表示负离差值较大,可判断为负偏或左偏。

3若事件A,B满足P(A)>0,P(B)>0,且相互独立,则A,B一定是互斥的。

【答案】×查看答案

【解析】事件A与B相互独立表示A(B)的发生与否对B(A)发生的可能性不会产生任何影响,但允许A,B两个事件同时发生;而A和B互斥是指A,B不能同时发生。题中,由A,B相互独立不能推出A,B一定是互斥的。

4设随机变量X服从N(μ1,σ12),Y服从N(μ2,σ22),且P{|X-μ1|<1}>P{|Y-μ2|<1},则必有σ1<σ2。

【答案】√查看答案

【解析】由题可得:

即Φ(1/σ1)>Φ(1/σ2)

所以,1/σ1>1/σ2,即:σ1<σ2。

5当样本容量给定时,置信区间的宽度会随着置信水平的增大而增大。

【答案】√查看答案

【解析】置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。在样本量相同的情况下,置信水平越高,置信区间越宽。

6在置信水平为90%条件下,某参数的置信区间为(60,80),说明这个区间以90%的概率包含了该参数的真值。

【答案】×查看答案

【解析】题中,置信区间的含义是:将构造置信区间的步骤重复多次,在得到的所有的样本区间中有90%的区间包含总体参数的真值,而不是说这个区间以90%的概率包含了该参数的真值,针对某一个具体区间它一定包含参数的真值或一定不包含参数的真值,不存在以多大的概率包含参数真值的说法。

7在假设检验中,增大样本容量,可以使两类错误的概率同时减小。

【答案】√查看答案

【解析】当样本量一定时,如果减小α错误,就会增大犯β错误的机会;若减小β错误,也会增大犯α错误的机会。若要使α和β同时变小,只能增大样本量。

8在方差分析中,拒绝原假设说明各总体的均值都不相等。

【答案】×查看答案

【解析】在方差分析中,拒绝原假设说明各总体的均值不全相等。若要检验哪些总体均值之间存在差异,则需要采用多重比较方法进行进一步分析。

9一元回归模型的判定系数R2表明了回归直线对观测数据的拟合程度。

【答案】√查看答案

【解析】R2越接近于1,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x的变化来解释y值变差的部分就越多,回归直线对观测数据的拟合程度就越好;反之,R2越接近于0,回归直线对观测数据的拟合程度就越差。

10若F检验表明多元回归模型的线性关系显著,则意味着每个自变量与因变量的关系都显著。

【答案】×查看答案

【解析】在多元线性回归分析中,如果F检验表明线性关系显著,则意味着在多个自变量中至少有一个自变量与因变量之间的线性相关系显著,而不是每个自变量与因变量之间的线性相关系都显著。

三、名词解释(每小题4分,共20分)

1离散系数

答:离散系数又称为变异系数,是测度数据离散程度的相对统计量,其作用主要是用于比较对不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。离散系数指标有:全距(极差)系数、平均差系数、方差系数和标准差系数等,常用的是标准差系数。它们的计算公式如下:

①极差(全距)系数:Vr=R/X(_),R=Xmax-Xmin;

②平均差系数:Va,d=A·D/X(_),

③方差系数:

④标准差系数:Vs=s/X(_)。

2简单随机抽样

答:简单随机抽样又称为单纯随机抽样、纯随机抽样、SRS抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础,其特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础。其突出特点是简单、直观,但是在实际应用中也有一些局限。

3估计量的有效性

答:估计量的有效性是指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。无偏性只考虑估计值的平均结果是否等于待估参数的真值,而不考虑每个估计值与待估参数真值之间偏差的大小和分布程度。在解决实际问题时,不仅希望估计是无偏的,更希望这些估计值的偏差尽可能地小。

设θ(∧)1和θ(∧)2是θ的两个无偏估计量,若θ(∧)1的方差小于θ(∧)2的方差,即:D(θ(∧)1)≤D(θ(∧)2),则称θ(∧)1是比θ(∧)2有效的估计量。

4单因素方差分析

答:单因素方差分析是指只涉及一个分类型自变量,研究一个分类型自变量对一个数值型因变量的影响的方差分析。单因素方差分析的步骤为:

(1)提出假设

H0:μ1=μ2=…=μi=…=μk(自变量对因变量没有显著影响);

H1:μi(i=1,2,…,k)不全相等(自变量对因变量有显著影响)。

(2)构造检验统计量

F=MSA/MSE~F(k-1,n-k)

(3)统计决策

若F>Fα(k-1,n-k),则拒绝原假设H0:μ1=μ2=…=μk,表明μi(i=1,2,…,k)之间的差异是显著的,即有证据表明所检验的因素对观测值有显著影响。

若F<Fα(k-1,n-k),则不拒绝原假设H0,没有证据表明μi(i=1,2,…,k)之间有显著差异,即这时还不能认为所检验的因素对观测值有显著影响。

5假设检验中的两类错误

答:在进行统计推断时,依据样本提供的信息进行判断,即由部分来推断总体。因而判断有可能正确,也有可能不正确,换而言之,统计推断面临着犯错误的可能。

(1)假设检验中的两类错误

①第Ⅰ类错误是在假设检验中拒绝了本来是正确的原假设,犯这种错误的概率用α表示,所以又称α错误或弃真错误;

②第Ⅱ类错误是在假设检验中没有拒绝本来是错误的原假设,犯这种错误的概率用β表示,所以又称β错误或取伪错误。

(2)两类错误之间的关系

在假设检验中α和β一般是此消彼长的,即如果减小α错误,就会增大犯β错误的机会;若减小β错误,就会增大犯α错误的机会。而使α和β同时变小的办法只有增大样本量。但样本量不可能没有限制,否则就会使抽样调查失去意义。因此,在假设检验中通常遵循首先控制犯α错误原则。

四、简答题(每小题5分,共30分)

1简述众数、中位数和平均数的应用场合。

答:众数、中位数和平均数都是用来度量数据的集中趋势的数据。它们的内涵及应用场合如下:

(1)众数

众数是一组数据中出现次数最多的变量值。

众数主要用于测度分类数据的集中趋势,也适用于作为顺序数据以及数值型数据集中趋势的测度值。一般情况下,只有在数据量较大的情况下,众数才有意义。

(2)中位数

中位数是一组数据排序后处于中间位置上的变量值。它将全部数据等分成两部分,每部分包含50%的数据,一部分数据比中位数大,另一部分则比中位数小。

中位数主要用于测度顺序数据的集中趋势,也适用于测度数值型数据的集中趋势,但不适用于分类数据。它是一个位置代表值,特点是不受极端值的影响。

(3)平均数

平均数也称为均值,它是由一组数据相加后除以数据个数所得的结果。

平均数在统计学中具有重要的地位,是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。

2举例说明相关关系和函数关系的差别?

答:(1)相关关系和函数关系的内涵

①相关关系

变量之间存在的不确定的数量关系,称为相关关系。相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。对这种关系不确定的变量显然不能用函数关系进行描述,但也不是无任何规律可循。通过对大量数据的观察与研究,就会发现许多变量之间确实存在着一定的客观规律。例如子女的身高与其父母的身高,一个人的收入水平与其受教育程度,农作物的单位面积产量与施肥量等都存在相关关系。

②函数关系

设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量。所以,函数关系是一一对应的确定关系。

(2)相关关系和函数关系的区别

①函数关系指变量之间的关系是确定的;而相关关系的两变量的关系则是不确定的,可以在一定范围内变动。

②函数关系变量之间的依存可以用一定的方程y=f(x)表现出来,可以给定自变量来推算因变量;而相关关系则不能用一定的方程表示。函数关系是相关关系的特例,即函数关系是完全的相关关系,相关关系是不完全的相关关系。

(3)举例

y2=x,x与y之间是相关关系,但不是函数关系。因为,当x=1时,y=±1,

对于x的取值,变量y存在两个值与其对应,不满足函数的定义,但y的取值会受x的影响,即x与y之间确实存在关系。

3简述中心极限定理及意义。

答:(1)中心极限定理

从任意一个均值为μ、方差为σ2的总体中随机抽取一个样本容量为n的样本,当样本量n足够大时,样本均值x(_)近似服从均值为μ、方差为σ2/n的正态分布。

(2)中心极限定理的意义

中心极限定理为数理统计在统计学中的应用铺平了道路。用样本推断总体的关键在于掌握样本特征值的抽样分布,而中心极限定理表明:只要样本容量足够地大,那么未知总体的样本特征值就近似服从正态分布。从而,只要采用大量观察法获得足够多的随机样本数据,几乎就可以把数理统计的全部处理问题的方法应用于统计学,这从另一个方面也间接地开辟了统计学的方法领域,其在现代推断统计学方法论中居于主导地位。

4在假设检验中如何使用P值?

答:P值是一种在原假设为真的前提下出现观察样本以及更极端情况的概率,即检验统计量的值超过或者小于(还要依照分布的不同、单侧检验、双侧检验的差异而定)由样本所计算出的检验统计量的数值的概率。

在假设检验中,运用P值法作决策时,如果P值小于α,也就是说,原假设对应的为小概率事件,根据上述的“小概率原理”,就可以否定原假设,而接受对应的备择假设;如果P值大于α,就不能否定原假设。

5简述一元回归模型的基本假设。

答:(1)一元线性回归模型的概念

对于具有线性关系的两个变量,可以用一个线性方程来表示它们之间的关系。描述因变量y如何依赖于自变量x和误差项ε的方程称为回归模型。

只涉及一个自变量的一元线性回归模型,可表示为:y=β0+β1x+ε。

(2)一元线性回归模型的主要假设

①因变量y与自变量x之间具有线性关系;

②在重复抽样中,自变量x的取值是固定的,即假定x是非随机的;

③误差项ε是一个期望值为0的随机变量,即E(ε)=0;

④对于所有的x值,ε的方差σ2都相同;

⑤误差项ε是一个服从正态分布的随机变量,且独立,即ε~N(0,σ2)。

6举例说明非平稳时间序列的特点。

答:非平稳时间序列,是指包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。其又可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。非平稳时间序列的特点有:

(1)时间序列的均值不为常数;

(2)时间序列的方差不为常数;

(3)自协方差函数与起点相关。

典型的非平稳时间序列:随机游走序列yt=yt-1+ut,式中为白噪声。

yt的方差为:

表明yt的方差随时间的变化而变化,即随机游走序列是非平稳序列。

五、计算题(每小题6分,共30分)

特别说明:Z0.05=1.645,Z0.025=1.96,t0.05(24)=1.71

1.如果投资项目A的预期回报率为8%,标准差为5%;而投资项目B的预期回报率为12%,标准差为7%,如何帮助投资者作出选择?

解:由题可得:E(XA)=8%,σA=5%;E(XB)=12%,σB=7%。

计算标准差系数得:

VA=σA/E(XA)=5%÷8%=0.625

VB=σB/E(XB)=7%÷12%=0.583

因为,VA>VB,即项目B的投资风险小于项目A,且项目B的预期回报率高于项目A,所以,投资者应该选择投资项目B。

2设随机变量X和Y的方差分别为0.09和0.25,相关系数为-0.85,求3X-2Y的方差。

解:由题可知,D(X)=0.09,D(Y)=0.25,ρXY=-0.85。则

D(3X-2Y)=32D(X)+22D(Y)-2×3×2Cov(X,Y)=3.34

3工厂生产的某种设备的寿命X(以年计)服从指数分布,概率密度函数为

为确保消费者的利益,工厂规定出售的设备若在一年内损坏可以调换。若售出一台设备,工厂获利100元,而调换一台则损失200元,计算工厂出售一台设备获利的数学期望。

解:设工厂出售一台设备获得的利润为Y元。

由题可知,调换一台设备的概率为:

出售一台设备的概率为:

则工厂出售一台设备获利的数学期望为:

4一家研究机构拟评估在校大学生每月网购的平均花费,为此随机抽取25名在校大学生进行调查,得到样本均值为160元,标准差为50元。假定在校大学生每月网购的花费服从正态分布,求平均花费的90%的置信区间。

解:由题可知,n=25,x(_)=160(元),s=50(元)。

由于总体方差未知,且为小样本,则平均花费的90%的置信水平下的置信区间为:

即平均花费的90%的置信水平下的置信区间为(142.9,177.1)。

5某厂生产需用玻璃纸做包装,按规定,供应商供应的玻璃纸横向延伸率不应低于65。从近期来货中抽查了100个样品,测得样本均值为63.5,标准差为5.5。回答:

(1)在0.05的显著性水平下能否接收这批玻璃纸,并分析检验中会犯哪类错误。

(2)抽查的100个样品的样本均值为多少时可以接收这批玻璃纸,此时可能犯的错误属于哪种类型?

解:(1)①设供应商供应的玻璃纸的平均横向延伸率为μ。

建立假设:H0:μ≥65;H1:μ<65。

构建检验统计量:

因为,x(_)=63.5,s=5.5,n=100,μ0=65;

所以

则z<-z0.05=-1.645,拒绝原假设,即认为供应商供应的玻璃纸横向延伸率低于65,故不能接收这批玻璃纸。

②以上检验中会犯第Ⅰ类错误,拒绝了本来是正确的原假设。即供应商供应的玻璃纸横向延伸率本来是不低于65的,但是在该特定样本和显著性水平下假设检验认为供应商供应的玻璃纸横向延伸率低于65。

(2)根据(1)可知,要想接收这批玻璃纸,则必须:

解得,x(_)≥64.1。即当样本均值x(_)≥64.1时,可以接收这批玻璃纸。

此时可能犯第Ⅱ类错误,接受了本来是错误的原假设。即供应商供应的玻璃纸横向延伸率本来低于65,但是在该特定样本和显著性水平下假设检验没有拒绝原假设,导致这批玻璃纸被接收。

六、综合题(每小题10分,共30分)

1

(1)小王到一家工厂应聘工人,这家工厂共15人,由厂长、5个领工和9个工人组成,应聘时厂长向小王介绍说这家工厂的平均工资是每月5240元。小王认为薪水比较丰厚就接受了这个工作,但工作了一段时间后要求见厂长,发生了下面一段对话:

小王:“你欺骗我,我已经问过其他工人了,没有一个人的工资超过5240元,平均工资怎么可能是5240元呢?”

这时,厂长拿出一张工资表来向小王解释说:“我每月工资13000元,5个领工每人每月工资7000元,你来之前有9个工人,每人每月工资3400元”。

请问厂长是否欺骗了小王?为什么厂里大多数人拿到的工资都低于全厂(不包括小王)的平均工资?这种情况下用什么来描述工资水平比较合适?(5分)

发表评论

|京ICP备18012533号-223