北京交通大学经济管理学院《432统计学》[专业硕士]历年考研真题及详解.pdf
《北京交通大学经济管理学院《432统计学》[专业硕士]历年考研真题及详解.pdf》由会员分享,可在线阅读,更多相关《北京交通大学经济管理学院《432统计学》[专业硕士]历年考研真题及详解.pdf(98页珍藏版)》请在咨信网上搜索。
1、目录2011年北京交通大学经济管理学院432统计学专业硕士考研真题2011年北京交通大学经济管理学院432统计学专业硕士考研真题及详解2012年北京交通大学经济管理学院432统计学专业硕士考研真题2012年北京交通大学经济管理学院432统计学专业硕士考研真题及详解2013年北京交通大学经济管理学院432统计学专业硕士考研真题2013年北京交通大学经济管理学院432统计学专业硕士考研真题及详解2014年北京交通大学经济管理学院432统计学专业硕士考研真题2014年北京交通大学经济管理学院432统计学专业硕士考研真题及详解2015年北京交通大学经济管理学院432统计学专业硕士考研真题2015年北京
2、交通大学经济管理学院432统计学专业硕士考研真题及详解2011年北京交通大学经济管理学院432统计学专业硕士考研真题2011年北京交通大学经济管理学院432统计学专业硕士考研真题及详解一、简要回答下列问题1举例说明区分数据类型对统计分析的重要性。统计数据是对现象进行测量的结果。区分数据的类型对统计分析很重要,因为对不同类型的数据,需要采用不同的统计方法来处理和分析。比如,对分类数据,通常需要计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和检验等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和
3、假设检验等。如果不对数据进行区分,则会导致统计方法的滥用,使得得出的结论缺乏可靠性。22008年12月,据美国媒体报道:“本国12月新房中位价为20.65万美元,相比2007年12月的22.77万美元下滑了9.3%”,为什么采用中位数而不采用算数平均值?试应用描述统计学知识解释其中的缘由。答:中位数是一组数据排序后处于中间位置上的变量值,中位数将全部数据等分成两部分,每部分包含50%的数据,一部分数据比中位数大,另一部分则比中位数小。中位数主要用于测度顺序数据的集中趋势,也适用于测度数值型数据的集中趋势,但不适用于分类数据。平均数也称为均值,它是一组数据相加后除以数据的个数得到的结果。平均数在
4、统计学中具有重要的地位,是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。题干中关于测度新房集中趋势的指标,由于房屋价格的分布是正偏分布,存在很大的极大值,而算术平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。相反,中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,其作为集中趋势测度的代表性较好。因此选用房价中位数作为房价分布集中趋势的代表值。3一家连锁超市,近期不断接到消费者关于500克包装的某产品薯片重量的投诉。店方猜想,这些投诉是由于运输过程中沉积在口袋底部的碎片所引起。为此店方决定对来
5、自该品牌的下一批薯片的平均重量(克)进行检验,如果有证据说明重量小于500克,就拒收这批薯片并向供应商进行投诉。请建立适当的原假设和备择假设,使得一旦拒绝原假设就拒收这批薯片并向供应商进行投诉;第类错误和第类错误是什么?连锁超市的顾客将哪类错误看的较严重?连锁超市的供应商将哪类错误看的较严重?答:(1)原假设:薯片的平均重量不低于500克;备择假设:薯片的平均重量低于500克。(2)第类错误是指原假设为真时拒绝原假设所犯的错误,本题中指薯片的平均重量是大于500克的,但是由样本所得结果是拒绝原假设,即认为薯片的平均重量低于500克。第类错误是指原假设为假而接受原假设所犯的错误,本题中是指薯片的
6、平均重量是小于500克的,但是由抽取样本所得结果是接受了原假设,认为薯片的平均重量不低于500克。(3)连锁超市的顾客将第类错误看得比较严重,因为犯第类错误的概率偏大,会使得顾客受到的损失较大。(4)连锁超市的供应商将第类错误看得比较严重,因为犯第类错误的概率偏大,会导致供应商受到的损失较大。4数据的误差有哪两类,它们的本质差别是什么?答:(1)数据误差的类型数据的误差是指通过调查搜集到的数据与研究对象真实结果之间的差异。数据的误差有两类:抽样误差和非抽样误差。抽样误差抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差。在概率抽样中,我们依据随机原则抽取样本,可能抽中由这样一些单位组成
7、的样本,也可能抽中由另外一些单位组成的样本。根据不同的样本,可以得到不同的观测结果。抽样误差并不是针对某个具体样本的检测结果与总体真实结果的差异而言的,抽样误差描述的是所有样本可能的结果与总体真值之间的平均差异。抽样误差的大小与样本容量、总体的变异性等因素有关。非抽样误差非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由其他原因引起的样本观察结果与总体真值之间的差异。抽样误差是一种随机性误差,只是存在于概率抽样中;非抽样误差则不同,无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。非抽样误差包括有抽样框误差、回答误差、无回答误差、调查员误差、测量误差等。(2)两种误差
8、的本质差别抽样误差与非抽样误差最根本的差别是抽样误差是可以计算和控制的,且其只存在于概率抽样中。而非抽样误差控制的重要方面是调查过程的质量控制。5“截至2010年8月,京津城际高铁进行两年,已经累计放松4328万人次,武广高铁9个月时间完成客运输送1331万人次,沪宁线进行两个月,发送旅客1071万人次”,人们对这样的数据描述并无多少概念,如何更好的量化它们,一遍使人们印象深刻?答:文中给出了三条高铁各自开通以来的客运数量,由于运行年限的不同,使得无法直接做出对三条高铁客运繁忙程度的直接比较与评价,而只能观察其总量特征。若以各高铁客运总量除以其各自的运营时间,则可得到其单位时间的发送量,便可以
9、对但这之间客运量的差异做出直接比较。如果利用图形来显示单位时间内客运量的频数分布,就可以使得人们更加形象和直观地度量数据的集中趋势,也便于人们对不同的数据进行比较,观察差别。二、计算回答下列问题12008年,某地区工业总产值按当年价格计算为42.55亿元,2007为33.27亿元,其增长速度为多少?按2000年不变价格计算,2008年,该地区工业总产值为33.61亿元,2007年为28.50亿元,其增长速度是多少?你认为哪种方法计算出来的增长速度更可信?利用指数等知识,请给出合理的解释。请解释不变价格指数的概念。答:(1)由题意其增长速度为:即2008年相对于2007年,工业总产值的增长速度为
10、27.89%。(2)以不变价格计算的增长速度为:即按2000年不变的价格计算,2008年相对于2007年,工业总产值的增长速度为17.93%。(3)第二种方法计算的增长速度更可信,因为按照第一种方法计算出来的增长速度中包含有通货膨胀的影响,而第二种计算方法采用不变价格计算增长速度则剔除了通货膨胀的影响,相比较而言更能反映工业总产值增长速度。(4)不变价格又称“可比价格”或“固定价格”,与“现行价格”(当年价格)相对应。不变价格指数是指计划统计工作中用来计算一定时期内不同年份的商品价值指标而规定使用的某一固定期的价格。旨在消除价格变动的影响,便于比较各年之间的经济增长速度。2研究美国1780年到
11、1970年之间人口变化情况(人口单位:百万)。虽然影响人口变化的因素很多,但这里只选定时间作为其解释变量进行了回归分析,结果如下:若将时间变量的二次项引入回归模型,则结果如下:试分别说明两个模型检验效果,并分析哪种模型的效果更好,给出理由。答:通过对比两个模型的回归结果可得,将时间变量的二次项引入回归模型后,模型回归效果更好。(如下所述将时间变量的一次项的回归模型称为模型1,将引入时间变量二次项的回归模型称为模型2。)理由如下:(1)模型拟合程度的分析模型1中的模型2中的比较可知,模型2中的可决系数和调整之后的可决系数均大于模型1中相应的值可知模型2比模型1的拟合效果要好。(2)回归系数的分析
12、模型1和模型2中的各系数均通过t统计量的显著性检验。相比较而言,模型2中各系数的t统计量的值远远大于其临界值,故模型2比模型1的拟合效果应该更好。综上所述,人口变化与时间应该是曲线关系而不是简单的线性关系。三、综合题1有些预定了宾馆客房而没有去住宿的旅客,若不能及时取消预订,这样的客人就被称为“未出现者”,宾馆一般采用超员预订客房的方法,防止未出现者过多给宾馆造成的损失。有一拥有4000个客房的大型连锁宾馆正在进行这方面的研究,它们抽取30天的随机样本,记录其每一天的未出现者人数,频数分布如下:根据这一样本,运用经验法则,宾馆至少应超员预订多少客房?旅游年鉴的数据显示,宾馆业每天的未出现者人数
13、连续3年均稳定在20人这一平均水平。请问上述样本能否说明宾馆业每天的未出现者人数明显降低了?答:(1)根据上述样本,可计算出每天未出现人数的平均值为:每天未出现人数的样本方差为:其中Mi是第i组的组中值,fi是对应的频数。根据经验法则,约有99%的数据在平均数3个标准差的范围之内,即宾馆每天未到人数在(6.04,22.9)之间的人数包含了99%。即宾馆至少应超员预定7个客房。(2)对样本数据进行假设检验如下:提出假设原假设:宾馆业每天的未出现者人数未明显降低;备择假设:宾馆业每天的未出现者人数明显降低。计算统计量作出决策由于,故拒绝原假设,即宾馆业每天的未出现者人数明显降低。2估计成本是回归分
14、析在会计学上的一个重要应用。根据搜集到的产量和成本数据,利用最小二乘法可以求出关于成本和产量估计的回归方程。下面的Excel结果是给予某一制造业的产量(单位:台)和总成本(单位:万元)计算得到的。将方差分析表和参数估计表中的7个缺失值补齐;写出总成本与产量的估计一元线性回归方程式,并解释回归系数的含义;检验回归方程的线性关系是否显著(c0.05);计算判定系数R2,它有什么用途?计算估计标准误差se,它有什么用途?公司的生产计划进度表明,下个月必须生产60台产品,下个月总成本的点估计值是多少?不用计算,对下个月总成本的95%的置信区间和预期区间做简单说明。答:(1)由题意得:SSA3695.5
15、0,SST4046.97,k2,n129可得出:SSESSTSSA4046.973695.50351.47,而由此可得方差分析表如下:(2)由表中数据可得回归方程为:回归系数表示产量为0时的成本为12.677万元;回归系数表示产量每增加1台,成本平均增加0.731万元。(3)由方差分析表知:故拒绝原假设,即回归方程是显著的。(4)由题意知可决系数为:表示回归方程中,成本的变化有91.32%是由于产量的变化引起的。(5)由题意知估计的标准误差为:估计的标准误差反映了用估计的回归方程预测因变量y时预测误差的大小。(6)将60代入估计的回归方程可得:即下个月生产60台产品时,成本的点估计为56.54
16、万元。(7)回归估计的置信区间为:回归估计的预测区间为:比较两个公式可知,预测区间的宽度比置信区间的宽度要宽。3一家电器商店经营已有5年之久,在这期间,iPod touch的销售量(单位:千台)持续上升,见下表数据:下图为销售量的时间序列图。“可以看出,销售量有明显的季节成分,并且后面年份的销售量比前面年份的高,因此其中还有趋势成分,但周期性难以判断。可以认定iPodtouch销售量序列是一个含有季节成分和趋势成分的时间序列。”请结合复合型时间序列的分解、预测模型,分析、评述上面这段话的合理性。上表中,中心化移动平均值和比值两列共有6出空格,请计算补充这6个数据。用移动平均将趋势剔除之后的序列
17、(比值列),计算销售量的季节指数(要求列出必要的表格)。从销售量数据中剔除季节成分后,用一元线性模型求得销售量的线性长期趋势方程为:,用此趋势方程并考虑季节变动,预测2010年四个季度iPod touch销售量。(要求有计算过程)答:(1)复合型序列是指含有趋势、季节、周期和随机成分的序列。对这类序列的预测方法通常是将时间序列的各个因素依次分解出来,然后进行预测。结合复合型时间序列可知,上面这段话对iPod touch的预测是合理的。(2)由题意得表中数据计算如下:(3)由题意得各季节指数计算表如下:(4)预测2010年四个季度的销售量,将t2124分别代入趋势方程,得:考虑季节变动,2010
18、年四个季度的预测值分别为:19970 1.12222(千台)20890 0.55011(千台)21810 0.78917(千台)22730 1.54135(千台)即2010第一个季度的iPod touch的销售量为22千台;第二个季度的iPodtouch的销售量为11千台;第三个季度的iPod touch的销售量为17千台;第四个季度的iPod touch的销售量为35千台。2012年北京交通大学经济管理学院432统计学专业硕士考研真题2012年北京交通大学经济管理学院432统计学专业硕士考研真题及详解一、简要回答下列问题(本题共包括5个小题,每小题8分,共40分)1对于大多数工厂来说,按时获
19、得原材料和货物供给时很重要的。因此对大多数的采购代理商来说,交货时间的变异程度往往是选择供应商的最主要考虑因素。数据的变异程度如何反应?就选择供应商而言,你能给采购代理人怎样的建议?答:数据的变异程度是指各变量值偏离其中心值的程度。数据的变异程度越大,其集中趋势对该组数据的代表性就越差。反映数据变异程度是根据数据的不同类型采取不同的测度值,主要有:四分位差、方差和标准差等。方差、标准差、四分位差的数值越大,则样本的变异程度越大。在选择供应商的时候,采购人应该计算分析供应商的交货时间的平均数和标准差,如果供应商交货时间的标准差较大说明交货时间的变异程度很大,采购代理人选择应该谨慎。2一个班级进行
20、了期中考试,其中5名学生的分数为:72、66、81、89、77。试分析下面的说法哪个正确,哪个应受到怀疑?(注:只做简单计算。如样本均值,但不用计算样本标准差)作为样本的5名学生的期中平均分时77;全班学生的期中平均分时77;全班学生的期中平均分的估计是77;班级中一半以上得分将在785之间;如果样本中再加上5名学生,他们的分数会在6590之间。答:以上说法中第、种说法是正确的。由样本数据可以计算样本中的5名学生的平均分数是77分,因此是正确的;仅仅由5个样本的平均值就能得出全班学生的平均成绩,样本缺乏对总体的代表性;77分是全班学生的平均成绩的估计值;由于抽选的样本数量较少,仅仅由样本数据中
21、有一半以上的学生成绩在7085就推断全班学生有一半以上的学生成绩在7085,这种推断是不可靠的;样本中再加5名学生,他们的成绩不一定在6590之间,因为可能存在有极端值的情况。3容量为1000毫升的桃汁包装上的标签标明,该种桃汁的脂肪含量的均值不超过1克。回答下列问题以验证标签上的说明。建立原假设和备择假设;这时第类错误指什么?发生这类错误会导致怎样的后果?这时第类错误指什么?发生这类错误会导致怎样的后果?答:(1)原假设:该种桃汁的脂肪含量的均值不超过1克;备择假设:该种桃汁的脂肪含量超过1克。(2)第类错误是指原假设为真时,拒绝原假设的情况。本题中,第类错误是指桃汁的脂肪含量是不超过1克,
22、但是假设检验的结果却是拒绝了原假设。发生这类错误将会导致由于报告了本来不存在的现象,则因此现象而衍生出的后续研究、应用的危害。(3)假设检验的第类错误是指原假设为假,但是没有拒绝原假设。本题中的第类错误是该种桃汁的脂肪含量超过1克,但是假设检验得出的结论是不拒绝原假设。犯取伪错误,使得本应该被推翻的假设仍然被保留,不利于研究的发展。4一元线性回归中,一个大的R2意味着两个变量之间存在因果关系吗?试解释。答:判定系数R2测度了回归直线对观测数据的拟合程度。一个大的R2并不意味着两个变量之间存在因果关系,大的R2只能表示在线性回归模型中回归平方和占总平方和的比例越大,回归直线与各观测点越接近,因变
23、量的变化中能用自变量解释的比例比较大,反映模型的拟合程度较好。若自变量和因变量之间存在很强的相关关系,而不是因果关系的话,此时的R2也非常大。5一个小店的经营者想对未来几个月的小店的销售额做预测。它提供了自2007年一月开店以来各月的销售额。请你给他一些预测程序上的提示。答:时间序列分析的一个主要目的就是根据已有的历史数据对未来进行预测。时间序列含有不同的成分,如趋势、季节性、周期性和随机性等。对于一个具体的时间序列,它可能只含有一种成分,也可能同时含有几种成分。含有不同成分的时间序列所用的预测方法是不同的。因此,经营者在对时间序列进行预测时可以,通常包括以下几个步骤:确定时间序列所包含的成分
24、,也就是确定时间序列的类型;找出适合此类时间序列的预测方法;对可能的预测方法进行评估,以确定最佳预测方案;利用最佳预测方案进行预测。二、推断题(本题包括1个小题,共15分)试推导出一元线性回归分析中总平方和与回归平方和、残差平方和的关系。答:一元线性回归分析中,每个观测点的离差都可以分解为:将上述式子的两边同时平方,并对所有的n个点求和,可得:又根据ei的性质因此其中:即,总平方和(SST)回归平方和(SSR)残差平方和(SSE)。三、综合题(本题共包括5个小题,共95分)1历史数据标明,考入西部大学的学生入学时学术考试成绩的均值为900,标准差为160。每年选取一个实际样本来检测该年的考试成
25、绩是否与上一年在同一水平。今年有256名学生组成的样本表明分数的样本均值为930。回答下列问题(显著性水平取0.05)建立原假设和备择假设;用置信区间的方法进行假设检验;用检验统计量进行假设检验;检验的p值是多少?(10分)答:(1)建立假设如下:原假设:该年考试成绩与上一年在同一水平;备择假设:该年考试成绩与上一年有差别。(2)由样本可得参数置信水平为10.95的置信区间为:考虑检验问题:,由于,故拒绝原假设,即该年考试成绩与上一年不在同一水平。(3)计算统计量,由于总体标准差已知,因此选择Z统计量,计算如下:又因为,故拒绝原假设,即该年考试成绩与上一年不在同一水平。(4)2企业管理者管理能
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 考研历年真题
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【雁**】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【雁**】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。