医学统计学中参数的含义 统计学常考的名词解释和简答有哪些

seosqwseo3周前 (04-16)测评日记12

一、医学统计中,如何定义达到预设终点

通过符合医学科研项目的管理方式,以期达到预设研究科目终获得所需计量、计数资料,以及非参数和多元分析方法满足医学科研需求的研究终点。

这是个医学统计学中比较常见的用于临床试验研究的统计值,细分为:终点设计常讲主要终点(primary endpoint)和次要终点(secondary endpoint),实际上就是要设计者根据研究目的确定主要(次要)结局指标(测量/变量)。

1、主要终点的含义:

能够预测(疾病)临床结局的指标称之为主要终点,比如脑梗死临床验试验的主要终点是致残率、死亡率。

2、次要终点的含义:

次要终点是神经功能缺损程度积分。虽然主要终点可以更好地评价干预措施的临床效果,但由于其需要的观察时间较长,耗费也较大,故临床研究通常使用次要终点而不是主要终点。前提是:预设,就此而言,想达到什么样的研究目的,就要体现在预设终点里,是观察有效性还是判断受益率,或者正向终点,或者负向终点。通过对研究方向的设定,在研究过程中质控和有效比对组的选取,以及实践研究中*作环节的跟踪把控,对相关几率的必要统计手段,都是能够达到预设终点的有效途径。其目的使大家具备新的推理思维,结合专业问题合理设计试验,科学获取资料,提高科研素质。

二、统计学常考的名词解释和简答有哪些

1、统计学:是运用数理统计的基本原理和方法研究预防医学和卫生事业管理中资料的收集,整理和分析的一门应用科学。具体地讲,是按照设计方案去收集、整理、分析数据,并对数据结果进行解释,从而做出比较正确的结论。

2、总体:是根据研究目的确定同质的所有观察单位某种变量的**。

3、变异:同一性质的事物,其观察值(变量值)之间的差异。

4、抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,用样本指标推论总体,终达到了解总体的目的。这种用样本指标推论总体参数的方法称为抽样研究。

5、统计描述:用统计图表或计算统计指标的方法表达一个特定群体的某种现象或特征。

6、统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断,常用方法是参数估计和假设检验。

7、概率:是指某**出现可能性大小的度量,以符号P表示。

8、医学参考值范围:参考值范围又称正常值范围。医学上常把包括绝大多数人某项指标的数值范围称为该指标的参考值范围。

9、正态分布规律:实际工作中,经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数,用以估计该区间的观察例数占总例数的百分数,或变量值落在该区间的频数或概率。

10、可比性:是指对研究结果有影响的非处理因素在各处理组之间尽可能相同或相近。

11、动态数列:是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。

12、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异。

13、标准误:表示样本均数间变异程度。

14、率的抽样误差:抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。

15、参数估计:是指用样本指标(称为统计量)估计总体指标(称为参数)。

16、可信区间:总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率(如95%或99%)包含总体参数。

17、I型错误:拒绝了实际撒谎能够成立的H0,这类“弃真”的错误称为I型错误。

18、II型错误:接受了实际撒谎能够不成立的H0,这类“存伪”的错误称为II型错误。

19、检验效能:1-b称为检验效能又称为把握度。它的含义是:当两总体确实有差别时,按规定的检验水准a,能够发现两总体间差别的能力。

20、四格表资料:两个样本率的资料又称为四格表资料,在四格表资料中两个样本的实际发生频数和实际未发生频数为基本数据,其他数据均可由这四个基本数据推算出来。

21、列联表资料:对同一样本资料按其两个无序分类变量(行变量和列变量)归纳成双向交叉排列的统计表,其行变量可分为R类,列变量可分为C类,这种表称为R*C列联表。

22、参数检验:是一种要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行统计推断的假设检验。

23、非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。

24、秩次:即通常意义上的序号,实际上就是将观察值按顺序由小到大排列,并用序号代替了变量值本身。

25、直线相关系数:它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的统计指标。相关系数没有单位,取值范围是-1〈=r〈=1,r的绝对值越大表明两变量的关系越密切。

26、完全负相关:这是一种极为特殊的负相关关系,从散点图上可以看出,由x与y构成的散点完全分布在一条直线上,x增加,y相应减少,算得的相关系数r=-1。

27、正相关:它是说明具有直线关系的两个变量间,存在有正的相关方向,即当x增加时,y有相应增大的趋势,所算得的相关系数r为正值。

28、等级相关:是对等级数据作相关分析,它又称为秩相关,是一种非参数统计方法。

29、评价:是通过对某些标准来判断观测结果,并赋予这种结果以一定的意义和价值的过程。

30、综合评价:是指人们根据不同的评价目的,选择相应的评价形式,据此选择多个因素或指标,并通过一定的数学模型,将多个评价因素或指标转化为能反映评价对象总体特征的信息。

31、优序法:为了比较某几个事物或方案的优劣,在选定各项评价指标后,将待评价的对象或方案就各项评价指标的测量值大小分别排列,并分别对各序号(等级)以相应的评分值即优序数,然后综合诸评价指标,分别计算评价对象的总赋优序数,并按总赋优序大小评定其优顺序的方法即优序法。

32、Topsis:Topsis法常用于系统工程中有限方案多目标决策分析,此外,也可用于效益评价、卫生决策和卫生事业管理等多领域。

33、根本死因:WHO规定,根本死因是指:“(a)引起直接导致死亡的一系列病态**的那些疾病或损伤,或者(b)造成致命损伤的事故或暴力的情况。”

34、卫生服务需要:是指人们因疾病影响健康,引起**正常活动的障碍,实际应当接受各种卫生服务的需要(如预防保健、治疗、康复)。

35、卫生服务调查统计:是卫生统计的主要内容之一,卫生服务调查统计是从卫生服务资料的设计、收集、整理、分析的角度,来阐述卫生服务研究的特点、研究方法和注意事项,以便使卫生服务研究服务更具有科学性。

36、卫生服务调查:是指对卫生服务状况、人群健康的危险因素、人群卫生服务的需求和利用、卫生服务资源的分配和利用所进行的一种社会调查。

37、统计表:是以表格的形式列出统计指标,它是对资料进行统计描述时的一种常用手段。

38、统计图:是以各种几何图形(如点、线、面或立体)显示数据的大小、升降、分布以及关系等,它也是对资料进行统计描述时的一种常用手段。

39、均数的抽样误差:统计学上,对于抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差。

统计学概述

统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。

统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。

[编辑本段]统计学的发展历程

统计学的英文statistics早是源于现代拉丁文statisticum collegium(国会)以及意大利文 statista(国民或**家)。德文Statistik,早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。

统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“**算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。

统计学的发展过程的三个阶段

第一阶段称之为“城邦政情”(Matters of state)阶段

“城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口,资源和财富等社会和经济情况的比较,分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“**算数”这个名词所替代,并且很快被演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根。

第二阶段称之为“**算数”(Politcal arthmetic)阶段

与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。

“**算数”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。

1690年英国威廉·配弟出版(**算数)一书作为这个阶段的起始标志.

威廉·配弟用数字,重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉?配弟的(**算数)被后来的学者评价为近代统计学的来源,威廉?配弟本人也被评价为近代统计学之父。

配弟在书中使用的数字有三类:

第一类是对社会经济现象进行统计调查和经验观察得到的数字.因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多;

第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种:

“(1)以已知数或已知量为基础,循著某种具体关系进行推算的方法;

(2)通过运用数字的理论性推理来进行推算的方法;

(3)以平均数为基础进行推算的方法”;

第三类是为了进行理论性推理而采用的例示性的数字.配弟把这种运用数字和符号进行的推理称之为“代数的算法”。从配弟使用数据的方法看,“**算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。

第三阶段称之为“统计分析科学”(Science of statistical ****ysis)阶段

在“**算数”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。

十九世纪末,欧洲大学开设的“国情纪要”或“**算数”等课程名称逐渐消失,代之而起的是“统计分析科学”课程.当时的“统计分析科学”课程的内容仍然是分析研究社会经济问题。

“统计分析科学”课程的出现是现代统计发展阶段的开端. 1908年,“学生”氏(William Sleey Gosset的笔名Student)发表了关于t分布的论文,这是一篇在统计学发展史上划时代的文章。它创立了小样本代替大样本的方法,开创了统计学的新纪元。

现代统计学的代表人物首推比利时统计学家奎特莱(Adolphe Quelet),他将统计分析科学广泛应用于社会科学,自然科学和工程技术科学领域,因为他深信统计学是可以用于研究任何科学的一般研究方法.

现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和小平方法则。于是,现代统计方法便有了比较坚实的理论基础。

[编辑本段]统计学历史中的学派

一、18-19世纪——统计学的创立和发展

德国的斯勒兹曾说过:“统计是动态的历史,历史是静态的统计。”可见统计学的产生与发展是和生产的发展、社会的进步紧密相联的。

(1)统计学的创立时期

统计学的萌芽产生在欧洲。17世纪中叶至18世纪中叶是统计学的创立时期。在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和**算术学派。

1、国势学派

国势学派又称记述学派,产生于17世纪的德国。由于该学派主要以文字记述国家的显著事项,故称记述学派。其主要代表人物是海尔曼·康令和阿亨华尔。康令第一个在德国黑尔姆斯太特大学以“国势学”为题讲授**活动家应具备的知识。阿亨华尔在格丁根大学开设“国家学”课程,其主要著作是《近代欧洲各国国势学纲要》,书中讲述“一国或多数国家的显著事项”,主要用对比分析的方法研究了解国家组织、领土、人口、资源财富和国情国力,比较了各国实力的强弱,为德国的君主政体服务。因在外文中“国势”与“统计”词义相通,后来正式命名为“统计学”。该学派在进行国势比较分析中,偏重事物性质的解释,而不注重数量对比和数量计算,但却为统计学的发展奠定了经济理论基础。但随着资本主义市场经济的发展,对事物量的计算和分析显得越来越重要,该学派后来发生了分裂,分化为图表学派和比较学派。

2、**算术学派

**算术学派产生于19世纪中叶的英国,创始人是威廉·配第(1623-1687),其代表作是他于1676年完成的《**算术》一书。这里的“**”是指**经济学,“算术”是指统计方法。在这部书中,他利用实际资料,运用数字、重量和尺度等统计方法对英国、法国和荷兰三国的国情国力,作了系统的数量对比分析,从而为统计学的形成和发展奠定了方**基础。因此马克思说:“威廉·佩第——**经济学之父,在某种程度上也是统计学的创始人。”

**算术学派的另一个代表人物是约翰·格朗特(1620-1674)。他以1604年伦敦教会每周一次发表的“死亡公报”为研究资料,在 1662年发表了《关于死亡公报的自然和**观察》的论著。书中分析了60年来伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,从而引起了普遍的关注。他的研究清楚地表明了统计学作为国家管理工具的重要作用。

(2)统计学的发展时期

18世纪末至19世纪末是统计学的发展时期。在这时期,各种学派的学术观点已经形成,并且形成了两主要学派,即数理统计学派和社会统计学派。

1、数理统计学派

在18世纪,由于概率理论日益成熟,为统计学的发展奠定了基础。19世纪中叶,把概率论引进统计学而形成数理学派。其奠基人是比利时的阿道夫·凯特勒(1796-1874),其主要著作有:《论人类》、《概率论书简》、《社会制度》和《社会物理学》等。他主张用研究自然科学的方法研究社会现象,正式把古典概率论引进统计学,使统计学进入一个新的发展阶段。由于历史的局限性,凯特勒在研究过程中混淆了自然现象和本质区别,对犯罪、道德等社会问题,用研究自然现象的观点和方法作出一些机械的、庸俗化的解释。但是,他把概率论引入统计学,使统计学在“**算术”所建立的“算术”方法的基础上,在准确化道路上大大跨进了一步,为数理统计学的形成与发展奠定了基础。

2、社会统计学派

社会统计学派产生于19世纪后半叶,创始人是德国经济学家、统计学家克尼斯(1821-1889),主要代表人物主要有恩格尔(1821- 1896)、梅尔(1841-1925)等人。他们融合了国势学派与**算术学派的观点,沿着凯特勒的“基本统计理论”向前发展,但在学科性质上认为统计学是一门社会科学,是研究社会现象变动原因和规律性的实质性科学,以此同数理统计学派通用方法相对立。社会统计学派在研究对象上认为统计学是研究体而不是个别现象,而且认为由于社会现象的复杂性和整体性,必须地总体进行大量观察和分析,研究其内在联系,才能揭示现象内在规律。这是社会统计学派的“实质性科学”的显著特点。

社会经济的发展,要求统计学提供更多的统计方法;社会科学本身也不断地向细分化和定量化发展,也要求统计学能提供更有效的调查整理、分析资料的方法。因此,社会统计学派也日益重视方**的研究,出现了从实质性方**转化的趋势。但是,社会统计学派仍然强调在统计研究中必须以事物的质为前提和认识事物质的重要性,这同数理统计学派的计量不计质的方**性质是有本质区别的。

二、20世纪——迅速发展的统计学

20世纪初以来,科学技术迅猛发展,社会发生了巨大变化,统计学进入了快速发展时期。归纳起来有以下几个方面。

1、由记述统计向推断统计发展。记述统计是对所搜集的大量数据资料进行加工整理、综合概括,通过图示、列表和数字,如编制次数分布表、绘制直方图、计算各种特征数等,对资料进行分析和描述。而推断统计,则是在搜集、整理观测的样本数据基础上,对有关总体作出推断。其特点是根据带随机性的观测样本数据以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。目前,西方国家所指的科学统计方法,主要就是指推断统计来说的。

2、由社会、经济统计向多分支学科发展。在20世纪以前,统计学的领域主要是人口统计、生命统计、社会统计和经济统计。随着社会、经济和科学技术的发展,到今天,统计的范畴已覆盖了社会生活的一切领域,几乎无所不包,成为通用的方**科学。它被广泛用于研究社会和自然界的各个方面,并发展成为有着许多分支学科的科学。

3、统计预测和决策科学的发展。传统的统计是对已经发生和正在发生的事物进行统计,提供统计资料和数据。20世纪30年代以来,特别是第二次世界大战以来,由于经济、社会、军事等方面的客观需要,统计预测和统计决策科学有了很大发展,使统计走出了传统的领域而被赋予新的意义和使命。

4、信息论、控制论、系统论与统计学的相互渗透和结合,使统计科学进一步得到发展和日趋完善。信息论、控制论、系统论在许多基本概念、基本思想、基本方法等方面有着共同之处,三者从不同角度、侧面提出了解决共同问题的方法和原则。三论的创立和发展,彻底改变了世界的科学图景和科学家的思维方式,也使统计科学和统计工作从中吸取了营养,拓宽了视野,丰富了内容,出现了新的发展趋势。

5、计算技术和一系列新技术、新方法在统计领域不断得到开发和应用。近几十年间,计算机技术不断发展,使统计数据的搜集、处理、分析、存贮、传递、印制等过程日益现代化,提高了统计工作的效能。计算机技术的发展,日益扩大了传统的和先进的统计技术的应用领域,促使统计科学和统计工作发生了革命性的变化。如今,计算机科学已经成为统计科学不可分割组成部分。随着科学技术的发展,统计理论和实践深度和广度方面也不断发展。

6.统计在现代化管理和社会生活中的地位日益重要。随着社会、经济和科学技术的发展,统计在现代化国家管理和企业管理中的地位,在社会生活中的地位,越来越重要了。人们的日常生活和一切社会生活都离不开统计。英国统计学家哈斯利特说:“统计方法的应用是这样普遍,在我们的生活和习惯中,统计的影响是这样巨大,以致统计的重要性无论怎样强调也不过分。”甚至有的科学有还把我们的时代叫做“统计时代”。显然,20世纪统计科学的发展及其未来,已经被赋予了划时代的意义。

[编辑本段]统计学现状

在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。今天的统计学已展现出强有力的生命力。在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求。随着我国社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘。

第一,对系统性及系统复杂性的认识为统计学的未来发展增加了新的思路。由于社会实践广度和深度迅速发展,以及科学技术的高度发展,人们对客观世界的系统性及系统的复杂性认识也更加全面和深入。随着科学融合趋势的兴起,统计学的研究触角已经向新的领域延伸,新兴起了探索性数据的统计方法的研究。研究的领域向复杂客观现象扩展。21世纪统计学研究的重点将由确定性现象和随机现象转移到对复杂现象的研究。如模糊现象、突变现象及混沌现象等新的领域。可以这样说,复杂现象的研究给统计开辟了新的研究领域。

第二,定性与定量相结合的综合集成法将为统计分析方法的发展提供新的思想。定性与定量相结合的综合集成方法是钱学森教授于1990年提出的。这一方法的实质就是将科学理论、经验知识和专家判断相结合,提出经验性的假设,再用经验数据和资料以及模型对它的确实性进行检测,经过定量计算及反复对比,后形成结论。它是研究复杂系统的有效手段,而且在问题的研究过程中处处渗透着统计思想,为统计分析方法的发展提供了新的思维方式。

第三,统计科学与其他科学渗透将为统计学的应用开辟新的领域。现代科学发展已经出现了整体化趋势,各门学科不断融合,已经形成一个相互联系的统一整体。由于事物之间具有的相互联系性,各学科之间研究方法的渗透和转移已成为现代科学发展的一大趋势。许多学科取得的新的进展为其他学科发展提供了全新的发展机遇。模糊论、突变论及其他新的边缘学科的出现为统计学的进一步发展提供了新的科学方法和思想。将一些尖端科学成果引入统计学,使统计学与其交互发展将成为未来统计学发展的趋势。统计学也将会有一个令人振奋的前景。今天已经有一些先驱者开始将控制论、信息论、系统论以及图论、混沌理论、模糊理论等方法和理论引入统计学,这些新的理论和方法的渗透必将会给统计学的发展产生深远的影响。

统计学产生于应用,在应用过程中发展壮大。随着经济社会的发展、各学科相互融合趋势的发展和计算机技术的迅速发展,统计学的应用领域、统计理论与分析方法也将不断发展,在所有领域展现它的生命力和重要作用。

[编辑本段]学科分支

一些学科大量地利用了应用统计学,以至它们自己已经各自独立成为一门学科。

三、数据分析中要注意的统计学问题

一、均值的计算

在处理数据时,经常会遇到对相同采样或相同实验条件下同一随机变量的多个不同取值进行统计处理的问题。此时,往往我们会不假思索地直接给出算术平均值和标准差。显然,这种做法是不严谨的。

这是因为作为描述随机变量总体大小特征的统计量有算术平均值、几何平均值和中位数等多个。至于该采用哪种均值,不能根据主观意愿随意确定,而要根据随机变量的分布特征确定。

反映随机变量总体大小特征的统计量是数学期望,而在随机变量的分布服从正态分布时,其数学期望就是其算术平均值。此时,可用算术平均值描述随机变量的大小特征;如果所研究的随机变量不服从正态分布,则算术平均值不能准确反映该变量的大小特征。在这种情况下,可通过假设检验来判断随机变量是否服从对数正态分布。如果服从对数正态分布,则几何平均值就是数学期望的值。此时,就可以计算变量的几何平均值;如果随机变量既不服从正态分布也不服从对数正态分布,则按现有的数理统计学知识,尚无合适的统计量描述该变量的大小特征。此时,可用中位数来描述变量的大小特征。

因此,我们不能在处理数据的时候一律采用算术平均值,而是要视数据的分布情况而定。

二、直线相关与回归分析

这两种分析,说明的问题是不同的,既相互又联系。在做实际分析的时候,应先做变量的散点图,确认由线性趋势后再进行统计分析。一般先做相关分析,只有在相关分析有统计学意义的前提下,求回归方程才有实际意义。一般来讲,有这么两个问题值得注意:

一定要把回归和相关的概念搞清楚,要做回归分析时,不需要报告相关系数;做相关分析的时候,不需要计算回归方程。

相关分析中,只有对相关系数进行统计检验(如t检验),P<0.05时,才能一依据r值的大小来说明两个变量的相关程度。必须注意的是,不能将相关系数的假设检验误认为是相关程度的大小。举个例子:当样本数量很小,即使r值较大(如3对数据,r=0.9),也可能得出P>0.05这种无统计学意义的结论;而当样本量很大,如500,即使r=0.1,也会有P<0.05的结果,但这种相关却不具有实际意义。因此,要表明相关性,除了要写出r值外,还应该注明假设检验的P值。

三、相关分析和回归分析之间的区别

相关分析和回归分析是极为常用的2种数理统计方法,在环境科学及其它研究领域有着广泛的用途。然而,由于这2种数理统计方法在计算方面存在很多相似之处,因此在应用中我们很容易将二者混淆。

常见的错误是,用回归分析的结果解释相关性问题。例如,将“回归直线(曲线)图”称为“相关性图”或“相关关系图”;将回归直线的R2(拟合度,或称“可决系数”)错误地称为“相关系数”或“相关系数的平方”;根据回归分析的结果宣称2个变量之间存在正的或负的相关关系。

相关分析与回归分析均为研究2个或多个变量间关联性的方法,但2种方法存在本质的差别。相关分析的目的在于检验两个随机变量的共变趋势(即共同变化的程度),回归分析的目的则在于试图用自变量来预测因变量的值。

实际上在相关分析中,两个变量必须都是随机变量,如果其中的一个变量不是随机变量,就不能进行相关分析。而回归分析中,因变量肯定为随机变量,而自变量则可以是普通变量(有确定的取值)也可以是随机变量。

很显然,当自变量为普通变量的时候,这个时候你根本不可能回答相关性的问题;当两个变量均为随机变量的时候,鉴于两个随机变量客观上存在“相关性”问题,只是由于回归分析方法本身不能提供针对自变量和因变量之间相关关系的准确的检验手段,因此这又回到了问题二中所讲的,如果你要以预测为目的,就不要提相关系数;当你以探索两者的“共变趋势”为目的,就不要提回归方程。

回归分析中的R2在数学上恰好是Pearson积矩相关系数r的平方。因此我们不能错误地理解R2的含义,认为R2就是“相关系数”或“相关系数的平方”。这是因为,对于自变量是普通变量的时候,2个变量之间的“相关性”概念根本不存在,又谈什么“相关系数”呢?

四、相关分析中的问题

相关分析中,我们很容易犯这么一个错误,那就是不考虑两个随机变量的分布,直接采用Pearson积矩相关系数描述这2个随机变量间的相关关系(此时描述的'是线性相关关系)。

关于相关系数,除有Pearson积矩相关系数外,还有Spearman秩相关系数和Kendall秩相关系数等。其中,Pearson积矩相关系数可用于描述2个随机变量的线性相关程度,Spearman或Kendall秩相关系数用来判断两个随机变量在二维和多维空间中是否具有某种共变趋势。

因此我们必须注意的是,Pearson积矩相关系数的选择是由前提的,那就是2个随机变量均服从正态分布假设。如果数据不服从正态分布,则不能计算Pearson积矩相关系数,这个时候,我们就因该选择Spearman或Kendall秩相关系数。

五、t检验

用于比较均值的t检验可以分成三类:第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t检验,都必须在满足特定的前提条件下应用才是合理的。

若是单组检验,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布。

t检验是目前在科学研究中使用频率高的一种假设检验方法。t检验方法简单,其结果便于解释。简单、熟悉加上外界的要求,促成了t检验的流行。但是,由于我们对该方法理解得不全面,导致在应用过程中出现不少问题,有些甚至是非常严重的错误,直接影响到结论的可靠性。

常见错误:不考虑t检验的应用前提,对两组的比较一律用t检验;将各种实验设计类型一律视为多个单因素两水平设计,多次用t检验进行均值之间的两两比较。以上两种情况,均不同程度地增加了得出错误结论的风险。而且,在实验因素的个数大于等于2时,无法研究实验因素之间的交互作用的大小。

正确做法:当两样本均值比较时,如不满足正态分布和方差齐性,应采用非参检验方法(如秩检验);两组以上的均值比较,不能采用t检验进行均值之间的两两比较。

因此我们必须注意,在使用t检验的时候,一定要注意其前提以及研究目的,否则,会得出错误的结论。

六、常用统计分析软件

国际上已开发出的专门用于统计分析的商业软件很多,比较著名有SPSS(Statistical Package for SocialSciences)、SAS(Statistical AnalysisSystem)、BMDP和STATISTICA等。其中,SPSS是专门为社会科学领域的研究者设计的(但是,此软件在自然科学领域也得到广泛应用);BMDP是专门为生物学和医学领域研究者编制的统计软件。

当然,excel也能用于统计分析。单击“工具”菜单中的“数据分析”命令可以浏览已有的分析工具。如果在“工具”菜单上没有“数据分析”命令,应在“工具”菜单上运行“加载宏”命令,在“加载宏”对话框中选择“分析工具库”。

特别推荐一款国产软件——DPS,其界面见附图。其功能较为强大,除了拥有统计分析功能,如参数分析,非参分析等以外,还专门针对一些专业编写了专业统计分析模块,随机前沿面模型、数据包络分析(DEA)、顾客满意指数模型(结构方程模型)、数学生态、生物测定、地理统计、遗传育种、生存分析、水文频率分析、量表分析、质量控制图、ROC曲线分析等内容。有些不是统计分析的功能,如模糊数学方法、灰色系统方法、各种类型的线性规划、非线性规划、层次分析法、BP神经网络、径向基函数(RBF)等,在DPS里面也可以找到。

相关文章

康佳电视65N66口碑怎么样

康佳电视65N66口碑怎么样

很多小伙伴在关注康佳电视65N66怎么样?质量好不好?使用测评如何?本文综合已购用户的客观使用分享和相应的优惠信息,为大家推荐一款高性价比的产品,一起来看看吧。...

LG65英寸OLED平板电视机口碑怎么样

LG65英寸OLED平板电视机口碑怎么样

很多小伙伴在关注LG65英寸OLED平板电视机怎么样?质量好不好?使用测评如何?本文综合已购用户的客观使用分享和相应的优惠信息,为大家推荐一款高性价比的产品,一起来看看吧。...

创维(Skyworth)60G2060英寸好不好

创维(Skyworth)60G2060英寸好不好

很多小伙伴在关注创维(Skyworth)60G2060英寸怎么样?质量好不好?使用测评如何?本文综合已购用户的客观使用分享和相应的优惠信息,为大家推荐一款高性价比的产品,一...

小米(MI)小米电视机EA系列4K超高清AI远场语音金属全面屏智能平板电视EA55使用感受分享

小米(MI)小米电视机EA系列4K超高清AI远场语音金属全面屏智能平板电视EA55使用感受分享

很多小伙伴在关注小米(MI)小米电视机EA系列4K超高清AI远场语音金属全面屏智能平板电视EA55怎么样?质量好不好?使用测评如何?本文综合已购用户的客观使用分享和相应的优...

创维(Skyworth)创维电视怎么样?质量测评好不好用?

创维(Skyworth)创维电视怎么样?质量测评好不好用?

很多小伙伴在关注创维(Skyworth)创维电视怎么样?质量好不好?使用测评如何?本文综合已购用户的客观使用分享和相应的优惠信息,为大家推荐一款高性价比的产品,一起来看看吧...

海信(Hisense)75英寸质量测评好不好

海信(Hisense)75英寸质量测评好不好

很多小伙伴在关注海信(Hisense)75英寸怎么样?质量好不好?使用测评如何?本文综合已购用户的客观使用分享和相应的优惠信息,为大家推荐一款高性价比的产品,一起来看看吧。...