第74期我来读文献 |《第二语言研究中的统计案例分析》第二阶段线上答疑活动干货汇总

科技工作者之家 2020-11-02

来源:外语学术科研网

第74期“我来读文献”活动第二阶段线上论坛于10月31日晚7点举行。本期活动关注《第二语言研究中的统计案例分析》一书。


一不小心错过活动?想了解更多内容?小编将为您倾情分享本次线上论坛的干货,欢迎阅读学习!


领读专家 

许宏晨,北京语言大学英语学院教授,国际应用语言学学会会员、中国社会语言学学会会员。研究方向为社会语言学、二语习得、应用语言学量化研究方法、语言测试。曾主持并完成一项教育部青年专项项目。目前正在主持一项国家社科基金项目。近几年出版《第二语言研究中的统计案例分析》《中国大学生英语学习自我动机系统实证研究》《中国高校双语教学非语言结果实证研究》《第二语言研究中的结构方程模型案例分析》等著作,发表论文30余篇。


思考题

1. 方差分析和t检验有什么联系和区别?


方差分析和t检验都是为了寻找差异,这是两者的共同点。最大的不同点在于t检验只能检验两组样本之间的差异,而方差分析可以检验三组及三组以上样本之间的差异。两者第二个不同点在于t检验只能处理具有两个水平单一自变量的情况,而方差分析可以处理多个自变量水平交互的情况。


2. 根据因素个数及因素水平间关系,您可否构建起方差分析的全貌?


在方差分析中,因素指的是自变量。在一个研究中,因素的个数最少为一个,且这个因素至少要有三个水平。因素水平之间的关系可以是相互独立的,也可以是相互关联的。根据这样的基本原则,方差分析可以分为单因素方差分析和多因素方差分析两大类。由于实践中多因素方差分析通常只涉及两个自变量,所以最为常用的多因素方差分析是双因素方差分析。再结合因素水平之间的关系,我们还可以把方差分析分为单因素组间方差分析和单因素组内方差分析。组间分析表示因素各水平相互独立;组内分析表示因素各水平相互关联。当因素个数增加至两个时,我们可以把方差分析分为双因素组间方差分析、双因素组内方差分析和双因素混和方差分析。混合分析是指一个因素的各水平相互独立,另一个因素的各水平相互关联。


3. 相关分析中的三种类型根本差别在哪里?


相关分析的三种类型根本差别在于变量的性质。皮尔逊相关要求两个变量必须是呈正态分布的定距数据。肯德尔相关要求两个变量必须为定序数据。斯皮尔曼相关要求两个变量一个为定序数据,另一个为定距数据;或者两个变量均为非正态分布的定距数据。


4. 多元线性回归和相关分析之间有什么联系和区别?多元线性回归的因变量有何特点?


回归分析有清晰的自变量和因变量之分,其要回答的问题是自变量对因变量是否有影响?如果有影响,影响有多大?是否达到了显著水平?相关分析没有自变量和因变量之分,其要回答的问题是两个变量共同变化的强度和趋势如何?是否达到了显著水平?多元线性回归的因变量必须是定距数据。这是它最显著的特点。但它的自变量可以是定类数据、定序数据或定距数据。不过,多数情况下,我们都使用定距变量作为自变量。


5. 卡方检验对变量类型有什么要求?独立性检验和拟合度检验分别适用于什么情境?


卡方检验要求变量必须是频次变量,也就是说,只能是个数、次数、人数、类别数等。总之,它所使用的原始数据不能有小数。


卡方独立性检验用于检验两个或者多个频次变量之间是否存在关联。卡方拟合度检验用于检验一个频次变量各水平上的个数是否与给定分布个数之间有差异。


读者提问

1. 4.1实例分析中10名英语本族语者教师和10名中国英语教师的关联体现在哪里?为什么用配对样本t检验?使用配对样本t检验要求的关联性如何判定?


关联性体现在这些教师批改的是同一批作文。比如第一篇作文,它有两个得分,一个是10名英语本族语者给出的分数的平均分,另一个是10名中国英语教师给出的分数的平均分。这两个分数都是第一篇作文的得分。因此,这两个分数是相互关联的,要使用配对样本t检验。


配对样本t检验的样本关联性,体现在同一个被试是否具有两个可以关联起来的分数。一组被试的前后测分数是最典型的相关样本。此外,同一被试的两个不同侧面也是相互关联的样本。比如,一个学生在一次考试中的语法成绩和词汇成绩就构成了相关样本,因为都是这一个学生所得的分数。


2. 潜变量是什么意思?


潜变量是相对于显变量而言的。以问卷调查的数据为例,其中的每一个题项就是一个显变量。比如“我学习英语是为了出国深造”“我学习英语是为了考出好成绩”“我学习英语是为了阅读专业文献”。这三个题项都是显变量。它们共同来测量“英语学习动机”这个抽象的概念。这个抽象概念就是潜变量,因为无法直接测量它,只能转化为比较具体的问题。


3. 6.1实例分析中的F(2,48)=14.298,其中的2和48分别代表什么自由度?


在方差分析中,需要报告两个自由度,一个是组间自由度,一个是组内自由度。在本例中,2是组间自由度,48是组内自由度。自由度对我们外语教师而言意义不大。它是用于统计计算查表寻找临界值时使用的工具。现在我们多用软件进行统计计算,这些软件会把结果计算好,呈现给我们,省去了我们去查统计表的工作。所以直接汇报这个结果即可。如果想要深入了解,需要看一些心理统计学之类的书籍,其中会详细说明各种自由度的算法。

4. 双因素组间方差分析7.1实例分析中,为什么采用单变量univariate,而不采用多变量分析呢?是双因素为什么采用单变量呢?


SPSS软件中的Univariate功能模块是多因素方差分析的常用模块。这里的Univariate指的是只有一个因变量。由于例7.1中只有一个因变量,所以应该使用Univariate来进行分析。如果因变量的个数在两个或者两个以上,且相互关联,我们通常使用Multivariate功能模块进行分析。双因素指的是有两个自变量,不涉及因变量。而在SPSS软件中使用Univariate还是Multivariate模块取决于因变量的个数。


5. 实例分析7.1中采用编程的方式简单效应检验结果为什么和书上有部分出入?


因为具体算法不同。书上采用的是单因素组间方差分析的算法,把两个自变量的水平交互视作四个独立的组,然后进行方差分析。使用编程方法计算简单效应的算法与此不同,它特别考虑了交互作用,所以计算结果有出入。本书主要面向统计学初学者编写,因此把这个问题进行了转化处理。恰当的做法是直接采用编程的方法进行简单效应检验。具体可以参考其他书籍,比如《心理学研究方法——实验设计和数据分析》(舒华、张亚旭,2008,pp.136-138)。

6. 想请问一下12页练习题8,p≤0.05的意思是,抽样误差对统计结果的影响不到5%,应拒绝零假设。这个说法为什么不正确呢?


这个陈述的后半段是正确的,就是“应该拒绝零假设”。但是前半段不准确。因为抽样误差是在测量中对因变量的准确性产生了影响,不是对统计结果(比如t值、F值、r值等)产生影响。所以我认为它的表述不正确。


有关显著水平的确需要一个长期过程才能理解其含义。我建议外语学科用户使用统计的时候,还是把它作为工具和衡量标准来看待,不必深究其来源和意义。如果的确很感兴趣,需要深入了解,那么建议阅读一些概率论与统计学教材。


7. 判断统计方法时,要确定是寻找关联还是寻找差异,我有时会觉得模棱两可,有时候会被研究问题中的字眼迷惑,若能在这方面帮助厘清一下就好了。


其实无论是找关联还是找差异,关键在于把研究问题中的变量分析清楚。这个问题解决后,往往就比较容易进行后续分析。第一步,找出问题中的所有变量。第二步,确定这些变量的功能和性质。如果没有自变量和因变量之分,那么通常说来都用相关分析。如果有自变量和因变量之分,那么就再确认自变量和因变量的性质。如果因变量是定距变量,自变量是定类变量或者定序变量,通常都是找差异的,应该朝着t检验或者方差分析的思路去考虑。如果因变量和自变量都是定距变量,通常都是找关系的,首选就是回归分析。如果因变量和自变量都是定类变量或者定序变量,且数据是频次性质的,那么就应该用卡方检验了。


自由问答

1. 多元回归分析中,如果想把学生作文初稿成绩这种定距数据作为控制变量放入回归模型,应该如何操作?


一般来说,在回归分析中,我们通常都是考虑自变量和因变量之间的关系,如果说你打算让一个变量变成控制变量,或者说你不打算考虑它,我个人认为有两种办法可以在回归的这个具体方法上来进行调整。


第一个方法,比如说你使用逐步回归法(Stepwise),这种回归法会让最有用的变量先进入回归方程,没有用的变量后进入回归方程,通过这种方式来进行考察,看看哪一个变量更符合你的预期。


第二种方法,你也可以采用分层的方法,比如用层次回归的方法,把控制变量放在第一层,然后把其他的变量放在第二层,通过这种方式也可以在一定程度上看到自变量和控制变量对因变量的整体影响。


来源:iresearching 外语学术科研网

原文链接:https://mp.weixin.qq.com/s?__biz=MjM5ODcwMjgzMw==&mid=2651610646&idx=2&sn=a2580dfb260c9c8761f96c65813f35eb&chksm=bd3e45888a49cc9eed71b0e5fa115b6f34462d9c9b61e8798e2603a53a5199f97322245403b0#rd

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

统计学 样本方差 案例分析 方差分析 关联分析 自变量 因变量

推荐资讯