结构方程模型(SEM)简介
来源:数据小兵SPSS统计咨询
本文约5200字,建议阅读14分钟
本文为你介绍结构方程模型。
结构方程模型(SEM)
什么是结构方程模型?
结构方程模型(Structural Equation Modeling,SEM)是在1970年代由Joreskog综合因素分析、回归分析与路径分析而逐步形成的一门统计方法,是一种建立、估计和检验因果关系模型的方法。
模型中既包含有可观测的显在变量,也可能包含无法直接观测的潜在变量。SEM可以替代多元回归、路径分析、因子分析、协方差分析等方法,清晰分析单项指标对总体的作用和单项指标间的相互关系。与传统分析方法相比,结构方程模型在了解变量之间的共变关系的同时,能够解释模型中变量尽可能多的变异。
一般用SEM来解释变量的变异或者变量之间的共变(variation and covariation);用验证性因子分析探究潜变量和显变量之间的关系;用潜增长曲线模型(LGM)估计纵向数据的初始、变化、结构斜率和方差;用路径分析探究变量之间的因果。
PART 01 SEM常用的名词
1.潜变量
潜变量(latent variable /unmeasurement variables /factors / concepts /constructs/dimensions)
同义词:因素、构念、构面等。
潜变量是无法直接测量或观察到的变量,需借由一组观察变量(题目)间接地测量或观察来作推论,测量的方法可以来自调查或各种测验等。
如英文能力为潜变量,可以利用测验其听、说、读、写能力,来推测其英文能力如何;再比如内外向性格也是潜在的心理构面,可利用内外向量表来评估一个人性格是倾向外向或内向(形成型指标)。
潜变量一般以圆形或椭圆形代表。
2.观察变量
观察变量(observed variables/ measured variables/ manifest variables/ indicators generally considered endogenous)
同义词:测量指标、操作变量、测量变量等。
观察变量是可直接测量的变量,是一组变量的集合,用来定义或推论潜变量。
例如人的年龄、性别等变量。有时也会采用问卷来衡量,问卷的每个题目也都是一个观察变量。
观察变量一般以正方形或长方形代表。
3.外生变量
外生变量(exogenous variables/external variables/ independent variables/ predictor variables/affect other variables in the model)
同义词:自变量、预测变量、独立变量等。
外生变量指的是在模型中不受到其他变量影响的变量,也就是在图形中箭头朝外的变量。
外生变量可以是观察变量也可能是潜变量,依照变量的形态而定。
外生变量通常会有箭头向外指向其他的变量。
4.内生变量
内生变量(endogenous variables/internal variables/dependent variables/criterion effects of other variables/ can be represented as causes of other endogenous variables)
同义词:因变量、依变量、应变数、果变量、准则变量等。
内生变量指的是模型中收到其他变量所影响的变量,也就是图形被箭头所刺到的变量均称之为内生变量。
内生变量可以是观察变量也可以是潜变量,依照变量的形态决定。
简单说箭头往外刺就是外生变量,被箭头刺到就是内生变量。
5.模型
模型(model)是变量之间关系的统计陈述,有时也称之为路径图(pathdia gram),就是模型以图示方式的具体展现,也可称之为研究架构图。
每个潜变量之间的关系应有理论上的支持或实务上的证明,最后形成研究架构图。
SEM就是在检验这个模型是否与样本数据一致,如果结论是p值为不显著(p>0.05),则表示研究模型与样本数据一致,表示模型拟合良好。
6.模型设定说明
模型设定说明(model specification)是由一组参数或一个模型的陈述所形成的。
(1)模型设定与估计的重要原则是研究者经过一系列文献回顾之后,会提出感兴趣的模型,并且企图去了解模型中关系存在的事实。但在SEM实际分析中,即使假设的模型已经过严谨的推论,仍然会面临一些程度不一的不符合最初理想的结果。
(2)研究者要尽可能地定义出最佳结果,找出与样本数据拟合良好的特定模型并产生有意义且可以解读的结果。
(3)考虑所有可能的模型,包括竞争模型及等价模型(equivalence model),找出特定的模型尽可能通过协方差矩阵重复样本数据,产生拟合度高并具有意义且可以解读的结果。
7.参数
参数分成固定参数及自由参数。
(1)固定参数(fixparameters)。模型中没有被估计的值,通常设为0或1。固定的参数值通常根据模型设定的要求而定,其中一个重要的要求是建立模型中每一个潜变量的尺度,这也包含误差项(errors)。为解决模型中潜变量尺度设定的问题,一般以以下两种方式进行:
①将潜变量的标准差设定为1,称为标准化设定。因为SEM分析中把平均数假设为0,所以在正态分布下,平均数为0,标准差数为1即为标准正态——NORM(0,1)。
②固定潜变量所估计的多个指标中的一个指标,将其因素负荷量设为1,称为非标准化设定。
(2)自由参数(freeparameters)。模型中所估计的参数均为自由参数,通常包括因素负荷量、非标准化(标准化)路径系数、方差、协方差/相关系数,有些模型会估计平均数、截距等,这些都属于自由参数。
8.双相关
双相关(covary)是指协方差或相关,观察变量或潜变量之间如果没有因果关系的存在,只是有关联(association)而已,称为相关或共变。
9.因素负荷量
因素负荷量(factor scores/measurement weights)是一条直线直接从潜变量指向特定的观察变量,代表因素与测量变量之间的关系,这条关系解释为因素负荷量,该因素负荷量的平方称为变量估计的共同性(commonality),其实就是潜变量对特定观察变量的解释能力,称为多元相关平方(square multiple correlations,SMC),也是该测量变量(题目)的信度。
10.测量误差
测量误差(measurement errors)也称之为残差,代表的是特定的观察变量无法被相关的因素所解释的独特的方差。如图的e1~e3就属于残差。要衡量测量误差,每一个测量误差的方差需要被估计(非标准化),标准化残差为1一SMC或(1-factor loading2)。
11.单向因果关系
单向因果关系(causality)又称为递归路径(一路传递出去的路径)(recursive),即所有的结构模型路径都是单方向指向下一个变量,不会有两个变量相互(reciprocal)影响,也不会有反馈(feedback)路径的存在。因此,又称为变量与变量之间的直接效应。
12.间接效应
间接效应(indirect effect)又称为路径分析(path analysis),如x对y为直接效应,x对z为间接效应,y为中介变量。图形中x、y、z根据变量类型用方框或椭圆表示均可。
13.互为因果关系
互为因果关系(reciprocal,two-way causation)是非递归(non-recursive)路径的一种,也称循环互动路径。如图,x与y互为直接效应,x与y具有反馈循环效应。
14.循环因果关系
循环因果关系是非递归路径的一种,如图,x影响y、y影响z,z又回过头来影响x,以上均为直接效应,x、y、z:为间接反馈循环效应。循环因果关系和中介效应很像,不同的是中介是同一时间所搜集的数据,而循环因果关系是不同时间所搜集的数据。
15.干扰
干扰(disturbance)一样是不可解释的变异(残差),是内生变量无法被自变量解释的变异,标准化的干扰(残差)也等于1-SMC。
16.多元相关平方
多元相关平方为可解释方差或R2,是内生(潜在)变量被外生(预测)变量所解释的百分比。
17.矩阵
SEM以协方差矩阵作为分析的基础,因此有必要对分析中会出现的几个矩阵要加以介绍,分别为样本协方差矩阵(sample covariances,S matrix)、隐含(期望)协方差矩阵(implied covariances,Σ(θ))、残差协方差矩阵(residual covariance,S-Σ(θ))及标准化残差协方差矩阵(standardize residual covariance,[S-Σ(θ)]/s.e.)。
18.拟合度指标
拟合度(配适度)指标(fit indices)表示当研究者设定一个包含固定参数及自由参数的模型后,与样本数据协方差矩阵一致性的程度。如常用的拟合度指标为Chi-square、CFI、NNFI以及RMSEA等。
19.偏度
偏度(skew)表示变量数据分布左右不对称的程度。如果偏度过于严重,表示数据中有极端值(outliers),应将极端值予以删除。
20.峰度
峰度(kurtosis)表示变量的分布上下高低的程度。一般统计学上将正态峰定义为平均数为0,方差为1,图形呈现钟形对称分布,峰度为3。只要峰度高于3称之为高狭峰,峰度低于3则为低阔峰。在统计意义上,通常将峰度减3,此时正态分布的峰度为0,峰度值为正即为高狭峰,代表样本值较为集中;峰度值为负则为低阔峰,代表样本值较为分散。
21.多元正态
多元正态是当每一个观察变量都是正态分布的情况下,与其他的观察变量结合后仍维持正态分布的现象。当x轴为某指定变量的值,y轴为计算该变量每个值的权重,z轴是任何其他变量的值。在结构方程模型的分析中,多元正态是经常性的假设条件。
22.SEM模型的组成
一般SEM模型包含了测量模型与结构模型两部分。测量模型评估的是潜变量与测量指标之间的关系,又称为验证式因素分析(CFA)模型,而结构模型描述的是潜变量与潜变量之间的关系,不包含潜变量的测量指标。
23.验证式因素分析模型
验证式因素分析(confirmatory factor analysis,CFA)模型指的是所有的观察变量直接与潜变量联结,并让因素负荷量自由估计,箭头需由潜变量指向观察变量(反映型指标)。模型正定的条件为潜变量方差(方差)设为1或在某一观察变量因素负荷量设为1,每个构面至少要三个观察变量,除非模型有两个潜变量。
24.违犯估计
违犯估计(offending estimate)指的是参数估计中出现不合理的估计值,如标准化系数接近1(>0.95)或超过1、残差值为负值或不显著。因为残差值为平方值,所以不可能为负数。而不显著即代表残差不存在,不符合实务上的认知。
Hair等人(2009)提出发生违犯估计的原因通常是样本数不够大,如只有100多个样本或没有符合每个构面3个观察变量的原则。只要样本数超过300个,再加上每个构面有3个观察变量就不太可能产生违犯估计。
25.迭代与收敛
迭代(iteration)为数学上的一种演算法,对一组问题求解,从初始估计出发,先预估初始解,再寻找一系列近似解来解决问题的过程。这个过程使得后一个解比前一个解更接近实际值,直到与实际值差异可忽略不计为止,这一过程所使用的方法统称为迭代法。收敛(convergence)则是一连串的迭代结果,最后与实际值相接近,数学上通常以0.001为标准。
以实际的例子说明迭代法在生活上的应用,例如电视综艺节目中有一个猜数字的游戏节目,主持人先设定一个数字,由现场5位嘉宾猜数字,猜中就会获得奖励。第一位嘉宾假设猜66,主持人会提示正确的数字在0-66之间,于是第二位嘉宾可能猜36,主持人再次提示正确的数字在36-66之间。如此重复这个过程,嘉宾所猜的数字会越来越接近中奖号码,直到中奖号码猜中为止。这个猜测的过程称之为迭代,最后猜测的正确结果称之为收敛。
PART 02 SEM样本数(sample size)的需求
SEM是一种大样本的分析技术,样本数不应该太小,如此才能取得稳定的参数估计及标准误,因为协方差矩阵大小的差异对样本数非常敏感。至于样本数多少才够?有许多学者提出不同的看法。
#观点#
Loehlin(2004)调查了72篇SEM的论文,发现样本的中位数为198,因此他建议样本数至少为100个,有200个更好。Kline(2005)认为100个样本以下,SEM分析是不具说服力的。Schumacker和Lomax(2004)调查文献发现在许多文章中使用了250~500个样本,在这区间的样本数是适合的样本数。而少于100个样本产生的分析结果是不稳定的。特别是,研究的变量超过10个时,样本数如果低于200个,一般认为参数的评估非常不稳定,显著性检验也缺乏统计意义。Ding,Velicer和Harlow(1995)综合之前学者的研究,认为SEM分析时,100~150样本量是分析的最低标准。Barrett(2007)甚至建议期刊的审稿委员应该要拒绝所有样本少于200个的SEM论文,这个建议并不是标准的实务要求。执行SEM如无特殊原因,一般均以内置的最大似然法进行,而最大似然法在样本大于500以上时,卡方值会严重的膨胀,导致模型拟合度不佳。文献中认为,根据经验法则,样本数至少应该是模型变量数的8倍。
Mitchell(1993)甚至认为样本数至少应该是模型变量数的10~20倍,另外Bentler和Chou(I987)认为在研究符合数据假设的情况下,以估计参数(包含误差项及路径系数)的5倍为样本数在SEM分析时较为合适。如果数据是非正态或有缺失值的时候,研究人员抽取样本数应远大于最小要求。Jackson(2003)研究提出,在最大似然法估计下,估计参数与样本数比值(p:n)应为1:20,1:10是样本的最小要求,如果比值降到1:5以下,那结果就不值得相信了。
综合上述的看法,大于200以上的样本,才可以称得上是一个中型的样本,若要追求稳定的SEM结果,样本数最少在200以上。
也可从观察变量(题目)的数量来确定样本数量,每一个观察变量至少要有5个样本,最好每个观察变量在10-20个样本。
PART 03 SEM的分析工具
SEM的分析主要依赖计算机软件的协助。目前全球比较常用的SEM分析工具大致有以下八种,即Amos、CALIS、EQS、LISREL、Mplus、Mx、RAMONA以及SEPATH。
下面简单介绍的Mplus、Amos。
Mplus:
Mplus的优势在于允许一起分析横截面和时间序列数据,单层和多层数据,来自不同母样本的数据,以及可见或不可见的异质数据。可分析的变量是连续变量(continuous)、缺失变量(consored)、二分类变量(binary)、顺序变量(ordered categorical/ordinal)、名义变量(unordered categorical/ nominal)、计数变量(counts)或这些变量类型的组合。Mplus也有特别的功能处理缺失值、复杂的调查数据和多层次的数据。此外,Mplus有强大的功能用于蒙特卡罗模拟研究。
官网网址:http://statmodel.com/
Amos:
Amos(Analysis of Moment Structures)由Arbuckle(1995-2012年)开发,目前是IBM SPSS公司旗下的产品,该软件可以独立进行运作,无须依赖SPSS的工作环境。Amos可直接读取SPSS的数据文件,不同版本的SPSS数据文件皆可读取,并且可将整个数据文件应用于分析过程中,无须作任何文件切割。Amos以画图为主,软件会自动将图形转为程序代码并进行演算。此外,Amos也可以用BASIC语法输入,但此步骤太过麻烦,很少有研究者使用这一功能。Amos软件的特色是内置Bootstrap(自助法)的估计方法,可以估计所有参数的标准误及置信区间,对于缺失值的插补也提供了ML插补及多重插补法。
官网网址:http://smallwaters.com/
本文来自:记向日书公号
编辑:黄继彦