费雪变换
费雪变换(英语:Fisher transformation)是统计学中用于相关係数假设检验的一种方法。
基本介绍
- 中文名:费雪变换
- 外文名:Fisher transformation
- 学科:统计学
- 用途:相关係数假设检验的一种方法
简介
费雪变换(英语:Fisher transformation)是统计学中用于相关係数假设检验的一种方法。对样本相关係数进行费雪变换后,可以用来检验关于总体相关係数ρ的假设。
定义
已知N组双变数样本(Xi,Yi),i=1,...,N,样本相关係数r为

于是,r的费雪变换可定义为

当 (X,Y) 为二元常态分配且 (Xi,Yi)对相互独立时,z近似为常态分配。其均值为

标準差为

其中N是样本大小,ρ 是变数X与Y的总体相关係数。
费雪变换及其逆变换

可以用于构造ρ的置信区间。
讨论
当X和Y遵循二元常态分配时,Fisher变换是r的近似方差稳定变换。这意味着对于群体相关係数ρ的所有值,z的方差近似恆定。在没有Fisher变换的情况下,r的方差随着|ρ|变小由于Fisher变换大约是| r |时的恆等函式<1/2,有时候有必要记住r的方差很好地接近1 / N,只要|ρ|不是太大,N也不是太小。这与二元正态数据的r的渐近方差为1的事实有关。
自从费希尔于1915年引入这种变换以来,这种变换的行为已经得到了广泛的研究。费舍尔自己在1921年发现了二元常态分配数据的z的精确分布; 1951年Gayen确定了来自双变数A型Edgeworth分布的数据的z的精确分布。 1953年霍特林计算了z的矩和泰勒级数表达式以及几个相关的统计量,而霍金斯在1989年发现了具有有界四阶矩的分布数据的z的渐近分布。
套用
虽然Fisher变换主要与双变数正态观测的Pearson积矩相关係数有关,但在更一般的情况下,它也可以套用于Spearman秩相关係数。类似结果对于渐近分布适用,但需要较小的调整因子。
各种相关係数
对于不同测量尺度的变数,有不同的相关係数可用:
- Pearson相关係数(Pearson'sr):衡量两个等距尺度或等比尺度变数之相关性。是最常见的,也是学习统计学时第一个接触的相关係数。
- 净相关(英语:partial correlation):在模型中有多个自变数(或解释变数)时,去除掉其他自变数的影响,只衡量特定一个自变数与因变数之间的相关性。自变数和因变数皆为连续变数。
- 相关比(英语:correlation ratio):衡量两个连续变数之相关性。
- Gamma相关係数:衡量两个次序尺度变数之相关性。
- Spearman等级相关係数:衡量两个次序尺度变数之相关性。
- Kendall等级相关係数(英语:Kendall tau rank correlation coefficient):衡量两个人为次序尺度变数(原始资料为等距尺度)之相关性。
- Kendall和谐係数:衡量两个次序尺度变数之相关性。
- Phi相关係数(英语:Phi coefficient):衡量两个真正名目尺度的二分变数之相关性。
- 列联相关係数(英语:contingency coefficient):衡量两个真正名目尺度变数之相关性。
- 四分相关(英语:tetrachoric correlation):衡量两个人为名目尺度(原始资料为等距尺度)的二分变数之相关性。
- Kappa一致性係数(英语:K coefficient of agreement):衡量两个名目尺度变数之相关性。
- 点二系列相关係数(英语:point-biserial correlation):X变数是真正名目尺度二分变数。Y变数是连续变数。
- 二系列相关係数(英语:biserial correlation):X变数是人为名目尺度二分变数。Y变数是连续变数。
参见
- 数据转换(统计)
- Meta分析(此变换用于meta分析以稳定方差)
- 部分相关性