关于四分位数公式,请统计学高手指教
- Advancedadvance查了一些,感觉说法不是很一致,据说excel和spss的计算方法都不一样,是这个概念的公式本身就有争议吗?
比如 1 2 3 4 5 6 7 这个数列,按照某些定义q1=2 q2=4 q3=6,这三个数正好把数列4等分。但是至少用excel计算的结果是不一样的。
另外一个关于中位数的问题,比如这个数列1 1 1 1 1 1 1 2 3,中位数是1还是2,为什么?
多谢了!
[本帖最后由 Advancedadvance 于 2010-5-22 12:53 编辑] - 秃猫第一题是不是应该(7-6)÷4=1.5算出间距,然后2.5,5,7.5作为四分位数?
第二个应该是1啊,从小到大排列取序列中间的 - Allenz恰巧经常用这个。
三种算法,IRS方法(Counting Method)、KNTS方法、Excel方法
IRS:
N=2m, (N+2)/4,(N+1)/2,(3N+2)/2
N=2m+1, (N+3)/4,(N+1)/2,(3N+1)/4
KNTS:
(N+2)/4,(N+1)/2,(3N+2)/4
Excel:
(N+3)/4,(N+1)/2,(3N+1)/4
其中N为样本量,计算结果如果为12.25,则取第12个数和第13个数之差的四分之一与第12个数之和作为结果。
雾桑也应该熟悉这个。 - Allenz至于111111123九个数,IRS和Excel算法下都是1、1、1,棒子算法(KNTS)下是1、1、1.25 。
如果把上述九个数看作是TG的百姓收入,其平均值是1.33,而事实上是超过75%的人仅有1的收入(因为上四分位数为1),所以中位值在某些情况下比平均值更能反映数据分布的真实情况。 - Advancedadvance多谢楼上专业指教。
想再多问一下这三种算法的由来,按说某个概念不是应该有明确的定义和公式吗?怎么还会有不同的计算方法,而且Excel怎么还自己搞了一种算法。 - Allenz这个。。。应该是每个要求使用四分位数的机构都可以制定自己的标准吧。就好比楼主你也可以制定自己的算法,只要有人信。。。
- Advancedadvance原来如此。那岂不是很混乱,一个概念,不同的公式,交流起来很麻烦啊。比如均值,不管在哪里,只要一提,大家都知道公式是什么,而且大家的公式是一样的,计算结果也有可比性啊。
- Allenz是有点混乱;不过其实差别不大的。
一般而言,使用四分位数的时候都会说明计算口径的。 - 大手对于大样本来说,没有区别
而对于小样本来说,各个计算方式的差异远远大于置信区间的范围
实际用起来都一样