关于四分位数公式,请统计学高手指教

  • A
    Advancedadvance
    查了一些,感觉说法不是很一致,据说excel和spss的计算方法都不一样,是这个概念的公式本身就有争议吗?

    比如 1 2 3 4 5 6 7 这个数列,按照某些定义q1=2 q2=4 q3=6,这三个数正好把数列4等分。但是至少用excel计算的结果是不一样的。

    另外一个关于中位数的问题,比如这个数列1 1 1 1 1 1 1 2 3,中位数是1还是2,为什么?

    多谢了!

    [本帖最后由 Advancedadvance 于 2010-5-22 12:53 编辑]
  • 秃猫
    第一题是不是应该(7-6)÷4=1.5算出间距,然后2.5,5,7.5作为四分位数?
    第二个应该是1啊,从小到大排列取序列中间的
  • A
    Allenz
    恰巧经常用这个。

    三种算法,IRS方法(Counting Method)、KNTS方法、Excel方法

    IRS:

    N=2m, (N+2)/4,(N+1)/2,(3N+2)/2
    N=2m+1, (N+3)/4,(N+1)/2,(3N+1)/4

    KNTS:

    (N+2)/4,(N+1)/2,(3N+2)/4

    Excel:

    (N+3)/4,(N+1)/2,(3N+1)/4

    其中N为样本量,计算结果如果为12.25,则取第12个数和第13个数之差的四分之一与第12个数之和作为结果。

    雾桑也应该熟悉这个。
  • A
    Allenz
    至于111111123九个数,IRS和Excel算法下都是1、1、1,棒子算法(KNTS)下是1、1、1.25 。

    如果把上述九个数看作是TG的百姓收入,其平均值是1.33,而事实上是超过75%的人仅有1的收入(因为上四分位数为1),所以中位值在某些情况下比平均值更能反映数据分布的真实情况。
  • A
    Advancedadvance
    多谢楼上专业指教。
    想再多问一下这三种算法的由来,按说某个概念不是应该有明确的定义和公式吗?怎么还会有不同的计算方法,而且Excel怎么还自己搞了一种算法。
  • A
    Allenz
    这个。。。应该是每个要求使用四分位数的机构都可以制定自己的标准吧。就好比楼主你也可以制定自己的算法,只要有人信。。。
  • A
    Advancedadvance
    原来如此。那岂不是很混乱,一个概念,不同的公式,交流起来很麻烦啊。比如均值,不管在哪里,只要一提,大家都知道公式是什么,而且大家的公式是一样的,计算结果也有可比性啊。
  • A
    Allenz
    是有点混乱;不过其实差别不大的。

    一般而言,使用四分位数的时候都会说明计算口径的。
  • 大手
    对于大样本来说,没有区别

    而对于小样本来说,各个计算方式的差异远远大于置信区间的范围

    实际用起来都一样