sat考团吧 关注:22贴子:71
  • 5回复贴,共1

【备考指南】SAT数学综合问题之统计学部分

只看楼主收藏回复

1.mode(众数)
一堆数中出现频率最高的一个或几个数
e.g. mode of 1,1,1,2,3,0,0,0,5 is 1 and 0
2.range(值域)
一堆数中最大和最小数之差 ,所以统计学上又称之为极差.(两极的差)
e.g. range of 1,1,2,3,5 is 5-1=4
3.mean(平均数)
arithmatic mean(算术平均数): n个数之和再除以n
geometric mean (几何平均数): n个数之积的n次方根
4.median(中数)
将一堆数排序之后,正中间的一个数(奇数个数字),
或者中间两个数的平均数(偶数个数字)
e.g. median of 1,7,4,9,2,2,2,2,2,5,8 is 2
median of 1,7,4,9,2,5 is (5+7)/2=6

5.standard error(标准偏差)
一堆数中,每个数与平均数的差的绝对值之和,除以这堆数的个数(n)
e.g. standard error of 0,2,5,7,6 is:
(|0-4|+|2-4|+|5-4|+|7-4|+|6-4|)/5=2.4
6.standard variation
一堆数中,每个数与平均数之差的平方之和,再除以n
标准方差的公式:d2=[(a1-a)2+(a2-a)2+....+(an-a)2 ]/n


1楼2012-11-23 10:28回复
    e.g. standard variation of 0,2,5,7,6 is: average=4
    ((0-4)2 +(2-4)2+(5-4)2+(7-4)2+(6-4)2)/5=6.8
    7.standard deviation
    就是standard variation的平方根 d

    8.the calculation of quartile(四分位数的计算)
    Quartile(四分位数):
    第0个Quartile实际为通常所说的最小值(MINimum);
    第1个Quartile(En:1st Quartile);
    第2个Quartile实际为通常所说的中分位数(中数、二分位分、中位数:Median);第3个Quartile(En:3rd Quartile);
    第4个Quartile实际为通常所说的最大值(MAXimum);
    我想大家除了对1st、3rd Quartile不了解外,对其他几个统计值的求法都是比较熟悉的了,而求1st、3rd是比较麻烦的。
    下面以求1rd为例:
    设样本数为n(即共有n个数),可以按下列步骤求1st Quartile:
    1.n个数从小到大排列,求(n-1)/4,设商为i,余数为j
    2.则可求得1st Quartile为:(第i+1个数)*(4-j)/4+(第i+2个数)*j/4
    例(已经排过序啦!):
    1).设序列为{5},只有一个样本则:(1-1)/4 商0,余数0
    1st=第1个数*4/4+第2个数*0/4=5


    2楼2012-11-23 10:28
    回复
      2).设序列为{1,4},有两个样本则:(2-1)/4 商0,余数1
      1st=第1个数*3/4+第2个数*1/4=1.75
      3).设序列为{1,5,7},有三个样本则:(3-1)/4 商0,余数2
      1st=第1个数*2/4+第2个数*2/4=3
      4).设序列为{1,3,6,10},四个样本:(4-1)/4 商0,余数2
      1st=第1个数*1/4+第2个数*3/4=2.5
      5).其他类推!因为3rd与1rd的位置对称,这是可以将序列从大到小排(即倒过来排),再用1rd的公式即可求得:例(各序列同上各列,只是逆排):
      1.序列{5},3rd=5
      2.{4,1},3rd=4*3/4+1*1/4=3.25
      3.{7,5,1},3rd=7*2/4+5*2/4=6
      4.{10,6,3,1},3rd=10*1/4+6*3/4=7
      9.The calculation of Percentile
      设一个序列供有n个数,要求(k%)的Percentile:
      (1)从小到大排序,求(n-1)*k%,记整数部分为i,小数部分为j
      可以如此记忆:n个数中间有n-1个间隔,n-1/4就是处于前四分之一处,
      (2)所求结果=(1-j)*第(i+1)个数+j*第(i+2)个数
      特别注意以下两种最可能考的情况:
      (1)j为0,即(n-1)*k%恰为整数,则结果恰为第(i+1)个数
      (2)第(i+1)个数与第(i+2)个数相等,不用算也知道正是这两个数.
      注意:前面提到的Quartile也可用这种方法计算,
      其中1st Quartile的k%=25%


      3楼2012-11-23 10:28
      回复
        2nd Quartile的k%=50%
        3rd Quartile的k%=75%
        计算结果一样.
        例:(注意一定要先从小到大排序的,这里已经排过序啦!)
        {1,3,4,5,6,7,8,9,19,29,39,49,59,69,79,80}
        共16个样本 要求:percentile=30%:则
        (16-1)*30%=4.5=4+0.5 i=4,j=0.5
        (1-0.5)*第5个数+0.5*第6个数=0.5*6+0.5*7=6.5

        10.To find median using Stem-and-Leaf (茎叶法计算中位数)
        Stem-and-Leaf method 其实并不是很适用于GRE考试,除非有大量数据时可以用这种方法比较迅速的将数据有序化.一般GRE给出的数据在10个左右,茎叶法有点大材小用.
        Stem-and-Leaf 其实就是一种分级将数据分类的方法.Stem就是大的划分,如可以划分为1~10,11~20,21~30…,而Leaf就是把划分到Stem一类中的数据再排一下序。看了例子就明白了。
        Example for Stem-and-Leaf method:
        Data:23,51,1,24,18,2,2,27,59,4,12,23,15,20
        0| 1 2 2 4
        1| 12 15 18
        2| 20 23 23 24 27


        4楼2012-11-23 10:28
        回复
          5| 51 59
          Stem (unit) = 10
          Leaf (unit) = 1
          分析如下:
          最左边的一竖行 0, 1, 2, 5叫做Stem, 而右边剩下的就是Leaf(leaves). 上面的Stem-and-Leaf 共包含了14个data, 根据Stem及leaf的unit, 分别是: 1, 2, 2, 4 (first row), 12, 15, 18 (second row), 20, 23, 23, 24, 27(third row), 51, 59 (last row). Stem and Leaf其实就是把各个unit,比如个位,十位等归类了而已,一般是从小到大有序排列,所以在找Stem-and Leaf 找median的时候,一般不需要你自己把所有的数写出来从新排序.所以只要找到中间的那个数 (如果data个数是偶,则取中间两数的平均数), 就是median了.这道题的median是18和20的平均值 =19. 大家在碰到这种题的时候都可以用上面的方法做,只要注意unit也就是分类的数量级就行了.
          为什么用Stem-and-Leaf 方法?可能你觉得这样做太麻烦了,其实Stem-and-Leaf 方法好处就是:你不必从一大堆数里去按大小挑数了,按照data给出的顺序填到表里就可以了。但是,GRE考试这样做是否值自己斟酌。
          我的方法,不就是找十来个数么?排序!在先浏一眼数据看看大致范围,然后在答题纸上按个的写,觉得小的写前面,大的写后面,写了几个数之后,就是把剩下的数儿们,一个个的插到已写的数中间么!注意尽可能的把数之间的距离留大一些,否则,如果某些数比较密集,呵呵,你会死的很惨的。
          11.To find the median of data given by percentage(按比例求中位数)
          给了不同年龄range, 和各个range的percentage, 问median 落在哪个range里. 把percentage加到50%就是median的range了.担小心一点,range首先要保证是有序排列.
          Example for this:
          Given: 10~20 = 20%, 30~50 = 30%, 0~10 = 40%, 20~30 = 10%, 问median在哪个range里.


          5楼2012-11-23 10:28
          回复
            分析: 千万不要上来就加,要先排序,切记!!
            重新排序为: 0~10 = 40%, 10~20 = 20%, 20~30 = 10%, 30~50 = 40%. 然后从小开始加, median(50%)落在 10~20这个range里.
            如果觉得比较玄乎,我的方法,GRE大部分的题都可以这么搞。0~10岁 40匹ETS猪,10~20岁 20匹ETS猪,20~30岁 匹ETS猪,30~50岁 匹ETS猪,这100匹ETS猪按着年龄排下来,你说第五十匹ETS猪的年龄落在那个范围。

            (原题: 说一堆人0-10岁 占 10%,11-20岁 占 12%,21-30岁 占 23%,31-40岁 占 20%,〉40岁 占 35%,问median 在什么范围?)

            12:比较,当n<1时,n,1,2 和1,2,3的标准方差谁大
            standard error 和 standard variation (作用=standard deviation)都是用来衡量一组数据的离散程度的统计数值,只不过由于standard error中涉及绝对值,在数学上是很难处里的所以,都用标准方差,实际上standard error更合理一些,它代表了数据和平均值的平均距离.很明显题目中如果n=0的话,0,1,2的离散程度应该和1,2,3的离散程度相同.如果n<0,则n,1,2,的离散程度大于后者,而0<n<1的话,则后者大于前者,但是n为整数,这种情况不成立.故而
            Key: n是整数, 前〉=后(n=0,等;n=-1,-2,……大于)

            13.算数平均值和加权平均值
            三组数据的频数分布FREQUENCY DISTRIBUTION:
            1(6),2(4),3(1),4(4),5(6)
            1(1),2(4),3(6),4(4),5(1)
            1(1),2(2),3(3),4(4),5(5)
            其中括号里的是出现的频率,问MEAN和AVERAGE相等的有那些.
            答案:只有第二个.
            mean-arithmetic mean 算术平均值(1+2+3+4+5)/ 5 = 3
            average-weighted average 加权平均值: (1*1+2*4+...5*1)/(1+4+6+4+1)=48/16=3
            14.正态分布题.
            一列数从0到28,给出正态分布曲线.75%的percentile是20,85%的percentile是r,95%的percentile是26,问r与23的大小.
            Key:r<23


            6楼2012-11-23 10:28
            回复