AP统计可谓是微积分以外最热门的科目了,因为统计学是很多学科的必备技能,同时也是很实用的一个科目,所以大家要争取考5分哦,怎么考5分呢?
AP 统计学考试分两部分:选择题 (Multiple choice section) 和简答题 (Free response section),卷面分数100分,选择题与简答题各占50分,考试总时间为3小时。在整个统计学的考试中,计算器都是被允许使用的。分值具体换算见下表:
题目个数 | 作答时间 | 分数 | |
选择题 | 40 | 90min | 1.25*40=50分 |
简答题 | 6 | 90min | 共50分 |
Part A | 5 | 每题1.875*4=7.5分,共37.5分 | |
Part B | 1 | 4*3.125=12.5分 |
2012年-2014年,70分可以兑换5分,2015年100分与5分的对照关系如下表:
分数 | 5分制 |
64-100 | 5 |
51-63 | 4 |
37-50 | 3 |
27-36 | 2 |
0-25 | 1 |
AP统计学的知识点和考点覆盖了统计学的基础知识,这些也是统计最核心的基本内容。统计和数据有脱离不开的关系,说的简单一些,统计就是处理数据的一个工具。
统计学的考试内容也涉及四部分:如何获取数据(考纲第二部分:抽样及实验设计)、数据获取到之后如何将杂乱无章的数据进行整理并以极其形象的方式展现出来(考纲第一部分:探索性数据分析)、数据体现出的规律性和发生的可能性是怎么样的(考纲第三部分:概率)、获取到的历史数据怎么进行预估和判断(考纲第四部分:统计推断)。
College board 将四部分内容在考试中的占比划分如下:
主要内容 | 考试占比 |
探索性数据分析 | 20%-30% |
抽样和实验设计 | 10%-15% |
概率和概率分布 | 20%-30% |
统计推断 | 30%-40% |
现在进入考试的攻坚阶段,大家一定要练习官方真题,任何的练习题都没有真题有代表性,至少要将近5年的真题做2遍。市面上现有的巴郎、普林斯顿以及500题,都不建议大家继续使用,本身题目的出题方向就跟官方题目相差甚远,为了不出现复习太偏的情况,请大家一定只做真题!
下面对统计学的四部分内容的考点进行简单的梳理:
一. Exploring Data
探索性数据分析部分包括分类变量的描述分析和数值型变量的描述分析两部分。
分类变量包含两部分:单变量分类变量部分要了解频数分布表(frequency distribution table),条形图(bar chart)以及饼图(pie chart);双变量分类变量部分要掌握列联表(two-way table)的图形展示方法即对比条形图,如何求列联表中某一个cell对应的expected number。
单变量数值型变量 (univariate metric variable) 部分要掌握的主要内容包括:
频数分布表 (frequency distribution table),点图(dot plot),条形图(stem plot),直方图(histogram)。
分布的三种形状:对称分布(symmetric distribution)、左偏分布(skew to the left)、右偏分布(skew to the right)
分布中可以体现出的特征:集群和缺口(cluster and gap),异常值(outlier):指与数据中的其他部分有显著不同的数据点。
衡量分布的中心(center of distribution):均值(mean),中位数(median),众数(mode),其中中位数和众数不受outlier的影响。一个mode的数据为unimodal,两个mode的数据为bimodal。
衡量分布的波动(variation of distribution):极差(range)、标准差(standard deviation)以及四分数差(interquartile range)。其中四分位差不受异常值的影响.
衡量分布的位置(position of distribution):四分位数(quartiles)、百分位数(percentiles)以及标准计分(z-score)。
箱线图(boxplot),掌握如何绘制箱线图,并读取箱线图的数据。
对随机变量X进行变换(add or multiple)后,变换后新随机变量的均值,中位数,标准差,四分位数,极差,四分位差等的变换。
双变量数值型变量(bivariate metric variable)部分要掌握的主要内容包括:
散点图(scatterplot),散点图可以反映出:变量之间是否有关系,正关系还是负关系,关系强弱程度。
相关系数(Correlation)是衡量两个变量之间相关程度大小的量,取值范围为[-1,1]。改变变量的计量单位对变量间相关系数的大小没有影响。
最小二乘回归线 (least square regression line),,掌握截距项(intercept)和斜率(slope)两个系数的含义,残差(residual)的定义,判定系数(Coefficient of determination)的含义,残差图(residual plot)及斜率的区间估计和假设检验。
二. 抽样和实验设计(sampling and experiment)
抽样和实验设计部分需要掌握的主要内容包括:
数据获取的方式主要包括四种:普查、抽样调查、观测研究和实验设计
抽样方法主要包含两种:随机抽样(random sampling)和有偏抽样(biased sampling)。随机抽样主要包括:简单随机抽样(simple random sampling),分层随机抽样(stratified random sampling)、系统抽样(systematic sampling)以及整群抽样(cluster sampling)。有偏抽样主要包括:判断抽样(judgmental sampling)、方便抽样(convenience sampling)以及自愿样本(volunteer sampling)。
抽样中可能存在的误差或偏差。抽样误差(Sampling error)是指由于抽样这一动作所带来的误差,所以不可消除,只能通过一定的手段降低。涵盖不全偏差(undercoverage bias)、无回答偏差(nonresponse bias)以及回答偏差(response bias)等。
实验设计的基本概念
自变量、因变量
混淆变量(confounding):既不是自变量,又不是因变量,但对因变量有影响的变量。
因子(factor):可以简单地当做自变量来理解。水平(Level):因子下的取值个数。处理(Treatment):施加给实验单位的具体处理
控制组(control group),安慰剂(placebo)以及安慰剂组(placebo group)
实验设计的三要素:随机化、控制、实验的可重复性
几种常见的实验设计:
完全随机化设计(completely randomized design)
随机区组设计(randomized block design)
配对设计(matched pairs design)
© 2024. All Rights Reserved. 沪ICP备2023009024号-1