美国一站式升学服务平台

美国拨打:562-449-5356
  1. 首页
  2. SAT课程考试
  3. 80%中国考生都觉得难的SAT数学难点分析

80%中国考生都觉得难的SAT数学难点分析

在SAT数学的复习过程中,对于很多中国考生来说是非常容易的,然而SAT中也有一部分的考点对高一高二的考生难度较大,甚至超出高中数学学习范围,这里为大家配上例题做一些汇总,相信吃透这篇文章,一定可以帮助大家的SAT数学分数上一个新高度。

一、数据分析Data Analysis

1、什么是数据分析?

数据分析涉及到一系列的动作。首先要通过一定的方法采集数据(Data Collection)并且记录下来。然后对采集的数据进行过滤整理,找到其背后的整体趋势,从而可以辨别数据的真伪好坏,也能对事物的未来趋势做出预测。为了总结和预测,我们采用了数据分析(Data Analysis)。

2、数据分析中经常用到的图表有哪些?

以下列出统计和数据分析中经常用到的图表。记住:具体的某个个体数字并不是非常重要,重要的是整体的趋势。对于这些图表的解释如果让学生觉得陌生,那么建议该学生跟着统计老师好好补习一下。

(1)表格Table:对于数据的详细记录。如下图所示。要求学生可以从众多的数据信息中提取自己所需要的信息,加以整理和利用。

(2)柱状图Bar Graph/Histogram:看整体的趋势。如:下图是一个right skewed normal distribution。(注意:bar graph和histogram还是有区分的,但是在SAT考试中应该不会太过于区分,我也就不用细讲这个地方了。)

(3)线形图LineGraph:线形图表明了事物发展的总体趋势,通常而言,如果线的形状可以用某种方程来模拟,我们的数学分析就具有了预测的特征。

如下图:

红线是normal distribution,蓝线是logistic regression。如果可以进一步确定这两条线各自的重要参数,就可以通过已知来推知未知。

(4)饼状图piechart:主要体现的是比重proportion或者百分比percentage。大多数时候,饼状图并不体现绝对数值,只是对于不同事物的比重进行一个比较。

(5)Boxplot:展现数据的极值和quartiles(25 percentile,median,75 percentile),从而让人可以比较不同组数据的实质是否相同。见下图:

(6)Confidence Interval Graph:展现数据的平均值mean和95% confidence interval,可以让人认出实质不同的数据组。

如下图中:

第一组数据实质上低于第八组数据(因为第一组数据的高95% confidence interval还低于第八组数据的低95% confidence interval)。

在数据解释上,我们可以说:低收入家庭第一种族的学生明显比中等收入家庭第三种族的学生在数学表现要差。同理,我们还可以看出:对于社会中高收入的家庭而言,不同种族并不会实质性影响学生的数学表现。

3、与数据分析相关的实验experiment经常有哪些步骤?

SAT有的数据分析的题目里会涉及到一些实验的细节,对此不熟悉的同学常常会引发紧张情绪。在这里,我把实验的基本步骤简单介绍一下,作为对大家有用的知识背景。

实验的目的:通过实验来探知一个假设(hypothesis)是否正确。

实验的步骤:

(1)说明实验要验证的假设,同时要给出关键的定义以防误解。(这一步学生可以不用太多在意,因为考试的时候会在题目中把这个背景一带而过)。

(2)Literature Review(这个是把历来相关问题的文献调查一遍,一是确认自己不是重复做研究,二是找到他们所遗漏的问题,作为未来研究的方向和突破口。这一步学生也可以略过,因为我们的数学题目中不会涉及这一个环节)

(3)Experimental Design。实验设计可以有很多种方法,但是所有的方法必须要保证实验结果可以放之四海而皆准,因此,就是要保证实验个体在很多性质上都是具有代表性的。

比方说,有的实验给出男女参加人的比例或者参加人的种族(race)、民族(ethnicity)、文化背景(cultural background)、家庭经济背景(SES)、家庭文化教育背景(family educational background)等信息,其目的就是展现实验参加人对于人群的代表性。

这些与参加人有关的杂七杂八的信息叫做demographic data。这部分内容可以说的很琐碎,但是其目的就是证明代表性(representativeness)。

再比方说,实验说了用了某种方法来取样(sampling),取样的方法千奇百怪,但是其服务的目的都一样,保证所取的样本对于其所针对的目标群体(target population)具有代表性。

因此,学生们经常看到的词是随机取样(random sampling),这种取样方式是所有取样方式中最基本最常见的。

(4)Experimental Group vs. Control Group, 实验组和参照组。所谓参照组,就是不施加以实验的变量,静静地搁置在一旁的组。他们的存在就是为了通过比较看看实验介入变量所起到的作用。

比方说,要知道一种药是否能减肥,就给实验组(experimental group)吃这种药,给参照组(control group)吃长得一个样子的糖丸,然后实验期一过,通过两组的数据的对比,看看这种被实验的减肥药是否有效。

(5)数据分析Data Analysis。这个部分是我们的重点,因为涉及到了具体的计算。题目会先说到数据采集Data Collection,这个步骤注意数据的代表性就行了,因此题目也许会说到random等关键词,通过对上文(3)的学习,学生也知道了这一点。而数据的具体分析计算才是我们的重点,是数学的真正考点。

(6)Results & Discussion。这个部分就是结果。在数学考试中,一般会让学生求出结果而不是直接给出结果,所以,这个部分我们不必过于在意。对于Discussion, 它的真正含义是说出这次实验的疏漏和不足,以期在未来得到改进。

熟悉了以上的实验步骤,就能够有效地帮助大家理解题意,顺利做题了。

4、常考知识点与相关例题

在SAT考试中,这部分的题目并没有很难,主要考核的都是基础知识。

例题1:(Official Guide上的题目)

解析:本题貌似纷繁复杂,其实非常简单,就是考核学生的阅读能力和读图表提取数据的能力。它问的是comedy和PG-13交集中的数字”4”在总数50中所占的比重,所以答案应该是2/25.

例题2:(Official Guide上的题目)

解析:这道题目问的是对scatterplot图形的基本掌握,答案应该是D。

例题3 (最新的Practice Test 8的题目):

解析:这道题目以数据分析的形式出现,但是实质考察的知识是algebra里面的一元一次方程y=3.39x+46.89. 题目要求是询问slope3.39的含义。

slope斜率意味着针对每一个单位的x的增长,y相应所作出的增长。按照这个定义,我们发现答案应该是D,当然,这也对阅读水平提出了更高的要求。一些同学在data analysis部分丢分,本质原因不是数学能力,而且阅读水平。

例题4(最新的Practice Test 8的题目):

解析:本题考查的是实验设计的基本方法。如果想通过样本sample推知全体population,需要保证样本的代表性representativeness。而要保证代表性的基本方法就是random selection/ random sampling。

本题的叙述中,根本没有提及random sampling,也没有说明为什么要知道community的家庭平均孩子数目就一定要到playground去取样,因此,这个样本应该是一个biased sample。 答案选择C。

二、统计Statistics

目前,中国的高中课程中也引入了基本的统计概念和计算公式。比方说,所有学生都应该熟悉以下的一些基本统计概念:

(算数)平均数Mean (aka.: arithmetic mean):包括简单的算数平均数和加权平均数(weighted mean)。注意:几何平均数目前在SAT中没有考过。

中数Median:即50% percentile。将所有数字从大到小(或者从小到大)依次排列,居于最中间的一个数(奇数数列)或者两个数的算数平均值(偶数数列)。

众数Mode:在数列中出现频率最大的数。如果有两个数出现的频率并列最大,那么这两个数都是众数。

值域Range: 数列中的最大值与最小值的差值。

方差Variance与标准差Standard Deviation:衡量数字的零散程度的统计指标。目前SAT中还没有考到这两个指标的公式,因此这里我先暂时省略公式。考核的重点是对于standard deviation的概念的本质理解。

考试的时候,这些基本概念会和图表等题型结合起来考察学生。

请见如下例题:

例题1(Official Guide的题目):

解析:这道题目考的是统计基本概念之间的一个比较。实不相瞒,我差点做错。因为学习统计的时候,专门比较过mean, median, mode对于极值outlier存在与否的稳定性。

同时,目测可以看出,mean应该比19大(不知道的同学可以用加权平均公式计算一下算数平均数mean,不会加权平均公式的同学请参见例题3),因为4个20和2个21可以和6个18相互制约,从而使平均数接近19, 而剩下的22,23,30(尤其是outlier30)会将平均数mean向右方拉升,因此导致mean>median。答案是A。

例题2(最新的Practice Test 8的题目):

解析:本题考核的是range, standard deviation这两个统计基本概念。range=max-min,因此知道,r1=r2。对于standard deviation,了解常识的人知道:在histogram中数据越聚合,standard deviation越小,因此,应该是s1

但是答案更加幸运,选择D,说明SAT考试中并不需要学生真正用公式计算出standard deviation,只要了解这个概念的基本公式就行了。

三、概率Probabilities

概率,说的是事件发生的可能性,其数值在0到1之间。概率为0的事件叫做“不可能事件”。概率为1的事件叫做“必然事件”。其他的事件叫做“或然事件”。可以被计算的概率,在SAT的考核中常常是古典概型。

1、古典概型

古典概型是最简单最常见的概率。它说的是:同一时间可以有n个事件发生,每个事件发生的可能性都是相等的。因此,我们所要求的目标事件发生的可能性,就是(目标事件)/(总事件)。

比方说,在一个罐子里面有19块红糖,15块白糖。随机抽取一块糖,该糖是红糖的可能性(概率)就是19/(19+15)=19/34。

例题1:

解析:表面上看,这是一道图表分析题。但是看到实质你会发现这是有关于概率的一道题目。题目里面首先圈定了范围“18-44岁的选民”,这应该是(14766+47896)人,而其中来自Midwest的人是(3453+11237)人,因此,所求的概率就是: (3453+11237)/ (14766+47896)=14690/62662=0.234,因此选择B。

事实上,以图表形式来考核的古典概型的题目很多,几乎每次考试中都会遇到。 但是有的时候,考核的内容不是单一事件,而且很多事件结合在一起的概率。因此,必须要先熟悉这几个概念和公式。

2、独立事件(Independent Events)、互斥事件(Mutually Exclusive Events)

例题2(Official Guide的题目):

解析:probability of either AorB说明了要求的是两个事件的并集,即:两个事件中只要有一件事发生即可。

而“female under40”和“male40 or older”是两个互斥事件,没有人可以即是40岁以下的女人同时又是40岁以上的男人。因此,这个概率就是两个单独的事件的概率的叠加,即:P(AUB)=P(A)+P(B),因此答案选择B。

3、条件概率

条件概率说的就是事件A在事件B已经发生的情况下而发生的概率,表达为P(A|B)。

那么,如果一件事件的发生可能性不受另一件事发生与否的影响,这两件事情就叫做互相独立的事件,表达为:P(A)=P(A|B),则AB互相独立。同样,也有P(B)=P(B|A)的表达。

对于互斥事件,我们知道:一件事发生,另外一件事就一定不会发生,因为他们是互斥的,所以表达为:P(A)>0,但是P(A|B)=0。

如果两件事情并不能保证互相独立,则一件事情的条件概率的表达方式如下:

P(A|B)=P(AB)/P(B)。

对于条件概率的表达和计算,可以通过这样一道题目来简单理解:

一个盒子里面有20块糖,其中12块白色的,8块黄色的。在12块白色糖中,有5块白巧克力糖。求:(1)随机抽取一块糖是白巧克力糖的概率;(2)如果随机抽取一块糖是白色的糖,求该糖是白巧克力糖的概率。

解:(1)就是古典概型的题目。总可能是20,白巧克力糖的可能是5,则相关概率是5/20=1/4,随机抽取一块糖是白巧克力糖的概率是1/4.

(2)已经知道抽取的糖是白色的糖,所以这可能值为12,而其中白巧克力糖的可能是5,所以,相关的概率是5/12.如果我们套用公式,P(AB)=5,(既是白色糖又是白巧克力糖的事件为5),P(B)=12(白色糖的事件为12),所以,P(AB)/P(B)=5/12。

在(2)中,事件A(抽取白巧克力糖)和事件B(抽取白色的糖)不是相互独立的事件,相反,事件A是事件B的子集。

对于相互独立的事件A与B,有P(AB)=P(A)P(B)。

要理解这个公式,可以举一个简单的例子。

比方说,你每天早上读英语诗的概率是0.4,我每天能够在7点之前醒来的概率是0.6,那么显然这两件事情是互相不干涉的独立事件。因此,某天我7点前醒来恰巧那天早上你读英语诗的概率就是这两个独立概率的乘积:0.4*0.6=0.24。

目前对于概率,SAT还没有做更深层次的考核,学生掌握了上面的知识和方法,就可以对考核的题目游刃有余了。