gmat算分机制分析，gmat怎么算分？

Category: 翰林严选 Date: 2022年1月26日下午12:38

【ESR分析】从710的ESR中，解读GMAT的算分原理
今天，我们就一起来分析分析这份ESR，看看从中能得到哪些启示吧，根据一位同学的成绩来分析，重点在于gmat算分机制分析，一起来了解一下，为之后的考试做准备！
整体概述这位Y童鞋的目标分数是730分。
考完试出来，她给我的反馈是：SC做的很顺利，CR和RC做的稀烂，尤其是CR，有四五题是她最弱的归纳题：【ESR分析】从710的ESR中，解读GMAT的算分原理
那么ESR中反映出的V各科情况是否真的如此呢？我们且往下看：
V各科单科概况
先来看V的单科情况：

【ESR分析】从710的ESR中，解读GMAT的算分原理
还是老规矩，先看V的整体数据三张图：
CR算分题8题错了4题，平均用时2分19秒，得分37分；RC算分题10题错2题，平均用时2分07秒，得分39分；
SC算分题12题错3题，平均用时1分13秒，得分35分。
从正确率和pace来看，ESR的数据似乎和她下考场后的直观感受比较吻合：CR和RC都费时较多，而CR的正确率确实也不理想，只有50%。
但是，从得分来看，竟然和她的自我感觉乃至正确率大相庭径：她的SC得分居然是最低的！
为什么会这样？可能有同学会得出结论：GMAT是玄学。
但其实如果你了解自适应的算分原理，可能就能理解了。
自适应的算法非常复杂，需要用到IRT项目反应理论及MLE最大似然估计等高级算法，我们就不堆数学公式了，我简单用定性的说明，争取让你能够明白。
简单来说，GMAT计算你的能力值，需要绘制出你的“难度-正确率曲线”。这个曲线显然不是直接把你的所有题目样本简单的连起来，而是需要一个理论模型来将离散的样本进行回归分析。
我们最常见的样本回归分析模型就是线性回归，也就是根据样本拟合出一条直线。但是难度和正确率显然不应该符合线性关系。GMAT实际用到的是逻辑回归模型（logistic model）：
【ESR分析】从710的ESR中，解读GMAT的算分原理
我们定性的认知一下这个曲线的意义：曲线横轴是题目难度，纵轴是做对的概率。理论上，特别简单的题目，你的正确率会趋于100%，而特别难的题目你的正确率会趋于0%。当然，考虑到有蒙对的概率，所以图形最后并不趋于0而是趋于10%，这是GMAC选取的猜测参数c。
当GMAC把你的做题样本按照模型算法拟合成这样一个曲线后，你的能力值应该是对曲线求导，取斜率绝对值最大的点a所对应的难度b。它的意义是：在这个难度附近，难度波动对你的正确率影响最大，也就是说轻微的难度增加就会导致你正确率有相对显著的下降：
【ESR分析】从710的ESR中，解读GMAT的算分原理
假如用视力测试来类比的话，比方说医生发现你从2.0到4.9，答题正确率100%，5.0的时候你就有一部分看不清了，而5.1以上全都看不清。这意味着你在4.9之前和5.1之后正确率几乎毫无波动（只不过前者是保持100%，后者保持0%），而在5.0附近正确率波动特别显著，所以最终医生会评估你的视力为5.0。

所以小结一下：GMAT最后的算分，是拟合出你的“难度-正确率曲线”，然后求导取斜率最大点对应的难度值作为你的真实实力值，再换算成相应的得分。

花了这么多精力来讲原理，接下来我们说说为什么Y童鞋的CR正确率50%却能得37分，以及为什么她的SC正确率高达75%却只有35分。
我们来看官方给出的一个正常分布和一个异常分布：

【ESR分析】从710的ESR中，解读GMAT的算分原理
上图绿色点代表做对的题，红色点代表做错的题，按难度系数排列。这是一个正常分布，整体上符合简单题正确率稳定对，难题真正确率也稳定对，而越靠近中间正确率波动越大。Y童鞋CR的“中间”大概就在37分难度附近，比方说她的八道CR算分题，3题是低于36难度的题都对了，3题是高于38难度的题都错了，而2道37难度左右的题对一题错一题，那么她CR的得分就是37分。
【ESR分析】从710的ESR中，解读GMAT的算分原理
而这个图是一个异常分布，你会发现最难的题目在右上角，正确率很高，而整个图靠中间的部分正确率反而低。这时你会发现系统拟合出的曲线比正常情况左移了很多，相当于只考虑了左上角的对题和中间下方的错题，右上角做对的难题样本等于被舍弃了。Y童鞋的SC题目分布很可能类似于这个分布，不过没有这么极端（如果单科过于极端可能会被打最低分6分，如果三科都极端可能会被怀疑作弊）。比方说她遇到了4道34分以下的题目都做对了，遇到3个36分以上的题也都对了，但遇到5个35分左右的题目却错了3个。这时候，36分以上的难题相当于白做对了，拟合曲线只考虑了36分难度以下的9个题，最终给出了35分的得分。
这个故事告诉我们：中等难度题目的稳定性，比多做对几个难题要更加重要。
当然，进一步分析的话，我们会发现：Y童鞋的SC整体难度应该是低于CR的。而她明明更难的题都能做到高正确率，为什么35分左右的题正确率反而这么低呢？
理论上有可能是因为恰好有那么三四个该难度的题恰好考到了她的知识盲点。但如果是这种情况，考试中应该会有明显的感觉，根据她的考后反馈，排除这种情况。
所以，大概率是另外一种可能性：她在前面比较早有一个对她而言不难的35分题，她大意做错了，这导致SC单科的升库速度会略低于其他两科；然后她在最后可能出现了连错掉库，而恰好掉到低难度的时候是两个SC题，这两个题又做错了，导致SC单科分数低于她的真实实力。
我们接着看考试流程：
考试过程分析
这里我们主要看分段正确率、难度和时间饼图：
【ESR分析】从710的ESR中，解读GMAT的算分原理
她四个quarter的算分题错题情况分别是：

第一部分8题错2题，正确率75%；第二部分7题错1题，正确率86%；第三部分7题错2题，正确率75%；第四部分8题错5题，正确率50%。
第一部分她的简单题和中等题基本都做对了，而两道错题平均难度相当大，接近40分。而看她的时间饼图会发现，她在第一部分居然平均一题用时只有1分钟，做得太快太着急了。
我们按照饼图面积，错题平均用时大约是正确题两倍，稍微估算一下她的用时：
6R+2×2R=480s
对题用时R约等于50s一题，而错题用时约1分40秒一题。再结合她前面的各科平均pace，我有理由推断：她这一部分应该是错了一道较难的CR，用时超过2分20秒，同时错了一道SC，用时大约1分钟左右。
结合前面的信息，我进一步推断她第一部分是连续对了4-5题，很快进入高分库，系统给了一个超难题做错之后，又错了一个35分左右难度的SC，于是又给了一两个30左右难度的题目她做对了。

第二部分她继续保持良好的势头，在难度上升的情况下，正确率仍然非常高，对题平均难度在35分左右，直到难度上升到接近45才错了一个题。从用时来看大概率是错了一个超难的RC。
第三部分平均难度接近40分了，这部分她的整体正确率仍然很高，但错题平均难度和对题持平，应该不是错了表现最好的那科，而用时比正确题目多很多，大概率不是SC，很可能是两道CR很难的CR归纳题。

注意到前三部分她做的非常快，第四部分应该有很多时间。但这部分在难度和第三部分持平的情况下正确率却很低。结合前面她的考后感受，我做出的猜测是：这部分她先做对了一两题后，遇到了一篇超难的RC，她做得有些吃力，但实际只错了一道算分题。然后紧接着又出现一个CR的难归纳题，而前面的挫败给她在CR归纳题上带来了一定的心理阴影，她不仅这题做错了，还有点心态失衡，想放弃治疗了。
最后三道题中理论上应该有一个测试题，另外两个很可能是连着两个SC都做错了，尤其是最后一题，她应该是还有时间多，等在那里到最后才选，但是选错了，所以出现这部分错题用时异常多的情况。
当然，上述分析有不少是我的推断，所以需要询问沟通实际情况。
说实话，分析到这里我觉得这位Y童鞋这次考试有点可惜。
如果最后她心态不出现大幅波动，很有可能能做对最后的SC题，如果那样的话，反而是个别的错题被拟合曲线抛弃，SC得分甚至可能比RC要高，那么她很有可能已经分手了。
当然，从她这次考试，也明显暴露出来一些问题：
首先她前面做的太快，虽然正确率已经非常高了，但也一定程度上导致了前面不经意的小失误。如果能稍微的稳定一下pace，避免过早做错能力范围内的题，其实最后的错题影响会小很多。据了解Y童鞋考前模考做得太少，建议下次考前还是需要通过模考练练pace。前面可以稍微快点为后面难题节约时间，但也不要太快，否则失误率会增加。
其次，她在最后的心态崩了。究其原因是CR和RC在最后倍感吃力，从而误以为自己这两科没考好。但事实证明，她的这个判断是错的。这种吃力的感觉，其实是因为升库使得题目难度加大，触碰到了她的能力上限边缘。判断错了，本身倒是不扣分，但是这对最后的心态带来了较大的消极影响。就好比一场马拉松，跑到离终点还有不到1公里，却提前卸了一口气。
其实之前在分享里也提到过，GMAT考到最后对于高手而言是个逆商考试，希望Y童鞋通过这次的经历，积极做一些心态建设。真正在考场上，理论上尽量是要保持平和的心态，不要去揣测是否升库掉库，因为无论如何，前面做的题都不能改，你眼下能做的最优方案都是把后面能做对的题尽可能做对。
当然，人没法真的把自己变成无情的做题机器，那么考试中宁可给自己一些盲目自信：吃力的时候，不要觉得是自己考砸了，而要相信这是因为系统升库的原因；而做得比较轻松的时候，也不要担心自己掉库了，而要相信是因为自己能力强难题也不觉得难，这样不断给自己正面的心理暗示，鼓励自己坚持到最后。
小结
今天我们通过具体的一个案例带着大家初步了解了一下GMAT计算分数的原理。同样30美金的ESR，读得懂和读不懂，价值有天壤之别。