| 诊断评估
> 诊断测试的问题数量远超我的预期!
正如在第二十七章[1]中所讨论的,诊断测试之所以需要大量问题,主要有两个原因:
- 我们的课程采用了精细的认知脚手
- 我们不仅评估学生对当前课程内容的掌握程度,还会评估他们可能缺失的任何基础知识
对于高阶数学课程,诊断测试可能需要评估你对超过 1,000 个数学主题的理解!虽然感觉诊断问题很多,但实际上每个问题平均能够提供关于你对约 10 个不同主题掌握情况的关键信息。
这就像去一家专业健身中心,你首先需要进行全面的身体成分分析和针对全身各个肌肉群/关节的力量/灵活性测试。为了让你能以最高效的方式达成数学学习目标,我们需要精确了解你的强项和弱点,从而为你量身打造完美匹配个人需求的学习计划。
当然,如果你只是想在周末随便去健身房走几圈,那么这种方式可能不太适合你!但如果你希望每周投入大量时间进行系统训练,并希望尽快达到专业水平,这正是实现目标的最佳路径。
> 你们不能改进诊断算法来减少问题数量吗?
我们已经投入大量时间优化诊断算法,使其尽可能快速、高效。在保证结论精确性和稳健性的前提下,减少诊断问题数量存在一些物理上的硬性限制。我们的诊断系统已经优化到这样一个程度:如果强行将问题数量减半,你的学习定位将无法准确匹配你的实际知识边界,这会导致你因为做过于简单(或更糟糕的是,过于困难)的任务而感到挫败。
诚然,诊断测试过长会导致学生放弃,但定位不准确同样会造成放弃。Math Academy 针对这一权衡的解决方案主要面向那些愿意投入大量努力来学习更多数学知识的认真学生。对于这类用户而言,花一两个小时完成诊断测试,相较于他们计划投入到数学学习的总工作量来说微不足道。这类用户通常认为,在学习初期花费相对很少的额外时间是值得的,因为这能确保未来长期享受顺畅的数学学习旅程。
> 我感觉被安排学习与我课程无关的低级课程,而且在课程进度上花费了太多时间。我该如何解决这个问题?
你被分配学习较低级别课程主题的唯一情况是,当这些内容是你正在学习课程中某个主题的前置知识,且你在诊断测试中对这些内容(或其前置知识之一)回答错误。要想跳过这些主题,你需要在诊断测试中提供证据,证明你能够解决这些问题(或其后续相关主题)。
有时候,学生们会误认为某些主题与他们当前课程无关,而实际上这些是必不可少的前置知识。例如,积分看似与线性代数无关联,但在解决内积空间问题时却是必需的。同样,有理根定理、综合除法和多项式因式分解可能看起来不相关,但在计算 3×3 矩阵的特征值时,这些知识却是必不可少的。
如果你认为自己在诊断测试中本可以表现得更好,那么值得非常认真地重新参加测试。请记住,系统的所有评判都基于你展示解决问题的能力,而学生在其他地方学过课程但仍未能充分掌握内容以至于无法正确、一致且及时地解决问题的情况并不少见。
> 我在诊断测试中答错了一些题目,但我真的懂这些内容,我发誓!你不能就给我这些主题的学分吗?
欢迎你再次参加诊断测试,通过正确解决问题来证明你的知识水平!Math Academy 采用的是精熟学习系统,获得某个主题学分的唯一方式是提供掌握该主题的证据,即展示你能够正确解决问题的能力。如果你在诊断测试中答错了题目,系统会推断你尚未掌握这些主题(以及依赖于它们的任何主题),无论你自认为对它们了解得多么透彻。
> 有一个我知道如何做的主题,但诊断测试没有涉及这个内容,所以我没有获得相应的学分。
诊断评估系统非常全面;它会持续提问,直到获取学生在课程及其基础知识中每个主题的掌握情况(或不足之处)的确切证据。如果学生在某些主题上未能获得学分,那是因为他们在这些主题或其前置知识的问题上提交了错误答案。尽管有时候学生能够在没有完全掌握前置知识的情况下解决某个主题的问题,但这表明学生的数学知识基础中存在「漏洞」,诊断系统有意将学生安排到他们知识最薄弱处的底层,以便这些知识漏洞能够被有效填补。
将学生安排在知识漏洞的最底层对确保学习成功至关重要。如果诊断系统采取相反的做法,将学生安排在他们最高知识漏洞的顶层,那么学生可能会因获得更多学分而在初期感觉更接近目标,但这些知识漏洞迟早(很可能是很快就会)导致他们在学习需要更深层次前置知识的新主题时「卡住」,从而妨碍整个学习过程。
不过,成年学生在参加初始诊断时数学知识常常极其生疏,但在完成一些学习任务后,大量记忆可能会突然恢复。当这种情况发生时,通过重新进行诊断评估,学生有时可以获得显著更高的起点位置。
此外,我们正在开发一项新功能,学生可以在任何分配的课程上点击「我已经掌握这个内容」,并通过回答该主题的几个高级问题来证明自己的知识水平。这样,学生在初始诊断后能够快速、便捷地继续调整自己的知识画像。
> 诊断评估后,如果我被要求完成一个我尚未学习其前置知识的课程,该怎么办?
Math Academy 的诊断考试相当准确,但并非 100% 完美无缺,因为要确保完全精准的水平分级,将需要学生回答不切实际的大量诊断问题。为了显著减少问题数量,我们的诊断考试采用了一些灵活的推断方法——虽然罕见但确实偶尔发生——这可能导致学生在某些学习路径上略微落后或超前(但更可能是落后)于他们实际的知识边界。
(举例来说,如果学生在某个模块的「叶子主题」上正确回答了一个问题,我们会将该问题视为该模块的「代表性样本」,并为同一模块中的其他叶子节点授予一定学分。否则,诊断测试就必须对每个独立的叶子主题进行明确评估,这会导致问题数量爆炸性增长。这一设计理念是:如果学生掌握了某个相关知识群组中的最高级技能,那么他们很可能也掌握了该群组中的其他高级技能,或者至少具备足够的基础知识能够随时快速复习掌握。)
在实际应用中,在极少数学生知识水平被高估并收到了他们尚未学习前置知识的课程的情况下,这种高估的程度足够小,学生能够通过点击前置知识并以参考模式查看相关课程来自行补充学习。据我们所知,从未出现过学生无法通过这种方式取得进步的情况,前提是他们认真完成诊断测试并提交了真实反映其知识水平的答案。(在为数不多的几例学生被安排到远超其实际知识水平而无法在系统中取得进展的案例中,最终调查发现这些学生在诊断过程中都使用了外部资源来获取帮助。)
此外,即使在极少数情况下学生需要通过参考模式查看课程来学习前置知识,随着学生在系统中完成更多工作,这个问题也会迅速消失:学生很快就会到达这样一个状态——对于他们可学习的所有课程,他们已经明确完成了所有前置知识的课程。
> 诊断测试后,为什么失败一个单一任务会导致我的进度下降多个百分点?
诊断测试后,系统可能对学生在某些数学领域的知识有所推断,但置信度较低。随着学生完成学习任务,系统会更快地适应学生在这些低置信度领域的表现。如第二十七章[1]所讨论的那样,这些主题被称为「有条件完成」,因为尽管学生基于诊断测试(仅仅是)获得了这些主题的学分,但保留这些学分的条件是学生能够通过那些假定已掌握这些主题知识的任务。
如果学生在一个「有条件完成」的主题上没有通过某个任务,系统会这样推理:
⠀⠀⠀等等,我们原以为他们掌握了该主题及建立在其上的一些更高级主题——但他们在诊断测试中只是勉强通过了这些主题,所以他们现在遇到困难的事实表明他们很可能实际上并不掌握这些内容。现在需要修改我们之前的判断,撤销最初授予的学分。
这种机制在多步骤任务和测验中可能较为微妙,因为在这些任务中每个问题都链接到不同的主题。学生可能因为错误回答与特定主题相关的问题而失去该主题的学分,同时又因为正确回答与其他主题相关的问题而获得那些主题的学分,并且整体上仍然通过了任务。
| 课程
> 对于短课程,课程内容真的全面吗?
是的,我们的课程内容完全全面——事实上,我们会与所有主流教科书进行课程对比,确保我们覆盖的内容范围更加广泛。
那么,在课时结构如此精简的情况下,我们如何涵盖所有必要的内容呢?秘诀在于将每门课程细分为大量小课时。一门典型课程包含 150-300 个课时,每个课时包含约 3-4 个难度递进的「知识点」,每个知识点由一个详细解析的示例和 2-5 道练习题组成,练习题数量会根据学生的表现智能调整。
本质上,我们将「学习阶梯」切分成了大量的微台阶。这条学习路径仍然通往同样的高度,但每一步都足够小,学生不会因为面对过高的台阶而止步不前。
> 参加 Math Academy 为标准化考试(例如 AP 微积分 BC)提供的课程是否能够充分准备学生应对真实考试?
Math Academy 的课程涵盖了学生在标准化考试中取得成功所需的知识内容。虽然这构成了备考工作的绝大部分,但这并非完全足够。学生在完成 Math Academy 课程后,还需要针对他们计划参加的特定考试完成一定数量的模拟测试。
练习模拟考试如此重要的原因在于——除了有时间限制外——标准化考试通常会将知识内容以各种问题框架、表述方式和情境背景「包装」起来,这些形式初次接触时可能让学生感到陌生。虽然没有人能预测考试中会出现的具体题目,但学生可以通过大量练习来使自己适应与真题相同的统计分布规律。这需要通过完成尽可能多的模拟考试来实现——理想情况下是历年真题,或者至少是出题机构直接提供的模拟题。(如果无法获取此类资源,那么从其他在模拟真实考试题型方面有良好口碑的机构获取练习材料就显得尤为关键。)
当学生在模拟考试中答错题目(或对答案缺乏足够信心)时,应该查看解析,找出自己的错误,并立即正确地重做一遍。第二天,他们应该尝试不借助任何帮助解决同一问题。如果这次解答正确,可以等待几天后再次尝试;如果解答仍然不成功,则应回到这个过程的起点(查看解析,识别错误,立即正确解答,并在次日重新尝试)。这实质上是在学生的薄弱领域应用间隔重复。这个过程应该贯穿所有模拟考试的多轮练习,一直持续到真正考试的前一天。
同时,学生还应在其 Math Academy 课程中启用「备考模式」,这样他们就能持续复习课程内容,而不会被提升到下一课程。持续完成 Math Academy 的这些复习至关重要,这样学生才不会对任何课程内容变得生疏。在参加考试时,学生需要对所有 Math Academy 课程内容以及练习考试中涵盖的所有题型做到 100% 掌握且 100% 保持新鲜度。
根据经验,我们建议学生至少在考试前 6 周完成 Math Academy 课程,并在考前完成至少 6 套练习测试。在此期间,我们推荐每天投入约 1.5 小时备考:在 Math Academy 上进行 30-45 XP 的复习,以及花 45-60 分钟做练习测试并重新尝试解答其中的题目(批改练习测试所花费的时间不应计入这段时间)。在考试前一周,我们建议将备考时间增加到每天 2-2.5 小时,将额外时间用于练习测试。
练习测试需要计时,但可以分成较小的时间段完成。例如,如果一套完整测试需要 2 小时,那么可以通过做题号是 4 倍数的题目来构建一个 30 分钟的练习段。以这种纵向方式切分考试非常重要,而不是仅仅做考试的前四分之一部分,因为考试题目通常是从简单到困难排列的,预计困难题目会需要更多时间解答。
最后需要强调的是,当学生已经牢固掌握课程内容并开始参加实际模拟考试时,他们往往会对自己初次考试的低分感到惊讶。这种情况其实很正常,学生只需要一些实战经验就能逐渐适应考试的时间限制、题型和问题表述方式。Math Academy 在指导学生备考 AP 微积分 BC 考试(采用 1-5 分制评分,5 分为最优)方面积累了丰富的实践经验。根据我们的观察,即使是那些最终能获得 5 分的优秀学生,在首次模拟考试中通常也只能得到 2 分或勉强达到 3 分。到第二次模拟考试时,他们的成绩可能会提升至 3 分或 4 分;第三次考试可能稳定在 4 分或者刚刚触及 5 分水平;到第四次考试时,他们通常能稳定获得 5 分;而在后续的第五次和第六次模拟考试中,他们在 5 分档次的表现会越来越出色。
> Math Academy 是否解释解题步骤背后的「原因」?所有概念是否都是先教授的?
Math Academy 在整个课程体系中都着重解释解题方法背后的「原理」。以下是一个具体实例:
- 在代数教学中,当我们教授如何解方程时,首先介绍的是方程解的本质概念:解就是当代入变量后能使等式成立的数值。例如对于方程 2x=6,这实际上是在问「什么数乘以 2 得到 6」,学生无需运用代数知识就能直观理解解是 x=3(因为 2 乘以 3 等于 6)。
- 我们会先让学生不使用代数方法练习解决这类简单方程,然后才引入代数运算技巧,如「从 2x=6 开始,等式两边同时除以 2,得到 x=3」。这样的教学顺序让学生能够将代数操作视为他们已有直觉思维的自然延伸,而非孤立的规则。
然而,在我们的课程体系中,概念和步骤是紧密交织在一起的。我们不采用「先教所有概念,再教所有程序」的方式,因为如果没有一方的配合,另一方就无法得到适当深入的理解。概念和步骤之间存在双向的、相互强化的关系。换句话说,它们是这样相互构建的:
- 基础概念支撑基础解题步骤,
- 基础解题步骤支撑更高层次的概念,
- 更高层次的概念又支撑更高层次的解题步骤。
以一个具体例子说明:
- 学生必须能够数数才能理解数字的概念,
- 学生必须理解数字概念才能执行算术运算,
- 学生必须能够执行算术运算才能理解变量或代数方程的概念。
> 你们的大学课程是包含需要证明的习题,还是仅仅涉及计算?
我们的《证明方法》课程是以证明为基础的。截至撰写时间(2024 年 11 月),我们其他的大学课程都是以计算为基础的,但这仅仅是因为它们是各个学科的第一门课程,而基于证明的课程通常会是第二门。我们最终会开发更多基于证明的课程,但当前的计算类课程将作为它们的先修课程。
有时候人们会误以为 Math Academy 将停留在当前的深度/难度水平,而实际上,我们仍在不断构建和完善课程体系。这项工作远未完成。
- 我们的《证明方法》课程是否包含 ε-δ 证明?是的。它是否涵盖《鲁丁数学分析》(Papa Rudin)?不,因为那已经超出了课程范围。这是否意味着我们不会达到《鲁丁数学分析》的水平?不是的,这只是意味着我们还没有发展到那个阶段。
- 再举一个例子:我们有一门以计算为基础的线性代数课程,它是后续基于证明的抽象线性代数课程的先修课。这第二门线性代数课程会更深入地探讨理论和证明,类似于顶尖大学使用 Axler 教材的线性代数课程内容。
遗憾的是,有些人常常会不公平地转移评判标准,说「你们的[第一门]线性代数课程不如 Axler 教材那么深入」,而这根本就不是一个恰当的比较。这就像指责高中微积分课程不如大学实分析课程那么深奥——当然不会!这是两门完全不同的课程;事实上,前者是后者的基础课程;它本来就不是为了涵盖相同的内容。
Axler 的教材实际上是为线性代数的第二门课程设计的,尽管有些大学会直接让学生以此作为第一门课程(这往往会导致学生不必要的挣扎)。我们常开玩笑说,Axler 的《线性代数正确之道》(Linear Algebra Done Right)其实应该叫做《线性代数的二次学习》。
总的来说,我们是从基础开始构建课程体系,为每个学习阶段提供最完善的认知脚手架,并采用精熟学习(只有在学生掌握了前置知识后,才会引导他们学习新内容)——因此,我们自然会在提供基于证明的课程之前,先开设基于计算的课程版本。
但这并不意味着我们最终不会提供基于证明的课程!这些基于证明的课程本质上只是不同类型的课程,我们正在建立必要的先修课程作为通往它们的基础。基于证明的课程已经明确列入我们的发展规划中。
> 很难相信从基本乘法表开始,每周学习 5 小时,一年后就能让我完全为大学课程做好准备。我希望能有一个面向不熟悉 XP 系统的人的解释。
我们知道这听起来可能有些难以置信!为了让这一说法更具说服力,首先需要理解一点:孩子们在学校学习的数学并非全都是大学数学课程所必需的。正如第二十九章[2]所述,我们专门开发了数学基础课程序列,目的是帮助成年人尽可能快速高效地掌握大学数学课程所需的全部前置知识(从分数到微积分)。传统课程序列中约有三分之一的内容虽然是学校标准要求的,但实际上并不构成大学数学的前置基础。这些内容已经从我们的基础课程序列中剔除。
了解了基础课程序列仅包含传统课程约三分之二的内容后,我们可以从帕萨迪纳的校内项目成功案例来说明这一点:那里的六年级学生从预代数的不同起点开始,在接下来的 3 年里,每个教学日投入 40-50 分钟的高度专注学习时间,最终掌握了预代数、代数 1、几何、代数 2、预微积分和 AP 微积分 BC 的全部内容,并在八年级结束时通过了 AP 考试。这听起来也许令人难以置信,但 Math Academy 有 AP 考试成绩为证,过去十年也有大量媒体报道。
现在来看具体数字:每个教学日 40-50 分钟的高度专注学习 × 每年 180 个教学日 × 3 年,总共约 24000 分钟或 400 小时。而我们的基础课程序列只有这个规模的三分之二(因为约三分之一的内容实际上不是大学数学的前置知识),相当于约 267 小时。将这个时间除以一年 52 周,就得出每周约 5 小时。
> 为什么「整体模式」在大学课程中是禁用的?(「整体模式」是指让学生同时弥补那些与其所选课程没有直接依赖关系的、更基础课程中的知识缺口。)
学生最有可能取得成功的方式,是将长期目标分解为短期目标,保持学习动力,并在过程中体验众多小成就带来的满足感。假设一位经验丰富的导师正在辅导一名线性代数的学生,该学生提出了以下请求:
⠀⠀⠀除了帮我掌握线性代数和补充必要的前置知识外,您能否帮我填补所有我目前应该具备的数学知识空白?
在这种情况下,这位经验丰富的导师应该尝试劝阻学生:
⠀⠀⠀你确定要这样做吗?这当然可行,但我不建议这么做。我将不得不评估你过去 4 年应掌握的所有数学知识,然后教你所有缺失的部分,这可能相当于一整年甚至更久的数学课程量。这不仅仅是每次辅导多花 15 分钟那么简单,这至少会让你的学习负担翻倍。而且这些额外的工作并不会让你更快地掌握线性代数。
⠀⠀⠀与其尝试一口吃掉整个大象,为什么我们不先专注于线性代数本身(以及学习线性代数所必需的数学知识),然后等你继续学习其他需要这些基础的大学课程时,再逐步填补你数学背景的其他空白呢?
⠀⠀⠀比如,我注意到你的微积分基础不够扎实,但大部分微积分知识对学习线性代数并非必要,所以与其现在就强化这方面的知识,不如等到你学习多元微积分时再补强。这样学习会感觉更有针对性。同样,当你在学完多元微积分后开始学习概率与统计时,我们也可以用同样的方法来加强你的概率和统计知识。
⠀⠀⠀这种学习方式会更有动力。你将用 8 个月掌握线性代数,再用 8 个月学会多元微积分,然后用另外 8 个月攻克概率与统计,在整个过程中你会持续填补数学知识基础。而如果我们在前期投入更多的精力,先把所有数学基础知识补齐再往前走,仅线性代数就需要耗费 14 个月。之后你还需要 5 个月才能完成多元微积分,再花 5 个月学完概率与统计——这还是假设你能在最初的 14 个月内不放弃的情况下。
⠀⠀⠀无论选择哪种方式,两年后你将达到相同的知识水平。但如果每隔 8 个月就能收获一次学习成果,相比首次成果要等待整整 14 个月才能实现,前者显然更能持续激发你的学习动力。
如果一名学生已经接触到大学水平的数学但缺乏某些背景知识,在他们完成第一门大学课程时就强行填补所有缺失知识将是一个错误决策。更明智的做法是将这些补充学习分散开来,这样能降低学习阻力并增强学习动机,这种情况也会在学生以非整体模式修读更多大学课程时自然发生。
> 当你引入额外的认知脚手架来提高课程通过率时,你如何确定通过率的提升确实反映了真正的学习成果?通过率的增加是否可能仅仅源于更多的预设引导?
这确实是需要警惕的问题——而我们的确对此保持高度关注。我们不仅跟踪通过率,还监测学生在复习和测验中的表现。对于复习任务,预设引导较少;而对于测验,则完全没有预设引导。如果学生在测验中对这些问题表现不佳,这就表明之前的学习可能只是肤浅或暂时的。
此外,我们系统中的大多数主题都有许多后续知识要求,这使得学生需要不断地在已学内容的基础上构建更高级的技能。如果他们没有真正掌握前置知识,就无法继续在此基础上发展更复杂的能力——这就像篮球运动员如果不会运球,就无法成功完成任何需要带球穿越球场的战术配合一样。
上一章:
常见问题解答:XP(经验值)和练习安排 - 知乎下一章:
常见问题解答:其他 - 知乎Thoughts Memo 汉化组译制
感谢主要译者 gemini-2.5-pro-exp,校对 Jarrett Ye
原文:The Math Academy Way: Using the Power of Science to Supercharge Student Learning
参考
1. 第二十七章 诊断性考试的技术深度剖析 ./1903424959960843411.html2. 第二十九章 核心主题优先策略的技术深度剖析 ./1904984795546628821.html