继 AlphaGo 与众多围棋高手对战之后,人工智能挑战中国高考成为新的热点:两款数学高机器人将参加今年的高考,包括由国家科技部 863 计划牵头研制的机器人 AI-MATHS,以及 K12 在线教育公司学霸君旗下的 Aidam。今天,它们将在断网环境下做数学高考题。
2011 年,IBM 沃森在智力问答竞赛中击败人类,赢得冠军,成为人工智能史上一个里程碑。此后,IBM 沃森向医疗、法律等领域拓展,转型成为智能医疗系统,以及如果高考机器人考上清华北大,也许会成为另一个里程碑。
与 AlphaGo 一样,高考机器人并没有实体,而是一个能自动解题的人工智能系统。据介绍,跟以图像识别和匹配为主的拍照搜题技术不同,通过提前学习和训练,高考机器人能够解答从未出现过的新题目,并给出详细的解题步骤。
为什么选择参加高考?日本高考机器人 Torobo-kun 的研发团队曾对此作出过解释,计算机擅长计算,因此,它能够轻易在专业象棋、将棋等对弈游戏击败职业选手,但高考是人类社会的一项高难度测试,对计算机来说,答高考题需不仅仅需要强大的计算能力,更重要的是理解人类的思考过程,以及处理信息的过程。如果通过高考,也代表着人工智能领域的新突破。
学霸君创始人张凯磊称,希望通过此次 PK 展示人工智能在教育领域的进展,他对这场特殊的高考充满信心,“在学习了几千万道题目之后,机器已经能够像人一样思考知识点,并一步一步输出解题过程,而不是简单的暴力计算”。
据了解,AI-MATHS 学习了小学到高中的 7000 多个考点,运算量可达到 2 的 800 次方,其研发团队准星云学的创始人林辉认为,跟 AlphaGo 相比,高考机器人的研发难度更大,原因在于,用计算机语言描述围棋规则相对容易,但研发高考机器人,首先需要让系统理解人类语言。“比如遇到没学过的生词,人类会联系上下文去推测词义,猜对是比较容易的事;而机器人却会卡壳。”他解释说。
这正是日本高考机器人 Torobo-kun 放弃高考的原因。自 2013 年起,Torobo-kun 每年都会参加日本高考,它的目标是考入东京大学,在此前的多次考试中,其物理成绩不错,但受制于语言处理能力,在其他科目的成绩并不理想。日本高考机器人的研发负责人 Noriko Arai 教授表示,在目前的技术条件下,考上东大很难,她解释道:“人工智能系统无法理解必要的信息,阅读和理解句子含义的能力存在局限。”接下来,放弃高考的 Torobo-kun 会被应用到数据分析领域。
其实,早在高考机器人的概念成为热门关键词之前,针对各个专业领域知识处理的自动问答系统的研发,全球顶尖的研究机构已经有各类尝试。比如 1984 年启动的塞克(Cyc)工程,其目标是建立一个庞大的人类常识知识库,用于回答和解决一系列的科学和技术难题。2002 年启动的 Project Halo 则是要研发一个科学知识库,用于回答学生或专业人员提出的复杂科学问题,Project Aristo 则致力于解答标准化考试问题。
自动解题系统是人工智能领域的前沿性研究,涉及到人工智能技术的多个领域,包括图像识别、语音识别、自然语言处理等,据学霸君的首席科学家陈锐锋介绍,其解题过程涉及到三个步骤:
一是理解和识别人类语言,把题目变成机器人可解码、可理解的语言,即通过自然语言处理将人类语言转换为形式语言。
二是逻辑推理,利用计算机的知识语言网络,模拟人类处理信息的方式和策略,找出最佳解题路径。
三是用人类的语言回答问题,并给出详细的解题步骤,即将形式语言转化为自然语言。
其中最大的难点在于让机器理解人类语言,这也是自动解题系统被公认的核心问题之一:自然语言处理中的语义分析。机器需要首先识别人类的语言,并分析其含义,其中包括各类常识、谜语等隐性的线索,比如数学经典问题鸡兔同笼,其隐含条件是鸡有两条腿,兔有四条腿,而计算机可能并不知道这类常识,它更擅长规则下的精确计算,但人类的自然语言并不精确。比如在物理解题过程中,假设忽视物体的大小,以及假设摩擦为零之类的思考方式,计算机并不能理解。
AI-MATHS 同样遇到了这样的情况,当题目中出现机器人从未“学习”过的生词,比如投资、理财等,它会由于无法理解而卡住。
另外一点则是逻辑推理能力,不同国家的高考机器人研究团队发现同一个问题:在不同科目的尝试中,机器人在文科解题中表现更好。原因在于,理科强调逻辑理解和推理能力,而机器学习在这个领域还未取得重大进展,目前更强调记忆、计算等能力。因此,数学自动解题
正如研发 IBM 沃森并不仅仅是为了参加智力答题竞赛,高考机器人也并不是人工智能系统研发的最终目的。从学术上来讲,高考机器人可以检验人工智能在多大程度上能够模拟人类的思考和理解过程,就实际应用而言,则是要利用技术进一步提升老师和学生教与学的效率与效果。
2014 年,科技部启动 863 项目“基于大数据的类人智能关键技术与系统”,讯飞研究院副院长王士进表示,三年来取得了很多进展,包括认知推理解题、语文学科自动作文写作、地理学科基于知识图谱自动知识抽取的主观题答题、历史学科基于深度学习的推理解题、基于 OCR 手写文字识别的多维度智能答题评阅等。
这些技术在教育领域都有其应用场景。
>>智能助教
可以为学生提供实时答疑服务。IBM Waston 在教育领域推出了Jill Watson 应用,试图成为课堂里面的新助教,负责为学生提供实时反馈和答疑服务。2014 年,该应用在佐治亚理工等学校投入使用。经过研究团队的调试,Jill 能达到 97% 的正确率。
>>自动批改、阅卷
借助图像识别和语义分析技术的融合,实现主观题的自动批改以及评分,减轻老师的教学负担,同时能够加速在线教学数据的搜集。
>>自适应教学系统
搜集学生的学习行为数据,基于人工智能和大数据的技术做出诊断和分析,帮助老师更好地了解学生的学习情况,为其下一步的教学活动提供参考,同时,课后为学生推荐适合的学习材料,在学生遇到困难时为其提供解题思路,以此达到个性化学习的效果。
此外,人工智能的发展为教育从业者提出了一个新的问题:在人工智能时代,我们需要什么样的教育?日本的 Noriko Arai 教授表示了自己的担忧:“一个没有阅读和理解能力的机器人,成绩居然超过绝大多数高中生,而大多数学生只是填鸭式学习,并没有真正理解知识,相较而言,AI 在记忆方面做得更好,因此我们需要新型的教育。”