爱学习首 次开放OCR公式识别系统,为AI+教育开放更多技术资源
【慧聪教育网】12月25日,由爱学习教育集团AILab研发的“K12数理化OCR公式识别”系统在百度智能云平台(以下简称“百度云”)正式上线,为教育行业提供公式识别API服务。作为爱学习教育集团首 个入驻百度云的人工智能项目,本次对OCR技术的开放与共享展现了爱学习在“AI+教育”的战略方面取得了阶段性成果,开启了爱学习作为K12教育供给平台对外赋能的又一新篇章。
爱学习“K12数理化OCR公式识别”正式入驻百度云
OCR是一项将图像信息转化为可编辑的电子文本的计算机输入技术。伴随着人工智能的浪潮,OCR识别也逐渐被用于教育行业。OCR是教育资源电子化、信息化、智能化的重要入口,智能搜题、智能标签、自动组卷、自动解题等应用均依赖于此项技术。然而K12领域中数理化的文字符号较为繁复,很多文字识别技术仅止步于简单的一维文字识别,对理科公式等二维结构识别率较低。
爱学习此次入驻百度云的“K12数理化OCR公式识别”是对图像中的公式进行识别的API接口,主要用于K12场景下的数学、物理、化学的公式识别,中文公式、化学公式的支持是该系统的一大亮点,而且该系统简单易用,可以广泛地应用到智能录题、智能搜题等场景中。
爱学习AI试卷还原现场演示
此次入驻项目由爱学习集团AILab基于前沿的深度学习技术自主研发,是针对国内K12场景进行定制和优化的。通过采集近百万的公式数据,爱学习的OCR实现了从小学到高中数理化日常教学与竞赛的公式识别,既支持小学的简单运算,也支持高中竞赛的矩阵、微积分等复杂公式的识别。此外,该系统还实现了跨越数理化全部理科公式的识别,不仅支持数学运算,同时也支持化学反应式的识别。“我们提供了对中文公式的识别支持,像物理公式中的上下标,化学中的反应条件,国内的几乎所有教辅中都存在含有中文字符的公式。在我们的近万张的测试集中,实现了业内领 先的识别准确率,线上公式识别准确率高达95%以上。”爱学习集团AILab技术主管介绍道。
据爱学习集团AILab技术主管介绍,目前该套“K12数理化OCR公式识别”系统已经成功应用于爱学习内部的教研和教学,如资源库的试卷还原功能,教师端的智能DIY编辑器,爱尖子事业部的培优APP中教材的录入等都已经有了成熟的应用。“将该识别系统融入AI拍照判题中,可实现对整套试卷的智能阅卷,更大程度节省老师的判卷时间。以一套包括15道填空和选择题的数学试卷为例,从拍照到批改完成,仅需3-5秒,相对教师手工判题,效率提升10倍左右。”
爱学习AI智能录入界面
爱学习的OCR识别技术获得了百度云和行业的高度认可,此次入驻百度云也是为了向教育行业共享最新的研发成果,惠及更多的教育机构和个人用户。
自2018年成立AILab以来,爱学习教育集团开始着力打造“爱学习AI大脑”,其正在研发的多项人工智能分析领域的尖 端技术,覆盖多角色、全场景,在计算机视觉、语音识别、自然语言理解、决策能力等多方面实现行业技术领 先。此次“K12数理化OCR公式识别”产品入驻百度云,是爱学习坚持“AI+教育”战略的阶段性成果。接下来,AILab将在助力教育的方向上持续发力,打通教育领域感知智能、认知智能、决策智能、行动智能的AI闭环,在AI好课、OCR识别、语音评估、智能标签、学科知识图谱、个性化题目推荐、AI教管等细分领域精耕细作,使爱学习的AI成果既能对内提供服务、提升教学质量和效率,也能对外赋能,将更多更专业的AI技术共享给教育行业,为传统的教育模式注入新的活力。