探究图像识别教学中的计算思维培养方式

    朱丽花 白珍

    随着移动互联网、智能手机和各种社交媒体的发展,图像慢慢成为互联网中的主要信息载体,图像识别在日常生活中扮演了非常重要的角色。例如,交通运输方面的车牌自动识别系统,公共安全方面的指纹识别技术、人脸识别技术,农业方面的食品合格检测技术、森林里树木的健康状况分析技术,医学方面的X光片识别技术,商业方面的扫描二维码、商品相似款搜索技术,生活娱乐方面的“以图搜图”技术、娱乐监管技术等。此外,在机器人、智能家居、自动驾驶、教育、古玩等行业,图像识别也有不同程度的应用。但是,对课标提到的数据与计算的内容,不少教师的理解还停留在数值计算和工具操作层面,很少关注计算机处理类似于图像、视频等非数值型数据的原理和方法,并且普遍存在重实践轻理论、重操作轻思维的倾向。引导学生探究“人脸识别”背后的技术原理,体会形成问题解决方案过程中产生的一系列思维活动,有助于学生计算思维的发展。● “人脸识别”案例呈现

    如今“刷脸”时代已经到来,人脸识别技术已应用到公安、机场、边防、银行、电子商务、单位考勤、安防等多个领域。那么,“人脸识别”是什么?它又是如何工作的呢?人脸识别可描述为给定静止或动态图像,利用已有的人脸数据库来识别图像中的一个或多个人,因此人脸识别通常也叫做人像识别、面部识别等。人脸识别技术的工作过程可以概括为信息数字化、简约、提取关键特征、自动识别等,具体过程如图1所示。

    信息数字化。从摄像头、照片或视频中采样,检测出人脸的存在并确定其具体位置。

    简约。为了保证人脸图像中人脸大小、位置以及人脸图像质量的一致性,必须对图像进行简约和预处理。常用的操作有增强图像对比度、姿态矫正、光照补偿、尺寸归一化、锐化等。

    提取关键特征。提取出人脸中眼睛、鼻子、嘴巴的距离、倾斜度等关键特征。

    自动识别。输入一个人脸特征,和数据库中对应的特征进行逐个比对,找出“一个”与输入特征相似度较高的特征。将这个较高相似度值和预设的阈值相比较,如果大于阈值,则返回该特征对应的身份,否则返回“不在库中”。

    

    人臉识别技术使用到的提取、约简、数字化、抽象特征、建立模型、设计算法、自动处理等要素,都是构成计算思维的基本要素。● 运用计算思维探究“人脸识别”背后的技术

    通过界定问题、抽象特征、建立模型、合理组织数据、判断分析与综合等一系列计算思维活动,能够有效探究“人脸识别”背后的技术。

    1.界定问题

    界定问题是把复杂的问题分解为具有可操作性的若干个小问题。

    “人脸识别”的依据是什么?人脸识别是利用图像识别技术,根据原始图像的颜色分布、几何形状、纹理等视觉特征,来搜索相似的图像。它的技术方法有很多种,常用的一种称为“内容特征法”。

    计算机中的图像如何存储?计算机中的图像,画面被划分成一个个按行、列顺序排列的“方格”,这些“方格”称为“像素”(如图2)。

    

    2.抽象、提取关键特征

    抽象、提取关键特征是从问题出发,排除无关因素,提取研究对象的重要特征,找到解决问题的关键要素。

    我们将原图转成一张较小的灰度图像,假定为50×50像素(如图3)。这一步的作用是去除图片的细节,只保留结构、明暗等关键信息,摒弃不同尺寸、比例带来的图像差异。

    我们将灰度图像进一步转换成黑白图像(如图4)。转换时,先要为“黑”和“白”设定一个恰当的分界值,称为“阈值”。灰度小于这个阈值的像素被确定为“黑”,灰度大于这个阈值的像素被确定为“白”。阈值确定的原则是使黑白图像的轮廓与原图尽量一致。

    3.建模、构造算法

    通过关键要素间的逻辑关系,用形式化的方法来处理逻辑演算,构建数学模型,即将各关键要素的逻辑关系式通过一定的符号联系起来,形成表达推理的形式结构。

    我们将黑白图像中的每个像素用二进制数0或1表示,0代表黑,1代表白,形成一个50×50的0-1矩阵,称为“特征矩阵”(如图5)。

    我们将搜索到图像的特征矩阵与原图的特征矩阵进行比对,比对方法类似于“汉明距离”算法,即对两个矩阵中相同位置的二进制数值进行异或运算,若两个值相同则运算结果为0,否则为1。

    4.分析数据,得出结论

    统计运算结果中1的个数,若1少于一定数量则认为两张图像相似,否则认为不相似。

    由此可知,特征矩阵是根据原始图像的内容决定的。因此,需要对图像进行预处理,如调整色相、饱和度、明度、对比度、清晰度以及裁剪、局部加工等,强化图像的内容结构,突出图像特征,提高搜索效率。

    5.迁移、拓展延伸

    人脸识别技术可以减少信息泄露,加快通行检查速度,打击犯罪等。跟“人脸识别”使用相似技术原理的有车牌自动识别系统、商品相似款搜索、生物识别、水利资源调查等(如图6),这些都属于图像识别技术。

    

    图像识别技术是立体视觉、运动分析、数据融合等实用技术的基础,是人工智能的一个重要领域,它已经应用于我们生活的方方面面,给我们带来极大便利。图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。此技术的产生就是为了让计算机代替人类去处理大量的物理信息,解决人类无法识别或者识别率特别低的信息。

    在日常教学中,我们应该从最基本的概念、技术出发,刨根问底,追根溯源,让学生理解理论从何而来,向何而去,指导学生运用计算思维进行深入思考,帮助他们在分析问题和解决问题的过程中发展计算思维,提升计算思维能力。

相关文章!
  • 小学语文课堂教学中的激励性评

    摘 要:激励性评价作为小学常用的教学方式,在教师日常教学中具有重要作用,在各小学学科中都有应用。在小学语文课堂上,语文教师需要与学

  • 高等教育人工智能应用研究综述

    奥拉夫·扎瓦克奇-里克特 维多利亚·艾琳·马林【摘要】多种国际报告显示教育人工智能是当前教育技术新兴领域之一。虽然教育人工智能已有约

  • 生活引路,作文随行

    周海波【摘 要】“写作教学应贴近学生实际,让学生易于动笔,乐于表达,应引导学生关注现实,热爱生活,表达真情实感。”教师如何让学生更加贴