基于图像质量评价技术的数码照片选择方法研究

    顾伟

    摘? 要:数码照片成像设备和拍摄成本的快速降低,使得数码照片数量迅速增多,由此造成归档阶段照片选择工作量的急剧加大,占用了大量的档案人力资源。为切实降低人工工作量,本文在分析归档照片选择要求和提出选择标准的基础上,引入计算机研究领域的图像质量评价技术以辅助档案工作者快速、准确的完成照片选择工作。为确保该技术的有效性和实用性,本文设计了基于图像质量评价技术的数码照片选择方法,并从该方法的可行性和预期效果两方面进行分析,以期推动归档数码照片的选择工作向自动化、智能化方向的发展。

    关键词:数码照片? 图像质量评价? 照片选择

    Abstract: With the rapid reduction of digital photo imaging equipment and shooting cost, the number of digital photos has increased rapidly, resulting in a sharp increase in the workload of photo selection in the archiving stage, occupying a large number of archives human resources. In order to reduce the manual workload, this paper introduces the image quality evaluation technology in the field of computer research based on the analysis of the selection requirements and the selection standards of archive photos, so as to assist archivists to complete the photo selection work quickly and accurately. In order to ensure the effectiveness and practicability of the technology, this paper designs a digital photo selection method based on image quality evaluation technology, and analyzes the feasibility and expected effect of the method, so as to promote the development of the selection of digital photos to the direction of automation and intelligence.

    Keywords:Digital photo;Image quality assessment; Photo selection

    1 引言

    照片檔案作为一种重要的档案门类,具有重要的保存意义和凭证价值。数码照片的鉴别和选择是照片档案归档工作的第一步。近十年来,数码照片以其成像便捷、传输方便、存储量大、成本低廉的优势逐渐代替了传统感光照片,成为照片档案的主要载体,这种改变既符合原生电子档案单套制的归档要求,也方便了照片档案的利用,易于发挥照片档案在档案展览、文化建设等方面的作用。但另一方面,也正是因为数码照片成像器材、存储设备价格的低廉,使数码照片的拍摄成本几乎可以忽略。在拍摄时,拍摄者为确保能完整记录所有场景,做到照片的好中选优,经常会拍摄大量内容重复和与主题关联度不强的数码照片,这就使得档案工作者需要在照片收集、整理阶段花费大量的时间从这些海量照片中鉴别、挑选出小部分有价值的照片进行归档。以我校为例,我校每年拍摄产生的数码照片大约仅有15-20%进行了归档,剩余的照片大多都是因为拍摄内容和场景相似而被舍弃。同时,有学者研究指出:人眼在长时间的照片挑选过程中,会形成视觉疲劳,产生“遮蔽效应”,难以始终挑选出符合要求的高质量照片。因此,在照片档案的归档阶段,数码照片选择问题既是档案工作者在实践工作中存在的实际难题,也是对档案部门人力、财力的巨大耗费。

    故此,本文首先从分析数码照片选择要求入手,以业务和技术两个维度为切入点提出数码照片的选择标准,同时,引入计算机研究领域的图像质量评价技术,将标准与技术相结合,提出基于图像质量评价技术的数码照片智能化选择方法,并从可行性、预期效果两方面进行论证该方法的有效性和实用性。

    2 数码照片的选择要求和选择标准

    数码照片选择质量的高低直接影响着照片档案整理质量的好坏,也决定着照片档案实际利用效果。在归档整理阶段,数码照片选择的实质就是根据照片筛选的原则和方法从大量待选照片中找出有价值、高质量的照片进行归档,既要做到齐全、完整、精炼、优化,又要避免张张归档。简言之,数码照片归档选择的核心就是对待选照片进行质量评价。这里的质量评价包括两方面的要求:一是价值角度的评价。价值是照片这一客体对从事归档活动的人这一主体的作用,这是人作为价值主体综合多种选择因素对每张照片做出的选还是不选的主观评价。二是对照片本身客观质量的评价,这是从描述照片质量量化指标的角度所进行的客观定量分析,以照片质量量化指标值是否达到归档要求为标准进行的评价。

    故此,为满足上述要求,我们从业务和技术两个方面提出数码照片的选择标准:

    从业务的角度来说,照片的选择应符合真实性原则、价值性原则和完整性原则[1]。真实性原则保证照片是原始拍摄的照片,具有可靠性和有效性;价值性原则是确保被选的照片具有保存意义,做到不重复、不多选;完整性原则是指被选照片能够全面的反映事件的全貌,做到不少选、不漏选。

    从技术的角度来说,衡量一幅照片质量高低的指标可以分为两类,一类是以读取图像像素、分辨率、位深等图像属性为代表的衡量指标,另一类是通过对图像特征进行分析,获得图像视觉失真程度的评价方法,它是以计算图像模糊程度、噪声大小、压缩比率为代表的衡量指标。第一类指标衡量起来简单、易行,可以实现图像质量的初步估计,但与照片选择的实用需要还有差距;第二类指标衡量起来较为复杂,专业性较强,但能有效区分照片质量的高低,实用性较高。

    业务角度的衡量指标偏向于主观方面的评价,技术角度的衡量指标较为客观,它们都是从不同角度对数码照片进行筛选而提出的标准。换句话说,要想较好地解决数码照片的选择问题,就必须尽可能地同时满足业务和技术两方面的选择标准。

    3 数码照片图像质量评价技术

    数码照片的选择是一个对数码照片图像质量进行评价的过程。符合评价要求的就保留,不符合要求的就舍弃。在计算机研究领域,数码照片图像质量的评价方法主要分为两类:主观评价方法和客观评价方法。

    主观评价方法一般是依据人对图像整体视觉内容的主观印象进行判断的方法。这种方法能够较好地解决数码照片选择要求中完整性原则和价值性原则主观部分的选择需求,因为照片是给人观看的,所保留的照片是否完整、是否有保存意义、能否能反映出该事件的主要内容和信息由人的主观印象进行评判是最为准确的评价方法。在实际过程中,这种评价方法会因人审美的不同、专业水平的高低以及环境因素的影响产生不同的評价结果。因此,为减少这种差异性,国际电信联盟提出了双刺激损伤测量法、双刺激连续质量测量法和单刺激连续质量评价法等方法[2]。

    客观评价方法通常是利用计算机领域的相关研究方法,对图像分辨率、模糊程度、噪声大小、压缩率、块效应等各项具体衡量指标进行定量分析和比较的评价方法。客观评价方法能够较好地满足照片真实性原则和价值原则中相似照片择优选择的要求。照片真实性检测方法研究由来已久,在档案学研究领域和计算机学科研究领域都有较丰硕的研究成果[3][4][5][6],在文献质量评估[7]、司法鉴定等应用领域也有不少实际案例。在中国知网、IEEE Electronic Library等数据库中分别以“照片档案+真实性/真伪”和“Image Passive Forensics”为关键词进行检索,能检索出数百篇与之相关的研究论文发表在档案学核心期刊和计算机顶级期刊上。在文献[3]中详细论述了如何将图像被动认证技术应用于数码照片真伪鉴定中,并结合档案业务需要提出了具体的鉴定流程。文献[4][5][6]分别针对图像区域复制、模糊操作、双重JPEG压缩的改动进行分析,提出了各自的检测与定位方法。

    根据评价照片视觉质量时是否需要参考图像的信息,可以将相似场景照片优选问题分为全参考图像质量评价方法、半参考图像质量评价方法和无参考图像质量评价方法三种[8]。全参考图像质量评价方法是假设参考图像是完全已知的无失真图像,通过计算待评价图像与参考图像之间的差异得到评价值,并按照评价值的高低对图像视觉质量进行综合评价的方法。半参考图像质量评价方法是在只能获取参考图像部分关键信息的情况下,利用这些部分信息对待评价图像质量进行评价的一种方法。无参考图像质量评价方法不需要任何参考图像信息,可以直接计算待评价图像的视觉质量。因此,在实际应用中,无参考图像质量评价方法受到更广泛的青睐,并已广泛应用在医学CT图像、眼底图像以及航拍图像、卫星图像等需要进行图像质量自动检测的领域。具体的方法主要有基于机器学习、深度学习的有监督和无监督算法等。

    主观评价方法虽然是最直接、最能准确获得选择结果的方法,但是它无法在实际应用系统中直接使用,客观评价方法受到现有计算机学科研究成果的限制,在实际应用中存在一定的局限性,但它拥有较好的发展潜力并能快速、方便、自动化地投入到实际使用中。两种方法各有优点,可以相互结合,发挥各自优势,以一种简单、快速、易行的方式做好数码照片的选择工作。

    4 基于图像质量评价技术的数码照片选择方法

    4.1 选择过程和方法

    数码照片的选择过程是在满足真实性的前提下,按照照片形成的时间顺序,将相似场景的照片划为一组,然后,对每组照片的价值进行鉴定,确保有价值的照片能完整的收集,最后,在需要归档每组照片中择优选择一张质量最好的照片进行归档。因此,本文结合上述选择过程和图像质量评价技术,提出如下照片选择方法:首先,利用图像真实性检测技术,对每张照片的真实性进行鉴定,去除非自然形成的图像(如人工合成图像)和经过修改的非原始图像;然后,分别读取每张照片的像素大小、分辨率、位深等属性值,并利用无参考图像质量评价方法计算每幅照片的视觉失真程度以及模糊程度、噪声大小等数值,以此作为照片选择的客观依据;接着,对相似场景的照片进行人工分类和价值鉴定,如该场景中仅有一张照片,则直接选择归档,如该场景中有多张相似照片,则根据照片质量客观指标值的排序结果和主观评价选择最好的一张照片归档。

    4.2 可行性分析

    基于图像质量评价方法的数码照片选择过程的主要步骤有:照片真实性检测、照片客观质量评价值的读取和计算、照片分类和价值鉴定以及相似场景照片优选四步。

    照片真实性检测包括很多方面的检测内容,任何一种检测方法都无法对照片真实性的各个方面做到全面检测。在照片档案归档阶段,照片真实性检测不可能也不需要对所有涉及照片真实性的方面都做检测,只需重点关注照片内容的真实性即可,即照片本身是计算机合成图像还是真实拍摄照片、照片内容是否有实质性的改动(如照片是否存在复制-粘贴操作、照片内容是否有替换等情况)。至于有些通过图像处理软件对照片亮度、对比度等数值进行调整而不存在内容改动的检测,可以根据各自实际情况自行把握。不管是合成图像和真实照片的区分,还是复制-粘贴、替换操作的检测,通过计算图像统计特性和提取图像特征均能发现明显的变化,这在计算机信息安全领域已经取得了相对深入完善的研究成果,检测方法的选择和具体实现过程可交由计算机科学领域的人员去完成。

    在照片客观质量评价值读取和计算环节,像素大小、分辨率、位深等照片评价值既可以通过照片属性自行查找,也可以在照片档案管理系统元数据管理部分中查看;而每幅照片视觉失真程度、模糊程度和噪声大小等数值的计算已有很多方法可以实现,档案领域工作者只需提出明确的要求和需要计算的指标值即可,具体过程可直接交给计算机领域人员实现。但不同类型的照片,图像特点不一样,利用不同方法计算得到的评价结果会有差异,因此,在具体实施中需要档案领域人员和计算机领域人员相互配合,在分类分析照片特点的基础上选择合适的计算方法。

    照片分类和价值鉴定是一个主观判断为主的过程,交由档案工作者处理即可。相似场景照片的优选一般是根据前期照片客观质量评价排序结果进行选择的,但同时也需要档案工作者做最后确认,这主要是为了去除一些照片质量虽然较好,但细节上有瑕疵的照片,如拍照时人物只有一半在镜头中、拍摄背景不符合要求等情况。

    基于图像质量评价方法的数码照片选择方法是一个主观评价和客观评价相结合的方法,是将计算机学科研究成果实际应用于档案业务工作环节的过程,在这一过程中,只要能因地制宜地認真分析档案领域的业务需求,将计算机领域的研究成果与其准确结合,就能完成预期的目标。

    4.3 预期效果评价

    本文提出的基于图像质量评价方法的数码照片选择方法能够取得较好的预期应用效果,主要体现在以下两个方面:

    第一,该方法是针对数码照片归档过程中照片选择存在耗时耗力的问题,精准地将计算机学科的相关研究成果直接应用于档案整理业务流程中,将许多原先由人工完成的工作转化为计算机自动执行,因此,该方法可以节省大量人工时间,切实解决实际工作中的痛点和难点。

    第二,该方法的实现是由计算机系统去完成的,计算机系统的设计一般是根据功能需求使用模块化的设计方法,即某个功能模块的更新升级不会影响其他功能模块的使用。目前,虽然可能存在计算机技术智能化程度不高、算法选择不合适、实际应用效果不佳的情况,但从长远看,随着AI技术的发展和研究的深入,该方法会更加智能化的满足实际需要,取得更好地应用效果。

    5 结语

    长期以来,归档照片的选择工作一直是采用人工方式完成的。在人工智能技术迅速发展的今天,结合计算机技术,将图像质量评价技术应用于归档照片的智能化选择中,不仅是极具挑战而且也是极具研究价值的一项课题。我们只有更加精细化地分析照片选择过程中每项业务环节的具体需求和不同类别照片的特点,才能在准确把握各种图像质量评价技术优缺点的基础上,进一步推进照片选择的智能化水平。

    基金项目:安徽省高校档案工作协会重点研究项目(2021zd002)的阶段性研究成果。

    参考文献:

    [1]王媛,周璐. 数码照片归档筛选原则及方法[J].城建档案,2019(12):94-96.

    [2]Huang P, Qin S,Lu D. A Novel Approach to Image Assessment by Seeking Unification of Subjective and Objective Criteria Based on Supervised Learning[M]. Computer Vision/ Computer Graphics Collaboration Techniques. Springer Berlin Heidelberg,2011:274-285.

    [3]徐彤阳,尹凯. 基于计算机技术鉴定数码照片档案真伪的研究[J].档案学研究,2018(5):107-111.

    [4]王俊文,刘光杰,张湛,戴跃伟,王执铨. 图像区域复制篡改快速鲁棒取证[J].自动化学报,2009(12):1488-1495.

    [5]王雪玮,梁晓,郑津津,周洪军. 自然图像的无参考模糊检测与局部模糊区域分割[J].计算机辅助设计与图形学学报,2017(11):1980-1988.

    [6]罗瑚. 基于卷积神经网络的双重JPEG压缩取证研究[D].深圳:深圳大学,2018.

    [7] 张海燕. IQA在数字化文献质量评估中的应用研究[J].大学图书情报学刊,2016(6):46-50.

    [8]孙翠霞,刘有耀. 客观图像质量评价[J]. 计算机与数字工程,2019(9):2290-2294.

    (作者单位:安徽大学,安徽大学管理学院 来稿日期:2020-05-14)