标题 | 一种中国古画印章自动定位算法 |
范文 | 牟加俊+王建+何宇清+庞彦伟 摘 ?要: 中国国画中的印章含有丰富的语义信息,如画作作者或收藏者的姓名信息。提出一种基于多特征的中国古画印章分割方法。首先,对输入的古画彩色图像进行双边滤波和颜色增强处理,纠正古画的偏色情况,并增强图像颜色的饱和度;然后计算红色通道增强图像,检测印章可能出现的区域;再结合4种形状特征,准确定位印章区域。实验结果表明使用所提算法能够有效定位方形和圆形印章。 关键词: 中国古画; 印章定位; 偏色校正; 物体检测 中图分类号: TN919?34; TP317.4 ? ? ? ? ?文献标识码: A ? ? ? ? ? ? ? ? ? ? ? ? ? 文章编号: 1004?373X(2015)02?0096?04 Automatic positioning algorithm of ancient Chinese painting seal MOU Jia?jun, WANG Jian, HE Yu?qing, PANG Yan?wei (School of Electronic Information Engineering, Tianjin University, Tianjin 300072, China) Abstract: Seals in Chinese ancient paintings are rich in semantic information, such as names of authors or collectors. A multi?feature based seal partition algorithm for Chinese ancient paintings is presented. The input ancient color painting image is enhanced by correcting background color cast first, and then the enhanced red image is calculated and potential seal regions are detected. Finally, four shape features are employed for verifying the locations of real seals. The experimental results show the proposed method is efficient for locating most square and round seals. Keywords: Chinese ancient painting; seal localization; color cast correction; object detection 0 ?引 ?言 中国画(简称国画)是中华民族传统的绘画,它历经数千年的文化积累和发展,已成为中华民族独特的文化瑰宝之一。国画是用毛笔、墨在宣纸、绢帛上作画,它讲究笔墨,着眼于用笔墨造型。国画门类多样、异彩纷呈,从绘画种类上分为山水画、花鸟画和人物画。在画面的构成上,中国画讲究诗、书、画、印交相辉映。古代玺印有官印和私印之分,其中古画中的印章以私印为主,用来表现书画作者或者收藏者姓名及别号等信息。因此,从国画图像中自动分割并识别印章信息,对于实现基于内容的国画图像检索与分析是非常必要的。 国内外有关印章处理的工作主要集中在商业票据或公文身份有效凭证等。Fan和Tsai较早的开展了印章自动识别技术的研究[1],他们根据笔画拓扑结构的相对稳定性提出基于笔划骨架匹配的决策方法,先将印章图像做细化和旋转处理,然后利用距离权相关算法计算预留印章与待识别印章的相似度,这种方法缺点是要求印章的边框必须是直线且没有间隙,不能鉴别圆形印章。在前一种方法的基础上,Chen和Tsai采取广义霍夫变换(GHT)获取印章配准的参数[2],该方法可以处理任意形状的印章,但GHT的计算量太大,其时间复杂度很高。Chen提出了一种基于坐标变换的印章识别方法[3],将二值化后的印章图像由外向内进行扫描,找到4个切点,从而确定包含印章区域的最小圆,计算出印章图像的中心点。再将直角坐标空间变换到极坐标空间,确定预留印章中的像素点与进行旋转θ角后的匹配程度。匹配后将印章图像沿着θ轴分为K块,通过每个块中相匹配的像素点来计算其匹配值。这种方法同样受图像质量影响较大,仅适用于方章和圆章,计算量也很大。Soria等提出了一种基于色调特征的彩色文档图像中提取官方印章的方法[4],作者综合利用色度、饱和度和亮度等信息。基于对个人提交的税务表格数据的印章处理结果,验证了所提方法的有效性。Wang等提出了基于颜色信息的银行票据文档的印章提取方法[5],他们首先使用K均值算法从背景中分离印章区域,然后使用最近邻分类器去除印刷文字,并借助后处理过程改进分割结果。除上述外文文献之外,还有一些中文文献也讨论了印章检测与识别问题,如基于Fourier描述子的方法[6],基于极坐标系和小波多尺度分解的方法[7],多特征支持向量机(SVM)[8],基于旋转不变特性的方法[9],形态学top?hat变换[10]。 分析国内外印章处理相关文献,总结出已有方法存在以下2个问题:一是没有专门针对国画图像(特别是古画图像)印章区域分割与提取方法;二是现有方法都假定印章区域颜色保持一致,形状完整,没有考虑单个印章颜色特征存在差别,印章笔划断裂等不良情况,而这两种情况在古画图像的印章区域经常出现。受国画颜色退化、印章雕刻方式、印泥材质等不同情况的影响,古画图像中的印章保存完好程度不尽相同。本文提出了一种针对古画图像的红色印章自动定位算法,目的是从视觉质量下降的古画图像中定位方形或圆形红色印章区域,为后续的印章分割和识别做好准备。 1 ?所提方法 通过观察古画图像中的各类印章,总结出下述印章区域具有的三类特征: 颜色特征:古画所用印泥以朱砂印泥为主,呈现为高饱和度的鲜红色。 形状特征:古画中的印章以方形(包括正方形和长方形)和圆形为主,少量的是特殊形状(如葫芦形等)。 边缘特征:印章雕刻方法分为阳刻和阴刻两种情况,古画中这两类印章的附近区域都含有丰富的边缘特征。 所提算法综合使用上述三类特征用于印章分割。图1所示为所提方法的框图,它包括偏色校正、印章检测和印章验证三个步骤。首先针对古画图像普遍存在的偏色情况,通过分析背景区域的主颜色,对古画进行偏色校正;接下来根据印章的颜色特征,提取红色增强分量图,检测潜在的印章区域;最后利用印章的形状区域和边缘特征,准确定位印章。所提算法的详细实现过程在以下各子节中介绍。 <E:\王芳\现代电子技术201502\Image\32t1.tif> 图1 所提古画印章分割算法框图 1.1 ?古画图像偏色校正 由于存放年代久远,以及存放方式和环境的影响,古画图像普遍存在褪色、偏色等颜色退化情况。为了提高印章区域分割的性能,有必要对古画图像进行偏色校正,尽量恢复印章区域原有的颜色特征。 所提方法在YCbCr颜色空间进行偏色校正。首先使用下式将输入图像从RGB空间转换到YCbCr空间: [YCbCr=16128128+0.2570.5640.098-0.148-0.2910.4390.439-0.368-0.071RGB] ?(1) 在YCbCr空间中,Y表示亮度分量,Cb和Cr分别代表蓝色和红色偏移量。通过观察发现,前景与背景区域的Y值差别明显。所提算法使用Y分量将古画图像划分为前景和背景区域。具体的做法是:计算Y分量的直方图,用H(Y)表示;采用经典的Otsu方法,计算阈值T1;将Y值大于T1的点划归为背景区域,并用W表示背景区域。接下来,计算W内各点Cb和Cr的平均值,分别用[Cb]和[Cr]表示,即有: [Cb=1N(x,y)∈ΩCb(x,y), Cr=1N(x,y)∈ΩCr(x,y)] (2) 式中N表示W中像素数的总数。 假定国画背景区域是没有颜色的,即满足Cb=Cr=128。用(Cb′,Cr′)表示调整后的两色度通道值,处理过程如下式所示: [Cr′=128+Cr-Cr, Cb′=128+Cb-Cb] (3) 图2所示为背景偏色校正过程示例。其中,图2(a)为宋徽宗赵佶所画《鸜鹆图》的局部彩色截图,图中含有18枚印章,其中方形印章13枚,圆形印章5枚,各印章的尺寸差别明显。图2(b)是(a)对应的背景区域二值图,其中黑色代表背景区域。图2(c)是使用式(3)对图2(a)进行偏色调整的结果,其中Y分量保持不变。 <E:\王芳\现代电子技术201502\Image\32t2.tif> 图2 背景偏色校正过程示例 1.2 ?印章区域初定位 所提算法使用颜色特征初步定位印章区域。首先,根据Cr和Cb分量,使用式(4)计算红色分量增强图像,用Er(x,y)表示,即有: [Er(x,y)=log2Cr(x,y)Cb(x,y)] (4) 根据前面的分析,国画中的印章笔划呈现红色,印章笔划像素点的Cr取值较大,而Cb取值较小。根据式(4),印章像素点的Er值较大。所提方法采用无监督K均值分类算法,使用Er作为特征量分为3类,将类心值最大的一类标记为印章区域。图3(a)所示为图2(a)图像对应的印章区域初定位结果,其中白色区域对应于印章区域。 1.3 ?基于形状区域的印章区域精确分割 受到印章颜色退化、图像折痕等情况的影响,检测到的印章笔画可能存在断裂或缺损情况,导致部分印章笔划漏检。另外,古画中的红色衣物或花瓣的颜色与印章颜色非常接近,这类对象常被误检为印章区域。考虑到古画中的绝大部分印章区域是方形或者圆形,所提算法引入后处理过程,根据印章的边缘和形状特征,去除漏检和误检,精确定位印章区域。 首先,所提算法使用形态学操作处理印章笔划断裂和缺损情况。具体的做法是: (1) 使用半径为2的“diamond”算子对初定位结果进行膨胀处理; (2) 填充膨胀结果中印章区域内的空洞,处理结果用S表示。 接下来,所提算法使用形状特征去除误检区域。共使用4种结构特征,即面积、宽高比、矩形率和圆形率。用Wi表示S中某个印章区域,下标i表示该区域的序号。各种结构特征定义为: 基本特征:Wi的面积定义为Wi内像素点的总数,用AREAi表示。用TOPi和BOTi表示Wi的上、下边界,它们定义为Wi内各像素点水平方向坐标值xi(n)的最小值和最大值;用LETi和RGTi表示Wi的左、右边界,它们定义为Wi内各像素点垂直方向坐标值yi(n)的最小值和最大值。Wi的外接矩形定义为其上、下、左、右四个边界所围成的矩形区域。Wi的宽度定义为WIDi=|RGTi-LETi|,高度定义为HETi=|BOTi-TOPi|。用MXi和MYi表示区域Wi内各点坐标值xi(n)和yi(n)的平均值,定义Wi的中心为Ci=(MXi, MYi)。计算Wi内各点到Ci的街区距离,Wi的半径等于最大距离。定义Wi的周长Pi定义为其8连通约束下的外边界所含的像素数。 宽高比(Width and Height Ratio,WHR):Wi的宽高比定义为宽度和高度的比值,即WHRi=[WIDiHETi]。 矩形度(Rectangularity,RET)矩形度定义为区域的面积与其最小外接矩形面积的比值。矩形度反映了物体在最小外接矩形中的填充程度,矩形的矩形度为1,圆形的矩形度为[p4],三角形的矩形度为0.5。考虑到古画图像中印章区域都是按照垂直或者水平方向排列的,每个印章区域的最小外接矩形与其外接矩形相同。因此有RATi=AREAi/(HETiWIDi)圆形度(Circularity,缩写为CIR)圆形度反映了物体接近于圆形的程度,它定义为4p倍的面积区域与周长的平方之比,即有CIRi=4pAREAi/Pi。圆的圆形度为1,正方形的圆形度为p/4。 使用上述结构特征,制定下面4个约束条件。 (1) 条件1:AREAi>T2; (2) 条件2:T3<WHRi<T4; (3) 条件3:RATi>T5; (4) 条件4:CIRi>T6。 条件1描述的是对印章区域面积的约束,用来去除面积过小的干扰区域,所提算法取T2=50。条件2描述了对Wi宽高比的约束。对于正方形和圆形情况的印章,其宽高比接近于1。但对于长方形印章情况,其款高于可能大于或者小于1。因此应适当放宽对宽高比的约束,所提方法选取T3=0.33,T4=3。条件3和条件4用来区分方形印章和圆形印章。 根据矩形度(RET)和圆形度(CIR)的定义,方形印章(包括正方形和长方形)的RET应为1,圆形印章的CIR为1。但考虑到图像扫描过程中产生的变形,图像本身存在遮蔽或缺损等因素的影响,导致各印章区域RET或CIR小于1。为减少漏检,阈值T5和T6的取值不能太大,所提方法取T5=T6=0.66。所提算法使用两个步骤完成印章区域验证过程:(1)将不满足条件1和条件2去除干扰区域;(2)将剩余的候选区域使用条件3和条件4进一步进行判别并区分印章类型,即如果满足条件3,则判为方形印章;如果满足条件4,则判为圆形印章。 图3给出基于形状特征的印章区域验证过程。其中,图3(a)所示为图2(a)所示图像对应的印章检测区域二值图。图3(b)是形态学膨胀结果,图3(c)所示为使用形状特征进行印章区域验证的结果,其中方形印章和圆形印章分别用“口”和“O”标出。从实验结果来看,实验成功检测并提取出了原图像中不同尺寸18个印章中的17个,而且能够准确区分方形印章和圆形印章。惟一一个没有被正确检测的是原图中右下角的正方形印章。通过比对输入图像发现,该印章的红色特征退化情况严重,篆刻方式为阳刻,印章区域内部的笔划稀疏,导致在印章区域验证过程中,条件3和条件4都不满足,最终导致该印章区域被漏检。 2 ?实验结果分析 本实验选用30幅古画图像作为实验素材,全部图像从网络下载得到,其中绢质图像18幅,纸质图像12幅。采用人工方式从古画图像中提取印章区域,共得到212个印章区域,其中包括各种尺寸的方形印章168枚,圆形印章37枚,其他形状印章7枚。在全部印章212个印章中,阳刻印章133枚,阴刻印章79枚。采用所提算法检测并分割各图像中的印章,并与人工提取结果进行比较,表1列出了检测结果。 <E:\王芳\现代电子技术201502\Image\32t3.tif> 图3 印章区域验证过程示例 表1 印章区域检测结果 由表1可见,所提算法的总查全率为93.4%,其中方形印章的查全率最高,约为95.8%,圆形印章的查全率约为91.9%,其他形状印章查全率较低,只有42.8%。 通过分析实验结果,总结导致印章漏检的三种情况,一是印章颜色退化严重,部分区域被背景颜色掩盖;二是受到画面折痕,以及画面其他内容的遮蔽等情况,导致本来连续的印章区域被划分为多个小区域;三是特殊形状的印章,如葫芦形。 图4给出部分印章正检和漏检实例。为显示方便,截取部分图像区域显示,图4(a)中正确检测到的方形和圆形印章区域分别用“口”和“O”标出,其中右图右下方有图像部分区域被误检为圆形印章区域。 图4(b)左图中红色图中最下方的两个方形印章没有正确检出,其中左侧漏检的印章是因为印泥颜色不够鲜艳,与背景颜色接近,右侧漏检的印章受到画中水墨颜色的影响,导致部分印章笔划存在断裂。右图中右下方的葫芦形印章属于特殊形状情况,未被正确检出。 表2分别列出不同雕刻类型印章,以及不同材质古画图像印章的检测结果。结果显示,阴刻印章的查全率比阳刻印章高出约5%,这是因为阴刻印章的红色区域占整个印章区域的比重更大,更不容易收断裂、缺损等不良情况的影响。另外,所提算法对不同材质古画图像的印章定位性能存在差别,纸质材质古画的印章检测结果略高于绢质材质古画,这是因为绢质古画背景颜色偏色情况更严重,印章区域更容易和背景颜色混淆,导致更多的印章区域漏检。 <E:\王芳\现代电子技术201502\Image\32t4.tif> 图4 正确检测和漏检情况示例 表2 不同材质古画印章检测结果 3 ?结 ?论 提出一种基于多特征的中国古画印章定位算法。该方法综合利用了印章的颜色、形状和边缘特征,包括背景偏色校正、基于颜色特征的印章区域初定位、以及基于边缘和形状特征的印章区域验证等,实验结果验证了所提算法的有效性。未来的工作集中在如何提高印章区域的检测精度,以及特殊形状印章定位方面。 参考文献 [1] FAN T J, TSAI W H. Automatic Chinese seal identification [J]. Computer Vision Graphics and Image Processing, 1984, 25(2): 311?330. [2] CHENC M, TSAI W H. Automatic identification of Chinese seal imprint with arbitrary or partial shapes [J]. Computer Processing Chinese Oriental Languages, 1986, 22(6): 216?233. [3] CHEN Y S. Automatic identification for a Chinese seal image [J]. Pattern Recognition, 1996, 29(11): 1807?1820. [4] SORIA?FRISCH A. Color seal extraction from documents: robustness through soft data fusion [J]. EURASIP Journal on Applied Signal Processing, 2005, 13(8): 2146?2152. [5] WANG C Y, CHEN Y B. Seal extraction based on clustering and local thresholding techniques [J]. Advanced Materials Research, 2014, 926/930: 3467?3470. [6] 曾东武,刘重庆.Fourier描述符的印鉴识别方法[J].上海交通大学学报,1998,32(9):43?45. [7] 王新年,梁德群.基于极坐标和小波的印章配准方法[J].计算机工程与应用,2005,42(24):218?221. [8] 李晗,窦爱萍,解争龙,等.基于多特征的支持向量机印鉴识别[J].航空计算技术,2006,36(4):32?34. [9] 代红维,马社祥.基于旋转不变特性的印鉴识别方法研究[J].天津理工大学学报,2009,25(4):1?3. [10] 何瑾.金融印鉴真伪识别新方法研究[D].天津:天津大学, 2010. [11] Sonka.图像处理分析与机器视觉[M].3版.艾海舟,译.北京:清华大学出版社,2011. [2] CHENC M, TSAI W H. Automatic identification of Chinese seal imprint with arbitrary or partial shapes [J]. Computer Processing Chinese Oriental Languages, 1986, 22(6): 216?233. [3] CHEN Y S. Automatic identification for a Chinese seal image [J]. Pattern Recognition, 1996, 29(11): 1807?1820. [4] SORIA?FRISCH A. Color seal extraction from documents: robustness through soft data fusion [J]. EURASIP Journal on Applied Signal Processing, 2005, 13(8): 2146?2152. [5] WANG C Y, CHEN Y B. Seal extraction based on clustering and local thresholding techniques [J]. Advanced Materials Research, 2014, 926/930: 3467?3470. [6] 曾东武,刘重庆.Fourier描述符的印鉴识别方法[J].上海交通大学学报,1998,32(9):43?45. [7] 王新年,梁德群.基于极坐标和小波的印章配准方法[J].计算机工程与应用,2005,42(24):218?221. [8] 李晗,窦爱萍,解争龙,等.基于多特征的支持向量机印鉴识别[J].航空计算技术,2006,36(4):32?34. [9] 代红维,马社祥.基于旋转不变特性的印鉴识别方法研究[J].天津理工大学学报,2009,25(4):1?3. [10] 何瑾.金融印鉴真伪识别新方法研究[D].天津:天津大学, 2010. [11] Sonka.图像处理分析与机器视觉[M].3版.艾海舟,译.北京:清华大学出版社,2011. [2] CHENC M, TSAI W H. Automatic identification of Chinese seal imprint with arbitrary or partial shapes [J]. Computer Processing Chinese Oriental Languages, 1986, 22(6): 216?233. [3] CHEN Y S. Automatic identification for a Chinese seal image [J]. Pattern Recognition, 1996, 29(11): 1807?1820. [4] SORIA?FRISCH A. Color seal extraction from documents: robustness through soft data fusion [J]. EURASIP Journal on Applied Signal Processing, 2005, 13(8): 2146?2152. [5] WANG C Y, CHEN Y B. Seal extraction based on clustering and local thresholding techniques [J]. Advanced Materials Research, 2014, 926/930: 3467?3470. [6] 曾东武,刘重庆.Fourier描述符的印鉴识别方法[J].上海交通大学学报,1998,32(9):43?45. [7] 王新年,梁德群.基于极坐标和小波的印章配准方法[J].计算机工程与应用,2005,42(24):218?221. [8] 李晗,窦爱萍,解争龙,等.基于多特征的支持向量机印鉴识别[J].航空计算技术,2006,36(4):32?34. [9] 代红维,马社祥.基于旋转不变特性的印鉴识别方法研究[J].天津理工大学学报,2009,25(4):1?3. [10] 何瑾.金融印鉴真伪识别新方法研究[D].天津:天津大学, 2010. [11] Sonka.图像处理分析与机器视觉[M].3版.艾海舟,译.北京:清华大学出版社,2011. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。