基于AIS数据的船舶运动模式识别与应用

魏照坤+周康+魏明+史国友






摘要:
船舶运动模式的提取是轨迹数据分析的重要任务,它可以为船舶异常行为的检测提供参考依据,同时也可以作为航路规划和定线制设计的技术指标.针对现存的聚类算法大多为了追求效率而忽略了运动轨迹特征的问题,对聚类算法中的轨迹结构距离进行改进,将其作为轨迹相似度的评价标准.采用无监督DBSCAN聚类算法实现船舶运动模式的提取.利用琼州海峡船舶自动识别系统(AutomaticIdentificationSystem,AIS)数据,对该水域的船舶运动模式进行提取,获得行驶于该水域的船舶运动轨迹分布以及各类轨迹中转向区域的分布,其中船舶运动轨迹包括从琼州海峡东峡口向西航行的船舶轨迹,从琼州海峡西峡口向东航行的船舶轨迹,从秀英港前往海安港的船舶轨迹,从海安港前往秀英港的船舶轨迹和从琼州海峡东峡口前往海口港的船舶轨迹.将最终的聚类结果应用于电子海图显示与信息系统(ElectronicChartDisplayandInformationSystem,ECDIS)上,实现了对船舶的动态监控仿真.
关键词:
船舶自动识别系统(AIS);模式识别;聚类分析;电子海图显示与信息系统(ECDIS);琼州海峡
中图分类号:U697.33
文献标志码:A 收稿日期:20150907 修回日期:20151102
0引言
随着全球船舶自动识别系统(AutomaticIdentificationSystem,AIS)岸站的建立和不断完善,各地海事主管机关时刻都能接收到大量有关船舶信息的数据.对这些数据的研究可以帮助我们提取船舶运动模式,分析船舶行为,从而进一步挖掘不同航线船舶、不同类型船舶的运动特点.例如:在一些运量较大的港口附近,对船舶运动轨迹进行分类能够帮助监控人员识别异常行为;根据渔船运动的无规律性和货船运动的周期性,利用聚类结果区分船舶种类,判断运动特征是否与船舶类型相符,是否需要进一步的监控和调查.此外,船舶运动轨迹的聚类分析能够为航路规划和定线制的设计提供理论依据,有利于加强船舶动态监控,提高海事监管的效率.
目前国内外学者提出了诸多从目标对象的轨迹中获取运动模式的方法.SHU等[1]利用自组织映射网络作为预处理技术标记行人的运动特征,然后采用后向算法建立马尔科夫模型,实现了对人行为模式的提取;胡宏宇等[2]以改进的Hausdorff距离作为相似度标准,采用谱聚类算法实现了对车辆轨迹空间分布的提取;闻佳等[3]利用加权的Hausdorff距离和周分割算法实现了车辆轨迹的聚类;RISTIC等[4]基于港口信息,采用核密度估计的方法对船舶轨迹进行分类;ETIENNE等[5]提出了一种基于统计学和图论的轨迹聚类分析方法,该方法将船舶的起讫港作为节点,将相似轨迹归一化为特定的有向路径;AARSETHER等[6]采用图像匹配的方法对船舶轨迹进行聚类;GERBEN等[7]对提取船舶运动模式的两种主要的相似度对比的方法进行了分析,总结出二者中更适合于船舶轨迹聚类的方法;ANDERS等[8]将轨迹聚类应用于近海监控系统来识别船舶的异常行为;LAXHAMMAR等[9]通过高斯混合模型和核密度估计的方法对船舶运动进行统计分析,获得有异常行为的船舶数据.此外,神经网络和以K均值为代表的无监督聚类方法也被广泛应用于轨迹聚类,如JONHSON等[10]建立自组织特征映射网络学习轨迹分布模式,ATEV等[11]则利用K均值算法完成对轨迹的聚类.
海上交通与陆路交通有一定的相似性.道路被划分为单行道、双行道等,而航路也被划分为单向航路和双向航路.虽然海上交通的航行范围广阔,但在某些特定水域(港口、通航分道、狭水道)船舶密度较大,轨迹分布较密集.鉴于此特点,应用在陆路交通上的一些方法也可以应用到海上交通,以提高海上交通的监管力度和效率.
1AIS数据的预处理
由船舶交通管理中心(VesselTrafficServicecenter,VTS)提供的AIS数据通常具有较高的可信度,但是AIS数据中的船舶位置、船舶速度等信息会由于设备以及信号漂移等原因发生较大的改变,如AIS数据显示船舶位于陆地上,显示航速为35kn甚至更高[12].
为保证数据的可用,需要对数据做预处理,具体方法如下.
2轨迹聚类
移动目标轨迹的聚类能否取得良好的效果,在于轨迹间的相似性度量是否合理.当前主要的相似性度量的方法有基于欧氏距离的算法、基于公共子序列的算法、基于动态时间弯曲距离的方法和基于Hausdorff距离的方法,其中基于欧氏距离的算法通常用于计算等长的船舶轨迹相似性,其他的几种方法可以用于不同长度的船舶轨迹相似性计算.以上方法都仅从距离方面反映相似度,而基于轨迹结构距离的相似性度量方法的优点在于能够刻画每条子轨迹变化的趋势.因此,为便于度量船舶轨迹的变化,需要将整条轨迹划分成若干条子轨迹.
2.1轨迹分割
船舶轨迹的划分是通过设置船舶转向角的阈值实现的.船舶轨迹转向角是指相邻两个子轨迹段的航迹向之差,见图1.
图1中,a,b为轨迹中的两条子轨迹段,其航迹向的夹角为θ1,即为这两条子轨迹的转向角.鉴于AIS数据的位置坐标采用的是WGS84坐标系,利用恒向线直接反解算法[13]求得两条子轨迹段的航迹向,根据其航迹向的差值可以获得船舶子轨迹间的转向角.
恒向线直接反解算法的步骤如下.
2.2轨迹结构相似性度量
船舶子轨迹段相似性计算从子轨迹段的航迹向和两条子轨迹段间的距离两个方面进行.对两方面的度量结果赋以一定的权重求和,形成轨迹的结构距离.
(1)船舶航迹向的比较.
如图2所示,Li,Lj表示两条航迹线,θ表示航迹段的方向夹角,J表示Lj相对于Li的偏转程度.
航迹向对比方法为
通过上式不难发现:当夹角为0°时为最佳状态,即两条子轨迹方向完全一致;当夹角大于90°时可以认为两条轨迹基本反向,将两条轨迹的距离设置为无穷大,这样有利于区分航向相反船舶的轨迹.
(2)位置的比较.
本文在两条子轨迹段间距离的度量方面所采用的相似性度量方法为基于Hausdorff距离的方法:
式中:P(Li,Lj)为两轨迹间的位置距离;h(Li,Lj)为两轨迹间的直接Hausdorff距离;d(a,b)为a与b之间的欧氏距离.
船舶轨迹结构是指船舶轨迹所具有的属性的集合,这些属性刻画了船舶轨迹的特性和状态.船舶轨迹结构通常包含船舶运动信息,如:船舶的航迹向、船舶的位置.同时,在实际应用中还可以加入速度以及波动性的度量.进行轨迹相似性的比较时,充分考虑这些因素可以提高聚类的精度[14].依照式(8)和(9)可以求得子轨迹航迹向以及子轨迹间距离相似度.为计算轨迹结构的相似性,还需设定他们在轨迹结构中所占的权重W=(WT,WP),其中WT表示角度距离权重,WP表示位置距离权重.各权重值设定应满足:权重值之和应为1;各权重值应为非负,同时不能大于1.通常情况下采用的是将结构距离中的权重平均分配.式(11)和(12)分别为结构距离和相似度计算方法.
2.3聚类算法
基于轨迹结构距离的聚类算法是以DBSCAN算法为框架的,即从子轨迹集合中任取一条轨迹并判断在其邻域半径内是否包含满足要求的最小实体数.如果满足以上述条件,则认为是核实体,并搜索该实体的密度可达对象,标记为一类,直至子轨迹集合全部扫描完毕,未被标记的子轨迹则是孤立轨迹.具体的实现方法如下.
步骤1设定权重W,转向角阈值ω,近邻阈值η,近邻的数目ε.
步骤2根据ω将轨迹T分割成若干个子轨迹Ti.
步骤3对子轨迹段Ti,计算其与未标记的子轨迹段的D和N,若满足D和N条件的轨迹数目大于ε则将该子轨迹段标记为核心子轨迹段.
步骤4将Ti子轨迹段距离范围D内满足N条件的子轨迹段Tj与Ti聚为一类.
步骤5对Tj重复步骤3和4,将满足条件的子轨迹段继续归为一类,如果Tj不再满足上述条件,则重新从子轨迹集合中选取未被聚类的子轨迹段重复步骤3和4.直至轨迹集合全部扫描完毕.
3琼州海峡应用实例与应用
琼州海峡位于雷州半岛与海南岛之间,宽10~20nmile,长50~60nmile,是广州港、湛江港等港口与北部湾各港口海上交通的捷径.琼州海峡主要可分为3部分,分别为:琼州海峡东口,包括外罗水道、北水道、中水道和南水道;琼州海峡西口,包括灯楼角与临高角联线以西、兵马角所在经度线以东水域,该水域是来往于琼州海峡驶往八所港、三亚港等地的转向点,也是往北部湾各港口的转向点;琼州海峡中部,包括山狗吼灯塔经度线以西、灯楼角与临高角联线以东水域,该水域的水较深(20~118m),碍航物较少.
算例采用32位WIN7系统、2GRAM,在VS2010编译条件下提取750条船舶运动轨迹进行聚类,获得了5类结果,见图3.A类结果为从琼州海峡东峡口向西行驶于通航分道内的船舶的航行轨迹分布、B类结果为从琼州海峡西峡口向东行驶于反向航道的船舶的航行轨迹分布、C类结果为从海安港到秀英港的船舶的航行轨迹分布、D类结果为从秀英港到海安港的船舶的航行轨迹分布、E类结果为琼州海峡东峡口向西行驶进入海口港的船舶的航行轨迹分布.
3.1算法分析
为比较算法的优劣,将基于轨迹结构距离的DBSCAN算法与传统的DBSCAN算法进行对比,结果见表2.
表2算法对比结果
从表2中可以看出,基于轨迹结构距离的DBSCAN算法在运行时间方面劣于传统的DBSCAN算法,但是在分类结果和准确度方面皆优于传统的DBSCAN算法.这是因为:基于轨迹结构距离的DBSCAN算法需要进行轨迹的分割、角度的度量、归一化等操作,增加了计算复杂度;该算法以轨迹特征为参考,从多方面计算轨迹相似度,易发现比较隐蔽的轨迹群,使其聚类效果优于传统的DBSCAN算法的聚类效果.
3.2聚类应用
将上述所获得的船舶轨迹聚类的结果应用到船舶监控、异常检测上,能够大幅度提高海上安全保障能力,防止海上交通事故的发生[15].
3.2.1速度监控
速度监控是利用监控水域的AIS信息,对聚类结果中的船舶速度进行统计,获得船速分布图.根据实际工作中的经验和需要,确定行驶于该监控水域的船舶速度监控范围.图4是对从琼州海峡东峡口航行至海口港的船舶速度统计.对于该监控水域,本文以80%船舶运营速度(9~14kn)为标准.
图5为监控系统的速度报警,可以看出编号为A的船超速,说明该船航速不在监控航速范围内,予以报警.
3.2.2位置监控
位置监控主要是对航行于聚类结果区域的船舶进行船位的实时监控,如果船舶偏离监控水域,本船和监控系统应给予报警和提示,提醒监控人员和船舶驾驶员关注船舶动向.图6a为本船的位置报警示意图,图6b为监控系统的位置报警示意图.
3.2.3航向监控
航向监控主要利用AIS数据对聚类结果中船舶航向进行统计,获得船舶的航向分布,以此作为监控依据.图7a是对从琼州海峡东峡口到海口港的聚类结果中船舶转向后的航向统计结果.图7b和7c为本船和监控系统的航向报警示意图.
综上所述,可以得到船舶监控的实现流程图(图8),首先对进入监控水域的船舶进行位置监控(若偏离监控水域则报警),然后进行速度监控(判断速度是否超出规定范围,如果超出则进行速度报警),接着进行航向的监控直至船舶驶离监控水域.
4结论
本文利用轨迹结构距离作为相似性的度量标准,对轨迹段间的相似性进行评价,采用无监督的DBSCAN算法将相似性接近的船舶轨迹归为一类,实现了对船舶运动模式的提取.以琼州海峡为例,利用预处理过的部分琼州海峡AIS数据,将航行于该水域的船舶轨迹分为5类,分别为从琼州海峡东峡口向西航行的船舶轨迹、从琼州海峡西峡口向东航行的船舶轨迹、从海安港到秀英港的船舶轨迹、从秀英港到海安港的船舶轨迹以及从琼州海峡东峡口向西航行进入海口港的船舶轨迹.从琼州海峡东峡口向西航行的船舶轨迹位于(20°14′25″N,110°26′20″E)与(20°09′05″N,110°01′24″E)之间的通航分道内;从琼州海峡西峡口向东航行的船舶轨迹分布于(20°13′N,110°26′20″E)与(20°06′45″N,110°01′24″E)之间的通航分道内;从琼州海峡东峡口向西航行进入海口港的船舶轨迹,其转向位置大约发生在以(20°10′16″N,110°14′08″E)为圆心,半径为0.5nmile的水域范围内.将聚类的结果与ECDIS模拟器相结合,从船舶位置、速度、航向等3个方面实现了船舶动态监控的仿真.实验证明船舶运动模式识别能够有效地应用于船舶动态监控,进而保障航行安全,增强海上安全保障能力.
参考文献:
[1]SHUHM,KATSU.TraininghiddenMarkovmodelstructurewithgeneticalgorithmforhumanmotionpatternclassification[C]//SCIICASEInternationalJointConference.Busan:IEEEPress,2006:618622.
[2]胡宏宇,王庆年,曲昭伟,等.运动目标空间模式识别与异常行为检测[J].吉林大学学报,2011,41(6):15981602.
[3]闻佳,崔维.实时视频中的车辆运动轨迹的提取和聚类[J].计算机工程与应用,2010,46(11):155157.
[4]RISTICB,SCALARL.StatisticalanalysisofmotionpatterninAISdata:anomalydetectionandmotionprediciton[C]//11thInternationalConferenceonInformaiton.Fusion,Cologne:IEEEPress,2008:17.
[5]ETIENNEL,DEVOGELET.Similarityanalysisofmobileobjectstrajectoriesfollowingthesameitinerary[J].IngenierieDesSystemesDinformation,2009,14(5):85106.
[6]AARSETHERKG,TORGEIRM.EstimatingnavigationpatternsfromAIS[J].JournalofNavigaiton,2009,65(4):587607.
[7]GERBENKDV,MAARTENVS.Ananalysisofalignmentandintegralbasedkernelsformachinelearningfromvesseltrajectoris[J].ExpertSystemswithApplications,2014,41(2):75967607.
[8]ANDERSD,LARSN.Trajectoryclusteringforcoastalsurveillance[C]//10thInternationalConferenceonInformationFusion.Quebec:IEEEPress,2007:18.
[9]LAXHAMMARR,FALKMANG,SVIESTINSE.AnomalydetectioninseatrafficacomparisionoftheGaussianmixturemodelandthekerneldensityesimator[C]//12thInternationalConferenceonInformaitonFusion.Seattle:IEEEPress,2009:756763.
[10]JOHNSONN,HOGGD.Learningthedistributionofobjecttrajectoriesforeventrecognition[J].ImageandVisionComputing,1996,14(8):609615.
[11]ATEVS,MASOUDO,PAPANIKOLOPOULOSN.Learningtrafficpatternsatintersectionsbyspectralclusteringofmotiontrajectories[C]//IEEEInternationalConferenceonIntelligentRobotsandSystems.Beijing:IEEEPress,2006:48514856.
[12]QUXB,MENGQ,LISY.ShipcollisionriskassessmentfortheSingaporestrait[J].AccidentAnalysisPrevention,2011,43(3):20302036.
[13]史国友,朱公志,贾传荧,等.恒向线主题直接正反解的高精度算法[J].大连海事大学学报,2009,35(2):59.
[14]YUANG,XIASX,ZHANGL.Anefficienttrajectoryclusteringalgorithmbasedonstructuralfeatures[J].JournalofComputationalInformationSystems,2011,7(11):10271035.
[15]王艳军,王晓峰.AIS和北斗终端组合在船舶动态监控中的应用[J].上海海事大学学报,2011,32(4):1721.