网站首页  词典首页

请输入您要查询的论文:

 

标题 大数据背景下的广告智慧监管
范文

    王丽萍 周序生 何地 文志华

    摘要:大数据对广告智能化的影响是全面而深刻的。首先,对大数据的分析,能确定网络用户画像,提升广告的精准性。其次,大数据改变了传统的广告投放模式,产生了由受众需求为主的广告投放模式。这些变化都为广告的监管带来了新的问题,使得管理部门面临了新的监管挑战。本文针对大数据背景下的互联网广告新特性进行探讨,在分析现有的监测技术基础上,提出目前监管中存在的一些问题,针对这些问题提出了一些智慧监管方面的探索。

    关键词:大数据与广告;广告监管;广告智慧监管

    中图分类号:TP391 ? ?文献标识码:A

    文章编号:1009-3044(2020)31-0254-03

    大数据(BD:Big Data),指不能在一定时间范围内用常见的软件工具进行获取、管理和处理的数据集,而要采用新的处理方式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产[1]。海量的非结构化数据给整个行业带来了地震式的影响,广告领域亦然,受到了广泛而深远的影响。在互联网中,一切信息及其变化都是数据,小到一个人在网上的购买行为、健康数据,大到一个城市乃至一个国家的交通运行信息、经济相关数据、农业生态信息都是数据。

    大数据对广告智能化的影响是全面而深刻的。大数据的产生,从而使得网络用户画像的全面刻画成为可能,网络用户画像是互联网广告进行精准投放的基础。大数据改变了传统的广告投放模式,互联网广告的投放由算法根据受众需求而自动化去匹配广告,引起了广告投放模式的改变。这些变化都为广告的监管带来了新的问题,使得管理部门面临了新的监管挑战。此外,互联网的全域性以及边界的模糊性,使得原有的以辖区为主的广告监管模式面临着互联网模式下的新的挑战。

    1大数据背景下互联网广告呈现出的新特性

    1.1广告创作智能化

    大数据改变了广告内容创作方式,如:2015年美联社在全球率先推出智能机器人撰写体育与财经新闻稿件,国内的腾讯、新华社、今日头条和第一财经等网络媒体、传统媒体也紧接着推出了类似的智能创作写手。2017年,新华社在世界各大媒体机构中率先建立由AI驱动的新闻全链条生产,涵盖从线索、策划、采访、生产、分发、反馈等全新闻流程的“媒体大脑”正式上线;2017年5月,阿里推出了1秒能制作8000张海报的AI鲁班,在同年的“双11”期间发挥巨大作用,生产出肆亿张网络广告Banner,创作类人力资源得到极大减少;假如一张网络广告Banner最短耗时20分钟,那么需要1000个设计师不间断工作76年[2]。一年后,阿里推出了“AI智能文案”,一秒钟之内按照设计者要求完成了2万条文案,在戛纳国际创意节上给全球创意精英带来了巨大的震撼。

    1.2广告发布海量化

    与传统媒体相比,互联网广告的量是巨大的,互联网上存在这海量的广告数据。广告主可以通过多种渠道和方式,不受限制地将相应的广告展示在用户面前。可以说,互联网广告的内容极为丰富,互联网上汇聚了海量的广告信息,这些广告大部分都通过类似广告信息交换平台(ADX:Ad Exchange)的平台系统进行程序化的量化交易从而发布到互联网,一个主流的广告平台每天的广告量都在几百万条,高峰时期甚至超过千万条,在互联网上每天都诞生着海量的广告数据。

    1.3广告投放精准化

    互联网广告与传统广告不同,它可以对目标人群进行精准投放。互联网广告精准投放的基礎是来源于用户画像。所谓用户画像是指采用大数据分析、数据挖掘、通过分析获取用户主体身份特征、行为、消费习惯等重要信息,把这些信息存储在专门的用户画像数据平台上,互联网广告可以根据这些用户信息按照偏好进行广告投放,这就是广告的精准投放。把这些数据进行分析,得到的专业的用户画像数据,是互联网广告精准营销的基石。通过互联网上的广告投放平台,能让很多中小企业主可以获得较为低廉的广告价位,从而可以使得广告精准投放到目标群体。比如通过对用户上网的各类数据使用大数据分析可以得出用户地理位置分布、性别、年龄、工资、身高、衣着等主体身份内容,可以推测出购买商品类型、喜好、品牌、价格范围等行为和客体所需数据,亦能依托数据预测出可能需要的商品及服务的广告内容[3]。

    1.4广告形式多样化

    传统广告一般以文字内容为主,互联网广告以图片、视频为主,尤其是进入移动互联网时代后,短视频为主的广告更是占据了主要部分。短视频是一种新型的基于移动互联网传播的形式,其主要特点是视频时长短,大部分平台限定在15秒内, 5分钟内的只有极少数。很多平台提供使用方法简单易上手而功能比较丰富的视频制作软件,从而使短视频的制作成本很低,人人都能成为短视频制作大师,因此短视频的具备视频数量巨大、信息量大、制作成本低、用户黏着度高的特点[4]。自媒体时代的营利途径主要广告,短视频发布的广告有三个类别:一个是植入类型,其特点为在视频中植入广告内容,把演员、情节、广告融入剧情,使其形成一个整体;一个是贴片类型,其特点为在片头或者片尾插入广告内容,比如假如含广告的字幕及二维码,而其视频主体内容无广告;第三个是用户生成类型,视频通过画面、讲解、字幕的形式达到广告成效。不管是在互联网还是移动互联网上,视频类的广告已经成为网络广告的主要形式,对视频类广告的监管是不容忽视的内容。当然,目前个人pc端也被一些常用的工具软件比如杀毒、安全、插件类的软件植入图片、视频、网页链接类的广告,用户不胜其烦。不管是哪种类型的广告形式,图片、视频类广告的监测难点就是识别问题,如何能准确、高效地识别出非法广告,一直是广告动态监测中的重点和难点内容。

    2 现有的监测技术

    2.1数据获取技术

    广告数据的获取主要是采用的网络爬虫技术。网络爬虫主要是通过爬虫技术抓取网络数据,对抓取的网页中的数据进行关联性分析。在广告监测系统中,抓取的对象主要有广告标题、相关文本信息、链接地址以及广告的分类媒体等相关的信息。网页内容提取研究方法目前主要有:抽取网页内的固定内容、用语义方式抽取网页广告内容、基于视觉要素来抽取广告内容以及基于信息来抽取网页内的广告内容。广告监测平台中广泛使用网络爬虫技术,它本是搜索技术中的一种关键技术。

    2.2数据分析技术

    建立违规词库,对广告数据进行分析。运用自然语言处理、信息处理技术,尤其是信息挖掘技术,通过一系列技术把原来较为分散的信息进行关联分析,建立一个广告信息知识词库,同时需要确定违规词查询条件,把这些条件发送给信息检索引擎,可以根据搜索结果提前预警。广告信息知识库的违规广告信息来源主要是以手工建库、采集违规广告词以及以机器学习的方式获取。违规词库是判断广告是否违规的依据,把采集到的广告信息与词库中的词进行关键词的比较,从而进行违规词库的判断。同时,管理者还可以根据需要手动设置违规词汇,通过分析违规广告的上下文,与经训练好的违规词库和手动设置的词汇进行匹配就够比较精确的定位到违规词库,可供管理部门参考。但是,对于一些行业中的识别是有差别的,比如保健品广告中不能出现“宝、灵、精、强力、祖传、特效”等夸大性的词汇,也不能出现“处方、抗敏、抗菌”等具备疗效的词汇,对一些新颖的词汇比如“纳米”等词,消费者难以理解其意思,其中有部分词用在药品中却是不违规。所以必须收集这些保健品的产品名称与相关词汇进行关联,同时对于其他类似的行业、公司等也需要设计其规定的违规关键词和产品存放在数据库中。

    通过机器学习的相关技术,对图片、视频内容进行分析与识别。使用自然语言处理的相关技术能智能地识别出几万种敏感词的变体(社交媒体平台、移动端等联系方式),而且运用文本序列标注的方法也可以智能的识别出数据欺诈、排除干扰。一家美国公司DataVisor(人工智能方面),采用无监督机器学习算法设计出了AI一站式检测平台,采用该算法分析出用户IP地址、E-mail、行为模式等特征,能发现传统方法检测不出的细小关联,以及数据造假用户间的联系,从而挖掘出新的欺诈方式,帮广告主实现早期和未知欺诈检测;Sitemonitor技术(我国第三方营销数据技术公司秒针系统)能实时进行网络监测、分析,其灵活的埋点采集等方式实现分钟级实时监测,能对数据造假防范、投放优化提供数据支持[5]。

    3 存在的问题

    3.1广告数据采集的滞后性、被动性、不完整性

    通过网络爬虫技术从互联网采集的广告数据,从总体上看,是发生在广告发布之后的,由于广告发布与数据采集之间存在时间差,所以采集的数据总是落后于实际的数据,存在滞后性。相对于广告的发布方来说,所有的广告数据采集都是被动地进行的,都是在广告事件发生后,监管部门被动地去从各个渠道采集数据来判断广告是否违规违法。互联网上的广告形式多样,存在着海量的内容,尤其是在移动互联网占据主流之后,广告的投放形式发生了很大变化,目前大部分的广告投放主要是通过广告交易平台根据用户偏好进行的精准投放。也就意味着,在同一个电脑或者手机终端进行采集的时候,只能采集到少量几种类型的广告;即使是用到了几种不同类型的用户画像进行模拟而采集的时候,也不能完全穷尽广告的类型。所以,不管用什么方式去模拟用户进行数据采集,采集到的广告数据始终是不完整的,无法获取全量的广告数据。

    3.2图片、视频广告识别较难

    图片广告,尤其是短视频广告已经成为广告的主流。一直以来,图片以及视频的识别是广告识别中的难点问题。对于图片广告,一般采用OCR(Optical Character Recognition,光学字符识别)技术进行内容识别,识别之后对广告内容进行技术分析,但总有一些扭曲或者替换文字无法准确识别。对于视频广告,一般采用机器学习的方法,通过已知的训练模型对未知的视频内容进行特征匹配和分析,从而得出广告视频是否属于预测模型中相匹配的内容,进而判断出视频广告是否违规违法。但是,其难点在于特征库和训练模型的建立,识别准确率也取决于训练模型的适合与否。

    4广告智慧监管探索

    4.1管理方面的思考

    《广告法》规定我国由市场监督管理部门负责广告的监督管理工作。目前,我国各级政府市场监督部门的机构设置体系共四个层级:国家级、省级、市级与县级。国家市场监督管理总局为第一级,为我国广告监管的最高权力机构,根据国家法律和国务院的相关授权,代表政府对广告进行全方位的监督和管理。每个省(自治区、直辖市、特别行政区)的市场监督管理局为第二级,隶属于省级政府,受国家市场监督管理总局和省级政府的双重领导,内设的广告监管机构承担监督管理职责。第三级为市级和地区政府市场监督管理局,县级市场监督管理局为第四级。市场监督管理机关从上至下分别内设了广告监管司(中国互联网广告监测中心)、处、科、股(室),这些部门处室是我国的广告行政监管主体。

    互联网的诞生与普及让各个不同地区的人们可以在互联网上无间距交流、作业,基于互联网的商业打破了地域的限制,甚至国家之间的限制。广告的生产、交易、发布亦不例外。目前对互联网上广告的监管沿用了传统的广告管理模式,以省一级对应政府部门各自负责自己辖区内的广告监管事宜,这样的好处是管理范围及责任明确,方便落实到位。在今天,幾乎每个省级部门都构建了自己的网络广告监管平台,对自己辖区内的广告实施监督和管理。但在互联网环境下,已经没有了行政和地域的概念,是一张统一的、扁平化的网络,互联网公司的广告业务也是遍及全网,完全没有地域概念。比如,百度、阿里、腾讯虽然有公司的注册归属地,但他们的业务却是遍及全网,没有地域差异,其广告的发布也是由广告交易平台根据访问用户的偏好实现的程序化的自动购买,不涉及地域差别。所以,这些监管平台在实施广告监管的时候,实际上很有可能是有工作重复的一面,而且不比传统的基于辖区的监管,互联网上的辖区很难清晰地鉴定边界。这一些监管平台从技术上来说虽然有一定差别,但是从功能上来说其实都可以实施全网的广告监管,每个省级部门都投资建设监管平台,一定程度上属于重复建设。

    既然互联网上省一级的辖区边界难以鉴定,又需要对全网进行广告监管,那么从国家层面搭建一个技术先进的、覆盖整个互联网的广告监管平台是一个可行的途径。这样一来,针对广告数据采集的滞后性、被动性和不完整性问题,就可以从国家层面出台规章制度,要求每一个从事互联网广告的公司,把广告平台(包括广告交易平台、需求方平台、媒介方平台等)中的数据提供接口进行数据镜像,提供给监管平台进行事后审查监督。也可以对广告实行预先的审核,例如在法国,建立实行了广告前置审查制度,审查的机构具体由法国政府与有关媒体、广告企业、消费者协会共同投资组建,未经这个审查机构审查的,不能在媒体上发布广告[6]。对于媒介方平台中的每一条上传的广告,可以设置预先审核机制,由机器学习算法对内容进行预先审查,可以预先阻止一些违法违规广告进入互联网。如此则解决了互联网中的绝大部分广告监管,这样就抓住了互联网广告监管的主要矛盾,此外就可以把剩余精力用来对广告平台之外的小部分互联网广告进行监管了,这样主要矛盾与次要矛盾得以全覆盖,既能节省监管的精力,又能提高监管的效率。

    此外,与其他管理部门联合监管也是一个重要的方面。在大数据时代,自媒体已经逐渐成为新闻传播的主体,比如我们在百度或今日头条看到的新闻,都是后台通过某种算法的计算推荐给手机App或网页的,某些时候自媒体的文章也承载了广告的功能,只是很难鉴定其内容是否为广告内容。比如,某平台在播出一部电视剧X,此平台为了提高收视率,会在多个自媒体平台购买了流量来推广电视剧X,相应地,用户会在看新闻的时候浏览到多条关于电视剧X的新闻,这些新闻的内容大部分都是从不同的方面吸引用户去看此电视剧。这种类型的广告,一般称为软文广告,只不过在自媒体时代,使得软文广告规模大大增加,几乎无处不在。这种广告是以新闻的形式存在的,对它的形式很难直接鉴定。需要与其他部门联合进行监督,公安等部门会对新闻等内容会进行舆情监督,这样多个部门可以一起合作,发挥各自的优势,达到共同监督的目的。

    4.2发挥社会监督的力量

    从社会监督方面看,社会监督是我国网络广告监督的主要方式,让广大人民群众通过舆论媒体、社会组织和团体以及行业协会等自发对网络广告进行监督。社会监督的运行主要是三个层面:一个层面是消费者对网络广告的全流程监督;另一个层面是消费者协会等社会监督组织对网络广告的监督,第三层面是通过新闻媒体对违法违规、虚假广告及其相关责任人的监督、曝光。这三个层次由民众到组织到媒体自下而上的形式,逐层推进,形成了一个比较有序的网络广告社会规制体系。

    鼓励社会力量进行监督,随着智能手机的普及,可以开发具备监督举报功能的手机App,让公民可以随时随地拍照或拍视频举报违法广告。当然,也可以对此类举报采取一定的经济型鼓励,以提高人们参与的积极性。此外,为了增加广告的效果,目前影视剧的植入广告日趋增多,比如在影视剧中植入某类烟草的暗示性广告,或者是其他某类违规类广告,对于此种情况,可能在影视内容审核中会进行审查,但因為影视资源是海量的,某一些违规内容可能未必能审查出来。这时候如果有一种顺畅的社会监督渠道,人们在第一时间接触到此类暗示性广告时,就能对此内容进行监督举报,那么一方面能起到举报监督并经查实后对责任主体进行惩罚教育的效果,另一方面使得社会监督起到一种无形的威慑作用,消灭一些潜在的想打擦边球的想法和行为。

    4.3技术层面的方法

    获得技术接口,镜像广告数据,解决数据不完整的问题。在广告交易平台中,每一秒都进行着大量的广告交易,这些交易是由算法自动完成的,算法会根据访问当前广告位的用户的偏好信息(用户画像,由专门的数据平台存储)在广告交易平台中进行询价,之后会与多个报价中的价高者进行匹配,把中标者的广告内容发送给当前广告位,展示到用户的浏览页面。每一个步骤的响应时间是毫秒级,所有的这些操作都是在平台上自动化地完成。所以对于监管者来说,如果是用爬取数据方法去获取数据,势必难以得到完整的数据,而且具有滞后性,如果能直接从这些平台中把广告的信息以接口的形式镜像到监管平台,那么就能获得全量的广告数据,解决了广告数据不完整的难题。

    提高违法广告的识别率,尤其是强化对视频类广告的监管。当前,随着移动互联网的广泛深入地应用,视频类广告已经成为广告的主流形式。对于视频广告内容分析与理解技术中存在的不足,可以从分析视频类广告各种潜在语义特性,借助机器学习、视觉处理及多媒体处理等相关技术,分析视频广告中存在的多种语义概念,并构造描述逻辑层,使得不同媒体模态下的信息能交互融合,从而得到行之有效的技术和管理方案。可以通过深度学习、强化学习技术建立模型,对不同语境的场景的理解进行多维度检测。同时,可以构建一个具备语义分析、能自主学习的多维度视频监测平台。首先,可以构建视频参数信息采集接口,将采集到的视频及核心参数处理为统一格式,将海量视频相关数据投入到深度智能分析引擎。其次,通过深度智能分析引擎来结合基于视频参数构建的深度学习筛选模型进行分类检测,完成海量筛查。然后,深度智能分析引擎可以结合音频和视频的综合的检测,再结合深度学习模型做最终甄别确认,以提高检测准确率。最后,可以将前期难以鉴定的结果交给人工做辅助判定,通过强化学习,进一步矫正系统,提升准确率。

    参考文献:

    [1] 百度百科.大数据[EB/OL].https://baike.baidu.com/item/%E5%A4%A7%E6%95%B0%E6%8D%AE/1356941?fr=aladdin.

    [2] 曾静平.智能传播的实践发展与理论体系初构[J].人民论坛·学术前沿,2018(24):67-73.

    [3] 况旭,杨洋.解决网络监测五大难题创新互联网广告智慧监管[J].中国市场监管研究,2020(5):57-60.

    [4] 周一.自媒体短视频广告的监管与治理[J].新媒体研究,2019,5(8):57-59.

    [5] 张艳,王超琼.互联网广告数据治理的智能技术应用——基于防范数据造假的视角[J].青年记者,2020(15):84-85.

    [6]马特斯尔斯·W·斯达切尔,孙秋宁,译.网络广告:互联网上的不正当竞争和商标[M].北京:中国政法大学出版社,2004:99-156.

    【通联编辑:梁书】

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/11 20:46:55