近年来,对广播电视和视听新媒体监管工作的要求越来越高,监管的范围不断扩大,监管的内容不断增多,信息处理的复杂度不断提高,现有监管技术能力亟需提升,为提高广播电视监测工作效率,满足日益急迫的内容监测需求,要充分重视将先进的人工智能技术应用到广播电视内容监测这一领域,实现对视音频节目内容的智能化分析和处理,以保障广播电视和视听新媒体监管的科学性、精准性和有效性。早期,广播电视内容监测完全靠人力,这种以人工收听收看为主的内容监测方式,由于劳动强度大、工作效率低、主观差错率较高,已不能满足海量的内容监测需求。随着人工智能技术近几年的快速发展,视频中的人像、语音、字幕和场景等特征均可以通过机器学习的算法实现结构化,这也为视音频内容的识别和审核提供了方便,大大地减少人工审核的工作量,提高了广播电视播出安全性[1]。因此,将人工智能技术带入到广电监测领域是广播电视监测部门提升部门智能化工作能力的重要探索,是海量数据下高效监管的必然选择,是构建数字化监测网、保障广电安全的重要之举。本文针对广播电视内容监测的特点和需求,设计了一套基于人工智能的广播电视内容监测系统,从系统的硬件架构、系统功能和应用流程等方面进行阐述[2]。
1广播电视内容监测系统架构
随着对广播电视节目内容监管力度不断加大,各广播电视监测部门需及时掌握所辖区域内的广播电视节目内容的播出情况,是否存在广告、新闻等节目内容不符合总局相关规定要求的情况,因此,本系统主要功能集中体现在广告监管和新闻节目的内容监管。广播电视内容监测系统搭建在云计算平台上,由云平台提供统一的计算资源、存储资源和网络资源,主要分为广告监测区、新闻节目内容分析区、存储区、审核管理客户端区等4个部分。通过内容识别、检索等技术,针对辖区内广播电视节目播放的广告内容,自动发现、记录、汇总商业广告、公益广告以及各类违规广告的详细信息,及时掌握各类违规广告的播出动态,准确遏制违规广告的传播;同时对广播电视新闻节目进行内容分析,实现播出内容中重点敏感人物镜头片段的检出,快速查找新闻舆情视频片段,发现电视节目中的敏感内容,从而确保电视播出内容不存在相关的违规情况。系统硬件架构图如图1所示。根据系统需求在相应区域部署划分虚拟化服务器,广告监测区主要完成广告监测数据的分析、处理,并对外提供检索查询服务;广播电视新闻监测区主要完成新闻节目内容以及敏感人物的分析、处理,并对外提供检索查询服务。存储区为系统提供基础支撑,完成对所有广播电视节目的采集存储及特征码提取,并为各业务子系统提供文件访问、数据存储服务。客户端审核区为系统应用展示和操作,完成对服务器的配置与检出结果的数据审核,包括广告监测结果审核、新闻舆情监测结果审核、敏感人脸识别结果审核、敏感人名语音关键词结果审核。
2广播电视内容监测系统功能
2.1人工智能处理引擎
通过人脸识别、场景识别、语音识别、文字识别等技术,实现节目内容的智能拆条编目及标签化处理,便于进行查询、检索、分类,通过进一步挖掘分析,实现节目内容评估分析统计,最后生成节目内容分析报告。运用人工智能技术,实现对节目自动化、智能化的多业务识别分析,实现节目内容标签化处理。处理分析手段覆盖人脸识别、场景识别、语音识别、文字识别等技术。内容分析任务可根据“人脸识别”“场景识别”“OCR识别”“语音识别”等模块[3],选其中一个或多个进行定向任务分析。人脸识别:对节目画面中的人脸区域进行自动识别、标注、存储。能够快速、准确发现节目当中出现的政治人物、明星人物等,对重点人物出现时间,持续时长进行标注。场景识别:对节目画面中出现的各类景物对象、特定场景进行自动识别、标注、存储,后续即可利用关键词识别技术进行筛选,快速检索到目标数据;通过转场识别技术,有效识别节目的转场画面,以此判断转场出现的时间点,以此进行场景分割,对节目进行分割拆条。OCR识别:对节目画面中的文字区域进行自动识别、标注、存储,后续即可利用关键词识别技术进行筛选,快速检索到目标数据;自动识别标题板中的字幕、标题。当字幕和标题内容出现变化时,判断节目内容变化,以此为依据进行拆条。语音识别:对节目伴音进行语音转文字处理,后续即可利用关键词识别技术进行筛选,快速检索到目标数据;根据说话人的语音特征形成特定的分布,来辨别判断节目内容中说话人的变化,对节目进行分割拆条。
2.2业务功能
(1)广告监测广告监测主要包括广告自动识别、新广告自动发现、广告违规研判、语音内容检索和管理等功能。系统具有自动分析和识别功能,基于已知广告模板库,完成每天广告的智能识别处理,形成广告播出日志记录,根据设置好的合法或者非法样本,经过比对确定该广告是否违规,能够自动检测到正常广告、违法广告出现的时间、时长以达到自动识别的目的;采用重复性视音频片段检测技术,利用广告重复滚动播出的特征,自动发现广播电视中播出的疑似新广告片段系统,主动发现疑似广告。系统根据识别得到的播出结果进行违规研判,从实时视音频信号输入到广告识别结果形成无需人工参与,能够由系统自行完成。(2)新闻监测新闻监测主要包括舆情监测和敏感人物监测等功能。系统根据设置好的敏感舆情专题进行检索,快速定位符合要求的敏感新闻舆情视音频片段,检索到的文本通过音视频关联回放,并将编审后的结果录入敏感舆情库,同时可对敏感新闻视频段进行实时的取证、下载和管理;可根据新闻舆情监测的频道、任务,对新闻语音识别后的文本结果进行浏览与审核,用户可按“句”对识别结果进行新闻视频的定位回放与识别结果文本的查看与修改。敏感人物监测综合采用人脸识别、语音关键词检索技术,主动发现节目中出现敏感人物的画面,以及出现的敏感人名的语音,从而自动发现广播电视中敏感人物的违规播出情况。
3广播电视内容监测系统应用流程
系统通过流媒体将广播电视节目分发给广播电视内容监测系统,完成广播电视新闻和广告节目的自动识别、发现、审核、管理功能,实现广播内容安全及意识形态监管。系统应用流程图如图2所示。广播电视监测前端对已监测的频道进行每日采集EPG数据,对于新增的EPG则保存,对于有变更的数据则更新。通过流媒体实时拉取音视频节目流分发给广播电视内容监测系统,系统支持设置违规事件和频道的识别任务,包括敏感人物、敏感关键字、违规等级等参数,随后下发识别任务给识别引擎,识别引擎根据任务,达到预设的时间点,开始拉取视频进行识别,识别完成将结果上报平台,如有违规事件发生,则同时将告警数据上报。系统接收识别结果后,对结果打上识别标签,加入搜索引擎库,方便后续检索,提供文本检索、图片检索、视音频检索等综合检索功能。识别结果支持查询、修改、保存。
4结语
基于人工智能的广播电视内容监测系统结合智能识别引擎,运用语音识别、图像识别、机器学习等人工智能技术,实现对节目内容进行自动化、智能化的多业务识别分析,建立监测、预判、评估的过程,通过自动指标监测发现播出故障,实现广告内容精准识别、新闻节目的舆情监测和敏感人物监测,改变了传统靠人力收听收看的内容监测方式,实现高效精准研判,有效应对安全播出风险,提升了广播电视监测系统自动化和智能化水平。
参考文献:
[1]符芳铭.人工智能在广播电视监测监管中的应用分析[J].数码设计(上),2020,9(6):74-75.
[2]许依凡.人工智能在广播电视监测监管中的应用分析[J].数码设计(上),2020,9(1):88-89.
[3]万倩,朱里越,欧阳峰.基于人工智能的广电舆情分析系统[J].广播与电视技术,2019(12):46-52.
《基于人工智能的广播电视内容监测系统》来源:《中国有线电视》,作者:袁玉平