信息通信论文基于支持向量机多分类器的室内外场景感知算法

所属栏目:智能科学技术论文 发布日期:2015-11-26 16:53 热度:

  现在的社会是一个信息化社会,互联网发展的非常迅速,随着一些电子产品的发展,移动终端也被人们熟知,在交流的时候很多人都会用到手机或者一些客户端来进行沟通。本文是一篇信息通信论文范文,主要论述了基于支持向量机多分类器的室内外场景感知算法。

   摘要:针对普适室内外场景持续感知面临的低功耗、复杂动态环境、异构使用模式带来的挑战,提出了一种轻量级的基于支持向量机多分类器的高精度、低功耗室内外场景检测算法。该算法使用智能手机集成的各种传感器(可见光传感器、磁传感器、加速度传感器、陀螺仪传感器和气压传感器),在挖掘分析各种传感器在室内外场景的不同特征,以及人们在室内外场景的行为差异基础上,根据时间和气象条件设计多个支持向量机分类器,对复杂室内外场景进行识别。实验结果表明,基于支持向量机多分类器的室内外场景检测算法具有较好的普适性,可获得95%以上的室内外判定准确率,平均功耗小于5mW。

  关键词:室内外场景识别,行为识别,支持向量机,多分类器,属性

  0引言

  当今社会已进入移动互联时代,移动终端早已成为了人们通信交流重要平台,近年来移动终端具有的环境感知能力使得移动终端更加人性化和智能化。由此可见,有效地识别室内外场景能够为终端应用提供更加有效环境信息,从而有效提高移动终端的表现。例如,在基于位置服务方面,全球定位系统(Global Positioning System, GPS)在室外环境可以给出比较精确的推断,然而在室内由于卫星视距受阻的原因不能很好地提供有效信息。在室内,移动手机需要扫描到信号强度更强的WiFi信号,自动地提供移动数据流量服务;而在室外,WiFi连接信号受到环境的与距离的影响[1-2],效果相对较差。因此,如果能够比较准确有效地识别与区分室内外场景,可以对GPS和WiFi的扫描和开关策略以及场景图像自动识别[3-4]、场景和活动的行为感知、室内定位等依赖于工作场景的服务提供有效的指导意见。综上,室内外场景识别方法有很大的实用价值和研究价值。

  当前的定位导航服务,大多数均是依赖于接收GPS信号对周围的环境进行判别[5],但由于精度问题往往不能精确地给出结果,同时却伴随着能耗高、响应慢、效率低等典型问题。目前有如下几类常用的室内外识别方法:第1类添加一些具有识别作用的外设模块进行室内外场景识别。这种方法虽然可以完成识别任务,但是初始阶段部署代价较高,限制了系统的普遍应用。第2类是基于对周围环境的信息进行指纹采集[6-7],然后利用最广泛的匹配方法进行匹配建模,最后还要通过不同的客户在不同的场景下进行反馈不断地纠正识别结果。但是该方法面临指纹采集费时费力的问题,并要求中央服务器存储大量数据并响应用户请求,因而很难被广泛地应用到室内外场景识别。第3类基于模式识别的图像处理方法进行室内外场景识别[8-9]。这种方法的计算复杂度非常高,而且要求用户手工交互[10-11],采集视频图像进行场景识别,其普适性受到较大限制。

  与上述场景识别算法不同,本文利用手机集成的各种传感器, 不借助其他任何先验信息,提出了基于支持向量机(Support Vector Machine, SVM)多分类器的室内外场景感知算法,该算法具有高准确度、低功耗等特点,在Android平台下的大量实验验证了算法的有效性和可用性。

  1基于SVM多分类器室内外场景识别算法

  考虑到环境光强值受不同时段(白天、晚上、黄昏等时段)及终端不同使用模式(放到背包/口袋里面与拿在手里)影响较大,如果不区分使用时段或者使用模式,将难以有效利用不同时段和不同使用模式条件的可见光强度属性。为此,本文所提的基于SVM多分类器室内外场景识别算法首先从室内外区别比较明显的特征开始,基于对所处时段以及手机使用模式进行室内外场景识别。

  根据用户使用移动设备的状态及时间段组合,基于SVM多分类器室内外场景识别算法通过训练多个分类模型,进行高精度室内外场景识别。其中每个SVM分类器都基于终端使用模式和时间段抽取可区分室内外场景的最佳特征属性组合,即不同的SVM分类器使用不同的优化属性组合,减少无效特征数据对分类器的影响与干扰,从而提高室内外场景识别准确度。

  基于SVM多分类器室内外场景识别算法包括训练数据采集、多分类器训练、基于终端使用模式和时间段的室内外场景识别,其伪代码如下所示:

  1)训练数据采集。

  程序前

  输入:白天(D),夜晚(N),手持(H),口袋(P);

  输出:DateSet_DH, DateSet_DP, DateSet_NH, DateSet_NP。

  If(D)

  {

  If(H) getDate();//DateSet_DH Values

  Else getDate();//DateSet_DP Values

  }

  Else if(N)

  {

  If(H) getDate();//DateSet_NH Values

  Else getDate();//DateSet_NP Values

  }

  程序后

  2)分类器训练

  程序前

  输入:各个模型样本的特征子集N={N1,N2,…,Nk};

  输出:bestModle。

  for(i=1;i  Model=svmtrain(Ni);

  return bestModle;

  程序后

  3)基于终端使用模式和时间段适配的室内外场景实时识别。

  程序前

  输入:DateSet_DH, DateSet_DP, DateSet_NH, DateSet_NP;

  输出:indoor/outdoor。

  if(DH)

  result=bestModel(DateSet_DH);// indoor/outdoor   else if(DP)

  result=bestModel(DateSet_DP);// indoor/outdoor

  else if(NH)

  result=bestModel(DateSet_NH);// indoor/outdoor

  else if(NP)

  return bestModel(DateSet_NP);// indoor/outdoor

  程序后

  1.1分类器属性选择

  为了有效识别室内外场景,本文选取具有明显室内外区分度的特征进行分类,本文选取5个特征来定义室内外的特征属性如表1所示,定义VP1=〈L,M,S,T,P〉。

  表格(有表名)

  表1特征属性及含义

  特征属性属性含义

  L(Light)室内外光强的在滑动窗口内的均值

  M(Magnetic)有效运动时间内磁场数据窗口中主波峰的个数来衡量环境磁场变化强度

  S(Stop Count) 一个2min的滑动窗口(队列)记录在该有效运动时间内用户停顿的次数

  D(Direction)在单位有效运动时间内产生的转弯次数

  P(Pressure)30s内气压变化的差值

  1.1.1光强特征

  室内外光强的在滑动窗口内的均值。通常情况下室内外光强是一个区别很大的特征,经实验测得室内光强范围L∈[0,400],而室外光强范围L∈[0,40000]不等。为提高可见光判定室内外场景的鲁棒性,本文采用滑动窗口平滑处理方法,以减少非正常动作导致的可见光数据突变。

  1.1.2室内磁场特征

  现代建筑物内使用的钢筋混凝土等磁性材料导致室内不同位置的磁场产生变化。本文利用一段有效运动时间内磁场数据窗口中主波峰数目来评估环境磁场变化,并用于室内外场景区分。

  1.1.3走停行为特征

  通过对人们日常工作行为习惯的统计分析发现,人们一般在室内环境下常会处理一些事物,而在室外多数是一种持续的运动状态。占空比可有效表征用户在室内外行走模式的差异。本文使用宽度为2min的滑动窗口(队列)保存在该有效运动时间内用户停顿的次数τ∈[0,5],并根据用户连续走动时间动态调整室内外置信度。如果用户产生停顿的时刻已经超过滑动窗口(位于滑动窗口之外),则该停顿从总的有效停顿次数中剔除(最大有效停顿次数定义为5,超过5以后仍然计为5)。

  1.1.4转弯行为特征

  通过观察分析人们在室内外场景活动的规律性,发现人们在室内小尺度空间内单位时间内发生更频繁的转弯行为,而在室外由于比较开阔次数明显小于室内环境。 f表示当前检测到的转弯频率,σ表示人在单位有效运动时间内,能产生的最大转弯次数。处于室内的σ表示人在单位有效运动时间t内能产生的最大转弯次数,ε表示对不发生转弯时间段的计数,在没有发生转弯时,ε根据所设置的陀螺仪或加速度传感器采样频率q来计数,每采样一次数据,对应ε加1,每当判定发生一次转弯时,对ε进行更新,更新后的ε值为原ε值除以最新统计的转弯次数。

  1.1.5气压快变化特征

  气压判定室内外模块每10s采集一次气压观测值,构建大小为30s的滑动窗口,当滑动窗口填满观测数据后,计算窗口内最新观测气压与前30s的气压观察差值,如果该30s内的气压变化绝对值大于规定气压变化阈值,判定当前观测周期内用户产生了上下楼动作,导致气压观测快速变化,把该气压快变化累加到气压快变化参数上。具体来讲,每当需要判定室内外场景时,如果气压快变化小于-0.45hPa,表明用户从启动程序开始到目前为止,总体上发生了上楼动作,因此判定用户当前处于室内状态; 如果气压快变化参数值大于 0.45hPa,表明用户产生了下楼动作,联合考虑用户可能乘坐电梯或者步行下楼后往室外走,判定用户当前处于室内。综上,本文维护记录30s滑动窗口内的第三个值与第一个值得差值作为一个快变化值,检测到发生上楼动作时一直维护该数值,直到有对应的下楼动作发生时,该数值归零。

  1.1.6特征值数量选择及分类算法优化

  在实际的生活中,通过对模型的研究发现,人们通常情况下长时间处于一种室内的环境,据统计,人们每天平均有80%以上的时间都是在室内度过。如果是典型的上班族,估计这一数值将达到90%以上。也就是说室内室外的原始数据在数值上将会存在着严重的不平衡情况,标准SVM在使用过程中由于数据的不均衡将会对分类结果产生偏斜性的影响。本文采用文献[12]中提出的不平衡样本SVM方法,用标准的SVM分离出超平面的法向量通过高维样本投影到该法向量上得到投影数据的标准差以及样本容量所提供的信息[13],得出两类数据的惩罚因子,再用标准的SVM进行第2 次训练,得到一个新的分类超平面。

  1.2分类器参数训练流程

  在实际实验过程中,需要对采集到的可用来区分室内外场景的特征参数用组合的方式进行优化选择。对每个状态下的数据集进行整理,保证室内外标记在数量上的均衡,对数据集选取适宜变量进行训练、优化,得到高精度分类器,其训练流程如图1所示。

  图片

  图1分类器训练过程

  1.3多分类器设计

  将室内外场景判别分为白天手持、夜晚手持、白天非手持和夜晚非手持等4个状态,得到4个传感器状态阈值范围相对较小的四个分类器。通过对上文所述特征的分析发现室内外光强的在滑动窗口内的均值在白天与夜晚是两个相反的特性。通过对测量数据分析,发现白天室外光强远大于室内光强,由此可根据日出日落时间将SVM分类器分为白天与晚上两种。为评估所提室内外场景感知算法的普适性,选择手持手机放到胸前(无阻挡,能良好感知环境光强,对应人们使用手机情形), 以及手机放到口袋/挎包内(对应日常工作或外出过程中不使用手机情形)这两种常用模式进行实验,对应状态简称为手持状态与非手持状态(放在包或口袋内,光传感器失效)。   2实验及结果分析

  2.1实验条件

  本文基于LIBSVM(LIBrary for Support Vector Machines)[14]的建模法为核心,直接采用已有的软件库进行建模,较传统方法有速度快、精度高、方便易行的特点。在实验中本文选取了办公大厦、居家住宅、公共交通中心、学校、商场等有代表性的场地进行数据的采集,以保证训练后的分类器能有较强的场景普适性。在大部分有监督学习的实际应用中,并不是所有的属性特征在预测目标方面都具有相同的重要性。对于一些分类器冗余或不相关属性可能会导致训练模型有问题。本文选择怀卡托智能分析环境(Waikato Environment for Knowledge Analysis, WEKA)为工具进行属性选择。对于各个分类器一般会产生多个组合的分类结果。

  属性选择中采用为LIBSVM和10折交叉验证对所有特征进行一一验证,并记录正确分类的百分比。下面为每个分类器选择相应的属性值进行测试的结果。本文使用三星S4手机进行测试,对应的实验数据分布如表2所示。

  2.2实验结果及分析

  本文定义室内外场景检测准确率为在所有实验中,室内和室外场景被正确检测出来的比例,如式(1)所示:

  Ac=m/n×100%(1)

  其中:m为全部实验中室内外场景被准确检测出的次数,n为总的实验次数。

  2.2.1白天手持状态室内外场景识别性能

  对白天手持终端使用状态的训练数据进行属性组合训练,与使用所有属性不区分时段的单分类器模式下进行性能比较,发现当选择〈L,D,T,P〉属性组合时,基于SVM的多分类器室内外判别算法可获得最优的室内外场景分类性能,如表3所示。

  2.2.2夜晚手持状态室内外场景识别性能

  本文对夜晚手持状态数据进行属性组合训练后发现,夜晚手持状态下选择〈L,M,S,T,P〉属性组合可得到最优分类结果,如表4所示。

  2.2.3白天非手持状态室内外场景识别性能

  对白天非手持状态的情况下的数据进行属性组合训练,发现SVM多分类器在使用〈P,T,S〉属性的情况下会得到最优的分类结果,如表5所示。

  2.2.4夜晚非手持状态室内外场景识别性能

  通过对夜晚非手持状态的情况下的数据进行属性组合训练,发现SVM多分类器在使用〈M,S,T,P〉属性的情况下会得到最优的分类结果。具体各项结果如表6所示。

  2.2.5软件功耗

信息通信论文

  使用Powermonitor[15]手机能耗追踪设备能针对智能手机在处理不同任务时的功耗情况进行测试,同时通过在PC端安装PowerTool软件来进行直观的曲线数据记录。研发人员可以通过Powermonitor第一时间了解产品整体性能的稳定性,从而作出合理的评估和改进。通过对不同设备以及不同分类器的状态下的功耗进行了详细的测试,结果如表7。进行对比后发现使用多分类器的情况下由于一次训练完成后每次判别只会产生少量运算带来的功耗,总体平均功耗均小于5mW。

  2.2.6性能比较

  上述实验显示,各状态下分类器所优化属性值有所差别,部分分类器只需部分属性就能获得不错的性能,使用更多属性反而降低准确率。即最佳的属性子集得到的分类准确率可能高于完整数据集得到的分类准确率。表8比较了使用不同分类器进行室内外场景的性能和使用不同型号终端下的室内外场景评定性能,均获得了较高的室内外场景判定准确率,展示出良好的异构设备鲁棒性能。

  3结语

  本文提出了一种轻量级的基于支持向量机多分类器的高精度、低功耗室内外场景检测算法。使用大量真实数据集,通过挖掘各种传感器在室内外场景的不同特征,以及人们在室内外场景的行为差异,设计了基于时间和气象条件的多个支持向量机分类器,对复杂室内外场景进行识别,达到了良好的效果。下一步工作是进行室内外特征向量的优化选择以及实现不同设备不同场景的迁移性学习。

  参考文献:

  [1] YANG Z, WU C, LIU Y. Locating in fingerprint space: wireless indoor localization with little human intervention[J]. Proceedings of Annual International Conference on Mobile Computing and Networking, 2012, 6(1):269-280.

  [2] ZHANG Z, ZHOU X, ZHANG W. I am the antenna: accurate outdoor AP location using smartphones[C]// Proceedings of the 17th Annual International Conference on Mobile Computing and Networking. New York: ACM, 2011: 109-120.

  信息通信论文发表期刊推荐《通讯世界》由全球最大的信息出版公司美国国际数据集团(IDG)与我国知名的信息研究机构中国科技信息研究所联合出版。坚持“集成世界强势力量把握通信未来脉搏”的办刊理念,以及资本、发行、采编和服务的国际化运作。

文章标题:信息通信论文基于支持向量机多分类器的室内外场景感知算法

转载请注明来自:http://www.sofabiao.com/fblw/dianxin/zhineng/28879.html

相关问题解答

SCI服务

搜论文知识网的海量职称论文范文仅供广大读者免费阅读使用! 冀ICP备15021333号-3