第35卷第3期 萍乡学院学报 2018年6月 V_01.35 N0.3 Journal of Pingxiang University Jun-2018 基于深度学习的无线网络数据时空建模和预测研究 李莉贞 (阳泉师范高等专科学校信息技术系,山西阳泉045000) 摘要:首先对互联网服务提供商获得的无线网络数据(主要是蜂窝移动网络的数据)进行了初步分析,揭示了相 邻基站的数据之间具有时间和空间相关性。然后建立了一种时空预测的混合深度学习模型,并提出了一种新的空间 模型训练算法。最后使用无线网络数据集进行实验来评估模型的I陛能。结果表明,所提出的深度模型显著提高了预 测精度。 关键词:深度学习;无线网络;时空模型;预测算法 中图分类号:TP391 文献标识码:A 文章编号:2095.9249(2018)03.0079.04 随着无线网络的发展,移动设备已经成为人们日 域显示非零的自相关。使用样本白相关函 来检测 常生活中必不可缺的重要部分。移动设备产生了大量 数据在时间域的相关性,该函数的定义如下所示: 的无线网络数据;同时,复杂的无线网络产生了大量 ∑( 一 )( + 一歹) (1) 的运行时统计数据。通过这些数据,互联网提供商能 』 l . 一t=l够更好地理解用户需求和系统功能,以便进行资源分 c0 配的优化。无线系统数据基本上是时间序列数据,但 该函数检测了数据样本Yt与Yt+ 之间的相关性, 是 同时也表现出空间依赖性。通过利用大系统数据,提出 平均数,cO是数据样本的方差。若rk等于1(一1), 了一种无线网络时空建模和预测的深度学习方法,并 此时数据具有正(负)自相关性;若 等于零,则数据 利用实验进行性能评估。 不具有自相关性。在将数据集中的数据样本代入公式 (1)后的结果显示:数据集D在时域显示非零的自相 1数据集分析 关。接下来,公式(2)被用来检测数据集在空间域的 相关性。 首先介绍用于分析和评估的数据集,然后对数据 进行初步分析。本文采用的数据集是来自中国电信某 ∑ 。(dl一 )( 一 ) 分公司的一个大型无线网络,其中包含了2844个基站 ( N ∑ 。 匣产生的数据。该数据集包含了从2017年08月01日至 N-1 2017年12月30日每小时流量负荷的平均值。为了简 其中,Ⅳ是网格的数量。通过研究了网格数据之间的 化分析过程,目标区域被划分为网格,每个网格包含 空间相关性,经过计算发现,50%以上的相关值都大 一个基站,网格坐标用二元组(m,,2)表示。用 于0.4。此外,我们可以看到不同网格之间的相关值变 D={dm ,)表示网格(m, )在 时刻的数据流量。对数 化很大,这个性质表明数据具有空间相关性。 据集进行初步分析的目标是探讨数据在时间和空间方 面的相关性。可以分别在时间和空间域上检验数据的 2基于深度学习的时空建模和预测 时间自相关和空间相关性。根据分析,数据集D在时 由上一节的数据集分析可知,数据具有强空间相 收稿日期:2018.05—07 作者简介:李莉贞(1974一),女,山西阳泉人,讲师,研究方向:数据挖掘。 ·80· 萍乡学院学报 2018.年 关性,因此不能仅对历史数据进行时间建模。基于上 码。而重构输入的过程称为解码。通过重建部分损坏的 输入,去噪自动编码器使数据的表示更具有鲁棒性。自 动编码器可以堆叠形成一个深度学习网络。栈式自编码 能够有效地生成数据的非线性表示。由于数据片具有位 置相关和空间相关性,因此需要以较小的重构损失来获 得更好的编码表示。为了实现这一目标,LSA和经过 述观察,通过利用从目标网格及其邻居网格收集的历 史数据,一种新的混合深度学习模型被设计出来,用 以对每个网格 , )进行时空建模和预测。该模型由 三个主要部分组成:本地栈式自动编码器(LSA)、全 局栈式自动编码器(GSA)和长短期记忆网络 (LSMN)。该模型的工作流程如下: 1)网格的数据以及其邻居网格的数据组成一个数 据补丁,GSA将数据片作为输入,生成一个全局的编 码表示。 训练的GSA被用来捕获数据片的局部位置依赖性和空 间相关性,以产生更好的编码表示。 给定训练后的GSA,使用LSA能进一步减少数据 片的重构损失。首先,训练LSA第1层网络的权重以 2)经过GSA编码后,将每个数据补丁移送至相 应的LSA,并生成局部编码表示。将全局编码表示 和局部编码表示进行拼接以生成数据补丁的唯一编 码表示。 减少GSA网络中第1层的重构损失。然后,对LSA的 较高层进行训练,以学习较低层的不同表示。最后,将 LSA最高层的编码表示与GSA最高层的编码表示拼接 起来,生成数据片的唯一编码表示。 高效的SdA.3算法【4]能被用来GSA神经网络的训 练,却不能使用SdA.3训练LSA。接下来对LSA网络 3)将数据补丁的唯一编码表示发送到LSMN以进 行预测。 对于空间建模,自动编码器(AE)[ ]是进行数据压 缩的最好选择。AE是通常是拥有一个隐藏层的神经网 中第 层的编码函数 (·)和解码函数d ̄fo(·)进行定 义,分别如公式(3)和公式(4)所示。 络,通过训练获得输入数据的表示【 ,这一过程称为编 (x0) ( Xb十bb) (3) ’c 。 , ㈩ P (·)是激活函数,本文使用sigmoid函数作为激活函 数;X 是第J层的输入;Yo是第J层的编码结果, 同时 也可以作为上层的输入,即Y,j误的x 。算法1的第l ̄4行为LSA的第一层生成输入 数据。算法第5、6行是初始化操作。第7行使用带有 错误的数据(即文 )作为输入进行第一层网络的预训 练。重构损失定义为中的交叉熵,如下: =X 。W,j、 w 分别是编码和解码的权重,b。、b 分别是编码 和解码的偏置。 L(X,z):∑xlog(x)+(1-x)log(1一z) (5) 重构损失的最小化使用了随机梯度下降算法。算法 第8行使用X 生成第二层的输入x 。第9~12行是 在训练GSA和LSA的时候使用tied weight[ ,即 解码函数中的权值矩阵是编码函数中权值矩阵的转 置。W,和b 初始化为零矩阵0。LSA深度神经网络 j从第2层到第 层的预训练过程。在对第 层进行预 训练后,可以获得第 1层的输入X X + 的训练算法如算法1所示,它包括了预训练和微调两 .(即 个阶段。该算法中,网格(m,胛)及其邻居在t时刻产生 的流量数据组成数据片patch(d ̄ ,)。又 是指带有错 = (x。))。在对网络的所有层进行预训练后, 展开GSA和LSA以进行微调(如算法第l3行所示)。 第3期 李莉贞:基于深度学习的无线网络数据时空建模和预测研究 ·81· 算法1空间模型训练算法 输入:数据集D、己训练的GSA网络、bg 、b 输出:wf、,b b;, 1:X^<.---emp ̄; 2:For eachtdo 3:X^ X^u patch(din ); 4:End for 5:b 0; 6:w 0; 7:TrainFirstLayer0; 8:X =P (x^); 9:For eachj inddo 10:PreTrain(j); 11:x0+。=P (x0); 12:End for 13:Unroll(); 如上所述,递归神经网络(RNN)被用于时间建 模和预测,它将从混合空间模型中得到的编码表示作 为输入。但是,标准的RNN并不适用于对长期性的依 赖关系进行建模。LSMN可以捕获长期的时间依赖 性,它允许模型学习如何忘记隐藏状态以及如何更新 6 7 8 9 0 \ 、 \ \ 、 当前状态。LSMN的结构如图1所示。 ⑦ lit ot L_-< Ct-1 h ,=\ 图1 LSMN单元结构 LSMN由一个记忆单元c 、一个输入模块g,、 个输出模块h 以及三个逻辑门(分别是输入门i 、 出门O,、遗忘门 )。其中, i = (WxiX,+w fh +bf) C= (、7l x,+wyh,一1+b,) O = (Wx。X,+W 。hf_l+b。) gf= (Wxcxf+w 。hf_l+b。) c,=e o C 0i,o g, h =O o (c ) (11) t‘ ( )是双曲正切函数。符号。和0分别表示点乘和向 量求和。记忆单元结合以前的网格状态、当前输入和以 前输出来更新隐藏状态。遗忘门决定信息是否应该被遗 忘或被记住。输出门学习记忆单元如何影响隐藏状态。 为了预测网格( , )的未来值 +,,先前 个时间间 隙的数据片会被作为输入,然后被GSA和LSA编码。 对于每个时刻f t , 和patch(d ̄ ,)的值将被连接 为一个向量。这样一来,我们获得了矢量的时间序列, LSMN模块处理该序列并预测 “l。 3性能评估 基于深度学习模型与基于时间序列分析模型【6】均 被实现在Keras函数库中,以对两种算法在平均平方误 差、平均绝对误差和交叉熵三方面进行评估。选择以 目标网格为中心的11×l1个网格作为邻居网格。随机 选择了15个网格进行测试,对于每个网络f . 1,数 据被分为训练集和测试集。 首先,展示基于深度学习模型预测性能的实验结 果。如图2所示。图2(a)是上行链路的预测值与实 际值,图2(a)是下行链路的结果。由图2可知,预 测值与实际值的趋势较为一致。表l显示了基于深度 学习模型和基于时间序列模型下行/上行链路的平均平 方误差、平均绝对误差和交叉熵的比较。由表1可 知,基于深度学习的模型在所有指标上都优于基于时 间序列模型。实验结果很好地说明了深度学习模型应 用于无线网络数据分析的有效性。 ·82· 撬测值一—-实际值 萍乡学院学报 豌渊篷…蜜 值 2018年 一一l 0.9 0.8 0 7 0 9 0—8 0。7 孰 0.4 06 .。5盛OI4 0_3 謦O.3 0 2 0.1 0.2 0.1 0 O 0 lO 20 30 40 50 60 70 80 90 1001l0120130140150 0 10 20 30 40 50 60 70 80 90 100l10l20130140l50 嘲嘲(小时) 刚闽(小H ) (a)上行链路流量 (b)下行链路流量 图2流量的预测值与真实值对比 表l平均平方误差、平均绝对误差和交叉熵的结果对比 嘲 4结论 本文首先对一个真实数据集进行了分析,揭示了 数据的时间和空间相关性。然后提出了一种基于深度 学习的混合时空预测模型,包括一个新的基于白编码 的空间建模模型和基于长短期记忆网络的时间模型。 wise training of deep networks[C].Advances in neural information processing systems.2007:1 53~1 60. Yu J,Hong C,Rui et a1.Multitask autoencoder mo del for recovering human poses[J].IEEE Transactions O n Industria1 Electronics,20 1 8,65(6):5060-5068. Xing C,Ma L,Yang X.Stacked denoise autoencoder 其次提出了一种新的空间模型训练算法。实验结果表 明,与现有的方法相比,本文的深度模型显著提高了 预测精度。 参考文献 l P J,Davis R A.Introduction to time series [1] Brockwelbased feature extraction and classiicatfion for hyperspec tral images[J].Journal of Sensors,2016,2016. Kasun L L C,Yang Huang G B,et a1.Dimension reduction with extreme learning machine[J].IEEE Trans actions on Image Processing,2016,25(8):3906~3918. Hyndman R J.Athanasopoulos G Forecasting:principle S and practice[M].OTexts,2014. and forecasting[M].springer,2016. Bengio Lamblin P,Popovici D,et a1.Greedy layer— [责任编校:范延琛] of Wireless Network Data Based on Deep Learning Spatio—temporal Modeling and Prediction LI Li.zhen (Department ofInfonnation Technology,Yangquan Teachers College,Yangquan Shanxi 045000,China) Abstract:Firstly,the preliminary analysis of the wireless network data(mainly the data of the cellular mobile network1 obtained by the Intemet service provider reveals the temporal and spatial correlation between the data of the ad acent base stations.Then a hybrid deep learning mode1 of spatiotemporal prediction iS established and a new spatial model training algorithm is proposed.Finally,experiments are performed using wireless network data sets to evaluate the performance of the mode1.The results show that the proposed depth mode1 significantly improves the prediction accuracy. Key words:deep learning;wireless network:spatiotemporal model;prediction algorithm