• 工作总结
  • 工作计划
  • 读后感
  • 发言稿
  • 心得体会
  • 思想汇报
  • 述职报告
  • 作文大全
  • 教学设计
  • 不忘初心
  • 打黑除恶
  • 党课下载
  • 主题教育
  • 谈话记录
  • 申请书
  • 对照材料
  • 自查报告
  • 整改报告
  • 脱贫攻坚
  • 党建材料
  • 观后感
  • 评语
  • 口号
  • 规章制度
  • 事迹材料
  • 策划方案
  • 工作汇报
  • 讲话稿
  • 公文范文
  • 致辞稿
  • 调查报告
  • 学习强国
  • 疫情防控
  • 振兴乡镇
  • 工作要点
  • 治国理政
  • 十九届五中全会
  • 教育整顿
  • 党史学习
  • 建党100周
  • 当前位置: 蜗牛文摘网 > 实用文档 > 公文范文 > 城市轨道交通车站短时客流机器学习预测方法

    城市轨道交通车站短时客流机器学习预测方法

    时间:2023-02-20 11:55:06 来源:千叶帆 本文已影响

    胡明伟,施小龙,吴雯琳,何国庆

    1)深圳大学土木与交通工程学院,广东深圳 518060;
    2)深圳大学滨海城市韧性基础设施教育部重点实验室,广东深圳 518060;
    3)深圳大学未来地下城市研究院,广东深圳 518060;
    4)深圳大学深圳市地铁地下车站绿色高效智能建造重点实验室,广东深圳518060

    根据中华人民共和国交通运输部官方统计数据显示,截至2022-06-30,中国开通运营地铁的城市总计51个,开通运营城市轨道交通线路277 条,运营里程9 067 km,实际开行列车279万列次,完成客运量17.8 亿人次,进站量10.8 亿人次[1].随着国内各大城市轨道交通建设的日趋成熟,地铁线路由简单的单条线路逐步扩大成网络状,车站客流量随之急剧增加,使整个地铁系统的客流组织管理错综复杂,给地铁运营部门带来极大挑战.通过分析地铁系统收集的海量历史客流数据对车站短时客流进行预测,可以提前掌握乘客的出行规律.短时客流预测结果不仅可以帮助乘客躲避交通拥堵,还能为管理部门制定决策、运营管理及合理配置资源提供数据支撑,从而提高整个轨道系统的运行效率,实现轨道交通智慧化运营.

    短期客流预测方法包括基于统计学理论的客流预测方法、基于机器学习的客流预测方法和基于多模型融合的客流预测方法.近年来基于数据驱动的机器学习模型,如支持向量机、贝叶斯以及神经网络等,在智能交通领域特别是短期交通客流预测方面已取得较好效果.SUN等[2]提出一种基于贝叶斯算法的交通流预测模型,此模型可用于完整或有缺失的交通流数据集.CHANG等[3]提出一种基于k近邻算法的交通流预测模型,并在实际数据集上进行多次实验,结果表明,该模型适应于波动性大、不稳定的交通流.JEONG等[4]提出一种基于支持向量机的交通流预测模型,与其他模型不同,此模型可以在线学习模型权重参数,根据实际数据进行参数更新,达到提升预测效果的目的.傅贵等[5]基于支持向量机建立短时交通流预测模型,引入核函数对交通流数据进行预处理,通过中国广州市交通流检测系统的实际数据,验证模型的可行性和有效性.付宇等[6]基于地铁车站客流,结合日期、时段、天气及活动时间等外部客流特征,构建基于极限梯度提升(extreme gradient boosting,XGBoost)算法的大型活动期间地铁客流预测模型.

    不同预测模型各具优缺点,对场景的适应性也不同.基于多模型融合的客流预测模型可以综合各个模型的优点,建立预测性能佳、适应性好的预测模型.LI 等[7]对交通流数据进行特征分析,并以客流特征作为输入,分别构建支持向量机预测模型和差分自回归移动平均(autoregressive integrated moving average,ARIMA)预测模型,并将模型进行融合.SHI 等[8]提出基于XGBoost 和贝叶斯算法融合的列车到站延迟预测模型,基于可能影响下一站列车到达的11个特征建立XGBoost预测模型,利用贝叶斯优化算法对XGBoost 的超参数进行调优,并通过实际案例表明该模型具有良好的预测效果.谭满春等[9]构建ARIMA 模型和神经网络的组合模型,通过ARIMA 模型捕获变量之间的线性关系,同时利用神经网络捕获变量之间的非线性关系.

    传统预测模型难以实现准确的短时客流预测,多数研究都是在预测模型算法上进行改进,没有从乘客出行特征角度展开深入研究,也没有综合考虑时间、空间及外部影响因素对乘客的影响.本研究针对地铁短时客流预测问题,研究乘客出行规律,基于机器学习算法,结合轨道交通客流特征,建立轻量的梯度提升机(light gradient boosting machine,LightGBM)、长短期记忆(long short-term memory,LSTM)及LightGBM-LSTM 融合模型,与ARIMA 和XGBoost 模型进行比较,并通过杭州地铁的历史自动售票系统(automatic fare collection,AFC)刷卡数据进行验证,结果表明,基于LightGBM-LSTM融合模型预测性能更佳,对于不同类型车站的适应性更好.

    利用Python 编程语言在Sklearn 机器学习平台上搭建基于LightGBM 的短时客流预测模型,模型构建流程如图1.首先将预处理好的地铁进出站客流数据按照预先设定的比例拆分为训练集和测试集;
    LightGBM 模型核心参数及控制参数初始化后,将训练数据作为输入数据对LightGBM 模型进行训练,同时在划分好的测试集上进行检验,计算得到初始预测结果和预测误差;
    在预测误差基础上,对模型参数进行调节,从而得到精度更高的预测模型;
    若模型测试结果达到预期要求则停止训练,输出预测模型;
    最后,利用训练好的预测模型对未来时段的客流进行预测.利用Python编程,在Tensorflow 平台上建立基于LSTM 算法的短时客流预测模型,主要构建步骤与LightGBM模型大体相同.

    由于LightGBM 模型依靠人工挖掘的特征训练得到合适的模型,LSTM 模型擅长处理高维时空数据特征,挖掘潜在时空特征,因此,利用决策树将两个单一的模型进行融合,以构建预测精度更高的LightGBM-LSTM 融合模型,其融合框架如图2.可见,LightGBM与LSTM的融合框架包括:①数据预测处理及特征工程.因为地铁进出站客流受时间、空间及天气因素影响,需将复杂的影响因素进行特征工程工作,在原始数据中挑选合适的数据特征,便于预测模型训练.②基于LightGBM 和LSTM 模型的构建.利用模型融合中的学习法进行模型集成,选用决策树作为次级学习器,构建LightGBMLSTM 融合预测模型.通过Stacking 学习法将训练得到的多个初级学习器进行预测,将预测生成的新数据用于训练次级学习器,其具体过程可扫描文末右下角二维码查看图S1.

    图2 LightGBM与LSTM模型融合框架Fig.2 LightGBM and LSTM model fusion framework.

    2.1 数据预处理

    本研究数据集选用杭州市地铁2019-01-02 至2019-01-25的地铁AFC刷卡数据.由于AFC系统及一些人为因素,收集的原始AFC刷卡数据存在异常值或空值.其中,异常值主要包括:①进出站信息不完整,仅包含进站或出站记录之一;
    ②进出站的地铁站为同一站点;
    ③进出站时间逻辑混乱;
    ④乘客的旅行时间过长或过短.因此,根据预定义的算法先对原始数据进行清洗,将脏数据处理成满足质量要求的合理数据.当判定某些数据为噪声数据时,对其进行剔除.

    地铁车站客流量定义为在统计周期内到达地铁车站的乘客数量.其中,短时客流的统计周期T可根据实际需求进行调整,通常为5、10 或15 min.地铁AFC数据记录了乘客的进出站刷卡信息,若要在近7 000 万条交易记录中,获取不同时间粒度的地铁进出站客流量,需要对进出客流做进一步提取,为此,本研究所设计的算法流程如图4.

    图3 地铁车站客流提取算法流程Fig.3 Algorithm flow of subway station passenger flow extraction.

    2.2 客流特征分析

    地铁进出站客流是变化的动态流,其影响因素包括营运时间、前序客流、地铁车站及其他外部数据[10].地铁站点进出站客流在不同时间呈现不同的规律.利用地铁车站进出客流提取算法得到每个车站的日进站客流、出站客流及总客流,其中,时间粒度选用1 个完整运营日,2019-01-02 至2019-01-25杭州市地铁全路网客流量分布可扫描文末右下角二维码查看图S2.可见,杭州地铁全路网的日总客流量呈现以7 d为周期的变化过程.

    利用k-means 算法对杭州地铁日进出站客流进行聚类分析,以总客流量作为聚类特征.k-means聚类算法将运营日期划分为3 大类客流特征日,如表1.

    表1 k-means算法的运营日划分结果Table 1 Operation day division results by k-means algorithm

    当前时刻进出站客流量不仅与历史进出站客流有关,也受到前序时段客流量的影响.为充分挖掘客流分布的时间特征,将前5个预测时段的客流也作为时间特征进行相关性分析.计算得到前5个时段的皮尔逊相关系数分别为0.95、0.87、0.66、0.41及0.23.

    不同地铁站点的进出站客流存在较大差异,因此,将特征相似的地铁站点划分为一类展开研究.本研究采用k-means 聚类方法对杭州地铁进行站点类型划分,选取客流的形态特征、基本统计特征及时间分布特征作为聚类特征.其中,形态特征选用极大值点,基本统计特征选用偏度和峰度;
    时间分布特征选用客流时段分布均衡系数和高峰小时系数,具体数据可扫描文末右下角二维码查看表S1.

    杭州地铁中的80个车站聚类后被划分为5大类型,分别为工作型、居住型、居住工作混合型、购物型及交通枢纽型车站.外部环境因素也会对乘客的出行选择产生一定影响,本研究选取天气和空气质量作为外部环境影响因素,采集杭州市2019-01-02至2019-01-25的天气和空气质量数据,结果可扫描文末右下角二维码查看补充材料表S2 和表S3.将不同特征变量输入预测模型中,得到不同因素对乘客出行的影响.

    根据已构建的数据预处理算法,按照预测模型训练学习的需要,本研究采用留出法将数据集划分为训练集、测试集和预测集.其中,2019-01-02至2019-01-20 的样本数据用于训练;
    2019-01-21 至2019-01-24 的样本数据用于测试;
    2019-01-25 的样本数据用于验证模型的实际预测效果.

    应用LightGBM、LSTM 及LightGBM-LSTM 融合模型进行客流预测,并增加ARIMA和XGBOOST模型作为对照组.最后,根据聚类得到的站点类型,选取5 个代表车站进行模型预测结果分析.其中,居住类站点选取滨康路站作为代表案例;
    工作类站点选取盈丰路站;
    居住工作混合类站点选取九堡站;
    购物观光类车站选取龙翔桥站;
    交通枢纽类车站选取杭州东站.采用2019-01-25的以10 min为时间粒度的进、出站客流量进行模型验证.

    3.1 评价指标

    3.1.1 平均绝对误差

    平均绝对误差(mean absolute error,MAE)可直观反映平均误差值大小,计算为

    其中,yi为真实值;
    为预测值;
    n为样本个数MAE值越小,表明模型性能越好.

    3.1.2 均方根误差

    均方根误差(root mean square error,RMSE)对于一些异常值比较敏感,可以直观表示预测值与真实值的平均偏离程度.RMSE 值越小,表明预测值与真实值越接近,预测模型的性能越好.RMSE 可计算为

    3.1.3 平均绝对百分误差

    平均绝对百分误差(mean absolute percentage error,MAPE)是相对误差的变形,不仅可反映真实值和预测值间的误差,还能反映误差占真实值的百分比.MAPE 值越小,表明预测值越接近真实值,预测模型精度越高、性能越好.MAPE可计算为

    3.2 居住类型车站客流预测结果分析

    居住类车站(滨康路站)的进出站客流预测评价结果见表2.滨康路站位于居民区,周围土地的功能较单一,大多为居民小区类型用地.滨康路站进出客流趋势具有明显的潮汐特性,表现为单峰特征,客流在早高峰上班时间涌入.由表2可见,基于机器学习的模型表现整体好于传统时间序列模型.由于机器学习模型考虑了时间、空间及天气等多种特征,模型输入参数更复杂,因此,模型的时间成本更高.在单一机器学习模型中,LSTM 模型表现最好.基于LightGBM-LSTM的融合模型在进站客流预测中,以MAE=7.041、RMSE=9.398 及MAPE=15.75%的指标综合表现最好;
    在出站客流预测中则以MAE=9.845、RMSE=13.029 及MAPE=17.99%的指标综合表现最好.

    表2 居住类车站(滨康路站)的进出站客流预测结果评价Table 2 Evaluation of passenger flow forecast results of residential station (Binkang Road Station)

    3.3 工作类型车站客流预测结果分析

    工作类车站(盈丰路站)进出站客流预测评价结果见表3.作为工作类型车站,盈丰路地铁站周围土地的功能多为居住类型.盈丰路地铁站进出客流趋势具有明显的潮汐特性,与居住类车站类似都呈现单峰特征,但不同的是工作类车站的早高峰主要为出站客流,晚高峰主要为进站客流.

    表3 工作类车站(盈丰路站)进出站客流预测结果评价Table 3 Evaluation of passenger flow prediction results of work station (Yingfeng Road Station)

    由表3 可见,相较于LightGBM 和LSTM 模型,基于XGBoost 算法的模型较难适应工作类车站的客流特征,预测结果不理想.基于LightGBM-LSTM的融合模型在进站客流预测中,以MAE=13.927、RMSE=20.141及MAPE=15.53%在所有模型中的综合表现最好;
    在出站客流预测中则以MAE=12.417、RMSE=18.935及MAPE=13.37%综合表现最好.

    3.4 居住-工作混合类型车站客流预测分析结果

    居住工作混合类车站(九堡站)进出站客流预测评价结果见表4.作为混合类车站,九堡站位于综合功能用地区域内,周围的土地功能更丰富,既有居住类用地也有工作类用地.九堡站的潮汐特性为双峰特征,既有早高峰也有晚高峰.

    由表4可见,基于LightGBM-LSTM 的融合模型在进站客流预测中,以MAE=12.014、RMSE=14.469 及MAPE=13.02%的指标在所有模型中综合表现最好;
    在出站客流预测中则以MAE=12.987、RMSE=16.588及MAPE=13.44%综合表现最好.

    表4 居住工作混合类车站(九堡站)进出站客流预测结果评价Table 4 Evaluation of passenger flow forecast results of residential and working mixed station(Jiubao Station)

    3.5 购物类型车站客流预测结果分析

    购物类车站(龙翔桥站)进出站客流预测结果评价见表5.作为购物类车站,龙翔桥站位于公用设施密集区域,周围有旅游景点或大型商场.龙翔桥站的出站客流主要分布在上午,进站客流主要分布在下午到晚上.

    由表5 可见,在单一机器学习模型中,3 个模型的效果相差不大.基于LightGBM-LSTM的融合模型在进站客流预测中,以MAE=52.768、RMSE=71.115及MAPE=9.36%的指标在所有模型中综合表现最好;
    在出站客流预测中则以MAE=62.354、RMSE=86.111及MAPE=12.72%综合表现最好.

    表5 购物类车站(龙翔桥站)进出站客流预测结果评价Table 5 Evaluation of passenger flow forecast results of shopping station(Longxiangqiao Station)

    3.6 交通枢纽类型车站客流预测结果分析

    交通枢纽类车站(杭州东站)进站客流预测结果评价见表6.作为交通枢纽车站,杭州东站位于火车站和高铁站区域.杭州东站的客流时间分布无明显规律性,全天的进出站客流无明显波峰或波谷,但是进出站客流量都很大.

    表6 交通枢纽类车站(杭州东站)进站客流预测结果评价Table 6 Evaluation of inbound passenger flow forecast results of transportation hub station(Hangzhou East Railway Station)

    由表6 可见,基于LightGBM 和LSTM 模型的预测效果比基于XGboost 模型好.LightGBM-LSTM 融合模型在进站客流预测中,以MAE=118.406、RMSE=150.96及MAPE=12.85%的指标在所有模型中综合表现最好;
    在出站客流预测中则以MAE=82.256、RMSE=102.623及MAPE=8.37%综合表现最好.

    本研究提出一种地铁客流数据预处理算法,可有效识别和修复地铁客流异常数据,并根据需求对不同时间粒度的车站进出客流进行提取,为客流特征分析以及模型构建奠定了数据基础.考虑天气和空气质量影响因素,建立基于LightGBM 算法和基于LSTM 网络的短时客流预测模型,并利用决策树将两个模型进行融合,提出LightGBM-LSTM的融合客流预测模型.构建ARIMA和XGBoost作为实验对照模型,验证本预测模型的准确性.对杭州地铁的进、出站客流短时预测案例进行验证,选取居住类车站、工作类车站、居住工作混合类车站、购物类车站及交通枢纽类车站为代表,分别进行基于MAE、RMSE 及MAPE 指标的模型预测结果准确性评价,结果表明,基于多特征的机器学习模型能够较好预测地铁车站的短时客流,为地铁车站客流预测提供新思路,但是单一模型对于不同类型车站的预测效果波动较大;
    基于多模型融合的LightGBMLSTM 模型可以综合单一模型的优点,预测性能更佳,对于不同类型车站的适应性也更好.本研究尚未将融合后的模型与其他融合模型进行精度比较,这将是下一步工作的重点.

    猜你喜欢 客流车站预测 无可预测黄河之声(2022年10期)2022-09-27选修2-2期中考试预测卷(A卷)中学生数理化(高中版.高二数学)(2022年4期)2022-05-25选修2-2期中考试预测卷(B卷)中学生数理化(高中版.高二数学)(2022年4期)2022-05-25选修2—2期中考试预测卷(A卷)中学生数理化·高二版(2022年4期)2022-05-09车站一角智慧少年·故事叮当(2021年4期)2021-05-06城市轨道交通节假日期间大客流行车组织思考与实践科学家(2021年24期)2021-04-25基于系统动力学的城市轨道交通车站客流控制仿真与优化大连交通大学学报(2020年5期)2020-10-17地铁换乘客流预警及应对世界家苑(2017年7期)2017-08-27在北京,一个车站的治理有多难领导决策信息(2017年17期)2017-06-21地铁线网客流优化配置研究与应用科学家(2016年6期)2016-08-23
    相关热词搜索:客流车站机器

    • 名人名言
    • 伤感文章
    • 短文摘抄
    • 散文
    • 亲情
    • 感悟
    • 心灵鸡汤