• ISSN 0258-2724
  • CN 51-1277/U
  • EI Compendex
  • Scopus 收录
  • 全国中文核心期刊
  • 中国科技论文统计源期刊
  • 中国科学引文数据库来源期刊

手机信令定位频率对交通方式识别的影响

王彦琛 杨飞 李荣玲 周涛

王彦琛, 杨飞, 李荣玲, 周涛. 手机信令定位频率对交通方式识别的影响[J]. 西南交通大学学报. doi: 10.3969/j.issn.0258-2724.20220136
引用本文: 王彦琛, 杨飞, 李荣玲, 周涛. 手机信令定位频率对交通方式识别的影响[J]. 西南交通大学学报. doi: 10.3969/j.issn.0258-2724.20220136
WANG Yanchen, YANG Fei, LI Rongling, ZHOU Tao. Influence of Location Frequency on Travel Mode Extraction Using Cellular Phone Data[J]. Journal of Southwest Jiaotong University. doi: 10.3969/j.issn.0258-2724.20220136
Citation: WANG Yanchen, YANG Fei, LI Rongling, ZHOU Tao. Influence of Location Frequency on Travel Mode Extraction Using Cellular Phone Data[J]. Journal of Southwest Jiaotong University. doi: 10.3969/j.issn.0258-2724.20220136

手机信令定位频率对交通方式识别的影响

doi: 10.3969/j.issn.0258-2724.20220136
基金项目: 国家自然科学基金项目(52072313)
详细信息
    作者简介:

    王彦琛(1988—),男,博士研究生,研究方向为交通大数据,E-mail:wangyanchen1988@126.com

    通讯作者:

    周涛(1968—),男,教授级高级工程师,研究方向为交通规划与交通大数据,E-mail:taozhou_traffic@163.com

  • 中图分类号: V221.3

Influence of Location Frequency on Travel Mode Extraction Using Cellular Phone Data

  • 摘要:

    作为影响手机信令数据定位质量的关键因素,定位频率对交通方式的识别精度具有重要影响. 为量化定位频率与交通方式识别精度之间的变化规律,首先,提出一种基于随机森林的交通方式识别模型;其次,在通信运营商的协助下,通过开展实地数据采集实验,完成手机信令数据及对应真实出行信息的同步采集,并利用该数据集对本文提出的交通方式识别模型进行验证;最后,通过数据抽样形成一系列拥有不同定位频率的手机信令数据集,利用该系列数据集对不同定位频率下的交通方式识别精度进行评估研究. 研究结果表明:本文模型对步行、非机动车、汽车和公共交通4种交通方式的总体识别准确率为79.2%;每种交通方式对定位频率的敏感性不同,其中非机动车与公交的敏感性更高,步行和汽车的敏感性相对较低;随着平均定位频率从48 s/条下降至241 s/条,非机动车和公交的整体识别精度下降幅度分别约为19.2%和21.5%,而步行与汽车的整体识别精度则分别下降12.8%与11.5%;综合考虑识别准确率与计算效率两方面的需求,建议将60 s/条作为用户筛选与数据抽样的最佳阈值.

     

  • 图 1  相邻数据时间间隔分布

    Figure 1.  Distribution of time intervals between adjacent data

    图 2  定位距离误差分布

    Figure 2.  Distribution of location distance error

    图 3  手机信令数据轨迹预处理效果

    Figure 3.  Pre-processing effect of cellular phone data

    图 4  累积距离与直线距离

    Figure 4.  Cumulative distance and linear distance

    图 5  随机森林的工作原理

    Figure 5.  Principle of random forest

    图 6  模型准确率随决策树数量的变化趋势

    Figure 6.  Model accuracy varying with number of decision trees

    图 7  基于不同机器学习算法的模型识别效果

    Figure 7.  Performances of different machine learning models

    图 8  所有数据集的定位频率变化

    Figure 8.  Location frequency variation of all datasets

    图 9  不同定位频率下交通方式识别结果

    Figure 9.  Travel mode extraction results at different location frequencies

    表  1  手机信令数据样例

    Table  1.   Sample of cellular phone data

    用户全球标识码 设备标识码 位置区编号 基站小区编号
    460***340 2185***7347 34054 1710732
    460***340 2185***7347 34054 1710732
    460***340 2185***7347 34054 1678945
    日期 时刻 基站经度/° 基站纬度/°
    2019-9-21 9:00:34 106.6992 26.58389
    2019-9-21 9:01:41 106.7025 26.58639
    2019-9-21 9:02:10 106.7025 26.58639
    下载: 导出CSV

    表  2  本研究使用的出行数据集构成

    Table  2.   Composition of dataset of interest

    交通方式 数据量/条 出行段量/个
    步行12412114
    非机动车953477
    汽车23655207
    公共交通23458186
    合计69059584
    下载: 导出CSV

    表  3  特征参数的重要度排名

    Table  3.   Characteristic parameters ranking in terms of importance

    变量 变量意义 重要度/%
    f 基站使用频率 10.02
    Z11 11 min 时间窗直线距离 8.45
    Ttotal 出行总时间 7.92
    DOD 出行OD距离 7.30
    Z9 9 min 时间窗直线距离 7.26
    VaveOD OD间平均速度 6.96
    n 基站使用个数 6.36
    Z7 7 min 时间窗直线距离 5.23
    Z5 5 min 时间窗直线距离 5.16
    $ V_{\mathrm{ave}Z_{11}} $ 11 min 时间窗直线平均速度 4.04
    $ V_{\mathrm{ave}Z_9} $ 9 min 时间窗直线平均速度 3.54
    $ V_{\mathrm{ave}Z_7} $ 7 min 时间窗直线平均速度 3.51
    $ V_{\mathrm{ave}Z_5} $ 5 min 时间窗直线平均速度 2.98
    L11 11 min 时间窗累积距离 2.97
    L9 9 min 时间窗累积距离 2.54
    $ V_{\mathrm{ave}L_{11}} $ 11 min 时间窗累积平均速度 2.44
    $ V_{\mathrm{ave}L_9} $ 9 min 时间窗累积平均速度 2.40
    L7 7 min 时间窗累积距离 2.28
    $ V_{\mathrm{ave}L_7} $ 7 min 时间窗累积平均速度 2.08
    L5 5 min 时间窗累积距离 1.71
    $ V_{\mathrm{ave}L_5} $ 5 min 时间窗累积平均速度 1.50
    Tb 相邻数据的时间差 1.26
    Db 相邻数据的基站切换距离 1.10
    Vb 相邻数据的基站切换速度 1.02
    下载: 导出CSV

    表  4  机器学习算法主要参数

    Table  4.   Major parameters in machine learning algorithm

    算法 参数设置 参数值
    支持向量机核函数径向基函数
    核参数 σ0.25
    惩罚系数1
    BP神经网络神经元层数2
    神经元个数(100,50)
    隐藏层激活函数Relu
    权重优化算法Sgd
    初始学习率Adaptive
    下载: 导出CSV

    表  5  测试集识别结果

    Table  5.   Extraction results of test dataset

    交通方式 出行段数量/个 识别结果/个
    步行 非机动 公交车 汽车
    步行 37 33 1 2 1
    非机动车 24 2 19 3 0
    公共交通 65 0 8 46 10
    汽车 58 0 2 9 47
    合计 184 35 30 60 58
    下载: 导出CSV

    表  6  评价指标统计结果

    Table  6.   Statistical results of evaluation indicators

    交通方式 出行段数量/个 P/% R/% Fscore/%
    步行 37 94.3 89.2 91.7
    非机动车 24 63.3 79.2 70.4
    公共交通 65 76.7 71.9 74.2
    汽车 58 81.0 81.0 81.0
    合计 184 79.2 79.2 79.2
    下载: 导出CSV
  • [1] 杨飞,姚振兴. 基于手机定位数据的个体出行行为特征分析与技术研究:方法与实证[M]. 上海:同济大学出版社,2017:2-4.
    [2] 张博. 基于手机网络定位的OD调查的出行方式划分研究[D]. 北京: 北京交通大学,2010.
    [3] QU Y C, GONG H, WANG P. Transportation mode split with mobile phone data[C]//2015 IEEE 18th International Conference on Intelligent Transportation Systems. Gran Canaria: IEEE, 2015: 285-289.
    [4] LARIJANI A N, OLTEANU-RAIMOND A M, PERRET J, et al. Investigating the mobile phone data to estimate the origin destination flow and analysis; case study: Paris region[J]. Transportation Research Procedia, 2015, 6: 64-78. doi: 10.1016/j.trpro.2015.03.006
    [5] ASGARI F. Inferring user multimodal trajectories from cellular network metadata in metropolitan areas[D]. Paris: University of Pierre & Marie Curie, 2016.
    [6] POONAWALA H, KOLAR V, BLANDIN S, et al. Singapore in motion: insights on public transport service level through farecard and mobile data analytics[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco: ACM, 2016: 589-598.
    [7] DANAFAR S, PIORKOWSKI M, KRYSCZCUK K. Bayesian framework for mobility pattern discovery using mobile network events[C]//2017 25th European Signal Processing Conference (EUSIPCO). Kos: IEEE, 2017: 1070-1074.
    [8] 钟舒琦,邓如丰,邓红平,等. 基于兴趣点与导航数据的手机信令数据出行方式识别[J]. 中山大学学报(自然科学版),2020,59(3): 87-96.

    ZHONG Shuqi, DENG Rufeng, DENG Hongping, et al. Recognition of traffic mode of mobile phone data based on the combination of point of interest data and navigation data[J]. Acta Scientiarum Naturalium Universitatis Sunyatseni, 2020, 59(3): 87-96.
    [9] HUANG H S, CHENG Y, WEIBEL R. Transport mode detection based on mobile phone network data: a systematic review[J]. Transportation Research Part C: Emerging Technologies, 2019, 101: 297-312. doi: 10.1016/j.trc.2019.02.008
    [10] BURKHARD O, BECKER H, WEIBEL R, et al. On the requirements on spatial accuracy and sampling rate for transport mode detection in view of a shift to passive signalling data[J]. Transportation Research Part C: Emerging Technologies, 2020, 114: 99-117. doi: 10.1016/j.trc.2020.01.021
    [11] YANG F, WANG Y C, JIN P J, et al. Random forest model for trip end identification using cellular phone and points of interest data[J]. Transportation Research Record: Journal of the Transportation Research Board, 2021, 2675(7): 454-466. doi: 10.1177/03611981211031537
    [12] 宋璐. 基于手机定位数据的交通OD分布研究[D]. 南京: 东南大学,2015.
    [13] 钟罡. 基于手机大数据的城市综合客运枢纽乘客出行行为分析方法研究[D]. 南京: 东南大学,2019.
    [14] 陈晓光. 基于手机信令数据的出行端点识别误差与交通小区划分尺度研究[D]. 成都: 西南交通大学,2020.
    [15] Breiman L. Random forest[J]. Machine Learning, 2001, 45(1): 5-32. doi: 10.1023/A:1010933404324
    [16] CHENG L, CHEN X W, DE VOS J, et al. Applying a random forest method approach to model travel mode choice behavior[J]. Travel Behaviour and Society, 2019, 14: 1-10. doi: 10.1016/j.tbs.2018.09.002
  • 加载中
图(9) / 表(6)
计量
  • 文章访问数:  101
  • HTML全文浏览量:  45
  • PDF下载量:  28
  • 被引次数: 0
出版历程
  • 收稿日期:  2022-02-23
  • 修回日期:  2022-06-05
  • 网络出版日期:  2024-07-20

目录

    /

    返回文章
    返回