交通数据采集

2024-10-08

交通数据采集（共12篇）

交通数据采集篇1

随着我国城市化的进程越来越快,城市交通作为衔接工农业发展、城市建设、经济繁荣的重要支柱环节,发挥着越来越重要的作用。但同时看到,城市交通也带来一些负面影响,如交通拥堵、交通噪音、空气污染、打车难、行车难等问题,不仅成为市民工作和生活中所面临的一大难题,而且也制约着经济的发展。

“智慧城市”的提出,让人们看到了一个切实可行的办法来解决城市化进程中遇到的各种问题。“城市智能交通平台”是用更加智慧的手段来规划城市交通状况,为缓解交通拥堵问题,交通事件处理,交通诱导等提出了有效合理的手段。

1国内外研究现状

本文主要选取了美国的2个州、英国、日本及国内4个城市为代表,列举了它们交通大数据的研究成果,并具体标识了不同领域的应用情况。通过比较分析,可以看出美国的加利福尼亚州这方面发展很突出,已经开发5个基于交通大数据的应用系统,覆盖了日常生活的各个方面,大大提高了政府相关部门的管理效率,也方便了民众的出行。日本在智能交通领域的发展也比较成熟,主要以P-DRGS为代表。不过,在环境监测方面,该系统并没有涉及。英国目前主要采用Transport for London等4个智能交通系统,根据浮动车系统的历史数据和实时数据,在出行者最需要的时间和地点发布交通信息,通过历史数据估算出其他时段或地点的交通状况,从而大大降低了系统的费用。

我国近几年在智能交通领域方面也投入了大量的财力和人力,并取得了一定成绩。以北京、香港、上海、杭州、广州及深圳等几个城市为代表,在智能交通领域已经走在了我国前列,其中北京发展最为突出。2005年,北京建成国内第一个浮动车信息采集系统,该中心自主研发了交通信息发布实验系统。2008年至今,每日为市民提供路网运行速度监测数据。目前,该系统接收超过3万辆出租车上传的实时数据,能够快速准确地进行GPS采样点的地图匹配并处理出路段速度信息。

2城市智能交通平台功能模块

本文基于城市的交通信息数据,通过对海量的交通信息数据进行挖掘,得到车辆的行驶速度、地理位置及车辆行驶轨迹等主要数据,进而分析出不同路段的拥堵指数,识别交通事件的原因并进行针对处理。同时,利用车辆通行记录统计和速度,也可以计算出指定地区的空气质量,为政府制定政策和居民出行提供参考。本智能平台的框架如图1所示,具体分为交通管理模块、出行辅助模块、政府决策建议模块三部分。

2.1交通局交通管理者功能模块

2.1.1基于交通大数据的路况信息实时监控和预测

本文将采集的交通流数据进行交通拥堵状态的划分,并以不同的颜色表示不同的路况状态显示在电子地图上,基于行驶方向上的交通拥堵显示和预测。

2.1.2基于交通大数据的异常事件检测

通过实时采集交通流数据,分析交通流状态参数变化特征或车辆行驶特征,从而判定道路上是否有交通事件发生的过程。主要基于支持向量机等检测算法,将数据进行样本训练和测试,检测出交通事件的类别。

2.1.3基于GPS-出租车和GPS-公交车数据的智能调度

针对当前出租车空载率较高,对出租车进行智能调度,通过分析出租车拉乘客的上下车记录以及相应的地理社会功能性,给司机提供推荐服务,建议一些“趴活”地点,在最短的时间内拉到乘客,并且使收入最大化。

2.1.4电子政务管理

电子政务即政府机构应用现代信息和通信技术,将管理和服务通过网络技术进行集成,在互联网上实现政府组织结构和工作流程的优化重组,超越时间和空间及部门之间的分隔限制,向社会提供优质和全方位的、规范而透明的、符合国际水准的管理和服务。

2.2出行者功能模块

2.2.1基于时间和空间维度的公共交通换乘引导

利用公交车的实时GPS数据,可以得到公交车到达时间和公交车实时位置,根据乘客的出行始发和最终站点名称,进行公交线路查询。结合其它出行方式如轻轨和车租车等,规划出多条合理的换乘路线供选择。

2.2.2基于多因素博弈的交通诱导

我们根据多因素进行考虑,采用一种增量动态重规划方法求解诱导问题的最优路径集合,先采用逆向多目标启发式搜索进行全局规划,然后以增量的方式对全局规划所保留的部分信息有效地重用,可快速调整变化位置与目标位置之间新的移动路径。

2.2.3停车场实时诱导

当在电子地图上输入目的地时,可以进行停车场的车位信息查询、停车场的车位预定以及基于目的地的停车场位置推荐。

2.2.4基于云平台的信息发布

对于信息发布模块,借助云计算,进行数据迁移计算以及信息推送等优势进行信息发布,可以减少用户的能耗以及计算时间,更好的满足实时性能。

2.3政府(交警、环保局)部门功能模块

2.3.1基于交通大数据的智能交通管理策略

本模块优化信号灯控制策略、分析公交已有和增设站点的合理性、公交线路规划、公交专用车道及发车频率的合理性、交通路口路标和掉头位置及距离设置合理性、车辆优先控制策略、基于交通数据的融雪剂融雪效果评估

2.3.2基于交通大数据和空气质量监测点数据的城市(交通)环境查询

根据城市空气质量监测点数据以及浮动车数据进行城市交通环境查询包含以下空气质量、气象信息(温度、风力等)、PM2.5雾霾天气监测、最小能见度范围、降雨和降雪对交通的影响评估。

3结论

本平台针对城市的交通大数据,设计并开发一个集交通管理、出行引导、营运管理及政府决策为一体的智能交通管理平台,真正解决城市交通拥堵问题,提升智能城市的发展内涵。通过系统管理平台的使用,不仅提高了城市交通管理的科学性、规范性和实效性,也对城市的建设与发展提供了强大动力,为构建社会主义和谐社会,规范经济社会运行有着深远的意义。

交通数据采集篇2

考试时长：60分钟考生：刘德志总分：100 及格线：60 考试时间：2017-12-21 16:39-2017-12-21 16:42 100分

 1.(易)根据周琦老师所讲，高德交通信息服务覆盖（）多个城市以及全国高速路网。（单选题3分）得分：3分

o o o o  A.一百一十 B.一百 C.九十 D.八十

2.(易)根据周琦老师所讲，高德实时统计用户近（）行驶里程数据与用户数，一旦发现异常则报警。（单选题3分）

得分：3分

o o o o  A.5分钟 B.10分钟 C.15分钟 D.20分钟

3.(易)根据周琦老师所讲，高德交通信息服务覆盖全国主干道路及其它（）以上。（单选题3分）得分：3分

o o A.90% B.70% o o  C.50% D.30% 4.(易)根据周琦老师所讲，高德交通日均采集数十亿定位请求，系统处理月均（）公里驾驶里程覆盖。（单选题3分）

得分：3分

o o o o  o o o o  A.50亿 B.80亿 C.100亿 D.150亿

5.(易)根据周琦老师所讲，以下哪项不属于数据挖掘的内容？（单选题3分）A.补充与完善路网属性 B.多维分析统计用户出行规律

C.建立道路拥堵概率与拥堵趋势变化模型 D.高德地图导航有躲避拥堵功能

6.(易)根据周琦老师所讲，高德交通信息服务覆盖全国高速（）以上。（单选题3分）分：3分

得

得分：3分

o o o o  o o A.90% B.70% C.60% D.50% 7.(易)根据周琦老师所讲，高德2014年被（）全资收购了。（单选题3分）A.百度 B.阿里巴巴

得分：3分 o o  C.腾讯 D.搜狐

8.(易)根据周琦老师所讲，高德早在（）就开始投入资源来做全国交通信息的采集和发布。（单选题3分）得分：3分

o o o o  A.2002年 B.2004年 C.2005年 D.2007年

9.(易)根据周琦老师所讲，高德交通报告针对全国（）个城市交通状态进行挖掘分析。（单选题3分）得分：3分

o o o o  A.21 B.25 C.30 D.38 10.(易)根据周琦老师所讲，大数据加速道路网络快速更新，高德（）完成全国10万公里15万处更新。（单选题3分）

得分：3分

o o o o  o A.2006年 B.2008年 C.2010年 D.2014年

11.(中)根据周琦老师所讲，高德地图有哪些功能？（多选题8分）A.交通路况实时播报

得分：8分 o o o  B.智能计算到达目的地所需的时间 C.避堵路线方案规划 D.为用户搜索地点

12.(中)根据周琦老师所讲，高德现在的数据来源主要是（）。（多选题8分）分

得分：8o o o o  A.公众数据 B.行业数据 C.政府数据 D.国外数据

13.(中)根据周琦老师所讲，对大数据的管理和使用包括哪些方面？（多选题8分）得分：8分

o o o o  A.大数据的存储 B.大数据的应用 C.大数据的运营 D.大数据的挖掘

14.(中)根据周琦老师所讲，大数据在交通方面可以有哪些应用？（多选题8分）8分

得分：o o o o  A.出行轨迹选择 B.旅行时间计算 C.数据挖掘 D.多样化展现

15.(中)根据周琦老师所讲，以下哪些属于数据挖掘的内容？（多选题8分）

得分：8分 o o o o  A.补充与完善路网属性 B.多维分析统计用户出行规律

C.建立道路拥堵概率与拥堵趋势变化模型 D.高德地图导航有躲避拥堵功能

16.(极易)根据周琦老师所讲，高德地图使用大数据能进行小路的识别。（判断题3分）得分：3分

o o  正确错误

17.(极易)根据周琦老师所讲，高德地图使用大数据能进行新路的识别。（判断题3分）得分：3分

o o  正确错误

18.(极易)根据周琦老师所讲，通过索引技术，在分析具体问题时，可以回调出每条道路对应时刻的通车轨迹。（判断题3分）

得分：3分

o o  正确错误

19.(极易)根据周琦老师所讲，高德实时挑选样本进行算路，对发布数据质量进行评估，异常则实时报警。（判断题3分）

得分：3分

o o  正确错误

20.(极易)根据周琦老师所讲，高德交通信息服务覆盖110多个城市以及全国高速路网。（判断题3分）得分：3分 o o  正确错误

21.(极易)根据周琦老师所讲，高德每季度基于数据挖掘，发布全国主要城市的交通分析报告。（判断题3分）得分：3分

o o  正确错误

22.(极易)根据周琦老师所讲，高德交通信息服务覆盖全国高速90%以上。（判断题3分）得分：3分

o o  正确错误

23.(极易)根据周琦老师所讲，高德交通报告针对全国38个城市交通状态进行挖掘分析。（判断题3分）得分：3分

o o  正确错误

24.(极易)根据周琦老师所讲，将大数据智能化融入高德地图，能够提供更精准的到达时间预测和实时躲避拥堵功能。（判断题3分）

得分：3分

o o  正确错误

25.(极易)根据周琦老师所讲，进入了阿里巴巴集团之后，高德对大数据的处理和基础架构的能力得到了提升。（判断题3分）

得分：3分

数据中心助力交通管理篇3

和中国的其他城市一样，塞车对新疆乌鲁木齐市民来说并不鲜见，如何解决城市交通拥堵这个顽疾是乌鲁木齐市交通支队必须面对的问题。

用技术减压

“这几年乌鲁木齐市车辆增加很快。而受城市地理位置条件的影响，城市道路的扩建非常困难，导致城市道路建设远远落后于汽车数量的增长速度，从而使得城市交通压力非常大。”乌鲁木齐市交通警察支队科研所科长艾山江介绍说。

乌鲁木齐市是一个拥有400万人的中等规模城市。城市登记车辆40万辆左右，同时每天还有大量来自吐鲁番、石河子等周边城市的车辆进入这座城市，城市交通面临很大压力。乌鲁木齐市交通警察支队科研所是乌鲁木齐市交通警察支队下属单位，专门负责交通管理相关的信息系统的开发、建设与维护。

据艾山江介绍，为了弥补基础设施的不足，乌鲁木齐市非常重视用科技手段来提高交通管理水平，先后建设了道路监控系统、区域交通信号控制系统、闯红灯抓拍系统、超速抓拍系统和卡口系统。这些系统已经成为乌鲁木齐交通管理不可或缺的一部分。比如，遍布于乌鲁木齐市130多个主要路口的摄像头，基本覆盖了整个市区，因此，站在乌鲁木齐的交通指挥中心就可以对整个城市交通一目了然；而闯红灯抓拍和超速抓拍系统则对驾驶员的规范驾驶起到很重要的监督作用。现在，通过这两个系统提取出的违章数量已经达到所有违章数量的70%；还有卡口系统可以对交通肇事车辆进行自动跟踪，协助交警抓获肇事者。特别值得一提的是新引进的区域交通信号控制系统，它能根据十字路口的交通流量智能地调节交通信号灯的时长，以尽可能地使交通顺畅。

“我们希望依靠这些信息系统把一线民警逐步从抓违章、纠正违章等工作中解脱出来，从而把大量的精力投入到疏导交通上。”艾山江说。

不过，这些愿望是建立在信息可靠的前提之上的。乌鲁木齐市交通警察支队陆续上线了各种各样的信息系统，再加上现有的系统数据量增长迅速，使得数据中心几乎是满负荷运转，数据中心的升级换代被提上日程，而乌鲁木齐市交通警察支队新办公大楼的落成正好带来契机。

可成长的数据中心

“对新的数据中心主要有三个方面的要求：产品质量、服务水平和可扩展性。”艾山江表示，交通事关全市百姓，因此其信息系统是绝对不允许出现宕机等事故的，所以在产品选型的时候，过硬的产品质量是最起码的门槛。当然，仅有产品质量还不够，服务水平也必须跟得上，他希望厂商不仅能给予技术上的支持，还能提供一些管理上的建议。第三个要求就是数据中心必须有非常好的可扩展性。

“IT技术的发展很快，要准确地预测未来有多少信息系统运行是非常困难的，而我们又不能为未知的系统预留过多的负载余量。如果真要这样做，就会造成很大的浪费。”艾山江说，“我们希望只有在真正需要扩容时再投入。”

据悉，乌鲁木齐交通警察支队老的数据中心是2004年建成的，根据当时的信息化水平，有人曾估计保证使用10年。而几年过去，这个数据中心就有些吃不消了。

经过多方面的比较，乌鲁木齐交通警察支队选择了施耐德旗下的APC提供的“英飞 (InfraStruXure) ”整体机房解决方案。在艾山江看来，过去使用APC 的UPS产品的经验让他们感觉放心，不仅包括产品质量还有服务，而让乌鲁木齐交通警察支队下定决心的还有APC提出的“边成长边投资”的理念。

所谓“边成长边投资”是指，随着IT需求的增加逐渐新增电源模块、空调系统、电力分配系统，而不是在建设初期一步到位，由此可以将投资推迟到真正需要的时候，从而避免浪费。支持APC“边成长边投资”理念的就是APC模块化的“英飞”系统。这是一个集电力分配、UPS、制冷于一体的整体机房，其模块化的设计思路使得用户可以通过新增模块来满足新的IT需求。其独特的In-Row空调系统也是该产品的一大亮点，与常规的机房空调不同，In-Row空调内嵌在机柜中间，它通过安装在各个机柜门前的温度传感装置来控制制冷风量，其冷风直接供应到各个机柜的正面，再结合“背靠背”的机柜摆放方式，从而实现高效制冷，达到节能效果。

交通数据采集篇4

1.1 振动与声波

由于声音产生于物体的振动, 没有振动就没有声音, 声音的传播主要是在某种弹性介质中的一种振荡传播过程。常规介质的基本类型有3种:①气体, 通常为空气 (空气传声) ;②液体, 通常指水;③固体。本文研究的汽车行驶噪声在空气中传播, 而其引起的地面振动信号则是固体传声。声音产生于振动, 但不是所有的振动产生的声音都能听见, 因为人耳能到的声音频率范围为20～20 000 Hz, 低于20 Hz的声波为次声波, 高于20 000 Hz的声波为超声波。振动发声的物体称为“声源”, 实际声源的形状是多种多样的, 要想从数学上严格求解不规则声源产生的声场是十分困难的, 因此, 在理论上处理时往往理想化, 当观察点与声源距离很远时, 或声源尺寸远小于波长时, 可按点声源处理问题[2]。

1.2 交通噪声

交通噪声是指运载工具运行时产生的噪声, 由行驶的汽车所产生的这种综合的声辐射称为汽车噪声。在工程研究中将汽车噪声分为车内噪声和车外噪声。汽车的噪声分为发动机噪声、电器系统噪声和底盘噪声等。对于行驶中的汽车、发动机噪声、轮胎噪声和空气动力噪声表现比较明显, 在干燥的路面上行驶的车辆由中速变到高速过程中, 车速每增加1倍, 轮胎噪声增加6～12 dB。空气动力噪声是车辆行驶时由于局部气流分离而产生的, 在车速小于100 km/h时, 空气动力噪声不是很明显;当车速超过100 km/h时其影响越来越显著, 且其随车速增加的趋势比轮胎噪声快[3]。

2 交通流数据采集原理

2.1 声强表述方法

声波引起空气质点的振动, 使大气压产生迅速的起伏, 产生的压强称为声压。平时听到的最弱的声音声压为2×10-5 Pa, 最强声音的声压为20 Pa。为计算方便, 且符合人耳听觉分辨能力的灵敏度要求, 将最弱的声音 (2×10-5 Pa) 到最强的声音 (20 Pa) 按对数方式分成等级, 作为衡量声音大小的常用单位, 有声压P的声压级LP=20lg (P/Po) , 从此, 将声压信号转化为声压级Lp描述声强。

2.2 数据采集系统

为采集与分析车辆的声学信号特征, 必须设计数据采集系统。以汽车噪声分析为基础, 设计数据采集系统。系统采用元件是商品化元件, 在满足研究需求的基础上降低实验室搭建费用, 节约系统构建时间。

2.2.1 硬件部分

系统的硬件部分包括杭州爱华有限公司的AWA14423型传声器与一台便携式笔记本电脑相连接, 两台便携式DV录像机。

2.2.2 软件部分

本系统软件包括:①AvantLite动态信号分析系统, 如图1所示。这是一套基于DSP的高精度动态信号分析系统, 主要由数据实时处理箱和运行在计算机的基于Windows的应用软件两部分组成。数据实时处理箱负责数据采集和实时分析, 包括信号采集、抽取、滤波、实时分析、信号源输出等。基于Windows的应用软件主要完成用户测试设置、操作命令、信号及数据的显示和存储等工作, 两部分通过USB电缆相接, 实现相互间的高速数据通讯。②基于声强的交通流分析系统。系统使用VISUAL STUDIO 2005编制, 程序在Framework 2.0或以上版本运行。将传声器测得的声音通过AvantLite动态信号分析系统, 进行数据记录和分析。图2为在750 Hz的频率下记录90 112个数据, 然后, 将数据导入该系统进行声音和交通状态分析。先将数据转换成声压级, 由于数据较多, 采用每50个点位为一组, 分别取其最大值。波峰选择时, 采用降噪滤波处理方法:①采用多点取降噪算法, 获取一条含有高脉冲的由始至终平稳曲线数组;②根据一定的频宽得出波峰曲线数组;③将数组进行运算, 得出最终的所需波峰曲线数组, 排除背景噪声干扰, 符合条件的波峰数即为通过的车辆数, 最后根据α=|QAi-QBi|/ QAi计算差值比为交通状态判定提供依据。

3 数据采集方案及交通状态分析

3.1检测点位置

检测点应该选择在城市快速路或高速公路中间路段上, 车辆运行为随机达到, 车流密度较小, 检测点离车行道的路沿2～5 m处, 检测器的安装位置一般距地面1.2 m处, 与车辆的质心高度基本相同, 具体设置方式见图3。若在高速公路上, 则可设置在中央分隔带并通过一定的技术对反方向的声强信息进行屏蔽。由于进出口处均有收费站或其他办公人员, 对于附近出现的交通非正常状况很容易观察, 而对于中间路段, 可根据具体需求情况, 一般每隔800～1 000 m设置一个检测器。

3.2背景噪声修正

背景噪声会对实际测量噪声级产生影响, 应从测得的总噪声中减去。在测量之前, 对背景噪声单独做检测, 并与所欲测量声源的噪声进行比较。如果两者差值大于10 dB, 背景噪声对噪声源测量的影响可以忽略。通过测量得出道路上背景噪声与欲测量声源的噪声差值大于10 dB, 背景噪声对噪声源测量的影响可以忽略。

3.3数据采集分析

1) 测量基本情况。虽然, 本系统设计主要适用高速公路中间路段, 但考虑到试验进行的具体条件和安全问题, 试验选择了一条城市快速路。①测量时间:2009-12-12T9:00～9:30, 采样总时间30 min, 取样间隔时间2 min, 天气晴朗。②测量地点:浙江师范大学东大门迎宾路。

2) 测量数据处理。同时, 采集监测点A与监测点B的数据, 两监测点相距200 m, 通过AvantLite动态信号分析系统在750 Hz的频率下记录所有声强的数据各90 112个, 将其导入基于声强的交通流分析系统, 以第一组数据为例, 将检测点B数据导入文件1, 将检测点A数据导入文件2, 如图4所示。然后点击计算差值比。

将15组数据分别进行分析, 得到以下数据, 如表1所示。其中, Ai为监测点A的数据, Bi为监测点B的数据。

3.4 交通状态分析

由于道路上交通流的复杂性, 在路网中车流运行状态随着时间的变化而时刻改变。在运行过程中, 用正常、拥挤和消散3 个状态简单描述。通常采用车流的排队队长L 、平均排队延误D、速度的变化率Δv 等指标反映车流拥挤和消散过程。这些指标在一定程度上确实反映出车流的运行状态, 但不能快速地反映出交通的瞬息变化[4,5]。

由于城市交通拥挤现象的复杂性, 必须对拥挤行为的特征变量进行深入分析, 才能提出及时、准确、可靠性高的自动检测方法。本方法主要针对城市快速路网中典型的两交叉口之间的路段, 结合交通流的时间和空间分布规律, 考虑交通拥挤条件下车流的运行特征, 以流量差值的检测指标为基础, 通过理论推导和统计分析, 构建出适当的拥挤判别指标, 从而实现对拥挤事件的自动检测, 为交通管理部门提供及时、准确的决策依据[6]。本方法以路段两相邻点数据融合, 通过计算差值比α确定该路段的交通状态, 根据实际交通情况将交通流划分为4个状态, 如表2所示。由于实际检测路段的α<0.5, 则判定该路段在检测时间段内交通流状态为正常, 未拥挤。

4 结束语

交通流特征参数的检测数据是交通管理部门制定管理规则、采取措施和对交通设施进行规划、设计的。使交通流特征参数检测成为高速公路智能交通系统的关键技术。本文通过声强数据处理分析, 构建数据采集系统, 提出交通流状态判定方法, 可供城市快速路和高速公路交通管理部门参考和借鉴。交通流特征参数声学检测技术是典型的多学科交叉研究项目, 涉及诸多学科知识, 还可有以下改进空间:应对汽车噪声信号产生机理和传播特性进行深入研究, 本文研究的噪声信号是作为点目标产生的信号, 实际上噪声应该是来自车辆不同位置, 包含车型分类的信息。

参考文献

[1]姜桂艳, 温慧敏, 杨兆升.高速公路交通事件自动检测系统与算法设计[J].交通运输工程学报, 2001, 1 (1) :77-81.

[2]马大猷.噪声与振动控制手册[M], 1版.北京:机械工业出版社, 2002, 9:18-24, 102-108, 222-226.

[3]洪宗辉.环境噪声控制工程[M].北京:高等教育出版社, 2002.

[4]庄斌, 杨晓光, 李克平.道路交通拥挤事件判别准则与检测算法[J].中国公路学报:自然科学版, 2006, 19 (3) :82-87.

[5]邓卫, 李峻利.高速公路常发性与偶发性交通拥挤的判别[J].东南大学学报:自然科学版, 1994, 24 (2) :60-65.

交通数据采集篇5

项目名称：城市交通信息采集系统项目建议书** 申报单位：xxx 联系人：xxx 电话：xxxx 传真：xxxx 编写时间：xxxx 主管部门：xxxx

撰稿单位：郑州经略智成企业管理咨询有限公司

撰稿时间：2013年5月2日

第一部分系统定义

一、杭州市城市交通信息采集系统构成

二、系统定义

第二部分城市交通信息采集系统建设设置标准

一、城市交通信息采集系统设置标准相关定义

（一）关于设置的定义

（二）关于道路的定义

二、城市交通信息采集系统设置标准

（一）交通信号控制系统

（二）交通监视系统

（三）交通违法监测系统

（四）交通信息屏发布系统

（五）交通流视频检测系统

（六）行程时间检测系统（OD系统）

（七）停车诱导系统

（八）智能卡口系

第三部分道路城市交通信息采集系统技术标准

一、SCATS信号控制系统

（一）系统构成

（二）功能要求

（三）主要设备技术指标

二、单点远程控制交通信号系统第四部分交通信息屏发布系统技术指标

一、系统构成

二、功能要求

三、主要设备技术指标第五部分交通流视频检测系统技术指标

一、系统构成二、功能要求

三、主要设备技术指导

四、中心平台

第六部分行程时间检测系统（OD系统）技术指标

一、行程时间检测系统（OD系统）的标准模式

二、行程时间检测系统（OD系统）的标准结构和功能

三、行程时间检测系统（OD系统）的技术标准

四、行程时间检测系统（OD系统）主要设备性能指标第七部分停车诱导系统技术指标

一、系统组成二、功能要求

三、主要设备技术指标

四、中心平台.48 第八部分智能卡口系统技术指标

一、智能卡口系统的标准模式

二、智能卡口系统的标准结构和功能

三、智能卡口系统的技术标准.四、智能卡口系统主要设备性能指标

第九部分城市交通信息采集系统数据接口规范

一、交通违法监测系统接口.二、交通诱导系统中心平台.三、三、行程时间检测系统（OD系统）接口.1、外来黑名单接入

2、数据格式

3、数据流程

四、智能卡口系统接口.第十部分交通违法监测系统技术指标

一、交通信号违法监测系统

（一）中心接入要求

（二）路口设备要求

二、违法超速行为监测系统.第十一部分技术方案、设备方案和工程方案

（一）主要设备方案

（二）工程方案

（三）技术方案、生产工艺流程及装备水平

（四）项目招标内容

第十二部分主要原材料供应、资源开发及综合利用分析

（一）主要原材料供应

（二）资源开发和利用方案

（三）资源节约措施

第十三部分总图、运输与公用辅助工程

（一）总图布置

（二）场内外运输

（三）公用辅助工程第十四部分环境影响分析

（一）厂址环境条件和现状

（二）项目建设和生产对环境的影响

（三）环境保护措施方案

（四）环境保护投资

（五）环境影响评价第十五部分投资估算及资金筹措

（一）投资估算表

（二）资本金筹措

（三）债务资金筹措

（四）中请专项资金的主要原因和政策依据第十六部分财务分析及评价结论

（一）不确定性分析

交通数据采集篇6

【关键词】海事;船舶交通管理系统;数据分析;安全建议;船舶流量

1 广州船舶交通管理系统(以下简称GZVTS)2010年3月份船舶交通流量及日常值班监控统计情况

本文所选的12条辖区门线将GZVTS辖区水域围成相对封闭的水域,全长约68 n mile,面积约412 ()2。

1.1 航经GZVTS报告门线的交通流量统计情况

借助管理信息系统(MIS)对航经GZVTS辖区门线的船舶动态记录数据进行统计,包括VTS系统内雷达自动跟踪数据、船舶自动识别系统(AIS)自动跟踪显示数据、VTS操作员的人工跟踪标识数据等。前两种数据由电脑自动记录,完全排除人为主观因素的影响,其准确性取决于系统雷达和AIS信号的强弱及其稳定性,准确率较高;后者由人工进行记录,其准确性取决于操作员的VTS值班经验和工作态度。统计时间为3月1―31日,周期为1 d,间隔为4 h,统计数据包括通过报告门线的船舶交通流总量、交通流进口量、交通流出口量和各时间间隔经过各报告门线的交通流峰值。 2010年3月份GZVTS报告门线的交通流量见表1。

表1 2010年3月份GZVTS报告门线交通流量艘次

1.2 GZVTS中心日常值班监控情况

GZVTS区域设置3个值班监控操作台,DP 1负责RLSE,RLTG,RLGW,RLLE,RLLW等5条报告线,面积约320 (n mile)2;DP 2负责RLLE,RLFZ,RLTP等3条报告线,面积约38 (n mile)2;DP 3负责RL75,RLD1,RLDJ,RLDG等 4条报告线,面积约60 (n mile)2。

2010年3月份,参与VTS值班的操作员共310人次,共接收船舶报告23 526艘次,跟踪船舶20 953艘次,信息提醒5 382次,应船方请求提供信息服务2 813次,重点监控船舶2 727艘次。

2 统计数据分析

2.1 船舶交通流量大

2010年3月份船舶交通总量达222 076艘次,平均每天经过报告门线的交通流量为7 166艘次。假设进出该辖区的船舶中有70%需2次经过辖区门线,则每天进入辖区的船舶约4 658艘次。

2.2 船舶报告量占交通流总量比例不高

船舶跟踪量占报告量比例为89.06%。一方面,由于VHF通话频密,信道拥堵,VTS操作员难以应对所有船舶报告并及时一一登记在册;另一方面,部分VTS操作员由于工作量较大产生消极意识而不作记录。

2.3 交通流密度分布不均衡

从统计数据来看,交通流密度在08:00―20:00时段达到高峰,为128 846艘次,20:00―08:00时段交通流密度相对较低,仅93 230艘次,二者相差35 616艘次。交通流量最大的门线是RLLE报告线(38 033艘次),交通流量最小的门线为RLD1报告线(5 172艘次),二者相差32 861艘次。

2.4 与2009年3月份统计数据的比较

2.4.1 交通流量基本持平

2009年3月份的交通总量为220 276艘次,2010年3月份的交通总量为222 076艘次,增加1 800艘次。从统计数据看,主要是航经RLLW,RLTP,RLDJ,RLGW,RLDS,RLTG等报告线的交通流量有所增加,其中航经RLLW报告线的交通流量从2009年3月份的艘次增加到2010年3月份的艘次,增加艘次;航经RLSE,RLLE,RLFZ,RLDG,RLD1,RL75等报告线的交通流量有所减小,其中航经RLD1报告线的交通流量下降最多,达艘次。究其原因,可能由于黄埔大桥对雷达信号的影响使航经RLD1报告线的船舶视频回波不稳定,导致VTS系统不能及时捕捉船舶信号。

2.4.2 船舶报告量、跟踪数明显减少,信息服务次数有所下降

2009年3月份船舶报告量为艘次,跟踪船舶艘次,重点监控船舶艘次,信息提醒次,信息服务次;2010年3月份船舶报告量减少艘次,船舶跟踪数减少艘次,信息提醒减少次,信息服务减少次,重点监控船舶基本持平。

一方面,利用MIS记录船舶动态信息的过程比较繁琐,部分VTS操作员对统计数据资料不够重视,只记录其认为比较重要的部分信息;另一方面,由于VTS操作员值班工作量较大,因此偏重于重点船舶的监管和船舶监控提醒等与水域安全直接相关的工作,并不记录全部事项,因此造成数据量明显下降。

3 安全管理改进建议

3.1 完善VTS系统

尽快优化雷达、AIS等基站管网的布局,大力引进或开发先进软件,提高VTS系统性能,保证VTS数据的准确性。

3.2 加强对小型船舶动态的现场监管

由于VTS设备性能的局限性,VTS系统对于大型船舶的管理基本到位,但对小型船舶的监管效率不高。从近期辖区事故险情统计数据看,小型船舶比较容易发生险情,加强对这类船舶动态的现场监管很有必要。

3.3 扩大配制AIS设备的船舶范围

从日常值班情况看,多艘船舶同一时刻经过报告门线的情况时有出现,此时VTS值班员很难做到对未配制AIS设备的船舶进行准确的跟踪识别。由于目前设备性能存在一定的局限性,对中小型船舶的跟踪识别容易丢失,也就不能给中小型船舶提供及时的信息服务,VTS功能的发挥因此受到严重影响。

3.4 改进系统记录的方式、方法

目前,GZVTS采用的MIS系统程序较为繁琐,一些名词术语不易理解归类。建议自主开发或引进新的记录模式,增强系统自动记录功能,减少人工记录工作量,提高统计数据的全面性、准确性。

3.5 增设VTS监控操作台,增加VTS操作员,优化人均监控区域

GZVTS现有VTS操作员20人,个人监控区域最大达320 (n mile)2,最小约40 (n mile)2;个人监控船舶交通流量最大达艘次/d,最小不低于200艘次/d。过大的监管区域不易于VTS监控操作台监控画面的设置及监管区域整体性的保持,频繁切换监控画面不但耗费不必要的时间而且影响VTS操作员的监控连续性。安全责任是VTS操作员最大的压力源之一,而过大的工作量容易引起操作员水平发挥失常,使其监管服务的及时性、有效性得不到保证。近期险情主要发生在主航道以外的水域,而目前值班人员的配置只能满足对重点水域的重点监管,主航道以外水域往往成为监管的非重点水域,且在航道外航行的船舶绝大多数是没有跟踪标识的小型船舶,容易被疏忽。因此,应增设VTS监控操作台及操作员,优化人均监控区域。

4 结语

交通数据采集篇7

交通运输业是我国国民经济的重要支柱,建国几十年来,我国积累的丰富的交通运输科学数据分散在不同行业、部门、单位甚至个人手中,难以共享,这在相当大程度上制约了科研与生产水平的提高。随着Internet迅猛发展和信息一体化的深入,交通科学数据共享的需求愈来愈强烈,而网络信息无序、多元、异构等特点,给资源的共享和利用带来困难。因此,需要制定和实施一系列准确、规范并且可操作的网络信息资源描述格式及应用系统,改善网络科学数据组织的状况,提高对资源的存取和利用效率。作为“关于数据的数据”,元数据具有良好的层次结构,可以简洁、清晰地描述数据的特征与属性,是网络科学数据资源组织的基础。因此元数据在交通科学数据共享中的应用成为新的研究课题。

1 元数据及其标准

1.1 元数据的涵义

元数据(metadata)一词最早出现于NASA的《目录交换格式》(DIF)手册中。迄今为止,元数据还没有一个公认的定义,学术界比较公认的定义是:元数据是关于数据的数据( data about data)或“描述数据的数据”( data that describes data) 。其主要目的是:为数据生产者提供有效的数据管理和维护的手段,通过元数据提供网上数据查询、检索与交换;使数据的使用者快速、全面、有效地获取数据资源,实现异地、异构数据库系统的数据共享。

1.2 元数据标准

元数据标准的发展情况在国外主要有都柏林核心(DC)、ISO19115、E-GIF、GILS等几个主要标准;国内主要有中国可持续发展信息元数据、NREDIS信息共享元数据内容标准草案、NSII空间元数据标准、国土资源信息核心元数据标准、地质调查元数据内容与格式标准、国家气象局气象数据元数据标准和数据图书馆元数据标准等。国内、外较为成熟的是:

1) 美国都柏林核心元数据标准。最早产生于1995年召开的元数据研讨会上,由OCLC和NCSA联合发起。其最初目的是为了网络资源的著录与挖掘,描述的对象是网络资源,目前已经被翻译成20种语言在各国使用,并于2003年正式被国际认可,发布为ISO15836。它包括15个基本元素,大致可分为3部分:数据资源内容、知识产权与外部属性。

2) 《地理信息元数据》国家标准。《地理信息元数据》国家标准由全国地理信息标准化技术委员会提出,经过国家技术质量监督局批准,1999年底开始由国家基础地理信息中心负责起草。它以ISO19115草案为基础,参考美国FGDC的CSDGM标准,结合中国具体国情制定。此标准定义描述地理信息及其服务所需要的模式,提供有关数字地理数据标识、覆盖范围、质量、空间和时间模式、空间参照系和分发等信息。

1.3 交通运输科学数据共享元数据内容

《交通运输科学数据共享元数据内容》是在采用或参考国际标准、国外先进和国内的元数据内容标准的基础上,结合本领域科学数据的特点而制定的。其中主要借鉴了ISO19115《地理信息——元数据》和《都柏林核心元数据集》,ISO19115为制定交通运输科学数据共享元数据内容框架提供了重要参考,帮助确定了元数据子集、元数据实体、元数据元素3个元数据层次关系;都柏林核心元数据集提供了制定交通运输科学数据共享核心元数据的思想。将这些成熟思想与交通运输领域科学数据共享的实际情况融合,使得制定的共享元数据标准既具有先进性,又为与国外交通运输领域进行信息、服务交流奠定了元数据内容标准一致性的基础。

交通运输科学数据共享元数据内容包含3个元数据集合:科学数据共享核心元数据、部分科学数据共享公共元数据以及部分科学数据共享参考元数据,这3个元数据集合在内容上有密切的关系,即:共享参考元数据包含共享公共元数据的元数据实体和元素,共享公共元数据包含共享核心元数据的元数据实体和元素。在元数据的内容层次上,共享参考元数据和共享公共元数据有共同的层次结构,而共享核心元数据有自己的内容层级结构。图1表示的是3个元数据集合之间的关系。

共享核心元数据借鉴都柏林核心元数据集思想,由17项最为简洁的元数据实体/元素组成,涵盖了数据集标识、语种、字符集、联系方、创建日期、标准名称、标准版本、数据集标识、数据集内容、分发、质量、参照系、图示表达、扩展、数据模式、限制、维护方面的信息。这17项元数据实体/元素描述了交通运输科学数据资源最一般的信息,具有高度的概括性,构成了交通领域数据集元数据的根实体,即元数据实体集信息。

共享公共元数据包含共享核心元数据的全部内容,分别与元数据实体集中的标识信息、内容信息、分发信息、数据质量信息、图示表达目录信息、元数据扩展信息、数据模式信息、限制信息、维护信息9个元数据实体相关联,由相应的9个元数据子集、共89项元数据元素/实体组成。其中依据交通运输领域的自身特色,对内容信息子集进行扩展,从数据产生方式、描述对象、服务范围方面进一步明确了数据资源的内容。

共享参考元数据是公共元数据的扩展与细化,比公共元数据拥有更多的元数据子集、更为丰富的元数据实体和元素。具体而言,在共享公共元数据的基础上,与元数据实体集中的参照系信息相关联,即包含10个元数据子集,共136项元数据元素/实体。

上述3个层次的元数据集合构成了交通科学数据共享元数据内容的整体框架,如图2所示。该框架包括3部分:元数据实体集信息、10个元数据子集、2个元数据类型实体。

2 基于元数据的交通运输科学数据共享平台设计

2.1 交通运输科学数据资源体系

应用《交通运输科学数据共享元数据内容》共享数据资源,首先要对数据资源分类、分层。分类、分层是为确定数据资源的著录范围,便于元数据的管理、检索与交换。为此,在调研本领域现有科学数据分布、科学技术发展和趋势的基础上,参考学科分类与代码表、国民经济行业分类与代码、中国图书馆图书分类法、交通汉语主题词表、中国铁路叙词表等资料,提出了交通运输科学数据资源体系。

该体系分为公路、铁路、水路运输、民航、综合运输、其他6个方面,每一个方面为一大类,在大类下设中类、小类及数据集3层,形成逐级细分的3层的体系框架,以公路运输为例,图3说明了体系框架的层次关系。

2.2 交通运输科学数据资源数据集元数据表

数据集位于交通运输科学数据资源体系框架的底层,是可以标识的数据集合。它由具有相同属性的数据资源聚集而成,不仅显现了某一类资源的特点,而且划分的资源范围恰到好处,不会因为过粗或过细而影响元数据的检索和使用效果,因此对数据集进行著录是最为适当的。根据上述共享元数据内容,对9个元数据子集、共89项元数据元素/实体进行选择,形成必选的7个元数据子集、共31项元数据元素/实体,这就是对交通运输科学数据资源数据集著录元数据的必选内容,其余为可选内容。在实际著录中,依据数据集本身的特点,可在必选基础上有所增加。表1为交通事故统计数据集元数据列表。

2.3 基于元数据的交通运输科学数据共享平台

交通运输科学数据共享平台是基于元数据设计构建的,它采用分布存储、集中管理的策略,分为数据加工、数据汇交、数据管理、数据服务和门户网站5个部分。平台总体架构如图4所示。以下具体论述元数据在5个部分中的应用。

1) 元数据著录。

元数据著录是通过元数据编辑器在数据加工子系统中完成的。元数据编辑器可以按照标准所定义的处理逻辑,根据当前编辑状态动态地规范用户操作,引导著录人员编辑生成正确的元数据。根据以上元数据标准要求,编辑组件动态生成功能根据元素数据类型和取值方式动态地确定界面编辑组件的形式,使用户易于理解、操作;元素关系自动关联保证元素之间的约束关系能够被自动处理,减少著录人员因对标准理解的误差而产生元数据结构错误的可能;元素值域检查对著录的数据值的有效性进行判断,确保著录内容的正确性。著录并检查后的元数据以XML文档格式输出,并且把元数据结构定义信息和元数据相应的元素信息分别输出,为元数据的存储与检索做准备。

2) 元数据汇交。

各数据生产单位将著录后的元数据通过数据汇交系统汇交到交通科学数据中心,该过程分为2个步骤:首先数据生产单位通过网络在线或客户端软件离线提交元数据,然后是元数据的质量审查、访问权限控制与发布。通过审查并实施了权限控制后的元数据存储在元数据库及元数据关系数据库中。

3) 元数据存储管理。

元数据管理是数据管理系统中存储管理的一部分。在元数据库中,元数据以关系化的方式进行存储,即以独立的存储表记录元数据的结构定义信息。在元数据关系数据库中不仅存储结构信息,而且存储元数据内容信息,即以元素为单位,将元数据XML文本分解,逐个存储元素的相应信息,同时以整个元数据XML文本为单位存储,将XML文本存放于一个字段中。在检索元数据时,根据请求将元素信息与结构信息相关联,检索到符合的元数据后,通过存放XML文本的字段直接提取元数据全文,避免重新组合元数据元素,提高存取速度。

4) 元数据检索。

元数据检索分为一般检索与高级检索,是数据服务系统的组成部分。标准规范的元数据格式给用户提供了统一的接口,用户只需要使用通用规范的检索词就可以与标引的元数据相匹配,准确定位。用户通过得到的元数据,直接链接到相应数据资源,或与资源生产单位联系,索取相应数据。对于一些具有较完善的元数据著录、管理系统的数据生产单位,按照标准要求,可通过交通科学数据资源信息整合接口实现元数据的检索与共享,而不需将元数据汇交到数据中心。整合接口的检索请求是由一个前缀加后缀组成的符合RFC2396格式要求的URL,例如:http://www.XXX.cn/resource?sort=01&key word=值&page=1&pagesize=15,通过此接口可在交通科学数据中心跨平台检索到元数据,用户无需考虑元数据存放位置,直接定位相关目标数据源。

5)元数据组织与浏览。

元数据以树型目录的格式通过共享网门户展现给用户,它以交通运输科学数据资源体系为基础,将各数据集的元数据以树型结构展示。熟悉交通科学数据资源分类的用户可以从树干进入,逐层展开,直至定位到树枝部的数据集,通过元数据定位到数据资源。用户还可以通过检索,先浏览相应的元数据,再由树枝部逐层折叠,由细到粗浏览某一小类、中类或整棵树的元数据。这样的元数据组织形式,使得没有具体实体存在的网络数据资源有机联结在一起,便于用户的定位与选择。

3 结束语

交通科学数据共享平台设计采用TBS Search(数据库全文检索系统)、TBS RPS(资源发布服务系统)和SQL Server(数据库管理系统),既能支持大规模、快速的全文检索服务,又能发挥SQL大型数据库存储数据量大、效率高、安全性好的性能,满足交通运输领域积累的海量科学数据资源的整合、优化与共享。目前,交通科学数据共享平台初步搭建完成(www.transdata.cn),现已共享元数据842个,共享数据资源3G。平台实际运行表明:通过元数据已实现分散、无序、多元、异构的数据资源的有机整合,提高了对资源的存取和利用效率。但同时发现:一些数据生产单位早已制定元数据标准、建立元数据系统,但其元数据格式与《交通运输科学数据共享元数据内容》存在差异,如果推翻已有而新建并不现实,因此问题的关键在于如何进行不同格式元数据之间的转化。常用的元数据格式有DC、XML、RDF以及MARC 4种,交通运输科学数据共享元数据采用XML格式,实现这4种格式的元数据之间的任意转换,不仅需要技术的深入研究,还需依靠标准化步伐的推进,这也是基于元数据的共享平台进一步的研究方向。

参考文献

[1]叶鹰,潘有能,潘卫.情报学基础教程[M].北京:科学出版社,2006

[2]黄鼎成,郭增艳.科学数据共享管理研究[M].北京:中国科学技术出版社,2002

[3]陈燕,吕晓春,孙静涛.焊接科学数据共享体系设计与元数据研究[J].焊接,2006(6):56-60

[4]石镇山,宋彦彦.基于元数据的仪器仪表科学数据共享平台设计[J].仪器仪表标准化计量,2007,33(3):7-10

[5]谢斌红,张英俊,陈立潮.太原地区科学数据共享平台设计与实现[J].太原理工大学学报,2008(1):52-56

[6]URL:http://dublincore.org/(访问时间:2008-2-1)

[7]URL:http://dublincore.org/documents/dces/(访问时间:2008-2-1)

交通数据采集篇8

车检器是1种交通流数据检测设备,它能检测高速公路过往车辆的车型、车速、车流量、道路占有率等参数,可以实时获取各路段交通流信息,便于高速公路运营与管理部门分析各路段运行状况,及时采取控制管理措施,并有效地利用实时的交通数据预测未来的交通状况,是实现有效的交通控制和交通诱导的关键所在[1]。

车检器还能与限速标志、情报板、摄像机等设备配合,协调全局或局部交通的控制和诱导,从而改善交通秩序、增加现有交通设施的通行能力、减少交通事故,对交通控制、事件检测、交通规划及交通安全等方面具有重要意义,最终可获得可观的社会经济效益。车检器的流量检测数据是进行交通状态估计、预测及评价的重要数据基础,也是交通管理和公众出行信息服务等的重要数据来源[2]。但是,由于设备故障、通信系统故障、环境因素异常等原因,流量检测数据存在着错误、缺失等问题,影响了车检器检测数据的精度及稳定性。这些问题的存在一定程度上影响了车辆检测数据的管理和有效应用。因此,对车辆检测数据进行修正及对车检器稳定性的评估是十分必要的。

国外特别是美国的高速公路交通流数据的校验方法发展较为成熟。比较典型的是Turochy等及美国德克萨斯交通研究所(Texas Transportation Institute)提出的基于交通参数阈值检测和基于交通流理论检测的ITS数据有效性检验规则,并将二者结合起来对数据进行判断[3,4]。该方法具有简单实用、可实时实施等优点,在美国的高速公路交通流数据有效性检验中已经得到了广泛应用。

我国在交通流数据有效性检验方面也有一定的研究。与国外主要针对高速公路交通流数据不同,我国当前的交通流数据有效性检验规则研究主要基于城市道路交通流数据[5,6,7,8],对高速公路上的交通流数据有效性研究还不够。笔者结合国内外研究成果,探究出1套判断高速公路车检器的流量检测数据的有效性并对其进行修正的方法。与传统方法不同的是,采用的方法不是针对单点数据的判别和修正,而是以天为单位进行整体的数据修正,这种微观转宏观的方法实现,大大减少了工作的复杂性,并在对研究时间跨度较长的情况下,算法优越性更突出。将分车型和总自然量的车检器断面流量检测数据分别与OD数据得出的断面流量数据[9]进行比较分析,得到相应车型的对比系数,然后通过对对比系数的处理与分析,修正各车型的流量检测数据,并对高速公路车检器的稳定性进行评估。

1 研究思路

1.1 研究思路概要

假设某车检器某车型的日流量检测数据为A,通过OD数据得出的断面流量数据为A′,则它们之间的对比系数为

将若干天数的对比系数ki进行分析,选取对比系数的平均水平k′来修正车检器未来的流量检测数据。k′的值可表示为

假设未来某天(为了消除车检器的检测精度随时间和外界环境的影响而改变较大的情况、加强k′的可用性,未来的某天应取距离k′的分析日期较近且环境因素较类似的天数)车检器此车型的日检测数据B已知,则修正后的数值^B(准确的流量检测数据的估计值)为

在修正方法和修正值确定后,对方法的有效性进行验证:将估计值^B与断面流量的实际值B′进行相对误差分析,则可验证此修正方法的有效性。绝对误差可表示为

当相对误差e小于某值时,则可认为此方法有效。

引入标准差的概念,计算修正系数k′与对比系数ki的差异程度来对车检器的稳定性进行判断,并通过同型号不同车检器的稳定性计算,得到此类车检器的稳定性总体水平。

1.2 研究步骤

包括对流量检测数据的修正及车检器稳定性的评估2方面,具体实现步骤如图1所示。

图1 车检器检测数据的处理过程Fig.1 Process of vehicle detectors′detection data

1)将车检器检测数据(包括流量、占有率、速度等)中的流量检测数据抽取出来,以天为单位进行整合,得到车检器每天的流量检测数据。

2)由于车检器某天的有效工作时间没有覆盖全天的所有时段,此情况导致日流量检测数据的不准确(检测值偏小)。为了解数据的缺失程度,需要得到车检器每天有效工作时长,并经过数据清洗过滤掉有效工作时间低的检测数据,保留有效工作时间高的检测数据。

3)设计算法将有效工作时间较高的流量检测数据经过修补得到全天的流量检测数据。

4)将全天的流量检测数据与断面流量数据进行对比,得到对比系数,将车检器不同天数的对比系数进行计算,得出车检器的修正系数,实现对车检器流量检测数据的修正,并对此修正方法的有效性进行验证。

5)设计算法求出对比系数与修正系数的差异程度,完成对车检器流量检测数据稳定性的评估,并通过对同型号不同车检器稳定性的比较,分析某一型号车检器稳定性的平均水平。

2 车检器流量检测数据的修正方法

车检器由于自身或外界(环境因素异常、交通状况变化特征明显)因素的影响,造成检测精度普遍不高的问题。为了清楚了解到某厂家某型号车检器流量检测数据与实际断面流量的差异,并将其还原到最接近实际流量的状态,本研究提供了以OD历史数据为基础来推导出修正车检器流量检测数据的方法。运用此方法,可以保证车检器检测数据的准确性和有效性。

2.1 车检器数据预处理

1)车检器流量检测数据抽取。用穷举法,将某车检器全年的检测数据进行数据抽取和计算,得到以天为单位的流量检测数据。本研究需要的数据种类有车检器编号、所处路段名称、车检器位置桩号、日期、小型车检测数、中型车检测数、大型车检测数、自然量总数、每日工作时长等。

2)车检器流量检测数据清洗规则。由于车检器自身故障或通信故障等问题,1d中某时段的检测数据存在上传失败或上传错误的情况[10],导致车检器某天的工作时长一般小于24h,检测数据的覆盖时间范围由此也低于24h。由于车检器一般具有固定的数据采集周期,将车检器某天的记录条数进行统计,即可得到车检器检测数据的覆盖时间,即车检器的有效工作时长(假设某车检器的数据采集周期为5min,某天有效记录数共有200条,则有效工作时长为1 000min即16.7h)。根据每天的有效工作时长,筛选出有效工作时间比例(1d工作时长占1d总时长的百分比)高的天数作为研究对象。有效工作时间比例可表示为:

式中:n为天数的编号,n=1~365;t(n)为车检器在第n天的有效工作时长,h;d(n)为车检器在第n天工作的有效工作时间比例。

当某车检器某天的有效工作时间比例d(n)≥D%(D取有效工作时间比例的众数)时,此条记录保留,可作为研究对象继续研究;否则,此天数据的缺失度过大,数据还原后的可靠性及真实性较低,影响后续分析结果的真实性,此条数据不作为研究对象[11]。

3)补齐成全天的检测数据。将保留下来的车检器流量检测数据(包括小、中、大型车和总流量的检测数据)根据有效工作时间,补齐成整天工作时的数值,作为车检器全天正常工作时检测到的数据。本研究将车检器1d中缺失数据的时段对应的每类车型的前15d的有效检测数据与后15d有效检测数据(有效检测数据是指完整可用的检测数据,如果遇到数据不完整的天数,跳过此天,日期向前或向后顺延,直到取到30条数据为止)求平均值作为相应车型的流量填补值,补充到当天缺失数据的时段中。按照此方法,将车检器流量检测数据补齐成全天的检测数据。

2.2 对比系数的计算

对比系数表示车检器流量检测数据与实际的断面流量数据的比值,即车检器流量检测数据的准确度。对比系数与1越接近,则准确度越高。假定车检器所在桩号位置的分车型日断面流量已知,将车检器全天检测数据与对应日期的日断面流量数据进行比例计算,得出每个车检器每天的对比系数。

对比系数可表示为:

式中:j为区分小、中、大型车及总自然量的标号,j=1~4;m为天的标号,由于部分天数的记录被清洗,m一般小于365;fj(m)为车检器第m天第j型车的对比系数;Qj(m)为车检器第m天第j型车的全天检测数据;Sj(m)为车检器第m天第j型车的断面流量。

2.3 修正系数的确定

代表某车检器对比系数的平均水平的值即为修正系数。设某车检器每天分车型的对比系数为fj(m)(j=1,2,3,4),则每类车型的修正系数为每类车型对比系数的平均值,由公式(7)得出:

式中:珚Fj表示车检器第j型车的修正系数。

2.4 车检器数据修正

车检器分车型的修正系数已通过上述步骤算出,通过修正系数可以将车检器数据修正到与实际情况相符的值。假设某路段有X厂家XX型号的车检器a,某天的检测数据、有效工作时间比例d(d≥众数D)、数据丢失的时段已知,则流量检测数据的修正方法为:将车检器检测数据缺失时段的数据根据2.1节中数据还原的方法补齐,还原成全天的检测数据,然后根据公式(8),将全天的检测数据修正到最符合实际的值:

式中:Dj为车检器第j型车的日流量修正值,j=1~4;为车检器第j型车的修正系数;qj为车检器第j型车某天的检测数据。

2.5 修正方法有效性检验

按车检器检测数据修正的方法,将某月的分车型流量检测数据修正结果与实际的断面流量数据进行相对误差的计算,然后对相对误差进行分析,验证此方法的有效性。相对误差可表示为:

式中:t为代表天数的标号,一般t≤31;ej(t)为车检器第t天第j型车的相对误差;Dj(t)为车检器第t天第j型车的日流量修正值;Sj(t)为车检器第t天第j型车的断面流量。

当某类车型的相对误差ej(t)均小于±5%时,说明修正结果与实际流量值之间的相对误差较小,证明此修正方法有效。

3 车检器稳定性分析

车检器稳定性表示车检器的实际检测结果与修正后的结果相符和的程度。车检器稳定性取值在0~1之间,值越大,则每个对比数据与修正系数的差异越小且趋于稳定。通过对比某型号不同车检器的稳定性,可得出此型号车检器个体精度的差异程度及该类车检器对抗外界因素的能力。车检器对比系数的标准差如式(10)所示,车检器的稳定性计算如式(11)所示:

式中:fj(m)为车检器第m天第j型车的对比系数;珚Fj为车检器第j型车的修正系数;Sj为车检器第j型车的对比系数的标准差;Kj(j=1,2,3,4)表示车检器检测第j型车对应的稳定性。

4 实例分析

本研究以某路段同一型号的车检器作为实例测试对象,对车检器的对比系数、稳定性和修正结果的误差进行分析,论证理论研究的可行性和有效性。下文为实例验证的结果。

4.1 车检器流量检测对比系数分析

本研究中,对比系数值为1,则与实际断面流量相符程度为100%,与值1差别越大则检测误差越大。同一型号不同车检器流量检测数据的对比系数有可能不同,本例选取同一路段上布设的均为×厂××型号的车检器9月份的对比系数进行对比分析,对比结果如图2、3所示,其中f1,f2,f3,f4分别表示小、中、大型车及总自然量的对比系数。

由图2可以看出001号车检器的总自然量与中型车的对比系数与1最接近,因此检测结果准确度较高,其次是小型车与大型车的检测结果准确度。大型车的对比系数普遍高于1,说明检测值比实际的断面流量值普遍偏大。

由图3可以看出004号车检器的中型车、大型车和总自然量的对比系数与1差距较大,检测结果准确度都比较低,而小型车的对比系数与1接近,检测结果准确度相对较高。

将图2与图3对比得001号车检器的中型车和总自然量的对比系数平均水平均达到0.9,而004号车检器的中型车和总自然量的对比系数平均水平只达到0.6,所以对此2种车型而言,001号车检器的检测结果准确度高于004号车检器。此外,001号车检器的小型车和004号车检器小型车的对比系数的平均水平均为0.8,说明二者的小型车检测结果准确度大致相等;而001号和004号车检器的大型车检测结果准确度均较低。

图2××路段001号车检器分车型对比系数Fig.2 Contrast coefficient of different models of 001vehicle detector

图3××路段004号车检器分车型对比系数Fig.3 Contrast coefficient of different models of 004vehicle detector

4.2 车检器稳定性分析

选取陕西省某3条路段上均为×厂××型号的12个车检器2013年9月的日检测流量数据进行分析,得出各车检器稳定性分布规律如图4所示,其中w1,w2,w3,w4分别为小、中、大型车及总自然量的车检器稳定性。

图4 9月份各车检器稳定性对比分布图Fig.4 Stability contrast distribution of each vehicle device in September

由图4可见,前10个车检器和第12个车检器分车型稳定性均在0.98左右,说明这11个车检器较稳定。第11个车检器中型车稳定性在0.88左右,稳定性较差,应及时对该车检器及其相关设备进行检修或提高检修频率,以保证车检器的稳定工作。

4.3 流量检测数据修正方法有效性验证

本例中,对某路段001号车检器2013年11月的日流量检测数据进行修正,修正方法采用的基础数据为2013年001号车检器全年的车检器检测数据。修正步骤为:(1)将全年的001号车检器基础数据以天为单位进行整合,并根据每天的记录条数计算有效工作时长;(2)计算每天的有效工作时间比例,并求出众数(本例中求得的众数为0.8),将有效工作时间比例大于0.8的天数进行数据补齐,剩余天数被清洗掉;(3)将补齐的数据与断面流量数据进行对比,求得对比系数;(4)对比系数求平均值得到修正系数;(5)用修正系数将11月不同天数的车检器数据进行修正。由于11月大部分天数的有效工作时间比例均在0.8以上,而有5d的数据缺失较多,均在0.8以下,因此这5d的数据不予修正;(6)修正完毕,得出修正结果的相对误差。相对误差分布范围如图5所示,其中e1,e2,e3,e4分别表示小、中、大型车和总自然量检测数据的修正结果的相对误差。

图5 11月份流量检测数据修正结果相对误差分布图Fig.5 Relative error distribution map of correction results of flow test data in Nov.

由图5可以看出,小型车和总流量的误差均在±4%之内,且大部分分布在±2%之内,说明通过修正系数对车检器流量检测数据的修正方法可行,误差较小。而中型车误差大部分在±5%之内且为负值,说明修正结果较实际断面流量普遍偏小;大型车误差在10%之内且为正值,说明误差较大且修正结果较实际断面流量偏大,这种现象可能是由于车检器将一部分中型车判定为大型车而导致的。

5 结束语

笔者提出了修正车检器流量检测数据与评估其稳定性的方法,并通过实例分析对修正方法的有效性进行了验证,对同型号不同车检器的稳定性进行了对比分析。研究结果表明不同车检器的检测结果与实际的断面流量之间存在不同的稳定的差异,而修正方法对小型车及总流量的流量检测数据有效。本研究对中型车与大型车检测数据的修正结果还不够精确,需要对其余型号的车检器再进行试验分析,总结规律,探究原因,对算法进行进一步改进。本研究提出的方法对修正车检器流量检测数据具有现实意义,为车检器的稳定性评估方法提供了新的思路。

参考文献

[1]彭春华,刘建业.车辆检测传感器综述[J].传感器与微系统,2007,26(6):4-7.PENG Chunhua,LIU Jianye.Review of Vehicle Detection Sensors[J].Transducer and Microsystem Technologies,2007,26(6):4-7.(in Chinese)

[2]秦玲,齐彤岩,吴鹏.断面交通检测数据清洗技术及其应用研究[J].公路交通科技,2007(1):159-161.QIN Ling,QI Tongyan,WU Peng,Technology and Application of Traffic Detection section data cleaning[J].Journal of Highway and Transportation Research and Development,2007(1):159-161.(in Chinese)

[3]AlDeek H Chandra.New algorithms for filtering and imputation of real-time and archived Dual-Loop detector data in I-4data warehouse[J].Transportation Re-search Record,2004(1867):116-126.

[4]LOMAX T,TURNER S,MARGIOTTA R.Monitoring urban roadways in 2002:using archived operations data for reliability and mobility measurement[R].Washington D.C.:Federal Highway Administration,2002.

[5]秦玲,郭艳梅,吴鹏,等.断面交通检测数据检验及预处理关键技术研究[J].公路交通科技,2006(11):39-41.QIN Ling,GUO Yanmei,WU Peng,et al.Key techniques research for station traffic data screening and pre-processing[J].Journal of Highway And transportation Research and Development,2006(11):39-41.(in Chinese)

[6]姜桂艳,江龙晖,张晓东,等.动态交通数据故障识别与修复方法[J].交通运输工程学报,2004,4(1):121-125.JIANG Guiyan,JIANG Longhui,ZHANG Xiaodong,et al.Approach to dynamic traffic data identification and imputation[J].Journal of Traffic and Transportation Engineering,2004,4(1):121-125.(in Chinese)

[7]朱雷雷,张韦华,聂庆慧.干线公路交通流数据有效性检验规则[J].东南大学学报:自然科学版,2011,41(1):184-198.ZHU Leilei,ZHANG Weihua,NIE Qinghui.Traffic data screening rules for highways[J].Journal of Southeast University:Natural Science Edition,2011,41(1):184-198.(in Chinese)

[8]陈大山,孙剑,李克平,张瑜.基于van Aerde模型的快速路交通流特征参数辨识[J].武汉理工大学学报:交通科学与工程版,2013(37)6:1251-1254.CHEN Dashan,SUN Jian,LI Keping,ZHANG Yu.Recognition of expressway traffic flow characteristic parameter based on the van Aerde model[J].Journal of Wuhan University of Technology:Transportation Science&Engineering,2013(37)6:1251-1254.(in Chinese)

[9]靳引利,张英,韩雪婷.基于OD的高速公路断面交通流量推算方法[J].交通信息与安全,2015,33(1):47-52.JIN Yinli,ZHANG Ying,HAN Xueting.Estimation Method of Expressway Section Traffic Flow Based on OD Data[J].Joarnal of Transport Information and Safety 2015,33(1):47-52.(in Chinese)

[10]范兆军,郑海起,戚洪海.基于信息融合技术的机械系统故障诊断框架研究[J].科学技术与工程,2006,6(23):4709-4713.FAN Zhaojun,ZHENG Haiqi,QI Honghai.Fault diagnosis system based on data fusion algorithm[J].Science Technology and Engineering,2006,6(23):4709-4713.(in Chinese)

基于大数据的智慧交通探析篇9

1 智慧交通面临的问题

1.1 对交通系统中出现的数据不够重视

在现有的智慧交通体系的建设过程中,人们只关注现有交通体系智能化的发展,比如:对公交出行路线、交通安全、公众便捷出行等方面加强智能化建设,但是缺乏对数据的分析利用,也没有深度挖掘大数据内蕴含着的价值。

1.2 缺乏有效管理

近年来,越来越多的人已意识到大数据新时代的来临,越来越注重技术开发工作,其中就包括对交通数据的采集、整理与分析,但是由于尚没有形成统一的管理体系,缺乏统一的指挥和领导,最终导致管理模式上产生断裂,而原有的管理方式及体系都已经不能适应新时代开发应用的要求。

1.3 智慧交通系统与其他系统脱离

当下智慧城市的构想与建设是包含了各个方面在内的,比如:城市照明、城市安全等城市管理的各个方面,都将在未来建设成为一体的智慧体系。但就目前来看,包括交通系统在内的各个系统之间仍为各自独立的状态,没有形成紧密的配合和良好的互动。此外,各个智慧系统分管在各自部门之下,不仅降低了智慧城市的便民效果,还加大了建设及管理成本。

2 智慧交通的前景展望

2.1 智慧交通应该具有的特点

智慧交通是基于大数据建设而成的,所以智慧交通的特点很大程度上也就是数据的特点。而数据具有多样化、海量化的特点。多样化,是指智慧交通从应用上看,可作为数据源的方面特别多,小到公民公交卡、路口监控、家用车载GPS,大到物联网、车联网,这涉及各式各样的数据,多样化显而易见。海量化,是指随着城市规模的不断扩张,交通工具的急剧增加,交通总量迅猛增长,需要收集和分析的数据将是难以想象的海量规模,一个中等大小城市,一个月收集而来的数据就超过数百个TB的规模。

2.2 大数据对智慧交通的影响

大数据对于建设智慧交通的最大意义在于,可以通过技术手段来突破行政区划等现实层面的制约。在传统的交通管理上,正是由于技术有限,当数据规模超过一定数量便不再便于管理和控制,所以人为地依照行政区划设定了种种限制,而大数据的共享,完全可以跨越所有原来为了便于管理而人为设定的限制。在无间隔的数据共享之后,将极大地优化现有信息的组合,根据全方位大覆盖面建立起来的数据库,分析能力将不可估量。另外,车辆安全、资源配置、城市治安、交通预测等方面也都将借助大数据的东风,得到迅猛发展。

3 智慧交通产业的创新性发展

3.1“互联网+”时代新战略的提出

“互联网+”时代这一说法首先出现在2015年的“十二大”,由李克强总理写在了当年的政府工作报告里,之后便大范围地流传开来。与此同时,“互联网+”这一新型行业整合形式也随之出现。作为一种新型的业务体系和商业模式,它将借助移动网络的平台,通过对大数据的收集、整理、分析与应用,进而将大数据同传统行业结合在一起,推动行业的发展。

互联网的突出特点便是利用数据将既有系统智慧化,具体体现在智慧交通上,是把既有交通体系根据新兴需求,从内部管理到产业化运营,都进行智慧化改革。

3.2 智慧交通的应用前景

大数据智慧化的关键在于综合分析,在移动互联网高速发展的大背景之下,运用大数据的综合分析技术建立交通工具、交通设施和出行公民之间的立体网络,通过整合有用的信息和资源,将会拥有巨大的应用前景。

一方面,可以使资源便捷地信息化,即将资源利用的分布状况适时发布,以实现最大程度上的信息流通顺畅,提高资源利用率。上文已经提到,智慧城市当中的各系统应该是互相关联而不是相互独立的,智慧交通作为城市基础建设,承载着巨大的数据资源,因此,完善智慧交通体系,分享共用数据信息,对建设智慧城市其他各子系统将有着重要意义,有利于降低城市管理成本,提高智慧城市建设效率。另一方面,可以使信息资源化,即将从大数据库中分析整理得来的有效信息当作另一种新型的高价值信息充分利用,以在便民的同时,通过产业化的运营来激励管理者,促进智慧交通的持续发展。这在一定程度上会推动交通管理的改革步伐,在智慧交通建设成熟阶段,政府部门对城市交通的管理决策也将发生变化,不必完全从管理者的角度去思考问题、解决问题,还可能从运营商的角度来思考、解决问题,既最大程度上满足人民需求,改善城市交通条件,又实现产业化运营,利于管理机构的持续发展。

摘要：本文将智慧交通当作切入口,结合大数据时代的新技术,针对当下交通模式中的一些发展情况进行探析,论述在当今大数据迅猛发展的时代如何将互联网技术与交通系统相结合,建设全新的智慧交通,以实现未来数据时代新型交通模式为目标,讨论大数据在交通收费、交通拥堵等方面的解决办法,为中国建设智慧城市出谋划策。

关键词：大数据,智慧交通,互联网技术

参考文献

[1]孙怀义,王东强,刘斌.智慧交通的体系架构与发展思考[J].自动化博览,2011(z1).

交通数据中频繁轨迹模式挖掘篇10

在从相同长度的时空序列中发现时空周期性模式时, 一种算法被提出, 而且应用序列结构来支持时空查询的执行。但我们关心的是随机长度的序列趋势, 并且研究的点是不确定的取样点。在文献[6]中DSF_MINE算法在天气预报进行时空挖掘时被引进, 但是那篇文章研究了固定地点的随时间变化的属性间的关系, 但是没考虑算法怎样应用到运动对象的挖掘中。所以, 对于这种变化中的位置属性和对应的固定属性的关系的研究, 就显得尤为必要, 具体应用中, 用户什么时候进入某位置就需要被知晓, 所以时间戳也是我们关心的因素。这里提出两种算法MINE_ALLFP和MaxMOP, 分别用来发现所有的运动频繁集和最大频繁集。我们引入图的概念, 并且在发现频繁集的过程中引入一种类似图中路径来增加算法可行性, 为了控制住模式的可控性并且使得可控性的大小可变, 我们引入一种基于网格的簇集 (clustering) 技术。

为了达到最终目标——支持基于位置系统LBS的功能, 提出一种基于规则的位置预测算法, 来利用挖掘出来的规则预测一个运动对象的未来时刻的位置。其中运动规则是利用现提出的MINE_ALLFP算法对用户的历史运动信息进行挖掘得到的运动频繁集得到的。利用现提出的算法来预测未来用户的位置和用户的运动频繁集, LBS系统可以有效的给有交通LBS的用户和客户发生对应客户请求的信息。

2 运动模式的一些定义和问题描述

主要任务是研究T个时间段内N个对象的运动情况。空间方面, 关心二维参考平面内的位置信息, 用二维坐标 (x, y) 表示。时间方面, 关心时间区间max_span内位置变化的信息, 这个时间范围为[start, end]。给定一个最小时间间隔τ, 即从刚进入位置开始, 运动对象在τ时间内位置不会再变化。设时间段是T个单元时间间隔τ, 第i个时间段用ti表示 (1≤i≤T) 。

问题描述1:给定一个一般轨迹集合D, 一个二维参考平面M, 关注的时间区间max_span[start, end]和支持度的最小阈值min_sup。我们的任务就是从数据库中发现对象运动的所有的频繁模式。

问题描述2:给定用一系列的位置表示的轨迹的历史数据库DB={ ( (pi, vti) , 1≤i≤n}、取样时间间隔为τ、参考二维平面M、最大的时间限制max_gap、最小的支持度min_sup、最小的置信度min_conf。问题是从DB中发现所有符合阈值限制的频繁运动规则。

3 发现模式的算法MINE_ALLFP

处理之前, 用一个函数MINE_MS来使得我们可以从相同的输入中得到我们希望的模式。运动对象数据库DB首先按照物体标识符的Оj分类, 在同一个对象的信息内部是按照时间戳进行排序的。之后, 根据轨迹的生存时间[ts, te], 将生存时间在给定最大时间段max_span[start, end]中的轨迹从DB中抽取出来。这个函数during () 在文献[10]中有介绍。这样我们就从数据库中抽取了我们关心时间段内的特定对象的运动信息。

3.1 前期工作之一:轨迹重构

在nx×ny个相同大小的单元, 必须限制单元、取样率的取值, 使对象 (物体或人) 在每次访问单元时, 运动至少命中一次。

3.2 轨迹的计算

假设一个单元上的多次命中对一个轨迹来说算作一次, 所以必须产生轨迹。对于一个动作来说, 我们不关心同一个单元中所有的连续的点, 而只是存储端点。

3.3 数据集转换

物理存储上, 在运动序列中每个单元的数据结构形式是类似这样的: (Rij, Оj, ti) , 其中Rij中有一个指针, 指向对象Оj在时刻t i所存储的位置R[i, j]页。最终, 运动物体数据库DS被转换成用标识符Оj标识的不同运动序列的集合MS。

3.4 MINE_ALLFP算法

直接应用像GSP或者DSF_MINE之类的算法是不可能的, 因为模式中一个区域的形状和大小在每一轮重新发现并被自动修改的。我们提出的MINE_ALLFP算法用于发现所有的频繁模式。

为了便于快速高效的产生候选模式, 模式域的MBRs被提出来。如果这些对的交集不是空的, 取得的候选模式将会是这种形式cand={< (a1, t1) , (c2, t2) , …, (ck-1, tk-1) , (bk, t'k) >, 我们将cand中所有域的符合一定条件的点连接起来:Ri.Оj=Rj.Оj, 此时要将Ri和Rj连接起来条件是Ri.Оj=Rj.Оj, 且Ri.ti=Rj.tj。候选模式的支持度是符合候选模式的对象Оj的个数。

然后, 候选域需要经过一个检测, 因为经过连接操作之后它们可能不再是密集型的了。如果支持度大于最小支持度min_up, 那么候选模式的域将会被重聚类。对于得到的新的聚类, 一个模式将会被创建, 模式域的大小也会跟着调整。比如, 考虑候选模式< (R123, t1) , (R01, t2) >。在连接单元R123和单元R01的点之后, R01的大小没变, 但是R123, 的大小被调整到R13。第二, 考虑图5 (b) 中的候选模式< (R23, t3) , (R3, t4) >。在连接单元R23和单元R3的点之后, R23的大小没变, 但是R3被分为两个聚类R31和R32。所以两个模式被新创建, < (R23, t3) , (R31, t4) >和< (R23, t3) , (R32, t4) >。

最后, 考虑候选模式的剪枝技术。任何一个候选的k-模式, 如果有任何子模式是非频繁的就被舍弃。为了解决这个问题, 保持所有最小的非频繁模式的列表Min Infeq List (文献[6]) 。MinInfeq List被初始化为包含所有非频繁2-模式。当一个新的候选模式cand产生的时候, 我们检查它的子模式有没有在此列表中的。如果有, cand立即被舍弃, 而不用再候选模式域的点集上做连接。

3.5 Max MOP算法

Max MOP算法用来寻找最大模式, 它可以存储很多空间并保存所有必要的信息。从数据结构来看, 除了用于候选模式剪枝的Min Infreq List, 我们需要其他的两种链表:用Max Freq List来存储最大的频繁模式, 用Cand List来存储新产生的候选模式, 这两个链表都初始化为包含所有的频繁2-模式, 而MinInfreq List是初始化为包含所有的非频繁2-模式。候选模式cand出现时, 如果满足下面三个条件:cand不在Max Freq List中, cand是频繁的, cand不是列表中任何模式的子模式, Max Freq List会更新, cand被插入到Max Freq List中。在cand被插入之后, 将Max Freq List列表中cand的所有子模式删除。算法的结果存在Max Freq List中。

3.6 预测运动用户未来时刻的位置

这个算法的目的是根据运动规则预测运动用户的位置除了要对取样点进行重采集—轨迹重构, 将某时刻对应当位置信息序列转换为运动序列也是很有必要的。如果两个连续的点之间的时间间隔大于max_gap, 一个运动序列就被创建。算法MINE_ALLFP把运动序列集MS作为输入, 同时利用有向图、min_up等信息发现所有频繁运动模式。

发现了运动规则之后, 一个运动对象的未来位置就可以被估计了。假设用户到现在为止有下面的路径P=< (l1, vt1) , (l2, vt2) , …, (lj-1, vtj-1) >。规则的后项的第一个位置和置信度的总和以及规则的支持度都存在一个数组中。数组按照支持度和执行度的值降序排列。在第一个元组中的位置和时间戳即使在那个时刻用户将要进入的下一个位置。

4 总结及展望

现提出一种新的技术来从大量平凡时空数据中挖掘频繁运动模式, 这种技术包括两个算法MINE_ALLF和Max MOP。从交通数据中发现运动规则可能会提供更多的关于交通流的信息来更好的帮助用户在决定行走路线是时候提高效率和准确度, 来支持服务商按照能够发给用户有用的信息, 来帮助用户进行下一步决策。

参考文献

[1]易善桢.一种平面移动对象的时空数据模型[N].软件学报, 2002.

[2]包剑.面向移动环境的时空数据挖掘研究[D].阜新:辽宁技术工程大学, 2004.

[3]潘玲.空间数据挖掘与GIS集成技术研究[D].武汉:武汉理工大学硕士, 2007.

[4]宋国杰.一种无线通信环境中用户移动模式的挖掘算法[N].软件学报, 2002.

[5]郭小芳.时间序列数据挖掘中的若干问题研究[D].西安:西北大学, 2008.

[6]I.Tsoukatos and D.Gunopulos.Efficient Mining of Spatiotemporal Patterns, 2001.

[7]G.Gidofalvi and T.Bach Pedersen.Spatio-temporal Rule Mining:Issues and Techniques.

[8]J.F.Roddick, K.Hornsby, and M.Spiliopoulou.An Updated Bibliography of Temporal, Spatial, and Spatio-temporal Data Mining Research.

[9]陈捷.面向移动环境的时空数据挖掘研究现状与展望[Z].博士论坛.

交通数据采集篇11

相关交通运输行业作为传统行业的“老大哥”，在大数据时代的背景下，面临海量交通安全数据的处理，转型势在必行。对基础架构技术进行革新，配合上层软件解决方案的软硬件结合的模式将重塑高效、安全的交通运输业未来。

作为一家专注于商用车车联网领域的运营和服务商，北京中交兴路信息科技有限公司（以下简称“中交兴路”）便是新形势下传统交通运输行业的缩影，提供安全、运行稳定可靠的完整车联网信息服务解决方案，成为勾勒未来完美车联网蓝图的关键。

传统方案将数据的采集和存储作为前端任务，而将数据的分析作为后端任务。各种传感器技术的应用造成数据种类复杂多样，非结构化数据所占比重快速上升，海量增长的数据也对网络传输和后端处理能力造成很大的压力。

远程被管理车辆每天大约需要上传20MB左右的数据。按照100万辆计算，每月大约600TB，每年7.2PB左右。根据政府监管和中交兴路其它增值服务需求（一年两份冗余），100万辆车对数据中心的存储需求大约在14PB。面对如此海量的数据，中交兴路首先需要将数据的访问和存储等服务从硬件资源池中分离出来，使数据访问脱离硬件以面对新型存储设备和存储容量扩充等需求，此外中交兴路还需要考虑存储系统的性能和带宽以应对百万级车辆同时上传数据的需求。

如此一来，增强数据存储能力，提高大数据处理和分析性能成为关键。作为国内领先的商用车车联网服务商和全国性道路货运车辆公共监管与服务平台供应商，中交兴路率先看到基于英特尔架构计算平台的领先优势，部署用以应对海量数据的采集、存储和分析等业务对数据中心的性能需求。

目前，中交兴路大数据平台可以满足现有百万级车辆的10PB级数据存储能力和存储性能需求，并可灵活扩展以应对更多车辆数据的存储挑战。与此同时，相应的车联网解决方案对大量车载终端海量实时数据及时采集、处理、存储和分析，同时支持大规模终端用户实时查看、分析、监控和处理实时业务，并可伴随业务规模的增长而动态扩充平台性能以满足业务需求。

中交兴路大数据中心利用分布式处理的软件框架Apache Hadoop/HBase和基于英特尔至强处理器E5系列的服务器实现百万级别车辆数据的存储、查询、分析和统计。底层架构使用英特尔至强处理器E7系列的出色性能和大内存支持等特性实现数据的实时分析和处理，并轻松实现计算性能的扩展，用以支持更高的计算密度和增强的虚拟化等特性，使得中交兴路大数据平台成为理想的云计算技术运行平台。

针对中交兴路车联网平台百万级车辆管理的业务需求，中交兴路和英特尔还一起研发实施了英特尔架构的硬件平台和第三方商业、开源软件相结合，基于云计算和大数据处理技术的车联网平台压力测试。压力测试方案模拟可以10万、30万、50万车辆的位置和告警（如超速、疲劳驾驶），持续运行1小时。目前，中交兴路大数据中心，既服务于中交各业务和产品线，也服务于整个货运生态；针对合作企业需求，通过数据开放平台，提供数据分析、趋势预测、用户行为画像、区域分析、咨询报告等服务。

中交兴路车联网大数据平台通过实现PB级海量数据的集中存储和管理，满足车联网业务需求。该平台帮助确保车辆安全保障和实时护驾，通过实时获取车辆各项状态及信息数据实现实时管控，高效安全进行车货匹配，创新了行业商业模式，为行业发展转型奠定了基础。

基于英特尔架构的解决方案，凭借其高性能、可扩展性、灵活性、安全性等优势而构建起了包括存储、网络、计算在内的下一代数据中心架构，完美地支持了未来车联网发展和行业业务需求，而这一切只是英特尔助力交通运输行业转型、企业业务升级的一个“小”的缩影。

交通大数据发展的挑战及建议篇12

大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合, 正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析, 从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。

《华尔街日报》将大数据时代、智能化生产和无线网络革命称为引领未来繁荣的三大技术变革。2011 年以来, 各国纷纷将“大数据”的开发利用作为夺取新一轮竞争制高点的重要抓手。国务院于2015 年8月发文《国务院关于印发促进大数据发展行动纲要的通知》 (国发〔2015〕50 号) , 标志着大数据发展已上升为国家意志。

交通行业是天然的大数据行业。交通的规划、管理、决策等各方面都要以大量交通数据的分析和预测为支撑。而今, 随着全国智能城市、感知公路等信息化建设的推进, 以物联网为方向的信息采集技术逐渐普及, 3G/4G网络传输技术迅猛发展, 交通海量数据正在通过不同的途径成级数增长。这为交通大数据的发展提供了条件。

2 交通大数据的构成

如今, 随着信息采集、信息传输技术的发展普及, 交通数据的类型、数量正在飞速增长。但这些数据往往各成系统, 各自孤立, 还未能得到有效的整合和充分利用。对这些数据进行梳理, 按照数据所有者类型进行分类, 主要分布在以下方面:

2.1 铁路系统

铁路售票系统数据。

2.2 公路系统

道路收费系统、道路流量检测系统、电子监控系统、车牌识别系统、路上称重系统、信息服务平台数据等。

2.3 城市交通管理系统

道路监控数据、出租车调度系统、公交运营系统、地铁售票检票系统、停车管理系统、公共自行车运营系统、公交一卡通统计数据、长途客运售票系统数据。

2.4 规划部门

城市居民出行调查数据 (抽样调查数据) 、历年城市交通年报等。

2.5 公安交警系统

天网工程治安卡口数据、交警电子眼数据、交通事故统计数据等。

2.6 移动运营商

手机指令数据。

2.7 互联网数据

网购物流数据、大众点评网等网络数据。

2.8 企业

专车运营数据、滴滴打车数据、车辆导航信息、邮政包裹数据、快递包裹数据、港口码头集疏运数据等。

3 交通大数据的应用情况

目前, 交通大数据的发展氛围已经形成, 无论是政府部门, 还是企业单位, 都认识到了其发展必然性和巨大价值潜力。但从全国来看, 交通大数据的应用尚处于探索、小范围尝试阶段, 研究应用所采用的数据较为单一。例如, 交警部门利用系统内部数据对事故易发点进行分析和治理;交通研究机构采用利用手机指令数据提供的个体活动链特征, 将其与居民出行调查数据库等传统数据相结合, 建立模型, 从而提高模型的校验、预测精度及动态特征;土地评估咨询单位基于大众点评网等网络数据, 对火车站周边商圈货物的OD进行分析, 从而对火车站周边度用地进行评估等等。可见, 规模化的大数据应用态势尚未形成, 交通大数据发展发展潜力巨大 (图1) 。

4 大数据发展面临的挑战

交通大数据时代来临, 对传统的交通数据管理方式提出了巨大挑战, 体现在数据存储、数据的开工共享、数据分析挖掘以及大数据的应用转化等多个方面。

4.1 数据的储存

现代交通大数据的储存面临难题, 主要在于两个方面:一是, 数据规模庞大, 且以分秒的速度成级数增长;二是, 数据类型多, 不仅包含非结构化的数据, 还包含语音、视频等数据类型。另外, 由于历史数据极具价值, 通常需要长时间保存, 大规模、多类型数据的长期储存给交通大数据的发展提出了前所未有的挑战。

4.2 数据的共享

交通大数据的基础数据分散在多个政府部门、咨询单位, 不面向公众公开, 且彼此孤立, 难以实现共享, 给交通大数据的发展造成了很大阻力。且不提交通部门、交警部门、规划部门等跨部门的数据共享, 单单从交通部门内部来看, 数据的共享利用也困难重重。以江苏省为例, 高速公路收费数据、流量观测数据多年来由省交通厅委直接托苏交科进行保存、分析和统计;全省普通国省干线的流量观测数据由省厅公路局委托江苏纬信公司进行分析统计;各地市地方公路流量观测数据多由公路处下属养护部门进行搜集;全省公路OD调查数据由省厅公路局分别于2003 年、2007 年委托江苏纬信公司进行调查和统计分析;近几年不少地市也单独进行过本地区范围内的OD调查……这些数据没有得到公开共享, 其他咨询单位要进行交通分析和需求预测, 搜集基础数据时困难重重。

4.3 数据的分析、挖掘

数据的分挖掘面临的挑战, 主要在于两个方面:一是, 对有效数据的筛选。面对如此庞大的基础数据, 如何根据实际需要, 筛选有效数据是进行数据分析的第一步。例如, 分析机动车对外出行OD, 可选用“RFID+治安卡口+高速公路收费站数据+往年公路OD调查数据”;分析城市居民的活动分布, 可选用“手机移动信令数据+公交IC卡+地铁AFC数据+车辆GPS数据”;分析城市路网拥堵状况, 可选用“出租车GPS数据+公安320 治安卡口数据”等等。二是, 对数据分析模型的建立。在数据筛选的基础上, 根据不同需要, 创建不同的模型, 实现对有效数据的深入分析, 挖掘数据价值。例如, 建立更完善的交通需求预测模型、路网容量分析模型、路网运行时空特征分析模型等。有些模型的建立不仅需要交通方面的人才, 还需要计算机编程、模型算法研究、GIS等多专业的人才共同努力才能实现。三是, 对有效数据的快速处理实时分析。海量的实时数据使得大数据与传统数据相比具有突出的实时性优势。大数据“4V”特征之Velocity, 就是指大数据处理速度快, 要求实时处理而非传统的处理方式。如何对海量实时数据进行实时动态的计算、分析, 也是未来面临的挑战之一。

4.4 数据的应用

大数据的应用需面向不同群体, 涵盖交通管理部门、交通规划部门、数据中心、咨询研究机构、普通出行者等等多种使用主体。如何实现针对不同用户主体, 开发个性化的应用系统, 也是未来发展需要关注的问题。

5 发展建议

5.1 顶层设计

交通大数据分散于多个部分、咨询研究单位、企业, 数据相互孤立, 难以发挥大数据整体优势。因此, 需要国家层面、省级层面、市级层面分别进行顶层设计, 统筹规划、合理安排, 并制定详细的行动计划, 从而避免重复建设、各行其是、互不兼容, 推动交通大数据抱团发展。

5.2 数据的开放共享

数据的开放共享需要政府的推动, 逐步实施。建议先尝试在各系统内部实现数据共享, 例如, 在城市交通系统内部, 从城市运输系统、城市道路系统、城市交通管理系统三个维度, 实现交警、交委、建委、规划的相关数据共享, 共享者之间, 以协议的形式明确数据格式、数据安全、数据使用等细节。在此上, 在逐步实现跨部门共享, 最终实现面向全社会的共享。

5.3 新技术的引进

交通大数据时代来临, 对于大数据的采集、储存、分析挖掘和应用等各方面都提出了新的要求, 需要积极探索引进新技术、新方法, 例如, 云数据平台的建立、实时算法的改进、交通数据可视化技术的研究等等, 并要加强从基础研究到实际应用的转化研究, 充分挖掘交通大数据的应用价值, 从而推动大数据健康快速发展。

5.4 人才结构的完善

交通大数据作为一个综合性强、涉及面广、技术要求高的新领域, 需要更完整、更专业的人才结构。不仅需要交通规划及模型研究方面的人才, 还需要信息体系构建、数据分析、通信技术研究等专业的人才。

6 结语

交通大数据发展的必然性和蕴藏的巨大价值已经得到业内的共识, 但是其规模化发展仍然面临诸多挑战。本文对交通大数据涉及的范围进行了详细梳理, 对大数据发展面临的挑战进行深入分析, 并针对这些挑战提出了切实可行的建议。

参考文献

[1]叶亮.“大数据”背景下我国交通数据管理应用的转型与发展[J].交通与运输, 2013.12:65-67.

[2]马英杰.交通大数据的发展现状及思路[J].道路交通与安全, 2014.8, 第14卷第4期:55-59.

[3]钱喆.广州交通大数据实践与思考[R/D].2015.10, 会议论文.

[4]杨涛, 程晓明, 等.交通大数据的辩证法——交通大数据发展的制度建设和未来方向[R/D].2015.10, 会议论文.

【交通数据采集】推荐阅读：