一种基于手机信令数据的用户实时行程计算方法
未命名
08-05
阅读:92
评论:0

1.本发明涉及大数据处理技术领域,更具体的是涉及一种基于手机信令数据的用户实时行程计算方法。
背景技术:
2.实时行程计算是通过计算得到用户的实时行政地理位置和行动轨迹。实时行程计算在交通治理、旅游客流量分析、广告投放、传染病防控等领域有很好的应用价值。因此实时行程计算有非常重要的意义。
3.现有的计算实时行程的方法种类很多,其中包括是通过设备gps数据进行实时的计算、通过视频监控数据进行实时行程计算和通过据雷达数据进行实时行程计算和通过手机信令数据进行实时行程计算。随着通信系统的发展,手机与基站之间的交互产生了海量的手机信令数据,手机信令数据在通信系统中具有覆盖范围广、用户数量大、时间跨度长等特点,这些信令数据中,隐含着用户的时间和空间信息。因此,这种高精度的时空特征数据让实时计算用户的实时行程成为了可能。相对于其他实时行程计算方法而言,通过手机信令数据进行实时行程计算有及时性强、覆盖范围广、易于获取、成本低,不需要额外搭建和绑定设备等诸多优点。目前基于手机信令数据进行行程计算的大多是离线采集和分析预测,分析对象通常是以群体为单位,识别人群出行特征。相对于实时计算,离线批量分析的延迟较大,时效性较低。
4.针对上述问题,本发明提供了一种基于手机信令数据的实时行程计算方法。
技术实现要素:
5.本发明提供了一种基于手机信令数据的用户实时行程计算方法,以解决现有的实时用户行程计算方法覆盖范围小,成本高,实时性不强等问题,能够实时准确的查询到用户的途径和到访地,以及用户当前的实时位置和所在地市,能够实时反映出个体用户行程的属性特征。
6.本发明一方面提供了一种基于手机信令数据的用户实时行程计算方法,包括以下步骤:
7.s1:获取目标用户信令数据和实时流数据,该目标用户信令数据和实时流数据为原始信令数据;
8.s2:运营商基站数据码表实时解析和实时关联原始信令数据,并补全原始信令数据,得到信令数据;其中,所述运营商基站数据码表包括基站经纬度信息、基站区域编码信息等;
9.s3:针对信令数据存在的数据重复、字段缺失、信令漂移等问题进行实时的数据清洗,获得清洗后的实时信令数据;
10.s4:基于数据清洗后的实时信令流数据,实时计算用户驻留点、驻留时间以及交通出行方式;
11.s5:基于用户驻留点,实时关联相应城市的行政区域码表,聚合得到地市驻留时间和行程轨迹。
12.进一步地,所述步骤s1中,获取目标用户信令数据具体包括:
13.1)基于目标用户手机的运营商基站获取实时的手机信令数据;
14.2)基于手机信令实时流数据进行实时流数据传输。
15.进一步地,所述步骤s2中,所述根据运营商基站数据码表的实时解析和实时关联原始信令数据并补全原始信令数据的方法,具体步骤包括:
16.1)定时从分布式文件系统中读取运营商基站数据码表,用固定分隔符分割的方式实时解析运营商基站数据码表为键值对,其中键为基站编码,值为基站经纬度,并将存储到map中。
17.2)基于解析出来的运营商基站数据码表,实时补充原始信令数据中的经纬度信息。
18.进一步地,所述步骤s3中,针对信令数据存在的数据重复、字段缺失、信令漂移等问题进行实时的数据清洗的方法,具体步骤包括:
19.1)实时对所述原始信令数据进行标准化处理,标准化处理包括字段转化、筛选、拼接等;
20.2)实时对所述原始信令数据剔除关键字段缺失的数据和重复的数据,检测并丢弃出现乒乓切换问题的数据,丢弃信令漂移产生的信令数据。
21.进一步地,所述步骤s4中,基于清洗后的数据实时计算用户驻留点、驻留时间以及交通出行方式的计算方法,具体步骤包括:
22.1)基于geohash算法计算用户驻留点,其中驻留点经纬度为一个geohash块中所有信令点经纬度的均值;
23.2)驻留时长的计算方法为离开驻留点的最后一条信令数据时间与进入驻留点的第一条信令数据时间的差值;
24.3)基于驻留点和驻留时间计算用户出行速度,两驻留点之间的距离除以驻留时长即为用户出行速度;
25.4)基于用户出行速度,匹配出行交通工具速度范围,得到用户出行方式。
26.本方案中,所述所述实时驻留点计算完成后,基于用户驻留点和驻留时长,实时关联行政区域码表,并聚合得到地市驻留时间和行程的方法,具体步骤包括:
27.1)通过驻留点的lac和ci值实时关联行政区域码表,得到某省某市名称,具体到地市级别,其中所述lac值表示用户手机网络制式,所述ci值表示基站唯一编码;
28.2)对于同一用户在同一地市的驻留点,累加驻留点驻留时间得到地市的驻留时间,即用户行程。
29.本方案中的手机信令数据为实时流数据,所述的一种基于手机信令数据的用户实时行程计算方法,使用的是实时流式数据进行计算,其中流式数据是存在于多个分区中,在每一个分区中是按照队列模型进行排列的,流式数据具有一定的时效性,每条数据都有自己的时间戳;流式数据在使用时只能指定起始点然后按照数据流顺序开始使用;流式数据同时拥有持久化策列,可以反复消费使用。
30.本方案中一种基于手机信令数据的用户实时行程计算方法,所述的计算方法为实
时计算方法,数据计算方式为流式计算,严格的实时处理。所述基于手机信令数据的用户实时行程计算方法中的实时执行包括以下步骤:实时读取目标用户信令数据的获取和实时流数据传输;运营商基站数据码表的实时解析和实时关联原始信令数据并补全原始信令数据;针对信令数据存在的数据重复、字段缺失、信令漂移等问题进行实时的数据清洗;基于数据清洗后的实时信令流数据,实时计算用户驻留点、驻留时间以及交通出行方式;基于用户驻留点,实时关联行政区域码表,并聚合得到地市驻留时间和行程。实时计算不间断得常驻运行,并拥有一定的中断和恢复机制。所述基于手机信令数据的计算用户实时行程的实时计算方法处理流式信令数据时意外中断或人工干预中断时,会进行检查点创建。在需要恢复运行时从检查点进行断点续传。
31.本发明与现有技术相比,优势在于实时计算,其计算出结果与数据产生的事件差在秒级延迟。本发明提出了一个新的用户实时行程计算方法,它采用移动信令数据分析,可以有效地解决传统方法覆盖范围有限、成本高昂、延迟大等问题,能够实时准确地查询到用户的行程信息,包括途径、到访地点以及当前位置和所在地市,从而更好地反映出个体用户行程的特征。
附图说明
32.图1为本发明的流程图。
33.图2为本发明实施例的结构示意图。
34.图3为乒乓切换数据清洗前后实例图。(a)数据清洗前存在轨迹兵乓切换现象。(b)数据清洗后用户真实轨迹
35.图4为信令漂移数据清洗前后实例图。(a)数据清洗前存在信令漂移现象;(b)数据清洗后用户真实轨迹。
36.图5用户实时行程计算结果(精确到地市级别)。
具体实施方式
37.为了更好地理解本发明的目的、特点和优势,下面将通过附图和具体实施方式来进一步阐述。需要注意的是,在不违反原则的情况下,本发明的实施方案和实施方案中的特征可以相互结合。
38.本实施实例以地市级别实时行程为例,本发明的范围不受公布的具体实现例的限制,因为它可以通过多种不同的方法来实现,这些方法可以帮助我们更好地理解本发明。
39.在本发明实施实例中,电话信令数字是电话使用者在开启、关机、通话、短信、上网时与基站进行通信时产生的,基站会将每个使用者的信令数据记录下来,以便更好地管理和控制手机系统。此外,电话信令数字具有多种优势:一是样本数量庞大,覆盖的用户范围广泛,自然人持有率极高;二是数据安全性更高,信令数字是匿名的,通过msidn标识唯一使用者,没有任何个人身份信息内容,可以更加有效地保护使用者的隐私安全。通过采用非自愿信息,可以有效地保护使用者的隐私;此外,使用者无需主动提供信息,也不会受到任何形式的篡改干预;此外,该信息具有较高的时效性和连续性,能够准确反映出不同时间段内手机用户所处的空间位置。
40.图1示出了本技术一种基于手机信令数据的用户实时行程计算方法的流程图。
41.如图1所示,本技术公开了一种基于手机信令数据的用户实时行程计算方法,包括以下步骤:
42.1)获取目标用户信令数据的获取和实时流数据传输;
43.2)运营商基站数据码表的实时解析和实时关联原始信令数据并补全原始信令数据,其中,所述基站码表包括基站经纬度信息、基站区域编码信息等;
44.3)针对信令数据存在的数据重复、字段缺失、信令漂移等问题进行实时的数据清洗;
45.4)基于数据清洗后的实时信令流数据,实时计算用户驻留点、驻留时间以及交通出行方式;
46.5)基于用户驻留点,实时关联行政区域码表,并聚合得到地市驻留时间和行程轨迹
47.在本发明实施实例中,首先获取目标用户信令数据的获取和实时流数据传输,当用户用户拿着手机移动时,会根据信号覆盖范围进行基站连接,当用户走出了一个基站的覆盖范围同时会进入蜂窝网络另一个基站覆盖范围,这是发生了基站切换如图2所示,两个基站会分别记录这个用户连接的开始和结束时间,用户连接着基站表示用户在基站附近,各个基站记录下来的信令通信数据输到数据中心,我们实时从数据中心获取数据通过kafka进行流数据的实时传输,当任务首次启动时,我们指定消费数据的开始时间,它是一个kafka的时间戳,例如:20221020100500,表示从2022年10月20日10点05分那个时间点的数据开始消费,然后开始依次顺序消费后续数据,如果指定的时间过早,那么会存在消费数据的速度没有跟上数据产生的速度而产生积压。
48.在本发明实施实例中,所述所获取的目标用户信令数据具体包括:基于目标用户手机的运营商基站获取的手机信令数据和基于运营商基站数据码表获取所述补全数据。
49.在本发明实施实例中,原始信令数据在采集到kafka中之后是以竖线分割的文本,原始信令数据有多种类型,其字段格式也不统一,因此后续需要对其进行标准化,其中原始信令中几个比较关键的字段及其含义如下:
50.表1原始信令数据关键字段及其含义
[0051][0052]
在本发明实施实例中,所述根据运营商基站数据码表的实时解析和实时关联原始信令数据并补全原始信令数据的方法,具体步骤包括:
[0053]
1)定时从分布式文件系统中读取运营商基站码表并解析运营商基站数据码表刷
新到内存中,其中运营商基站数据码表包括基站经纬度信息、基站区域编码信息等信息;
[0054]
2)基于解析出来的运营商基站数据码表的lac和ci的值关联基站的经纬度信息补充原始信令数据中的经纬度信息。
[0055]
在本发明实施实例中,原始信令数据中是没有经纬度的,所以需要将对应信令数据的经纬度进行补充填充。通过经纬度填充,我们可以将用户的定位数据与基站的经纬度数据相符,从而使用户的定位数据与基站的经纬度数据一致。为了实现这一目的,我们需要对原始信令数据中的lac和ci编码进行查询,其中lac编码是用于区分省份的一个地理位置区域编码,ci编码是基站唯一编码,lac和ci编码可以用来补充信令数据中的经纬度数据,以便更好地反映用户的位置信息,从而更准确地定位用户的位置信息。表2显示了ci的一些码表。例如一条信令数据的lac是10,ci是16375018704,那么它的经度和纬度分别为:111.6284,40.7834。我们认为用户产生这条信令数据时的经纬度坐标就是111.6284,40.7834。
[0056]
表2lac、ci对应经纬度码表
[0057][0058][0059]
在本发明实施实例中,述针对信令数据存在的数据重复、字段缺失、信令漂移等问题进行实时的数据清洗的方法,具体得是实时对所述原始数据进行标准化处理和实时对所述原始数据剔除关键字段缺失的数据,丢弃信令漂移产生的数据。
[0060]
需要说明的是由于原始信令数据种存在大量的字段缺失、数据重复、信令漂移和边界基站等问题。为了能够更加准确计算用户行程,我们需要对原始信令数据进行预处理。数据清洗是对原始信令数据中存在字段缺失数据、重复数据、采样不均、信令漂移、边界基站信令等情况进行剔除。
[0061]
在本发明实施实例中,对于信令数的重复数据产生,通常是发生在短时间内的,但基站采集传输过程不同,其不一定是严格的先后顺序,存在一定的时延,由于数据是处理的,因此我们用滑动窗口对实时流中的实时数据进行去重,其窗口滑动和去重过程如下:滑动窗口有滑动窗口的大小,在窗口内的数据会按用户区分,对于用以用户,同一信令数据类型,同一时间点数据进行去重,滑动窗口滑过的数据流出,进行后续算子处理,滑动窗口的步长表示滑动窗口的步长,合理的步长能够很好的限定流数据中,因前时延产生的前后数据重复问题。
[0062]
在本发明实施实例中,对于用户发生乒乓切换的三种现象处理实例如图3所示,在实时流的算子中,维护着一个字典,里面存放着每一个用户最近的两个信令点的基站编码。图中a区域属于
“‑
a-b-a-b
‑”
型信令乒乓,在process算子是在滑动窗口之后的算子,对于一个滑动窗口内的数据,如果存在基站编码在短时间内形成
“‑
a-b-a-b
‑”
型循环,那么剔除第三个和第四个信令数据点,使之成为
“‑
a-b
‑”
型;图中b区域属于
“‑
a-b-a-b-a-b
‑”
型循环,那么通过process算子剔除后续的乒乓循环使之成为
“‑
a-b
‑”
型;图中c区域属于
“‑
a-b-a
‑”
型信令乒乓,那么剔除第三个信令点从而得到用户的真是轨迹。
[0063]
在本发明实施实例中,信令漂移很多时候会产生跨地市的漂移,并且漂移过程是在短时间内产生的。信令漂移的处理是借助于连续连信令点之间的速度进行判断的,首先根据两信令点的经纬度计算地表距离,然后根据两信令点的时间差计算速度。对于同一用户相邻两条信令中的经纬度在地球表面的两个点a(λ
1,
θ1)、b(λ
2,
θ2)。通过信令数据中的经纬度信息、时序信息,首先计算两个信令点a、b之间的距离,如计算公式1所示
[0064][0065]
然后通过信令点a和信令点b之间的时间差δt计算ab两点之间的速度,如公式2所示。
[0066][0067]
目前人们出行的交通工具中速度最快的是民航客机,其飞行速度约为1000km/h,若vab大于1000km/h,则判定b点为信令漂移产生的信令点,直接丢弃b点信令数据。
[0068]
在本发明实施实例中,对于边界基站信令数据,由于存在一个用户处于地市交界处,由于信号强度等问题连接到了另一个行政地市的基站,从而导致计算出的用户行程是去过那个地市的,实际上用户并没有跨越地市行政边界,因此需要对边界基站产生的数据进行剔除来确保最终计算结果的准确性。判断一条信令数据是否为边界基站信令数据,首先获取基站所属地市的边界,它是一个由多个经纬度点构成的不规则多边形,然后将地市边界点和信令经纬度转换成墨卡托坐标,然后利用平面几何算法计算该信令点与地市边界的最短距离,若最短距离大于对应类型基站覆盖范围的阈值,则认为其是边界基站数据。
[0069]
在本发明实施实例中,对于行程计算最重要的是关联行政地市,表示你去过或到达过或驻留在该地级市,那么对于地级市边界上的用户,很多存在由于隔壁地级市的基站信号强,通信质量好而连接到隔壁地市的基站上,虽然用户自身并没有踏入隔壁地市的行政管辖范围内,但是会产生停留在隔壁地市的信令数据,这种我们称之为边界基站信令数据,对于边界基站,我们采用跨地市条件判断,对于跨地市连接的基站全是边界基站的情况,我们认为其没有真正踏入该行政地市。地市行政边界数据是一个由很多个点组成的闭合不规则多边形。
[0070]
在本发明实施实例中,对于距离地市边界5公里范围内的基站我们定义为边界基站,对于边界基站数据,在实时计算中通过判断点到图形的最短距离小于5公里,则将该条数据舍弃。
[0071]
在本发明实施实例中,所述基于清洗后的数据实时计算用户驻留点、驻留时间以
及交通出行方式的计算方法,具体步骤包括:
[0072]
1)基于geohash算法的用户驻留点计算的,其中驻留点经纬度为一个geohash块中所有信令点经纬度的均值;
[0073]
2)驻留时长计算方法为离开驻留点的最后一条信令数据时间与进入驻留点的第一条信令数据时间的差值;
[0074]
3)基于驻留点和驻留时间计算用户出行速度,计算两驻留点之间的距离除以驻留时长得到用户出行速度;
[0075]
4)基于用户出行速度,匹配出行交通工具速度范围,得到用户出行方式。
[0076]
在本发明实施实例中,驻留点是用户行程分析的关键环节,通过对轨迹点的时空分析,可以得到用户的出行方式,家庭住址等信息。由于信令数据量巨大,在实时处理过程中,同一用户在静止状态或缓慢移动过程中会在同一位置会产生大量信令记录。通过驻留点聚合计算行程对后续分析计算量会产生重要影响。为了便于算法分析和简化计算量,我们利用geohash算法实时对海量经纬度散点聚合为区域驻留点。利用手机用户在所处同一geohash区域块的时间,即用户在此geohash区域块内的第一次通信时间与离开此geohash区域块最后一次通信时间差值,作为该用户在此轨迹点的停驻时间。在实时处理过程中,用geohash算法对每一条信令进行geohash编码,对于同于区域块内的所有信令数据点,通过geohash编码聚合成一条轨迹点,若同一用户连续的信令数据处于同一geohash区域块中,则只生成一条轨迹点数据,按照时间顺序计算排列出来的轨迹点组成了用户轨迹。具体操作为首先将实时流数据使用key by算子按用户进行分区,然后利用滑动窗口将窗口内数据按事件进行排序,最后使用process算子依次处理每一条信令数据,首先对经纬度进行geohash编码,判断该条编码与同用户上一条编码是否相同,若相同,则两条经纬度的均值,同时累加驻留时间,保存在流中不继续向下流出。若不同,则将上一条保存的信令数据流出。用户出行方式计算是基于驻留点之间计算速度,对于每一个驻留点与上一驻留点之间计算距离和速度,通过与交通出行工具速度范围做对比,匹配对应的交通出行方式。如表3,imsi为204046862096794和310170801576879的用户的分别使用了不同的交通工具。
[0077]
表3两个用户的出行方式计算
[0078][0079]
在本发明实施实例中,所述所述实时驻留点计算完成后,基于用户驻留点和驻留时长,实时关联行政区域码表,并聚合得到地市驻留时间和行程的方法,具体方法为:通过驻留点的lac和ci值实时关联行政区域码表,得到某省某市名称,具体到地市级别,其中所述lac值表示用户手机网络制式,所述ci值表示基站唯一编码;对于同一用户在同一地市的驻留点,累加驻留点驻留时间得到地市的驻留时间,即用户行程。
[0080]
需要说明的是,对于每一条原始信令数据,我们通过查询信令数据中的lac、ci对应的地市信息,对于同一用户在同一地市的驻留点,累加驻留点驻留时间得到地市的驻留时间,即用户行程,其中lac编码是用于区别省份的一个地理位置区域编码,ci编码是基站唯一编码。值得一提的是,同一用户在一天内的驻留时长累加通常会小于24小时。
[0081]
经过上述实施方法的处理,我们能够辨别出轨道中的重复定位点和“数据漂移”现象,并将它们从轨道中去除,然后按照时间顺序将轨道点连接而来如图4所示。通过这种方式,我们能够看到,重叠点和漂移点的去除,会使客户的路径方向更为清晰,并且能够很好地反应出客户出行地点的大体空间分布。
[0082]
通过以上的实施方式的描述,从图5可见,本发明识别方法与现有方法相比,行程识别实时性和精准度都有了大幅提升,从而验证了本发明方法的效果。
技术特征:
1.一种基于手机信令数据的用户实时行程计算方法,其特征在于,包括以下步骤:s1:获取目标用户信令数据和实时流数据,该目标用户信令数据和实时流数据为原始信令数据;s2:运营商基站数据码表实时解析和实时关联原始信令数据,并补全原始信令数据,得到信令数据;其中,所述运营商基站数据码表包括基站经纬度信息、基站区域编码信息;s3:针对信令数据存在的数据重复、字段缺失、信令漂移问题进行实时的数据清洗,获得清洗后的实时信令数据;s4:基于数据清洗后的实时信令流数据,实时计算用户驻留点、驻留时间以及交通出行方式;s5:基于用户驻留点,实时关联相应城市的行政区域码表,聚合得到地市驻留时间和行程轨迹。2.根据权利要求1所述的一种基于手机信令数据的用户实时行程计算方法,其特征在于,所述步骤s1中,获取目标用户信令数据具体包括:1)基于目标用户手机的运营商基站获取实时的手机信令数据;2)基于手机信令实时流数据进行实时流数据传输。3.根据权利要求1所述的一种基于手机信令数据的用户实时行程计算方法,其特征在于,所述步骤s2中,所述根据运营商基站数据码表的实时解析和实时关联原始信令数据并补全原始信令数据的方法,具体步骤包括:1)定时从分布式文件系统中读取运营商基站数据码表,用固定分隔符分割的方式实时解析运营商基站数据码表为键值对,其中键为基站编码,值为基站经纬度,并将存储到map中;2)基于解析出来的运营商基站数据码表,实时补充原始信令数据中的经纬度信息。4.根据权利要求1所述的一种基于手机信令数据的用户实时行程计算方法,其特征在于,所述步骤s3中,针对信令数据存在的数据重复、字段缺失、信令漂移问题进行实时数据清洗的方法,具体步骤包括:1)实时对所述原始信令数据进行标准化处理,标准化处理包括字段转化、筛选、拼接;2)实时对所述原始信令数据剔除关键字段缺失的数据和重复的数据,检测并丢弃出现乒乓切换问题的数据,丢弃信令漂移产生的信令数据。5.根据权利要求1所述的一种基于手机信令数据的用户实时行程计算方法,其特征在于,所述步骤s4中,基于清洗后的数据实时计算用户驻留点、驻留时间以及交通出行方式的计算方法,具体步骤包括:1)基于geohash算法计算用户驻留点,其中驻留点经纬度为一个geohash块中所有信令点经纬度的均值;2)驻留时长的计算方法为离开驻留点的最后一条信令数据时间与进入驻留点的第一条信令数据时间的差值;3)基于驻留点和驻留时间计算用户出行速度,两驻留点之间的距离除以驻留时长即为用户出行速度;4)基于用户出行速度,匹配出行交通工具速度范围,得到用户出行方式。6.根据权利要求1所述的一种基于手机信令数据的用户实时行程计算方法,其特征在
于,所述所述实时驻留点计算完成后,基于用户驻留点和驻留时长,实时关联行政区域码表,并聚合得到地市驻留时间和行程的方法,具体步骤包括:1)通过驻留点的lac和ci值实时关联行政区域码表,得到某省某市名称,具体到地市级别,其中所述lac值表示用户手机网络制式,所述ci值表示基站唯一编码;2)对于同一用户在同一地市的驻留点,累加驻留点驻留时间得到地市的驻留时间,即用户行程。7.根据权利要求1所述的一种基于手机信令数据的用户实时行程计算方法,其特征在于,使用实时流式数据进行计算,其中流式数据是存在于多个分区中,在每一个分区中是按照队列模型进行排列的,流式数据具有时效性,每条数据都有自己的时间戳;流式数据在使用时只能指定起始点然后按照数据流顺序开始使用;流式数据同时拥有持久化策列,反复消费使用。8.根据权利要求1所述的一种基于手机信令数据的用户实时行程计算方法,其特征在于,数据计算方式为流式计算,严格的实时处理;所述基于手机信令数据的用户实时行程计算方法中的实时执行包括以下步骤:实时读取目标用户信令数据的获取和实时流数据传输;运营商基站数据码表的实时解析和实时关联原始信令数据并补全原始信令数据;针对信令数据存在的数据重复、字段缺失、信令漂移问题进行实时的数据清洗;基于数据清洗后的实时信令流数据,实时计算用户驻留点、驻留时间以及交通出行方式;基于用户驻留点,实时关联行政区域码表,聚合得到地市驻留时间和行程;实时计算不间断得常驻运行,并拥有中断和恢复机制;所述基于手机信令数据的计算用户实时行程的实时计算方法处理流式信令数据时意外中断或人工干预中断时,会进行检查点创建;需要恢复运行时从检查点进行断点续传。
技术总结
本发明公开了一种基于手机信令数据的用户实时行程计算方法,共包含5个步骤:首先是手机用户信令数据的获取和实时流数据传输至云计算平台;其次根据运营商基站数据码表进行实时信令数据补全;再次针对信令数据存在的数据重复、字段缺失、信令漂移等问题进行实时的数据清洗;然后利用GeoHash算法实时计算用户驻留点、驻留时间以及交通出行方式;最后基于用户驻留点,实时关联行政区域码表,并聚合得到实时行程。本发明可以实时计算手机用户的实时行程,能准确反映出用户当前的实时空间位置和历史行程轨迹,该方法在交通治理、旅游客流量分析、广告投放、传染病防控等领域有很好的应用价。用价。用价。
技术研发人员:黄志清 杨孟新
受保护的技术使用者:北京工业大学
技术研发日:2023.03.03
技术公布日:2023/8/4
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/