CN107861957B - 一种数据分析方法及装置 - Google Patents
一种数据分析方法及装置 Download PDFInfo
- Publication number
- CN107861957B CN107861957B CN201610840500.5A CN201610840500A CN107861957B CN 107861957 B CN107861957 B CN 107861957B CN 201610840500 A CN201610840500 A CN 201610840500A CN 107861957 B CN107861957 B CN 107861957B
- Authority
- CN
- China
- Prior art keywords
- gps
- mobile terminal
- vehicle
- track
- gps data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S19/00—Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
- G01S19/38—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system
- G01S19/39—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system the satellite radio beacon positioning system transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
- G01S19/42—Determining position
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Remote Sensing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Radar, Positioning & Navigation (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Computer Networks & Wireless Communication (AREA)
- Life Sciences & Earth Sciences (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
Abstract
本发明实施例公开了一种数据分析方法及装置,该方法包括:利用预设的主题模型,分别对目标车辆的车辆GPS轨迹以及对应的目标移动终端的移动终端GPS轨迹进行分类,并根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。应用本发明实施例,以实现根据GPS数据,得到待分析人员的行为信息。
Description
技术领域
本发明涉及数据挖掘技术领域,特别涉及一种数据分析方法及装置。
背景技术
随着科技的发展,智能终端越来越融入人们的生活。并且随着定位技术越来越好,人们出行时越来越倾向于使用智能终端所配置的定位技术,为自己的出行进行导航,而非利用纸质的地图等进行导航。
在利用智能终端进行导航的过程中,会产生相应的GPS数据,这些GPS数据中隐含有大量的与使用者相关的数据信息,如:通过GPS数据可以分析出使用者是经常出入娱乐场所还是运动场所,等等。进而根据这些GPS数据,分析得到使用者的兴趣爱好以及生活习惯等等。
然而,现有技术中,并没有相对于这些信息的相关利用。那么如何利用这些GPS数据,分析得到相关人员的行为分析信息成为亟待解决的问题。
发明内容
本发明实施例公开了一种数据分析方法及装置,以实现根据GPS数据,得到相关人员的行为信息。具体方案如下:
一方面,本发明实施例提供了一种数据分析方法,所述方法包括:
获得目标车辆在第一预定时间内的车辆全球定位系统GPS轨迹,以及所述目标车辆对应的目标移动终端的移动终端GPS轨迹,其中,所述车辆GPS轨迹包括所述目标车辆所定位的车辆GPS数据,所述移动终端GPS轨迹包括所述目标移动终端所定位的移动终端GPS数据;
依据预设的第一主题模型,对该目标车辆的车辆GPS轨迹进行分类,并且依据预设的第二主题模型,对该目标移动终端的移动终端GPS轨迹进行分类;
根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。
可选的,所述获得目标车辆在第一预定时间内的车辆全球定位系统GPS轨迹,以及所述目标车辆对应的目标移动终端的移动终端GPS轨迹,包括:
获得所述第一预定时间内所述目标车辆的车载设备收集的所述车辆GPS数据,以及所述目标车辆对应的多个移动终端收集的移动终端GPS数据;
根据预设的第一轨迹划分规则以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹,并根据所述第一轨迹划分规则以及多个移动终端收集的移动终端GPS数据,确定每个移动终端的移动终端GPS轨迹;
对比所述车辆GPS轨迹以及每个移动终端的移动终端GPS轨迹,确定与所述目标车辆对应的目标移动终端以及该目标移动终端的移动终端GPS轨迹,其中,所述目标移动终端的移动终端GPS轨迹与所述车辆GPS轨迹相似度最高。
可选的,所述依据预设的第一主题模型,对该目标车辆的车辆GPS轨迹进行分类,并且依据预设的第二主题模型,对该目标移动终端的移动终端GPS轨迹进行分类,包括:
将所述目标车辆的车辆GPS轨迹输入所述第一主题模型;
获得所述第一主题模型输出的每条车辆GPS轨迹对应的第一主题;
将第一主题相同的车辆GPS轨迹划分为一类;
将所述目标移动终端的移动终端GPS轨迹输入所述第二主题模型;
获得所述第二主题模型输出的每条所述目标移动终端的移动终端GPS轨迹对应的第二主题;
将第二主题相同的所述目标移动终端的移动终端GPS轨迹划分为一类。
可选的,所述第一主题模型和第二主题模型均为隐含狄利克雷分布LDA模型;所述第一主题模型包括第一GPS数据、第一主题和第一GPS轨迹三层结构,所述第二主题模型包括第二GPS数据、第二主题和第二GPS轨迹三层结构;
所述方法还包括建立主题模型的过程,所述过程包括:
获得多个样本车辆在第二预定时间内的第一GPS数据,以及所述样本车辆对应的多个样本移动终端的第二GPS数据,其中,所述第一GPS数据包括对应样本车辆的第一样本标识,所述第二GPS数据包括对应样本移动终端的第二样本标识;
从所述第一GPS数据中,确定每个第一样本标识对应的第一GPS数据,并从所述第二GPS数据中,确定每个第二样本标识对应的第二GPS数据;
根据预设的轨迹划分规则以及对应同一个第一样本标识的第一GPS数据,确定所对应的样本车辆的第一GPS轨迹,并根据所述轨迹划分规则以及对应同一个第二样本标识的第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹;
分别进行LDA学习,获得每个第一GPS数据与第一主题的对应关系,以及第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系,并获得每个第二GPS数据与第二主题的对应关系,以及第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系;
所述获得所述第一主题模型输出的每条车辆GPS轨迹对应的第一主题,包括:
所述第一主题模型针对输入的每条第一GPS轨迹所包含的第一GPS数据,根据每个第一GPS数据与第一主题的对应关系确定车辆GPS数据对应的第一主题,并根据第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系确定车辆GPS轨迹的第一主题输出;
获得所输出的每条第一GPS轨迹的第一主题;
所述获得所述第二主题模型输出的每条所述目标移动终端的移动终端GPS轨迹对应的第二主题,包括:
所述第二主题模型针对输入的每条第二GPS轨迹所包含的第二GPS数据,根据每个第二GPS数据与第二主题的对应关系确定所述目标移动终端的移动终端GPS数据对应的第二主题,并根据第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系确定所述目标移动终端的移动终端GPS轨迹的第二主题输出;
获得所输出的每条第二GPS轨迹的第二主题。
可选的,所述车辆GPS数据包含车辆起始地点标识及对应的车辆起始定位时间和车辆终止地点标识及对应的车辆终止定位时间,所述目标移动终端GPS数据包含终端起始地点标识及对应的终端起始定位时间和终端终止地点标识及对应的终端终止定位时间;
所述根据预设的第一轨迹划分规则以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹,包括:
按照所对应的车辆起始定位时间的先后顺序,排序所述车辆GPS数据;
对每两个相邻的车辆GPS数据,依据排序在前的车辆GPS数据所对应的车辆终止定位时间以及排序在后的车辆GPS数据所对应的车辆起始定位时间,确定每两个相邻的车辆GPS数据的第一时间差;
当所述第一时间差超过预设的第一轨迹划分时间阈值时,将所对应的两个相邻的车辆GPS数据确定为第一轨迹划分界限,其中,车辆起始定位时间在前的车辆GPS数据对应的车辆终止地点标识为前一个车辆GPS轨迹终点,车辆起始定位时间在后的车辆GPS数据对应的车辆起始地点标识为后一个车辆GPS轨迹起点;
根据所述第一轨迹划分界限以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹;
所述根据所述第一轨迹划分规则以及多个移动终端收集的移动终端GPS数据,确定每个移动终端的移动终端GPS轨迹,包括:
按照所对应的终端起始定位时间的先后顺序,排序所述移动终端GPS数据;
对每两个相邻的移动终端GPS数据,依据排序在前的移动终端GPS数据所对应的终端终止定位时间以及排序在后的移动终端GPS数据所对应的终端起始定位时间,确定每两个相邻的移动终端GPS数据的第二时间差;
当所述第二时间差超过所述第一轨迹划分时间阈值时,将所对应的两个相邻的移动终端GPS数据确定为第二轨迹划分界限,其中,终端起始定位时间在前的移动终端GPS数据对应的终端终止地点标识为前一个移动终端GPS轨迹终点,终端起始定位时间在后的移动终端GPS数据对应的终端起始地点标识为后一个移动终端GPS轨迹起点;
根据所述第二轨迹划分界限以及所述移动终端GPS数据,确定所述目标车辆的每个移动终端GPS轨迹。
可选的,所述第一GPS数据包含第一起始地点标识及对应的第一起始定位时间和第一终止地点标识及对应的第一终止定位时间,所述第二GPS数据包含第二起始地点标识及对应的第二起始定位时间和第二终止地点标识及对应的第二终止定位时间;
所述根据预设的轨迹划分规则以及对应同一个第一样本标识的第一GPS数据,确定所对应的样本车辆的第一GPS轨迹,包括:
按照所对应的第一起始定位时间的先后顺序,排序所述第一GPS数据;
对每两个相邻的第一GPS数据,依据排序在前的第一GPS数据所对应的第一终止定位时间以及排序在后的第一GPS数据所对应的第一起始定位时间,确定每两个相邻的第一GPS数据的第三时间差;
当所述第三时间差超过预设的第二轨迹划分时间阈值时,将所对应的两个相邻的第一GPS数据作为第三轨迹划分界限,其中,第一起始定位时间在前的第一GPS数据对应的第一终止地点标识为前一个第一GPS轨迹终点,第一起始定位时间在后的第一GPS数据对应的第一起始地点标识为后一个第一GPS轨迹起点;
根据所述第三轨迹划分界限以及所述第一GPS数据,确定所对应的样本车辆的第一GPS轨迹;
所述根据所述轨迹划分规则以及对应同一个第二样本标识的第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹,包括:
按照所对应的第二起始定位时间的先后顺序,排序所述第二GPS数据;
对每两个相邻的第二GPS数据,依据排序在前的第二GPS数据所对应的第二终止定位时间以及排序在后的第二GPS数据所对应的第二起始定位时间,确定每两个相邻的第二GPS数据的第四时间差;
当所述第四时间差超过所述第二轨迹划分时间阈值时,将所对应的两个相邻的第二GPS数据作为第四轨迹划分界限,其中,第二起始定位时间在前的第二GPS数据对应的第二终止地点标识为前一个第二GPS轨迹终点,第二起始定位时间在后的移动终端GPS数据对应的第二起始地点标识为后一个第二GPS轨迹起点;
根据所述第四轨迹划分界限以及所述第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹。
可选的,所述方法还包括:
获得所述目标移动终端在所述第一预定时间内的终端交互数据,其中,所述终端交互数据包括日志交互数据和应用程序信息,其中,所述日志交互数据用于标识所述目标移动终端中各应用程序信息对应的应用程序的使用频率;
依据预设的第三主题模型,对所获得的终端交互数据,进行分类;
根据每一类终端交互数据以及所对应的应用程序信息,确定所述目标移动终端在所述第一预定时间内的子行为信息;
所述根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息,包括;
根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,以及所述子行为信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。
可选的,所述GPS信息包括:定位地点对应的经纬度信息、定位地点对应的预定范围内的建筑信息或定位地点对应的环境信息;
所述根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息,包括:
根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的经纬度信息确定所述目标车辆对应的第一地域主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标车辆对应的第一建筑主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的环境信息确定所述目标车辆对应的第一环境主题;
根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的经纬度信息确定所述目标移动终端对应的第二地域主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标移动终端对应的第二建筑主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的环境信息确定所述目标移动终端对应的第二环境主题;
根据所确定的所述目标车辆对应的第一地域主题、第一建筑主题或第一环境主题,以及所确定的所述目标移动终端对应的第二地域主题、第二建筑主题或第二环境主题,确定所述待分析人员在所述第一预定时间内的行为信息。
另一方面,本发明实施例提供了一种数据分析装置,所述装置包括:
第一获得模块,用于获得目标车辆在第一预定时间内的车辆全球定位系统GPS轨迹,以及所述目标车辆对应的目标移动终端的移动终端GPS轨迹,其中,所述车辆GPS轨迹包括所述目标车辆所定位的车辆GPS数据,所述移动终端GPS轨迹包括所述目标移动终端所定位的移动终端GPS数据;
第一分类模块,用于依据预设的第一主题模型,对该目标车辆的车辆GPS轨迹进行分类,并且依据预设的第二主题模型,对该目标移动终端的移动终端GPS轨迹进行分类;
第一确定模块,用于根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。
可选的,所述第一获得模块包括:第一获得单元、第一确定单元和第二确定单元;
所述第一获得单元,用于获得所述第一预定时间内所述目标车辆的车载设备收集的所述车辆GPS数据,以及所述目标车辆对应的多个移动终端收集的移动终端GPS数据;
所述第一确定单元,用于根据预设的第一轨迹划分规则以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹,并根据所述第一轨迹划分规则以及多个移动终端收集的移动终端GPS数据,确定每个移动终端的移动终端GPS轨迹;
所述第二确定单元,用于对比所述车辆GPS轨迹以及每个移动终端的移动终端GPS轨迹,确定与所述目标车辆对应的目标移动终端以及该目标移动终端的移动终端GPS轨迹,其中,所述目标移动终端的移动终端GPS轨迹与所述车辆GPS轨迹相似度最高。
可选的,所述第一分类模块包括第一输入单元、第二获得单元、第一划分单元、第二输入单元、第三获得单元和第二划分单元;
所述第一输入单元,用于将所述目标车辆的车辆GPS轨迹输入所述第一主题模型;
所述第二获得单元,用于获得所述第一主题模型输出的每条车辆GPS轨迹对应的第一主题;
所述第一划分单元,用于将第一主题相同的车辆GPS轨迹划分为一类;
所述第二输入单元,用于将所述目标移动终端的移动终端GPS轨迹输入所述第二主题模型;
所述第三获得单元,用于获得所述第二主题模型输出的每条所述目标移动终端的移动终端GPS轨迹对应的第二主题;
所述第二划分单元,用于将第二主题相同的所述目标移动终端的移动终端GPS轨迹划分为一类。
可选的,所述第一主题模型和第二主题模型均为隐含狄利克雷分布LDA模型;所述第一主题模型包括第一GPS数据、第一主题和第一GPS轨迹三层结构,所述第二主题模型包括第二GPS数据、第二主题和第二GPS轨迹三层结构;
所述装置还包括用于建立主题模型的主题模型建立模块,所述主题模型建立模块包括第四获得单元、第三确定单元、第四确定单元和第五获得单元;
所述第四获得单元,用于获得多个样本车辆在第二预定时间内的第一GPS数据,以及所述样本车辆对应的多个样本移动终端的第二GPS数据,其中,所述第一GPS数据包括对应样本车辆的第一样本标识,所述第二GPS数据包括对应样本移动终端的第二样本标识;
所述第三确定单元,用于从所述第一GPS数据中,确定每个第一样本标识对应的第一GPS数据,并从所述第二GPS数据中,确定每个第二样本标识对应的第二GPS数据;
所述第四确定单元,用于根据预设的轨迹划分规则以及对应同一个第一样本标识的第一GPS数据,确定所对应的样本车辆的第一GPS轨迹,并根据所述轨迹划分规则以及对应同一个第二样本标识的第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹;
所述第五获得单元,用于分别进行LDA学习,获得每个第一GPS数据与第一主题的对应关系,以及第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系,并获得每个第二GPS数据与第二主题的对应关系,以及第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系;
所述第二获得单元,具体用于所述第一主题模型针对输入的每条第一GPS轨迹所包含的第一GPS数据,根据每个第一GPS数据与第一主题的对应关系确定车辆GPS数据对应的第一主题,并根据第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系确定车辆GPS轨迹的第一主题输出;
获得所输出的每条第一GPS轨迹的第一主题;
所述第三获得单元,具体用于所述第二主题模型针对输入的每条第二GPS轨迹所包含的第二GPS数据,根据每个第二GPS数据与第二主题的对应关系确定所述目标移动终端的移动终端GPS数据对应的第二主题,并根据第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系确定所述目标移动终端的移动终端GPS轨迹的第二主题输出;
获得所输出的每条第二GPS轨迹的第二主题。
可选的,所述车辆GPS数据包含车辆起始地点标识及对应的车辆起始定位时间和车辆终止地点标识及对应的车辆终止定位时间,所述目标移动终端GPS数据包含终端起始地点标识及对应的终端起始定位时间和终端终止地点标识及对应的终端终止定位时间;
所述第一确定单元包括:第一排序子模块、第一确定子模块、第二确定子模块和第三确定子模块;
所述第一排序子模块,用于按照所对应的车辆起始定位时间的先后顺序,排序所述车辆GPS数据;
所述第一确定子模块,用于对每两个相邻的车辆GPS数据,依据排序在前的车辆GPS数据所对应的车辆终止定位时间以及排序在后的车辆GPS数据所对应的车辆起始定位时间,确定每两个相邻的车辆GPS数据的第一时间差;
所述第二确定子模块,用于当所述第一时间差超过预设的第一轨迹划分时间阈值时,将所对应的两个相邻的车辆GPS数据确定为第一轨迹划分界限,其中,车辆起始定位时间在前的车辆GPS数据对应的车辆终止地点标识为前一个车辆GPS轨迹终点,车辆起始定位时间在后的车辆GPS数据对应的车辆起始地点标识为后一个车辆GPS轨迹起点;
所述第三确定子模块,用于根据所述第一轨迹划分界限以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹;
所述第一排序子模块,还用于按照所对应的终端起始定位时间的先后顺序,排序所述移动终端GPS数据;
所述第一确定子模块,还用于对每两个相邻的移动终端GPS数据,依据排序在前的移动终端GPS数据所对应的终端终止定位时间以及排序在后的移动终端GPS数据所对应的终端起始定位时间,确定每两个相邻的移动终端GPS数据的第二时间差;
所述第二确定子模块,还用于当所述第二时间差超过所述第一轨迹划分时间阈值时,将所对应的两个相邻的移动终端GPS数据确定为第二轨迹划分界限,其中,终端起始定位时间在前的移动终端GPS数据对应的终端终止地点标识为前一个移动终端GPS轨迹终点,终端起始定位时间在后的移动终端GPS数据对应的终端起始地点标识为后一个移动终端GPS轨迹起点;
所述第三确定子模块,还用于根据所述第二轨迹划分界限以及所述移动终端GPS数据,确定所述目标车辆的每个移动终端GPS轨迹。
可选的,所述第一GPS数据包含第一起始地点标识及对应的第一起始定位时间和第一终止地点标识及对应的第一终止定位时间,所述第二GPS数据包含第二起始地点标识及对应的第二起始定位时间和第二终止地点标识及对应的第二终止定位时间;
所述第四确定单元包括:第二排序子模块、第四确定子模块、第五确定子模块和第六确定子模块;
所述第二排序子模块,用于按照所对应的第一起始定位时间的先后顺序,排序所述第一GPS数据;
所述第四确定子模块,用于对每两个相邻的第一GPS数据,依据排序在前的第一GPS数据所对应的第一终止定位时间以及排序在后的第一GPS数据所对应的第一起始定位时间,确定每两个相邻的第一GPS数据的第三时间差;
所述第五确定子模块,用于当所述第三时间差超过预设的第二轨迹划分时间阈值时,将所对应的两个相邻的第一GPS数据作为第三轨迹划分界限,其中,第一起始定位时间在前的第一GPS数据对应的第一终止地点标识为前一个第一GPS轨迹终点,第一起始定位时间在后的第一GPS数据对应的第一起始地点标识为后一个第一GPS轨迹起点;
所述第六确定子模块,用于根据所述第三轨迹划分界限以及所述第一GPS数据,确定所对应的样本车辆的第一GPS轨迹;
所述第二排序子模块,还用于按照所对应的第二起始定位时间的先后顺序,排序所述第二GPS数据;
所述第四确定子模块,还用于对每两个相邻的第二GPS数据,依据排序在前的第二GPS数据所对应的第二终止定位时间以及排序在后的第二GPS数据所对应的第二起始定位时间,确定每两个相邻的第二GPS数据的第四时间差;
所述第五确定子模块,还用于当所述第四时间差超过所述第二轨迹划分时间阈值时,将所对应的两个相邻的第二GPS数据作为第四轨迹划分界限,其中,第二起始定位时间在前的第二GPS数据对应的第二终止地点标识为前一个第二GPS轨迹终点,第二起始定位时间在后的移动终端GPS数据对应的第二起始地点标识为后一个第二GPS轨迹起点;
所述第六确定子模块,还用于根据所述第四轨迹划分界限以及所述第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹。
可选的,所述装置还包括第二获得模块、第二分类模块和第二确定模块;
所述第二获得模块,用于获得所述目标移动终端在所述第一预定时间内的终端交互数据,其中,所述终端交互数据包括日志交互数据和应用程序信息,其中,所述日志交互数据用于标识所述目标移动终端中各应用程序信息对应的应用程序的使用频率;
所述第二分类模块,用于依据预设的第三主题模型,对所获得的终端交互数据,进行分类;
所述第二确定模块,用于根据每一类终端交互数据以及所对应的应用程序信息,确定所述目标移动终端在所述第一预定时间内的子行为信息;
所述第一确定模块,具体用于根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,以及所述子行为信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。
可选的,所述GPS信息包括:定位地点对应的经纬度信息、定位地点对应的预定范围内的建筑信息或定位地点对应的环境信息;
所述第一确定模块,具体用于根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的经纬度信息确定所述目标车辆对应的第一地域主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标车辆对应的第一建筑主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的环境信息确定所述目标车辆对应的第一环境主题;
根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的经纬度信息确定所述目标移动终端对应的第二地域主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标移动终端对应的第二建筑主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的环境信息确定所述目标移动终端对应的第二环境主题;
根据所确定的所述目标车辆对应的第一地域主题、第一建筑主题或第一环境主题,以及所确定的所述目标移动终端对应的第二地域主题、第二建筑主题或第二环境主题,确定所述待分析人员在所述第一预定时间内的行为信息。
在本方案中,利用预设的主题模型,分别对目标车辆的车辆GPS轨迹以及对应的目标移动终端的移动终端GPS轨迹进行分类,并根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。可见,根据预设的主题模型,可以确定目标车辆在第一预定时间内的车辆GPS轨迹的内在联系以及目标移动终端的移动终端GPS轨迹的内在联系,进一步地,根据车辆GPS轨迹的内在联系以及移动终端GPS轨迹的内在联系,确定所对应待分析人员在第一预定时间内的行为信息。后续的可以根据该行为信息对该待分析人员进行跟踪,可以提高对该待分析人员的跟踪的准确率。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的一种数据分析方法的流程示意图;
图2A为本发明实施例中车辆GPS轨迹划分的流程示例图;
图2B为本发明实施例中移动终端GPS轨迹划分的流程示例图;
图3为本发明实施例中主题模型建立的一种流程示意图;
图4为本发明实施例所提供的一种数据分析装置的结构示意图;
图5为本发明实施例中主题模型建立模块的结构示意图;
图6为本发明实施例中GPS轨迹划分模块的结构示例图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种数据分析方法及装置,以实现根据GPS数据,得到相关人员的行为信息。
下面首先对本发明实施例所提供的一种数据分析方法进行介绍。
如图1所示,本发明实施例提供了一种数据分析方法,可以包括步骤:
S101:获得目标车辆在第一预定时间内的车辆全球定位系统GPS轨迹,以及所述目标车辆对应的目标移动终端的移动终端GPS轨迹,其中,所述车辆GPS轨迹包括所述目标车辆所定位的车辆GPS数据,所述移动终端GPS轨迹包括所述目标移动终端所定位的移动终端GPS数据;
可以理解的是,该第一预定时间可以为半年或一年等等,本发明实施例并不对该第一预定时间进行限定。该目标车辆的每条车辆GPS轨迹中可以包括至少一个车辆GPS数据;该目标移动终端的移动终端GPS轨迹中可以包括至少一个移动终端GPS数据。通过现有技术可知,该GPS数据(包括车辆GPS数据和移动终端GPS数据)中可以包括起始地点信息、终止地点信息以及中间所经过线路对应的各地点信息。
在一种具体实现方式中,所述获得目标车辆在第一预定时间内的车辆全球定位系统GPS轨迹,以及所述目标车辆对应的目标移动终端的移动终端GPS轨迹,包括:
获得所述第一预定时间内所述目标车辆的车载设备收集的所述车辆GPS数据,以及所述目标车辆对应的多个移动终端收集的移动终端GPS数据;
根据预设的第一轨迹划分规则以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹,并根据所述第一轨迹划分规则以及多个移动终端收集的移动终端GPS数据,确定每个移动终端的移动终端GPS轨迹;
对比所述车辆GPS轨迹以及每个移动终端的移动终端GPS轨迹,确定与所述目标车辆对应的目标移动终端以及该目标移动终端的移动终端GPS轨迹,其中,所述目标移动终端的移动终端GPS轨迹与所述车辆GPS轨迹相似度最高。
需要说明的是,每辆目标车辆可能对应多台移动终端。可以根据该目标车辆的车辆GPS轨迹,确定与该目标车辆对应的目标移动终端。具体的,将与该车辆GPS轨迹相似度最高的移动终端GPS轨迹对应的移动终端确定为目标移动终端。其中,计算车辆GPS轨迹与移动终端GPS轨迹的相似性可以采用现有技术,在此不做赘述。在一般情况下,该目标移动终端的持有者为该目标车辆的车主(即后续提到的待分析人员)。其中,每个移动终端GPS数据中均包含所对应的移动终端的标识,并且,每个车辆GPS数据中均包含所对应的车辆的车辆标识。
在一种具体实现方式中,所述车辆GPS数据包含车辆起始地点标识及对应的车辆起始定位时间和车辆终止地点标识及对应的车辆终止定位时间,所述目标移动终端GPS数据包含终端起始地点标识及对应的终端起始定位时间和终端终止地点标识及对应的终端终止定位时间;
如图2A所示,所述根据预设的第一轨迹划分规则以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹,包括:
S201A:按照所对应的车辆起始定位时间的先后顺序,排序所述车辆GPS数据;
S202A:对每两个相邻的车辆GPS数据,依据排序在前的车辆GPS数据所对应的车辆终止定位时间以及排序在后的车辆GPS数据所对应的车辆起始定位时间,确定每两个相邻的车辆GPS数据的第一时间差;
S203A:当所述第一时间差超过预设的第一轨迹划分时间阈值时,将所对应的两个相邻的车辆GPS数据确定为第一轨迹划分界限,其中,车辆起始定位时间在前的车辆GPS数据对应的车辆终止地点标识为前一个车辆GPS轨迹终点,车辆起始定位时间在后的车辆GPS数据对应的车辆起始地点标识为后一个车辆GPS轨迹起点;
S204A:根据所述第一轨迹划分界限以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹;
如图2B所示,所述根据所述第一轨迹划分规则以及多个移动终端收集的移动终端GPS数据,确定每个移动终端的移动终端GPS轨迹,包括:
S201B:按照所对应的终端起始定位时间的先后顺序,排序所述移动终端GPS数据;
S202B:对每两个相邻的移动终端GPS数据,依据排序在前的移动终端GPS数据所对应的终端终止定位时间以及排序在后的移动终端GPS数据所对应的终端起始定位时间,确定每两个相邻的移动终端GPS数据的第二时间差;
S203B:当所述第二时间差超过所述第一轨迹划分时间阈值时,将所对应的两个相邻的移动终端GPS数据确定为第二轨迹划分界限,其中,终端起始定位时间在前的移动终端GPS数据对应的终端终止地点标识为前一个移动终端GPS轨迹终点,终端起始定位时间在后的移动终端GPS数据对应的终端起始地点标识为后一个移动终端GPS轨迹起点;
S204B:根据所述第二轨迹划分界限以及所述移动终端GPS数据,确定所述目标车辆的每个移动终端GPS轨迹。
以目标车辆的车载设备所收集的车辆GPS数据为例进行说明:
其中,根据所对应的车辆起始定位时间的先后顺序,排序所述车辆GPS数据,或者,根据所对应的车辆终止定位时间的先后顺序,排序所述车辆GPS数据,这都是可以的。可以理解的是,所对应车辆起始定位时间或车辆终止定位时间越靠前的车辆GPS数据,在排序序列中的位置越靠前。
一般的,车辆GPS数据包含的车辆起始定位时间和车辆终止定位时间之间的时间差,可以确定为车辆的行驶时间,并且,排序靠前的车辆GPS数据包含的车辆终止地点标识,与排序靠后的车辆GPS数据包含的车辆起始地点标识相同。
针对每两个相邻的车辆GPS数据来说,排序靠前的车辆GPS轨迹所对应的车辆终止定位时间以及排序在后的车辆GPS数据所对应的车辆起始定位时间之间的时间差,可以认为是该目标车辆在该车辆终止地点标识所对应的地点停留的时间,可以将该时间确定为每两个相邻的车辆GPS数据的第一时间差,进而进行车辆GPS轨迹的划分。该第一时间差越大,可以表明该目标车辆在该终止地点标识所对应的地点停留的时间越长。此时,可以将该对应的两个相邻的车辆GPS数据确定为第一轨迹划分界限,车辆起始定位时间在前的车辆GPS数据对应的车辆终止地点标识为前一个车辆GPS轨迹终点,车辆起始定位时间在后的车辆GPS数据对应的车辆起始地点标识为后一个车辆GPS轨迹起点。另外,也可以是车辆终止定位时间在前的车辆GPS数据对应的车辆终止地点标识为前一个车辆GPS轨迹终点,车辆终止定位时间在后的车辆GPS数据对应的车辆起始地点标识为后一个车辆GPS轨迹起点,这也是可以的。
第一轨迹划分时间阈值以及第二轨迹划分时间阈值可以相同,也可以不同,其二者均可以由用户根据具体情况进行设置。本发明实施例并不对该第一轨迹划分时间阈值以及第二轨迹划分时间阈值进行限定。
S102:依据预设的第一主题模型,对该目标车辆的车辆GPS轨迹进行分类,并且依据预设的第二主题模型,对该目标移动终端的移动终端GPS轨迹进行分类;
可以理解的是,该主题模型中已通过训练大量的GPS数据(包括样本车辆GPS数据和样本移动终端GPS数据)及其对应的种类以及包括GPS数据的GPS轨迹(包括样本车辆GPS轨迹和样本移动终端GPS轨迹)及其对应的种类进行了学习,根据该主题模型学习到的训练结果,可以对该目标车辆的车辆GPS轨迹以及目标移动终端的移动终端GPS轨迹进行分类。其中,该主题模型可以采用现有技术的LDA(LatentDirichletallocation,隐含狄利克雷分布)模型。
其中,对目标车辆的车辆GPS轨迹进行分类的步骤以及对目标移动终端的移动终端GPS轨迹进行分类的步骤可以同时执行,也可以先后执行,这都是可以的。本发明实施例并不对目标车辆的车辆GPS轨迹进行分类的步骤以及对目标移动终端的移动终端GPS轨迹进行分类的步骤的执行顺序进行限定。
在一种具体实现方式中,所述依据预设的第一主题模型,对该目标车辆的车辆GPS轨迹进行分类,并且依据预设的第二主题模型,对该目标移动终端的移动终端GPS轨迹进行分类,包括:
将目标车辆的车辆GPS轨迹输入第一主题模型;
获得第一主题模型输出的每条车辆GPS轨迹对应的第一主题;
将第一主题相同的车辆GPS轨迹划分为一类;
将目标移动终端的移动终端GPS轨迹输入第二主题模型;
获得第二主题模型输出的每条目标移动终端的移动终端GPS轨迹对应的第二主题;
将第二主题相同的目标移动终端的移动终端GPS轨迹划分为一类。
需要说明的是,该第一主题模型可以根据预先学习到的训练结果,继续训练输入的该样本车辆的车辆GPS轨迹,训练出每条车辆GPS轨迹对应的主题,并将对应主题相同的车辆GPS轨迹划分为一类,其中,依据现有的主题模型技术,每条车辆GPS轨迹可以同时属于不同类主题中,其所在某一类主题的概率可能会不同或相同。即每条车辆GPS轨迹可能对应一类或多类主题。该第一主题模型用于基于输入信息的隐含关联,确定输入信息属于某一主题的概率,例如输入信息为车辆GPS轨迹时,车辆GPS轨迹中包含车辆GPS数据,该车辆GPS数据即为车辆GPS轨迹间的隐含关联。进一步的,根据输入信息属于某一主题的概率,对该输入信息进行聚类或分类。
同理,该第二主题模型可以根据预先学习到的训练结果,继续训练输入的该目标移动终端的移动终端GPS轨迹,训练出每条移动终端GPS轨迹对应的主题,并将对应主题相同的移动终端GPS轨迹划分为一类,其中,依据现有的主题模型技术,每条移动终端GPS轨迹可以同时属于不同类主题中,其所在某一类主题的概率可能会不同或相同。即每条移动终端GPS轨迹可能对应一类或多类主题。该第二主题模型与上述的第一主题模型的原理相同,在此不做赘述。
其中,需要强调的是,本发明实施例中的“第一主题模型”中的“第一”、“第二主题模型”中的“第二”以及后续提到的“第三主题模型”中的“第三”仅仅用于从命名上区分不同的主题模型,并不具有任何限定意义。
S103:根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。
其中,对于该目标车辆来说,其在第一预定时间内所对应的车辆GPS轨迹会存在多条。根据每一类车辆GPS轨迹,确定该目标车辆对应的主题。其中,可以理解的是,该目标车辆所对应的车辆GPS轨迹可能分属于不同类的主题,所对应车辆GPS轨迹属于某一主题的概率越大或者某一主题的车辆GPS轨迹占得该目标车辆所有的车辆GPS轨迹的比例越大,该目标车辆分属于该某一主题的概率越大。由于每一车辆GPS轨迹均由至少一个车辆GPS数据组成的,根据每条车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,可以为每一类主题限定具体的含义,进一步的,可以继续确定目标车辆在第一预定时间内的行为信息。可以理解的是,此处所说的行为信息可以包括该目标车辆在第一预定时间内出现在某一类场所的概率大小;或者出现在某一区域的概率大小。
同理,对于该目标移动终端来说,其在第一预定时间内所对应的移动终端GPS轨迹会存在多条。根据每一类移动终端GPS轨迹,确定该目标移动终端对应的主题。其中,可以理解的是,该目标移动终端所对应的移动终端GPS轨迹可能分属于不同类的主题,所对应移动终端GPS轨迹属于某一主题的概率越大或者某一主题的移动终端GPS轨迹占得该目标移动终端所有的移动终端GPS轨迹的比例越大,该目标移动终端分属于该某一主题的概率越大。由于每一移动终端GPS轨迹均由至少一个移动终端GPS数据组成的,根据每条移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,可以为每一类主题限定具体的含义,进一步的,可以继续确定目标移动终端在第一预定时间内的行为信息。可以理解的是,此处所说的行为信息可以包括该目标移动终端在第一预定时间内出现在某一类场所的概率大小;或者出现在某一区域的概率大小。
进一步的,根据目标车辆的行为信息以及目标移动终端的行为信息,可以确定目标车辆对应的待分析人员在第一预定时间内的行为信息,例如:结合该目标车辆在第一预定时间内出现在某一类场所的概率大小以及对应的目标移动终端在第一预定时间内出现在某一类场所的概率大小,确定待分析人员在第一预定时间内出现在某一类场所的概率大小;或者结合该目标车辆在第一预定时间内出现在某一区域的概率大小以及对应的目标移动终端在第一预定时间内出现在某一区域的概率大小,确定待分析人员在第一预定时间内出现在某一区域的概率大小。
其中,所获得的目标车辆对应的车辆GPS轨迹越多,根据该车辆GPS轨迹所确定出的目标车辆的行为信息越精确。所获得的目标移动终端对应的移动终端GPS轨迹越多,根据该移动终端GPS轨迹所确定出的目标移动终端的行为信息越精确,进一步的,所确定的待分析人员在第一预定时间内的行为信息越精确。
在一种具体实现方式中,所述GPS信息包括:定位地点对应的经纬度信息、定位地点对应的预定范围内的建筑信息或定位地点对应的环境信息;
所述根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息,包括:
根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的经纬度信息确定所述目标车辆对应的第一地域主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标车辆对应的第一建筑主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的环境信息确定所述目标车辆对应的第一环境主题;
根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的经纬度信息确定所述目标移动终端对应的第二地域主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标移动终端对应的第二建筑主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的环境信息确定所述目标移动终端对应的第二环境主题;
根据所确定的所述目标车辆对应的第一地域主题、第一建筑主题或第一环境主题,以及所确定的所述目标移动终端对应的第二地域主题、第二建筑主题或第二环境主题,确定所述待分析人员在所述第一预定时间内的行为信息。
可以依据现有技术,根据车辆GPS数据(或移动终端GPS数据)对应的GPS信息,确定车辆GPS数据(或移动终端GPS数据)对应主题的具体含义。可以理解的,当该车辆GPS数据(或移动终端GPS数据)对应的GPS信息变化时,该车辆GPS数据(或移动终端GPS数据)对应主题的具体含义也会变化,例如:当GPS信息为定位地点对应的经纬度信息时,主题模型所输出的主题类型对应为地域主题,该地域主题可以包括国家类别或省份类别等等,进一步的,分析该目标车辆(或目标移动终端)的行为信息,该行为信息可以为该目标车辆(或目标移动终端)经常活动地域范围;当GPS信息为定位地点预定范围内的建筑信息时,主题模型所输出的主题类型对应为建筑主题,该建筑主题可以包括古风建筑主题和现代建筑主题等,进一步的,分析该目标车辆(或对应的目标移动终端)对应(人员)的兴趣爱好、活动地点范围等;当GPS信息为各定位地点所处的环境信息时,主题模型所输出的主题类型可以对应为娱乐、餐饮、运动和社交等主题,进一步,分析该目标车辆(或目标移动终端)对应的行为信息,该行为信息可以包括该目标车辆(或目标移动终端)出现在某一类场所(如:娱乐、餐饮、运动和社交)的概率或活动范围等。
需要说明的是,后续的可以根据该目标车辆和对应的目标移动终端的行为信息,分析该目标车辆和目标移动终端共同对应的待分析人员的行为信息,进一步的根据待分析人员的行为信息对该待分析人员进行跟踪,可以提高对该待分析人员的跟踪的准确率。如:确定出目标车辆和目标移动终端对应的主题均为娱乐(对应为娱乐的主题的概率最大)时,可以表明该待分析人员会更频繁的出现在娱乐主题相关的某些定位地点处;在娱乐场所跟踪到该待分析人员的概率会较大。另外的,在确定该待分析人员频繁出现在某一定位地点时,可以很大概率的推测出该待分析人员进行的某种主题活动。
或者,当目标车辆和目标移动终端分别对应的概率最大(或相对较大)的主题不同,则根据一定的计算方式,确定出待分析人员对应的概率最大(或相对较大)的主题。其中,举例而言,目标车辆对应娱乐主题的概率为0.4,对应餐饮主题的概率为0.6;目标移动终端对应娱乐主题的概率为0.7,对应运动主题的概率为0.3,则根据一定的计算方式计算,确定结算结果,0.4*0.5+0.7*0.5=0.55(娱乐主题);0.6*0.5+0=0.3(餐饮主题);0+0.3*0.5=0.15(运动主题);根据上述计算结果,可以确定对应的待分析人员相对于娱乐主题的概率相对最大,可以表明该待分析人员会更频繁的出现在娱乐主题相关的某些定位地点处,在娱乐场所跟踪到该待分析人员的概率会较大。其中,0.5为人为设定或默认设定的目标车辆或目标移动终端的主题在计算过程中所占的权重值。另外,后续的再结合目标移动终端的子行为信息确定,待分析人员的的行为信息时,与上述情况类似,在此不做赘述。
可以理解的是,在根据目标车辆以及目标移动终端对应的主题,确定待分析人员的行为信息时,该目标车辆以及目标移动终端对应的主题的主题类型一般是相同的(例如,该目标车辆对应主题类型为第一地域主题时,该目标移动终端对应主题类型为第二地域主题),以能够更加准确的确定出待分析人员的行为信息。当该目标车辆以及目标移动终端对应的主题的主题类型不同时,例如:目标车辆对应主题类型为第一环境主题,而该目标移动终端对应主题类型为第二地域主题,则可以分别根据各自对应的概率最大的主题确定出各自的行为信息(在某一活动区域的概率最大或在某一类场所的概率最大),进一步确定待分析人员的行为信息(待分析人员在上述两者的交叉区域或类型最相似场所的出现概率较大)。
应用本发明实施例,利用预设的主题模型,分别对目标车辆的车辆GPS轨迹以及对应的目标移动终端的移动终端GPS轨迹进行分类,并根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。可见,根据预设的主题模型,可以确定目标车辆在第一预定时间内的车辆GPS轨迹的内在联系以及目标移动终端的移动终端GPS轨迹的内在联系,进一步地,根据车辆GPS轨迹的内在联系以及移动终端GPS轨迹的内在联系,确定所对应待分析人员在第一预定时间内的行为信息。后续的可以根据该行为信息对该待分析人员进行跟踪,可以提高对该待分析人员的跟踪的准确率。
在一种具体实现方式中,所述第一主题模型和第二主题模型均为隐含狄利克雷分布LDA模型;所述第一主题模型包括第一GPS数据、第一主题和第一GPS轨迹三层结构,所述第二主题模型包括第二GPS数据、第二主题和第二GPS轨迹三层结构;
其中,该第一主题模型的建立和第二主题模型的建立可以同时进行,也可以分开进行,当分开进行时,本发明实施例并不对该第一主题模型的建立和第二主题模型的建立对应的顺序进行限定。如图3所示,为该第一主题模型的建立和第二主题模型的建立可以同时进行的示例,所述方法还包括建立主题模型的过程,所述过程包括:
S301:获得多个样本车辆在第二预定时间内的第一GPS数据,以及所述样本车辆对应的多个样本移动终端的第二GPS数据,其中,所述第一GPS数据包括对应样本车辆的第一样本标识,所述第二GPS数据包括对应样本移动终端的第二样本标识;
S302:从该第一GPS数据中,确定每个第一样本标识对应的第一GPS数据,并从所述第二GPS数据中,确定每个第二样本标识对应的第二GPS数据;
S303:根据预设的轨迹划分规则以及对应同一个第一样本标识的第一GPS数据,确定所对应的样本车辆的第一GPS轨迹,并根据所述轨迹划分规则以及对应同一个第二样本标识的第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹;
S304:分别进行LDA学习,获得每个第一GPS数据与第一主题的对应关系,以及第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系,并获得每个第二GPS数据与第二主题的对应关系,以及第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系;
所述获得所述第一主题模型输出的每条车辆GPS轨迹对应的第一主题,包括:
所述第一主题模型针对输入的每条第一GPS轨迹所包含的第一GPS数据,根据每个第一GPS数据与第一主题的对应关系确定车辆GPS数据对应的第一主题,并根据第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系确定车辆GPS轨迹的第一主题输出;
获得所输出的每条第一GPS轨迹的第一主题;
所述获得所述第二主题模型输出的每条所述目标移动终端的移动终端GPS轨迹对应的第二主题,包括:
所述第二主题模型针对输入的每条第二GPS轨迹所包含的第二GPS数据,根据每个第二GPS数据与第二主题的对应关系确定所述目标移动终端的移动终端GPS数据对应的第二主题,并根据第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系确定所述目标移动终端的移动终端GPS轨迹的第二主题输出;
获得所输出的每条第二GPS轨迹的第二主题。
该第一主题模型中包括第一GPS数据、第一主题和第一GPS轨迹三层结构其中的对应关系可以表示为第一GPS数据-第一主题、第一主题-第一GPS轨迹以及第一GPS数据-第一GPS轨迹。该第二主题模型包括第二GPS数据、第二主题和第二GPS轨迹三层结构,其中的对应关系可以表示为第二GPS数据-第二主题、第二主题-第二GPS轨迹以及第二GPS数据-第二GPS轨迹。可以理解的是,每条第一GPS轨迹(或第二GPS轨迹)均为至少一个第一GPS数据(或第二GPS数据)组成,通过第一GPS数据(或第二GPS数据)对应的主题可以确定第一GPS轨迹(或第二GPS轨迹)对应的主题。其中,需要强调的是,本发明实施例中的“第一主题”中的“第一”以及“第二主题”中的“第二”仅仅用于从命名上区分不同的主题,并不具有任何限定意义。同理,本发明实施例中的“第一GPS数据”、“第一GPS轨迹”中的“第一”以及“第二GPS数据”、“第二GPS轨迹”中的“第二”仅仅用于从命名上区分不同的GPS数据、GPS轨迹,并不具有任何限定意义。
下面以样本车辆对应的第一GPS数据、第一主题和第一GPS轨迹进行说明:
获得在第二预定时间内的每个样本车辆的第一GPS数据,并且根据预设的轨迹划分规则以及每个样本车辆的第一GPS数据,确定出每个样本车辆对应的第一GPS轨迹后,对第一GPS轨迹进行LDA学习,即开始训练该第一GPS轨迹。其中,可以理解的是,第一GPS数据-第一GPS轨迹的对应关系是确定的,即第一GPS数据属于某一第一GPS轨迹的概率,并且,某一第一GPS轨迹存在某一第一GPS数据的概率是确定的。可以预先设置预定数量个第一主题,如第一主题1、第一主题2……第一主题N-1、第一主题N。与现有技术相同,LDA模型首先随机为第一GPS数据-第一主题以及第一主题-第一GPS轨迹进行赋值,并不断重复该赋值的过程。直到第一GPS数据-第一主题以及第一主题-第一GPS轨迹对应的数值收敛到某一结果后,不再变化,输出第一GPS数据-第一主题以及第一主题-第一GPS轨迹对应的收敛结果。该输出的收敛结果即为每个第一GPS数据与第一主题的对应关系,以及第一GPS数据的第一主题与第一GPS轨迹的主题间的第一转换关系,获得上述信息,该第一主题模型建立完成。
进一步的,在对目标车辆的车辆GPS轨迹进行训练时,根据上述输出的每个第一GPS数据与第一主题的对应关系,以及第一GPS数据的第一主题与第一GPS轨迹的主题间的第一转换关系,确定目标车辆对应的每条车辆GPS轨迹的第一主题。
具体的,样本移动终端对应的第二GPS数据、第二主题和第二GPS轨迹的LDA学习过程与样本车辆对应的第一GPS数据、第一主题和第一GPS轨迹的LDA学习过程相同,即第二主题模型与第一主题模型的建立过程相同,在此不做赘述。
其中,所述第二预定时间可以与第一预定时间相同,或不同,或可以有重合部分。
在一种具体实现方式中,所述第一GPS数据包含第一起始地点标识及对应的第一起始定位时间和第一终止地点标识及对应的第一终止定位时间,所述第二GPS数据包含第二起始地点标识及对应的第二起始定位时间和第二终止地点标识及对应的第二终止定位时间;
所述根据预设的轨迹划分规则以及对应同一个第一样本标识的第一GPS数据,确定所对应的样本车辆的第一GPS轨迹,包括:
按照所对应的第一起始定位时间的先后顺序,排序所述第一GPS数据;
对每两个相邻的第一GPS数据,依据排序在前的第一GPS数据所对应的第一终止定位时间以及排序在后的第一GPS数据所对应的第一起始定位时间,确定每两个相邻的第一GPS数据的第三时间差;
当所述第三时间差超过预设的第二轨迹划分时间阈值时,将所对应的两个相邻的第一GPS数据作为第三轨迹划分界限,其中,第一起始定位时间在前的第一GPS数据对应的第一终止地点标识为前一个第一GPS轨迹终点,第一起始定位时间在后的第一GPS数据对应的第一起始地点标识为后一个第一GPS轨迹起点;
根据所述第三轨迹划分界限以及所述第一GPS数据,确定所对应的样本车辆的第一GPS轨迹;
所述根据所述轨迹划分规则以及对应同一个第二样本标识的第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹,包括:
按照所对应的第二起始定位时间的先后顺序,排序所述第二GPS数据;
对每两个相邻的第二GPS数据,依据排序在前的第二GPS数据所对应的第二终止定位时间以及排序在后的第二GPS数据所对应的第二起始定位时间,确定每两个相邻的第二GPS数据的第四时间差;
当所述第四时间差超过所述第二轨迹划分时间阈值时,将所对应的两个相邻的第二GPS数据作为第四轨迹划分界限,其中,第二起始定位时间在前的第二GPS数据对应的第二终止地点标识为前一个第二GPS轨迹终点,第二起始定位时间在后的移动终端GPS数据对应的第二起始地点标识为后一个第二GPS轨迹起点;
根据所述第四轨迹划分界限以及所述第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹。
可以理解的是,针对样本车辆(样本移动终端)的第一GPS轨迹(第二GPS轨迹)的划分与目标车辆(目标移动终端)的车辆GPS轨迹(移动终端GPS轨迹)的划分相同,在此不做赘述。其中,所获得第一GPS数据中包含对应样本车辆的标识信息,并且,所获得第二GPS数据中包含对应样本移动终端的标识信息,以避免在划分轨迹时出现差错。其中,可以按照所对应的第一起始定位时间的先后顺序,排序第一GPS数据,还可以按照所对应的第一终止定位时间的先后顺序,排序第一GPS数据,这也是可以的。
在一种具体实现方式中,所述方法还包括:
获得所述目标移动终端在所述第一预定时间内的终端交互数据,其中,所述终端交互数据包括日志交互数据和应用程序信息,其中,所述日志交互数据用于标识所述目标移动终端中各应用程序标识对应的应用信息的使用频率;
依据预设的第三主题模型,对所获得的终端交互数据,进行分类;
根据每一类终端交互数据以及所对应的应用程序信息,确定所述目标移动终端在所述第一预定时间内的子行为信息;
所述根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息,包括;
根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,以及所述子行为信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。
一般情况下,该目标移动终端的持有者为目标车辆的车主,该车主即为本发明实施例所述的待分析人员。对该待分析人员的行为分析,还可以借助该目标移动终端的终端交互数据。可以理解的,该终端交互数据可以在一定程度上反映出待分析人员的兴趣爱好。可以依据预设的第三主题模型,对该终端交互数据进行分类,进一步的,根据每一类终端交互数据以及所对应的应用程序标识,确定该目标移动终端在第一预定时间内的子行为信息。再结合上述的目标车辆的车辆GPS轨迹以及目标移动终端的移动终端GPS轨迹,进一步分析待分析人员的行为信息。
其中,该依据预设的第三主题模型,对该终端交互数据进行分类,与上述的依据第一主题模型对目标车辆的车辆GPS轨迹进行分类以及依据第二主题模型对目标移动终端的移动终端GPS轨迹进行分类的原理相同,在此不做赘述。
该应用程序信息中包括所对应应用程序的标识信息以及分类信息,再结合日志交互数据(用于标识目标移动终端中各应用程序信息对应的应用程序的使用频率),确定目标移动终端在第一预定时间内的子行为信息(针对某一类应用程序的使用信息),进一步的,可以确定出该待分析人员的某一类应用程序的感兴趣程度。
相应于上述方法实施例,本发明实施例还提供了一种数据分析装置,如图4所示,所述装置可以包括:
第一获得模块410,用于获得目标车辆在第一预定时间内的车辆全球定位系统GPS轨迹,以及所述目标车辆对应的目标移动终端的移动终端GPS轨迹,其中,所述车辆GPS轨迹包括所述目标车辆所定位的车辆GPS数据,所述移动终端GPS轨迹包括所述目标移动终端所定位的移动终端GPS数据;
第一分类模块420,用于依据预设的第一主题模型,对该目标车辆的车辆GPS轨迹进行分类,并且依据预设的第二主题模型,对该目标移动终端的移动终端GPS轨迹进行分类;
第一确定模块430,用于根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。
应用本发明实施例,利用预设的主题模型,分别对目标车辆的车辆GPS轨迹以及对应的目标移动终端的移动终端GPS轨迹进行分类,并根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。可见,根据预设的主题模型,可以确定目标车辆在第一预定时间内的车辆GPS轨迹的内在联系以及目标移动终端的移动终端GPS轨迹的内在联系,进一步地,根据车辆GPS轨迹的内在联系以及移动终端GPS轨迹的内在联系,确定所对应待分析人员在第一预定时间内的行为信息。后续的可以根据该行为信息对该待分析人员进行跟踪,可以提高对该待分析人员的跟踪的准确率。
在一种具体实现方式中,所述第一获得模块410包括:第一获得单元、第一确定单元和第二确定单元;
所述第一获得单元,用于获得所述第一预定时间内所述目标车辆的车载设备收集的所述车辆GPS数据,以及所述目标车辆对应的多个移动终端收集的移动终端GPS数据;
所述第一确定单元,用于根据预设的第一轨迹划分规则以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹,并根据所述第一轨迹划分规则以及多个移动终端收集的移动终端GPS数据,确定每个移动终端的移动终端GPS轨迹;
所述第二确定单元,用于对比所述车辆GPS轨迹以及每个移动终端的移动终端GPS轨迹,确定与所述目标车辆对应的目标移动终端以及该目标移动终端的移动终端GPS轨迹,其中,所述目标移动终端的移动终端GPS轨迹与所述车辆GPS轨迹相似度最高。
在一种具体实现方式中,所述第一分类模块420包括第一输入单元、第二获得单元、第一划分单元、第二输入单元、第三获得单元和第二划分单元;
所述第一输入单元,用于将所述目标车辆的车辆GPS轨迹输入所述第一主题模型;
所述第二获得单元,用于获得所述第一主题模型输出的每条车辆GPS轨迹对应的第一主题;
所述第一划分单元,用于将第一主题相同的车辆GPS轨迹划分为一类;
所述第二输入单元,用于将所述目标移动终端的移动终端GPS轨迹输入所述第二主题模型;
所述第三获得单元,用于获得所述所述第二主题模型输出的每条所述目标移动终端的移动终端GPS轨迹对应的第二主题;
所述第二划分单元,用于将第二主题相同的所述目标移动终端的移动终端GPS轨迹划分为一类。
在一种具体实现方式中,所述第一主题模型和第二主题模型均为隐含狄利克雷分布LDA模型;所述第一主题模型包括第一GPS数据、第一主题和第一GPS轨迹三层结构,所述第二主题模型包括第二GPS数据、第二主题和第二GPS轨迹三层结构;
如图5所示,所述装置还可以包括用于建立主题模型的主题模型建立模块,所述主题模型建立模块包括第四获得单元510、第三确定单元520、第四确定单元530和第五获得单元540;
所述第四获得单元510,用于获得多个样本车辆在第二预定时间内的第一GPS数据,以及所述样本车辆对应的多个样本移动终端的第二GPS数据,其中,所述第一GPS数据包括对应样本车辆的第一样本标识,所述第二GPS数据包括对应样本移动终端的第二样本标识;
所述第三确定单元520,用于从所述第一GPS数据中,确定每个第一样本标识对应的第一GPS数据,并从所述第二GPS数据中,确定每个第二样本标识对应的第二GPS数据;
所述第四确定单元530,用于根据预设的轨迹划分规则以及对应同一个第一样本标识的第一GPS数据,确定所对应的样本车辆的第一GPS轨迹,并根据所述轨迹划分规则以及对应同一个第二样本标识的第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹;
所述第五获得单元540,用于分别进行LDA学习,获得每个第一GPS数据与第一主题的对应关系,以及第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系,并获得每个第二GPS数据与第二主题的对应关系,以及第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系;
所述第二获得单元,具体用于所述第一主题模型针对输入的每条第一GPS轨迹所包含的第一GPS数据,根据每个第一GPS数据与第一主题的对应关系确定车辆GPS数据对应的第一主题,并根据第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系确定车辆GPS轨迹的第一主题输出;
获得所输出的每条第一GPS轨迹的第一主题;
所述第三获得单元,具体用于所述第二主题模型针对输入的每条第二GPS轨迹所包含的第二GPS数据,根据每个第二GPS数据与第二主题的对应关系确定所述目标移动终端的移动终端GPS数据对应的第二主题,并根据第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系确定所述目标移动终端的移动终端GPS轨迹的第二主题输出;
获得所输出的每条第二GPS轨迹的第二主题。
在一种具体实现方式中,所所述车辆GPS数据包含车辆起始地点标识及对应的车辆起始定位时间和车辆终止地点标识及对应的车辆终止定位时间,所述目标移动终端GPS数据包含终端起始地点标识及对应的终端起始定位时间和终端终止地点标识及对应的终端终止定位时间;
如图6所示,所述第一确定单元包括:第一排序子模块610、第一确定子模块620、第二确定子模块630和第三确定子模块640;
所述第一排序子模块610,用于按照所对应的车辆起始定位时间的先后顺序,排序所述车辆GPS数据;
所述第一确定子模块620,用于对每两个相邻的车辆GPS数据,依据排序在前的车辆GPS数据所对应的车辆终止定位时间以及排序在后的车辆GPS数据所对应的车辆起始定位时间,确定每两个相邻的车辆GPS数据的第一时间差;
所述第二确定子模块630,用于当所述第一时间差超过预设的第一轨迹划分时间阈值时,将所对应的两个相邻的车辆GPS数据确定为第一轨迹划分界限,其中,车辆起始定位时间在前的车辆GPS数据对应的车辆终止地点标识为前一个车辆GPS轨迹终点,车辆起始定位时间在后的车辆GPS数据对应的车辆起始地点标识为后一个车辆GPS轨迹起点;
所述第三确定子模块640,用于根据所述第一轨迹划分界限以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹;
所述第一排序子模块610,还用于按照所对应的终端起始定位时间的先后顺序,排序所述移动终端GPS数据;
所述第一确定子模块620,还用于对每两个相邻的移动终端GPS数据,依据排序在前的移动终端GPS数据所对应的终端终止定位时间以及排序在后的移动终端GPS数据所对应的终端起始定位时间,确定每两个相邻的移动终端GPS数据的第二时间差;
所述第二确定子模块630,还用于当所述第二时间差超过所述第一轨迹划分时间阈值时,将所对应的两个相邻的移动终端GPS数据确定为第二轨迹划分界限,其中,终端起始定位时间在前的移动终端GPS数据对应的终端终止地点标识为前一个移动终端GPS轨迹终点,终端起始定位时间在后的移动终端GPS数据对应的终端起始地点标识为后一个移动终端GPS轨迹起点;
所述第三确定子模块640,还用于根据所述第二轨迹划分界限以及所述移动终端GPS数据,确定所述目标车辆的每个移动终端GPS轨迹。
在一种具体实现方式中,所述第一GPS数据包含第一起始地点标识及对应的第一起始定位时间和第一终止地点标识及对应的第一终止定位时间,所述第二GPS数据包含第二起始地点标识及对应的第二起始定位时间和第二终止地点标识及对应的第二终止定位时间;
所述第四确定单元包括:第二排序子模块、第四确定子模块、第五确定子模块和第六确定子模块;
所述第二排序子模块,用于按照所对应的第一起始定位时间的先后顺序,排序所述第一GPS数据;
所述第四确定子模块,用于对每两个相邻的第一GPS数据,依据排序在前的第一GPS数据所对应的第一终止定位时间以及排序在后的第一GPS数据所对应的第一起始定位时间,确定每两个相邻的第一GPS数据的第三时间差;
所述第五确定子模块,用于当所述第三时间差超过预设的第二轨迹划分时间阈值时,将所对应的两个相邻的第一GPS数据作为第三轨迹划分界限,其中,第一起始定位时间在前的第一GPS数据对应的第一终止地点标识为前一个第一GPS轨迹终点,第一起始定位时间在后的第一GPS数据对应的第一起始地点标识为后一个第一GPS轨迹起点;
所述第六确定子模块,用于根据所述第三轨迹划分界限以及所述第一GPS数据,确定所对应的样本车辆的第一GPS轨迹;
所述第二排序子模块,还用于按照所对应的第二起始定位时间的先后顺序,排序所述第二GPS数据;
所述第四确定子模块,还用于对每两个相邻的第二GPS数据,依据排序在前的第二GPS数据所对应的第二终止定位时间以及排序在后的第二GPS数据所对应的第二起始定位时间,确定每两个相邻的第二GPS数据的第四时间差;
所述第五确定子模块,还用于当所述第四时间差超过所述第二轨迹划分时间阈值时,将所对应的两个相邻的第二GPS数据作为第四轨迹划分界限,其中,第二起始定位时间在前的第二GPS数据对应的第二终止地点标识为前一个第二GPS轨迹终点,第二起始定位时间在后的移动终端GPS数据对应的第二起始地点标识为后一个第二GPS轨迹起点;
所述第六确定子模块,还用于根据所述第四轨迹划分界限以及所述第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹。
在一种具体实现方式中,所述装置还可以包括第二获得模块、第二分类模块和第二确定模块;
所述第二获得模块,用于获得所述目标移动终端在所述第一预定时间内的终端交互数据,其中,所述终端交互数据包括日志交互数据和应用程序信息,其中,所述日志交互数据用于标识所述目标移动终端中各应用程序信息对应的应用程序的使用频率;
所述第二分类模块,用于依据预设的第三主题模型,对所获得的终端交互数据,进行分类;
所述第二确定模块,用于根据每一类终端交互数据以及所对应的应用程序信息,确定所述目标移动终端在所述第一预定时间内的子行为信息;
所述第一确定模块,具体用于根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,以及所述子行为信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。
在一种具体实现方式中,所述GPS信息包括:定位地点对应的经纬度信息、定位地点对应的预定范围内的建筑信息或定位地点对应的环境信息;
所述第一确定模块,具体用于根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的经纬度信息确定所述目标车辆对应的第一地域主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标车辆对应的第一建筑主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的环境信息确定所述目标车辆对应的第一环境主题;
根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的经纬度信息确定所述目标移动终端对应的第二地域主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标移动终端对应的第二建筑主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的环境信息确定所述目标移动终端对应的第二环境主题;
根据所确定的所述目标车辆对应的第一地域主题、第一建筑主题或第一环境主题,以及所确定的所述目标移动终端对应的第二地域主题、第二建筑主题或第二环境主题,确定所述待分析人员在所述第一预定时间内的行为信息。
对于系统/装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (16)
1.一种数据分析方法,其特征在于,所述方法包括:
获得目标车辆在第一预定时间内的车辆全球定位系统GPS轨迹,以及所述目标车辆对应的目标移动终端的移动终端GPS轨迹,其中,所述车辆GPS轨迹包括所述目标车辆所定位的车辆GPS数据,所述移动终端GPS轨迹包括所述目标移动终端所定位的移动终端GPS数据;
依据预设的第一主题模型,对该目标车辆的车辆GPS轨迹进行分类,并且依据预设的第二主题模型,对该目标移动终端的移动终端GPS轨迹进行分类;
根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息;
所述目标车辆的车辆GPS轨迹对应多类主题,所述预设的第一主题模型的分类结果包括所述目标车辆的车辆GPS轨迹主题类别的概率;该目标移动终端的移动终端GPS轨迹对应多类主题;所述预设的第二主题模型的分类结果包括所述目标移动终端的移动终端GPS轨迹主题类别的概率;
所述根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息,包括:
在所述目标车辆的车辆GPS轨迹主题类别和所述目标移动终端的移动终端GPS轨迹主题类别不同的情况下,根据一定的计算方式,对所述目标车辆的车辆GPS轨迹主题类别的概率和所述目标移动终端的移动终端GPS轨迹主题类别的概率进行计算,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。
2.根据权利要求1所述的方法,其特征在于,所述获得目标车辆在第一预定时间内的车辆全球定位系统GPS轨迹,以及所述目标车辆对应的目标移动终端的移动终端GPS轨迹,包括:
获得所述第一预定时间内所述目标车辆的车载设备收集的所述车辆GPS数据,以及所述目标车辆对应的多个移动终端收集的移动终端GPS数据;
根据预设的第一轨迹划分规则以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹,并根据所述第一轨迹划分规则以及多个移动终端收集的移动终端GPS数据,确定每个移动终端的移动终端GPS轨迹;
对比所述车辆GPS轨迹以及每个移动终端的移动终端GPS轨迹,确定与所述目标车辆对应的目标移动终端以及该目标移动终端的移动终端GPS轨迹,其中,所述目标移动终端的移动终端GPS轨迹与所述车辆GPS轨迹相似度最高。
3.根据权利要求1所述的方法,其特征在于,所述依据预设的第一主题模型,对该目标车辆的车辆GPS轨迹进行分类,并且依据预设的第二主题模型,对该目标移动终端的移动终端GPS轨迹进行分类,包括:
将所述目标车辆的车辆GPS轨迹输入所述第一主题模型;
获得所述第一主题模型输出的每条车辆GPS轨迹对应的第一主题;
将第一主题相同的车辆GPS轨迹划分为一类;
将所述目标移动终端的移动终端GPS轨迹输入所述第二主题模型;
获得所述第二主题模型输出的每条所述目标移动终端的移动终端GPS轨迹对应的第二主题;
将第二主题相同的所述目标移动终端的移动终端GPS轨迹划分为一类。
4.根据权利要求3所述的方法,其特征在于,所述第一主题模型和第二主题模型均为隐含狄利克雷分布LDA模型;所述第一主题模型包括第一GPS数据、第一主题和第一GPS轨迹三层结构,所述第二主题模型包括第二GPS数据、第二主题和第二GPS轨迹三层结构;
所述方法还包括建立主题模型的过程,所述过程包括:
获得多个样本车辆在第二预定时间内的第一GPS数据,以及所述样本车辆对应的多个样本移动终端的第二GPS数据,其中,所述第一GPS数据包括对应样本车辆的第一样本标识,所述第二GPS数据包括对应样本移动终端的第二样本标识;
从所述第一GPS数据中,确定每个第一样本标识对应的第一GPS数据,并从所述第二GPS数据中,确定每个第二样本标识对应的第二GPS数据;
根据预设的轨迹划分规则以及对应同一个第一样本标识的第一GPS数据,确定所对应的样本车辆的第一GPS轨迹,并根据所述轨迹划分规则以及对应同一个第二样本标识的第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹;
分别进行LDA学习,获得每个第一GPS数据与第一主题的对应关系,以及第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系,并获得每个第二GPS数据与第二主题的对应关系,以及第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系;
所述获得所述第一主题模型输出的每条车辆GPS轨迹对应的第一主题,包括:
所述第一主题模型针对输入的每条第一GPS轨迹所包含的第一GPS数据,根据每个第一GPS数据与第一主题的对应关系确定车辆GPS数据对应的第一主题,并根据第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系确定车辆GPS轨迹的第一主题输出;
获得所输出的每条第一GPS轨迹的第一主题;
所述获得所述第二主题模型输出的每条所述目标移动终端的移动终端GPS轨迹对应的第二主题,包括:
所述第二主题模型针对输入的每条第二GPS轨迹所包含的第二GPS数据,根据每个第二GPS数据与第二主题的对应关系确定所述目标移动终端的移动终端GPS数据对应的第二主题,并根据第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系确定所述目标移动终端的移动终端GPS轨迹的第二主题输出;
获得所输出的每条第二GPS轨迹的第二主题。
5.根据权利要求2所述的方法,其特征在于,所述车辆GPS数据包含车辆起始地点标识及对应的车辆起始定位时间和车辆终止地点标识及对应的车辆终止定位时间,所述目标移动终端GPS数据包含终端起始地点标识及对应的终端起始定位时间和终端终止地点标识及对应的终端终止定位时间;
所述根据预设的第一轨迹划分规则以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹,包括:
按照所对应的车辆起始定位时间的先后顺序,排序所述车辆GPS数据;
对每两个相邻的车辆GPS数据,依据排序在前的车辆GPS数据所对应的车辆终止定位时间以及排序在后的车辆GPS数据所对应的车辆起始定位时间,确定每两个相邻的车辆GPS数据的第一时间差;
当所述第一时间差超过预设的第一轨迹划分时间阈值时,将所对应的两个相邻的车辆GPS数据确定为第一轨迹划分界限,其中,车辆起始定位时间在前的车辆GPS数据对应的车辆终止地点标识为前一个车辆GPS轨迹终点,车辆起始定位时间在后的车辆GPS数据对应的车辆起始地点标识为后一个车辆GPS轨迹起点;
根据所述第一轨迹划分界限以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹;
所述根据所述第一轨迹划分规则以及多个移动终端收集的移动终端GPS数据,确定每个移动终端的移动终端GPS轨迹,包括:
按照所对应的终端起始定位时间的先后顺序,排序所述移动终端GPS数据;
对每两个相邻的移动终端GPS数据,依据排序在前的移动终端GPS数据所对应的终端终止定位时间以及排序在后的移动终端GPS数据所对应的终端起始定位时间,确定每两个相邻的移动终端GPS数据的第二时间差;
当所述第二时间差超过所述第一轨迹划分时间阈值时,将所对应的两个相邻的移动终端GPS数据确定为第二轨迹划分界限,其中,终端起始定位时间在前的移动终端GPS数据对应的终端终止地点标识为前一个移动终端GPS轨迹终点,终端起始定位时间在后的移动终端GPS数据对应的终端起始地点标识为后一个移动终端GPS轨迹起点;
根据所述第二轨迹划分界限以及所述移动终端GPS数据,确定所述目标车辆的每个移动终端GPS轨迹。
6.根据权利要求4所述的方法,其特征在于,所述第一GPS数据包含第一起始地点标识及对应的第一起始定位时间和第一终止地点标识及对应的第一终止定位时间,所述第二GPS数据包含第二起始地点标识及对应的第二起始定位时间和第二终止地点标识及对应的第二终止定位时间;
所述根据预设的轨迹划分规则以及对应同一个第一样本标识的第一GPS数据,确定所对应的样本车辆的第一GPS轨迹,包括:
按照所对应的第一起始定位时间的先后顺序,排序所述第一GPS数据;
对每两个相邻的第一GPS数据,依据排序在前的第一GPS数据所对应的第一终止定位时间以及排序在后的第一GPS数据所对应的第一起始定位时间,确定每两个相邻的第一GPS数据的第三时间差;
当所述第三时间差超过预设的第二轨迹划分时间阈值时,将所对应的两个相邻的第一GPS数据作为第三轨迹划分界限,其中,第一起始定位时间在前的第一GPS数据对应的第一终止地点标识为前一个第一GPS轨迹终点,第一起始定位时间在后的第一GPS数据对应的第一起始地点标识为后一个第一GPS轨迹起点;
根据所述第三轨迹划分界限以及所述第一GPS数据,确定所对应的样本车辆的第一GPS轨迹;
所述根据所述轨迹划分规则以及对应同一个第二样本标识的第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹,包括:
按照所对应的第二起始定位时间的先后顺序,排序所述第二GPS数据;
对每两个相邻的第二GPS数据,依据排序在前的第二GPS数据所对应的第二终止定位时间以及排序在后的第二GPS数据所对应的第二起始定位时间,确定每两个相邻的第二GPS数据的第四时间差;
当所述第四时间差超过所述第二轨迹划分时间阈值时,将所对应的两个相邻的第二GPS数据作为第四轨迹划分界限,其中,第二起始定位时间在前的第二GPS数据对应的第二终止地点标识为前一个第二GPS轨迹终点,第二起始定位时间在后的移动终端GPS数据对应的第二起始地点标识为后一个第二GPS轨迹起点;
根据所述第四轨迹划分界限以及所述第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
获得所述目标移动终端在所述第一预定时间内的终端交互数据,其中,所述终端交互数据包括日志交互数据和应用程序信息,其中,所述日志交互数据用于标识所述目标移动终端中各应用程序信息对应的应用程序的使用频率;
依据预设的第三主题模型,对所获得的终端交互数据,进行分类;
根据每一类终端交互数据以及所对应的应用程序信息,确定所述目标移动终端在所述第一预定时间内的子行为信息;
所述根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息,包括;
根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,以及所述子行为信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。
8.根据权利要求1-6任一项所述的方法,其特征在于,所述GPS信息包括:定位地点对应的经纬度信息、定位地点对应的预定范围内的建筑信息或定位地点对应的环境信息;
所述根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息,包括:
根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的经纬度信息确定所述目标车辆对应的第一地域主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标车辆对应的第一建筑主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的环境信息确定所述目标车辆对应的第一环境主题;
根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的经纬度信息确定所述目标移动终端对应的第二地域主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标移动终端对应的第二建筑主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的环境信息确定所述目标移动终端对应的第二环境主题;
根据所确定的所述目标车辆对应的第一地域主题、第一建筑主题或第一环境主题,以及所确定的所述目标移动终端对应的第二地域主题、第二建筑主题或第二环境主题,确定所述待分析人员在所述第一预定时间内的行为信息。
9.一种数据分析装置,其特征在于,所述装置包括:
第一获得模块,用于获得目标车辆在第一预定时间内的车辆全球定位系统GPS轨迹,以及所述目标车辆对应的目标移动终端的移动终端GPS轨迹,其中,所述车辆GPS轨迹包括所述目标车辆所定位的车辆GPS数据,所述移动终端GPS轨迹包括所述目标移动终端所定位的移动终端GPS数据;
第一分类模块,用于依据预设的第一主题模型,对该目标车辆的车辆GPS轨迹进行分类,并且依据预设的第二主题模型,对该目标移动终端的移动终端GPS轨迹进行分类;其中,所述目标车辆的车辆GPS轨迹对应多类主题,所述预设的第一主题模型的分类结果包括所述目标车辆的车辆GPS轨迹主题类别的概率;该目标移动终端的移动终端GPS轨迹对应多类主题;所述预设的第二主题模型的分类结果包括所述目标移动终端的移动终端GPS轨迹主题类别的概率;
第一确定模块,用于根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,以及每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息;
所述第一确定模块具体用于:
在所述目标车辆的车辆GPS轨迹主题类别和所述目标移动终端的移动终端GPS轨迹主题类别不同的情况下,根据一定的计算方式,对所述目标车辆的车辆GPS轨迹主题类别的概率和所述目标移动终端的移动终端GPS轨迹主题类别的概率进行计算,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。
10.根据权利要求9所述的装置,其特征在于,所述第一获得模块包括:第一获得单元、第一确定单元和第二确定单元;
所述第一获得单元,用于获得所述第一预定时间内所述目标车辆的车载设备收集的所述车辆GPS数据,以及所述目标车辆对应的多个移动终端收集的移动终端GPS数据;
所述第一确定单元,用于根据预设的第一轨迹划分规则以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹,并根据所述第一轨迹划分规则以及多个移动终端收集的移动终端GPS数据,确定每个移动终端的移动终端GPS轨迹;
所述第二确定单元,用于对比所述车辆GPS轨迹以及每个移动终端的移动终端GPS轨迹,确定与所述目标车辆对应的目标移动终端以及该目标移动终端的移动终端GPS轨迹,其中,所述目标移动终端的移动终端GPS轨迹与所述车辆GPS轨迹相似度最高。
11.根据权利要求9所述的装置,其特征在于,所述第一分类模块包括第一输入单元、第二获得单元、第一划分单元、第二输入单元、第三获得单元和第二划分单元;
所述第一输入单元,用于将所述目标车辆的车辆GPS轨迹输入所述第一主题模型;
所述第二获得单元,用于获得所述第一主题模型输出的每条车辆GPS轨迹对应的第一主题;
所述第一划分单元,用于将第一主题相同的车辆GPS轨迹划分为一类;
所述第二输入单元,用于将所述目标移动终端的移动终端GPS轨迹输入所述第二主题模型;
所述第三获得单元,用于获得所述第二主题模型输出的每条所述目标移动终端的移动终端GPS轨迹对应的第二主题;
所述第二划分单元,用于将第二主题相同的所述目标移动终端的移动终端GPS轨迹划分为一类。
12.根据权利要求11所述的装置,其特征在于,所述第一主题模型和第二主题模型均为隐含狄利克雷分布LDA模型;所述第一主题模型包括第一GPS数据、第一主题和第一GPS轨迹三层结构,所述第二主题模型包括第二GPS数据、第二主题和第二GPS轨迹三层结构;
所述装置还包括用于建立主题模型的主题模型建立模块,所述主题模型建立模块包括第四获得单元、第三确定单元、第四确定单元和第五获得单元;
所述第四获得单元,用于获得多个样本车辆在第二预定时间内的第一GPS数据,以及所述样本车辆对应的多个样本移动终端的第二GPS数据,其中,所述第一GPS数据包括对应样本车辆的第一样本标识,所述第二GPS数据包括对应样本移动终端的第二样本标识;
所述第三确定单元,用于从所述第一GPS数据中,确定每个第一样本标识对应的第一GPS数据,并从所述第二GPS数据中,确定每个第二样本标识对应的第二GPS数据;
所述第四确定单元,用于根据预设的轨迹划分规则以及对应同一个第一样本标识的第一GPS数据,确定所对应的样本车辆的第一GPS轨迹,并根据所述轨迹划分规则以及对应同一个第二样本标识的第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹;
所述第五获得单元,用于分别进行LDA学习,获得每个第一GPS数据与第一主题的对应关系,以及第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系,并获得每个第二GPS数据与第二主题的对应关系,以及第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系;
所述第二获得单元,具体用于所述第一主题模型针对输入的每条第一GPS轨迹所包含的第一GPS数据,根据每个第一GPS数据与第一主题的对应关系确定车辆GPS数据对应的第一主题,并根据第一GPS数据的第一主题与第一GPS轨迹的第一主题间的第一转换关系确定车辆GPS轨迹的第一主题输出;
获得所输出的每条第一GPS轨迹的第一主题;
所述第三获得单元,具体用于所述第二主题模型针对输入的每条第二GPS轨迹所包含的第二GPS数据,根据每个第二GPS数据与第二主题的对应关系确定所述目标移动终端的移动终端GPS数据对应的第二主题,并根据第二GPS数据的第二主题与第二GPS轨迹的第二主题间的第二转换关系确定所述目标移动终端的移动终端GPS轨迹的第二主题输出;
获得所输出的每条第二GPS轨迹的第二主题。
13.根据权利要求10所述的装置,其特征在于,所述车辆GPS数据包含车辆起始地点标识及对应的车辆起始定位时间和车辆终止地点标识及对应的车辆终止定位时间,所述目标移动终端GPS数据包含终端起始地点标识及对应的终端起始定位时间和终端终止地点标识及对应的终端终止定位时间;
所述第一确定单元包括:第一排序子模块、第一确定子模块、第二确定子模块和第三确定子模块;
所述第一排序子模块,用于按照所对应的车辆起始定位时间的先后顺序,排序所述车辆GPS数据;
所述第一确定子模块,用于对每两个相邻的车辆GPS数据,依据排序在前的车辆GPS数据所对应的车辆终止定位时间以及排序在后的车辆GPS数据所对应的车辆起始定位时间,确定每两个相邻的车辆GPS数据的第一时间差;
所述第二确定子模块,用于当所述第一时间差超过预设的第一轨迹划分时间阈值时,将所对应的两个相邻的车辆GPS数据确定为第一轨迹划分界限,其中,车辆起始定位时间在前的车辆GPS数据对应的车辆终止地点标识为前一个车辆GPS轨迹终点,车辆起始定位时间在后的车辆GPS数据对应的车辆起始地点标识为后一个车辆GPS轨迹起点;
所述第三确定子模块,用于根据所述第一轨迹划分界限以及所述车辆GPS数据,确定所述目标车辆的车辆GPS轨迹;
所述第一排序子模块,还用于按照所对应的终端起始定位时间的先后顺序,排序所述移动终端GPS数据;
所述第一确定子模块,还用于对每两个相邻的移动终端GPS数据,依据排序在前的移动终端GPS数据所对应的终端终止定位时间以及排序在后的移动终端GPS数据所对应的终端起始定位时间,确定每两个相邻的移动终端GPS数据的第二时间差;
所述第二确定子模块,还用于当所述第二时间差超过所述第一轨迹划分时间阈值时,将所对应的两个相邻的移动终端GPS数据确定为第二轨迹划分界限,其中,终端起始定位时间在前的移动终端GPS数据对应的终端终止地点标识为前一个移动终端GPS轨迹终点,终端起始定位时间在后的移动终端GPS数据对应的终端起始地点标识为后一个移动终端GPS轨迹起点;
所述第三确定子模块,还用于根据所述第二轨迹划分界限以及所述移动终端GPS数据,确定所述目标车辆的每个移动终端GPS轨迹。
14.根据权利要求12所述的装置,其特征在于,所述第一GPS数据包含第一起始地点标识及对应的第一起始定位时间和第一终止地点标识及对应的第一终止定位时间,所述第二GPS数据包含第二起始地点标识及对应的第二起始定位时间和第二终止地点标识及对应的第二终止定位时间;
所述第四确定单元包括:第二排序子模块、第四确定子模块、第五确定子模块和第六确定子模块;
所述第二排序子模块,用于按照所对应的第一起始定位时间的先后顺序,排序所述第一GPS数据;
所述第四确定子模块,用于对每两个相邻的第一GPS数据,依据排序在前的第一GPS数据所对应的第一终止定位时间以及排序在后的第一GPS数据所对应的第一起始定位时间,确定每两个相邻的第一GPS数据的第三时间差;
所述第五确定子模块,用于当所述第三时间差超过预设的第二轨迹划分时间阈值时,将所对应的两个相邻的第一GPS数据作为第三轨迹划分界限,其中,第一起始定位时间在前的第一GPS数据对应的第一终止地点标识为前一个第一GPS轨迹终点,第一起始定位时间在后的第一GPS数据对应的第一起始地点标识为后一个第一GPS轨迹起点;
所述第六确定子模块,用于根据所述第三轨迹划分界限以及所述第一GPS数据,确定所对应的样本车辆的第一GPS轨迹;
所述第二排序子模块,还用于按照所对应的第二起始定位时间的先后顺序,排序所述第二GPS数据;
所述第四确定子模块,还用于对每两个相邻的第二GPS数据,依据排序在前的第二GPS数据所对应的第二终止定位时间以及排序在后的第二GPS数据所对应的第二起始定位时间,确定每两个相邻的第二GPS数据的第四时间差;
所述第五确定子模块,还用于当所述第四时间差超过所述第二轨迹划分时间阈值时,将所对应的两个相邻的第二GPS数据作为第四轨迹划分界限,其中,第二起始定位时间在前的第二GPS数据对应的第二终止地点标识为前一个第二GPS轨迹终点,第二起始定位时间在后的移动终端GPS数据对应的第二起始地点标识为后一个第二GPS轨迹起点;
所述第六确定子模块,还用于根据所述第四轨迹划分界限以及所述第二GPS数据,确定所对应的样本移动终端的第二GPS轨迹。
15.根据权利要求9-14任一项所述的装置,其特征在于,所述装置还包括第二获得模块、第二分类模块和第二确定模块;
所述第二获得模块,用于获得所述目标移动终端在所述第一预定时间内的终端交互数据,其中,所述终端交互数据包括日志交互数据和应用程序信息,其中,所述日志交互数据用于标识所述目标移动终端中各应用程序信息对应的应用程序的使用频率;
所述第二分类模块,用于依据预设的第三主题模型,对所获得的终端交互数据,进行分类;
所述第二确定模块,用于根据每一类终端交互数据以及所对应的应用程序信息,确定所述目标移动终端在所述第一预定时间内的子行为信息;
所述第一确定模块,具体用于根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的GPS信息,每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的GPS信息,以及所述子行为信息,确定与所述目标车辆对应的待分析人员在所述第一预定时间内的行为信息。
16.根据权利要求9-14任一项所述的装置,其特征在于,所述GPS信息包括:定位地点对应的经纬度信息、定位地点对应的预定范围内的建筑信息或定位地点对应的环境信息;
所述第一确定模块,具体用于根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的经纬度信息确定所述目标车辆对应的第一地域主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标车辆对应的第一建筑主题;或,根据每一类车辆GPS轨迹和车辆GPS轨迹所包含的车辆GPS数据对应的定位地点对应的环境信息确定所述目标车辆对应的第一环境主题;
根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的经纬度信息确定所述目标移动终端对应的第二地域主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的预定范围内的建筑信息确定所述目标移动终端对应的第二建筑主题;或,根据每一类该目标移动终端的移动终端GPS轨迹和移动终端GPS轨迹所包含的移动终端GPS数据对应的定位地点对应的环境信息确定所述目标移动终端对应的第二环境主题;
根据所确定的所述目标车辆对应的第一地域主题、第一建筑主题或第一环境主题,以及所确定的所述目标移动终端对应的第二地域主题、第二建筑主题或第二环境主题,确定所述待分析人员在所述第一预定时间内的行为信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610840500.5A CN107861957B (zh) | 2016-09-22 | 2016-09-22 | 一种数据分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610840500.5A CN107861957B (zh) | 2016-09-22 | 2016-09-22 | 一种数据分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107861957A CN107861957A (zh) | 2018-03-30 |
CN107861957B true CN107861957B (zh) | 2020-10-02 |
Family
ID=61698652
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610840500.5A Active CN107861957B (zh) | 2016-09-22 | 2016-09-22 | 一种数据分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107861957B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110517500B (zh) * | 2018-05-21 | 2021-04-13 | 上海大唐移动通信设备有限公司 | 一种人车关联处理方法及装置 |
CN108985488A (zh) * | 2018-06-06 | 2018-12-11 | 福建工程学院 | 个体出行目的地预测的方法 |
CN109151186B (zh) * | 2018-08-01 | 2021-05-11 | Oppo广东移动通信有限公司 | 主题切换方法和装置、电子设备、计算机可读存储介质 |
CN109086834B (zh) * | 2018-08-23 | 2021-03-02 | 北京三快在线科技有限公司 | 字符识别方法、装置、电子设备及存储介质 |
CN109783597B (zh) * | 2019-01-29 | 2020-12-29 | 江苏满运软件科技有限公司 | 确定司机固定位置的方法、装置、电子设备、存储介质 |
CN111696343B (zh) * | 2019-03-12 | 2022-04-05 | 北京嘀嘀无限科技发展有限公司 | 一种轨迹数据处理方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104064051A (zh) * | 2014-06-23 | 2014-09-24 | 银江股份有限公司 | 一种乘客便携移动终端与所乘公交车辆定位信息动态匹配方法 |
CN105183800A (zh) * | 2015-08-25 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | 信息预测的方法和装置 |
CN105225476A (zh) * | 2014-06-10 | 2016-01-06 | 浙江宇视科技有限公司 | 一种车辆轨迹的生成、聚合方法和装置 |
CN105427602A (zh) * | 2015-12-16 | 2016-03-23 | 浙江宇视科技有限公司 | 一种车辆出行主题确定方法及装置 |
CN105469599A (zh) * | 2015-12-01 | 2016-04-06 | 上海交通大学 | 车辆轨迹跟踪和车辆行为预测方法 |
CN105513395A (zh) * | 2015-11-30 | 2016-04-20 | 华南理工大学 | 一种基于车辆目的地预测的智能信息推送系统和方法 |
-
2016
- 2016-09-22 CN CN201610840500.5A patent/CN107861957B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105225476A (zh) * | 2014-06-10 | 2016-01-06 | 浙江宇视科技有限公司 | 一种车辆轨迹的生成、聚合方法和装置 |
CN104064051A (zh) * | 2014-06-23 | 2014-09-24 | 银江股份有限公司 | 一种乘客便携移动终端与所乘公交车辆定位信息动态匹配方法 |
CN105183800A (zh) * | 2015-08-25 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | 信息预测的方法和装置 |
CN105513395A (zh) * | 2015-11-30 | 2016-04-20 | 华南理工大学 | 一种基于车辆目的地预测的智能信息推送系统和方法 |
CN105469599A (zh) * | 2015-12-01 | 2016-04-06 | 上海交通大学 | 车辆轨迹跟踪和车辆行为预测方法 |
CN105427602A (zh) * | 2015-12-16 | 2016-03-23 | 浙江宇视科技有限公司 | 一种车辆出行主题确定方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107861957A (zh) | 2018-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107861957B (zh) | 一种数据分析方法及装置 | |
CN107862862B (zh) | 一种车辆行为分析方法及装置 | |
US10136249B2 (en) | Information distribution apparatus and method | |
CN108170793B (zh) | 基于车辆语义轨迹数据的停留点分析方法及其系统 | |
CN110222893B (zh) | 共享交通资源的投放地点推荐方法、装置与电子设备 | |
CN111212383B (zh) | 区域常住人口数量的确定方法、装置、服务器和介质 | |
CN107341166B (zh) | 一种车载app的推荐方法及系统 | |
JP2010231605A (ja) | イベント判断装置 | |
CN111144446B (zh) | 一种基于时空网格的司机身份识别方法和系统 | |
CN111105628A (zh) | 一种停车场画像构建方法和装置 | |
CN112556717B (zh) | 出行方式筛选方法和出行路线推荐方法和装置 | |
CN104599002A (zh) | 预测订单价值的方法及设备 | |
CN116629338B (zh) | 一种模型数据的处理方法、相关装置、设备以及存储介质 | |
CN116046008A (zh) | 基于态势感知的路线规划方法、系统及效能评估装置 | |
CN113971893B (zh) | 一种车位推荐方法、装置及存储介质 | |
CN108875032B (zh) | 区域类型确定方法及装置 | |
CN113934800A (zh) | 一种临时号车伴随关系识别方法、装置、终端及介质 | |
CN113704373A (zh) | 基于移动轨迹数据的用户识别方法、装置及存储介质 | |
CN110619090A (zh) | 一种区域吸引力评估方法及设备 | |
CN114007186B (zh) | 定位方法及相关产品 | |
CN112801156B (zh) | 用于人工智能机器学习的业务大数据采集方法及服务器 | |
CN113536028A (zh) | 音乐的推荐方法和装置 | |
CN113744070A (zh) | 新能源汽车保险成本的预测方法、装置及计算机设备 | |
CN111754253A (zh) | 用户的鉴权方法、装置、计算机设备及存储介质 | |
Allahviranloo et al. | Mobility knowledge discovery to generate activity pattern trajectories |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |