CN112101819A - 食品风险预测方法、装置、设备及存储介质 - Google Patents
食品风险预测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112101819A CN112101819A CN202011172563.0A CN202011172563A CN112101819A CN 112101819 A CN112101819 A CN 112101819A CN 202011172563 A CN202011172563 A CN 202011172563A CN 112101819 A CN112101819 A CN 112101819A
- Authority
- CN
- China
- Prior art keywords
- food
- detail
- name
- data
- weather
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 235000013305 food Nutrition 0.000 title claims abstract description 428
- 238000000034 method Methods 0.000 title claims abstract description 47
- 239000013598 vector Substances 0.000 claims description 110
- 238000007689 inspection Methods 0.000 claims description 50
- 238000005070 sampling Methods 0.000 claims description 30
- 235000015219 food category Nutrition 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 15
- 238000013480 data collection Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010276 construction Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 abstract 1
- 235000015277 pork Nutrition 0.000 description 37
- 238000012216 screening Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 241000251468 Actinopterygii Species 0.000 description 2
- 240000007124 Brassica oleracea Species 0.000 description 2
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 2
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 2
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 2
- 241000220225 Malus Species 0.000 description 2
- 235000013601 eggs Nutrition 0.000 description 2
- 235000019688 fish Nutrition 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 241000143060 Americamysis bahia Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 241000238557 Decapoda Species 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 235000021404 traditional food Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Primary Health Care (AREA)
- Mathematical Physics (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了食品风险预测方法、装置、设备及存储介质,涉及人工智能技术,基于各食品的多维度特征向量分别作为食品风险预设模型的输入,获取各食品的下月预测抽检不合格率,之后进一步筛选下月预测抽检不合格率高于不合格率阈值的食品细类名称以组成下月抽查食品细类名称清单,提高了筛选名单的效率。此外本发明可应用于智慧政务场景中,从而推动智慧城市的建设。
Description
技术领域
本发明涉及人工智能的智能决策领域,尤其涉及一种食品风险预测方法、装置、设备及存储介质。
背景技术
食品安全与人们的生活息息相关,关系到人们的日常生活与健康。为了监督市场的食品安全问题,各省市每月会定制抽检计划,并按照抽检计划进行食品抽检。因此抽检计划的定制关系到人们的切身利益与健康。
传统的食品抽检计划定制是一种随机选择的方式,随机选择抽检食品可能出现的情况是应该加大抽查力度的食品可能没有被加大抽检,相对安全的食品确定了很大的抽检力度。而且随机选择抽检食品名称组成食品抽检计划一般是基于抽检人员的抽检经验人工筛选得到,不仅对抽检人员的专业知识要求高,而且人工筛选效率低下。
发明内容
本发明实施例提供了一种食品风险预测方法、装置、设备及存储介质,旨在解决现有技术中选择抽检食品名称组成食品抽检计划一般是基于抽检人员的抽检经验人工筛选得到,不仅对抽检人员的专业知识要求高,而且人工筛选效率低下的问题。
第一方面,本发明实施例提供了一种食品风险预测方法,其包括:
调用预先设置的食品细类集合,并获取当前系统日期;其中,所述食品细类集合中包括多个食品细类名称;
获取所述食品细类集合中各食品细类名称对应的多维度特征向量,所述多维度特征向量包括历史特征向量、舆情特征值、天气特征向量、投诉特征值和进货特征值;
将各食品细类名称对应的多维度特征向量均作为输入预先训练训练的食品风险预设模型进行运算,得到各食品细类名称对应的预测抽检不合格率;以及
获取各食品细类名称对应的预测抽检不合格率中高于预设的不合格率阈值的预测抽检不合格率所对应的食品细类名称,以组成下月抽查食品细类名称清单。
第二方面,本发明实施例提供了一种食品风险预测装置,其包括:
食品细类集合获取单元,用于调用预先设置的食品细类集合,并获取当前系统日期;其中,所述食品细类集合中包括多个食品细类名称;
多维度特征向量获取单元,用于获取所述食品细类集合中各食品细类名称对应的多维度特征向量,所述多维度特征向量包括历史特征向量、舆情特征值、天气特征向量、投诉特征值和进货特征值;
预测抽检不合格率获取单元,用于将各食品细类名称对应的多维度特征向量均作为输入预先训练训练的食品风险预设模型进行运算,得到各食品细类名称对应的预测抽检不合格率;以及
下月抽查清单生成单元,用于获取各食品细类名称对应的预测抽检不合格率中高于预设的不合格率阈值的预测抽检不合格率所对应的食品细类名称,以组成下月抽查食品细类名称清单。
第三方面,本发明实施例又提供了一种设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的食品风险预测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的食品风险预测方法。
本发明实施例提供了一种食品风险预测方法、装置、设备及存储介质,是基于各食品的多维度特征向量分别作为食品风险预设模型的输入,获取各食品的下月预测抽检不合格率,之后进一步筛选下月预测抽检不合格率高于不合格率阈值的食品细类名称以组成下月抽查食品细类名称清单,提高了筛选名单的效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的食品风险预测方法的应用场景示意图;
图2为本发明实施例提供的食品风险预测方法的流程示意图;
图3为本发明实施例提供的食品风险预测方法的子流程示意图;
图4为本发明实施例提供的食品风险预测装置的示意性框图;
图5为本发明实施例提供的食品风险预测装置的子单元示意性框图;
图6为本发明实施例提供的设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的食品风险预测方法的应用场景示意图;图2为本发明实施例提供的食品风险预测方法的流程示意图,该食品风险预测方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。
如图2所示,该方法包括步骤S101~S102。
S101、调用预先设置的食品细类集合,并获取当前系统日期;其中,所述食品细类集合中包括多个食品细类名称。
在本实施例中,在服务器中可以由食品抽检人员预先设置食品细类集合,以通过服务器定期自动采集数据后,预测各食品细类名称对应的预测抽检不合格率。例如,所述食品细类集合包括河虾、猪肉、鱼、鸡蛋、苹果、白菜等食品细类名称。而且为了服务器定期采集数据,此时获取当前系统日期,以和上一食品风险预测日期求得时间间隔后判断是否等于预设的间隔周期(例如间隔周期设置为1个月,且一般食品风险预测日期设置在上一个月的月末最后一天)。
之后判断当前系统日期与上一食品风险预测日期时间之差是否等于预设的间隔周期。
在本实施例中,通过获取当前系统日期以和上一食品风险预测日期求得时间间隔(也即求得两者的时间之差)后,可以判断时间间隔是否等于所述间隔周期。例如,间隔周期设置为1个月,上一食品风险预测日期对应2018年7月31日,当前系统日期为2018年8月31日,2018年8月31日与2018年7月31日的时间之差是等于1个月。
在一实施例中,所述判断当前系统日期与上一食品风险预测日期时间之差是否等于预设的间隔周期的步骤之后还包括:
S1011、若当前系统日期与上一食品风险预测日期时间之差等于所述间隔周期,获取所述食品细类集合中各食品细类名称对应的历史特征向量、舆情特征值、天气特征向量、投诉特征值和进货特征值。
在本实施例中,为了获取每一食品细类集合中各食品细类名称对应的多特征融合的特征向量,此时可以考虑获取对预测抽检不合格率较相关的一些特征向量或特征值。
在一实施例中,如图3所示,步骤S1011包括:
S10111、以所述食品细类集合中包括的各食品细类名称为关键词、并以数据统计时间段集合为查询条件,从第一目标网址集合对应的网页数据中采集获取与各食品细类名称对应的历史不合格率数据,以得到与各食品细类名称对应的历史特征向量。
在本实施例中,仍以上一食品风险预测日期对应2018年7月31日,当前系统日期为2018年8月31日,间隔周期为1个月为例来说明,由于当前系统日期与上一食品风险预测日期时间之差等于所述间隔周期,此时可以调用预设的第一目标网址集合(例如市场监管部门提供的官方网站)及预设的数据统计时间段集合,以所述食品细类集合中包括的各食品细类名称为查询关键词(例如河虾、猪肉、鱼、鸡蛋、苹果、白菜等食品细类名称均作为查询关键词)、并以数据统计时间段集合为查询条件,从所述第一目标网址集合对应的网页数据中采集获取与各食品细类名称对应的历史不合格率数据。通过与各食品细类名称对应各个时间维度的历史不合格率数据,以得到与各食品细类名称对应的历史特征向量。
在一实施例中,所述数据统计时间段集合包括以当前系统日期为数据统计时间段终止时间点、且以第一目标网址集合的历史数据起始统计日期为数据统计时间段起始时间点的第一数据统计时间段,以当前系统日期的上一年同月份对应的第二数据统计时间段,以第二数据统计时间段及第二数据统计时间段的前一月份和后一月份组成的第三数据统计时间段,以当前系统日期的上一月份对应的第四数据统计时间段,以当前系统日期的前三个月份对应组成的第五数据统计时间段。
在一实施例中,步骤S10111包括:
所述食品细类集合中包括的各食品细类名称为关键词,并分别以所述第一数据统计时间段、所述第二数据统计时间段、所述第三数据统计时间段、所述第四数据统计时间段和所述第五数据统计时间段作为查询条件,分别从所述第一目标网址集合对应的网页数据中采集获取各个数据统计时间段内与各食品细类名称对应的历史总抽检不合格率,以得到与各食品细类名称对应的第一特征值、第二特征值、第三特征值、第四特征值和第五特征值;
由各食品细类名称分别对应的第一特征值、第二特征值、第三特征值、第四特征值、第五特征值,以组成与各食品细类名称分别对应的历史特征向量。
在本实施例中,为了获取各食品细类名称分别对应的历史特征向量,需要从5个时间维度去统计每一食品细类名称对应的抽检不合格率,其中:
第一个时间维度对应是统计历史总抽检不合格率,其对应的统计时间段是第一数据统计时间段。例如在第一目标网址集合的网页数据中以猪肉为关键词,以所述第一数据统计时间段为查询条件,可以查到猪肉在历史上每个月的抽检不合格率,将其求平均即可得到猪肉的历史总抽检不合格率。
第二个时间维度对应是统计历史同期抽检不合格率,其对应的统计时间段是第二数据统计时间段(例如当前系统日期为2018年8月31日,则第二数据统计时间段为2017年8月1日-8月31日对应的2017年8月一整个月)。例如在第一目标网址集合的网页数据中以猪肉为关键词,以所述第二数据统计时间段为查询条件,可以查到猪肉的历史同期抽检不合格率。
第三个时间维度对应是统计历史同期及同期上下月抽检不合格率,其对应的统计时间段是第三数据统计时间段(例如当前系统日期为2018年8月31日,则第三数据统计时间段为2017年7月-2017年9月)。例如在第一目标网址集合的网页数据中以猪肉为关键词,以所述第三数据统计时间段为查询条件,可以查到猪肉的历史同期及同期上下月抽检不合格率。
第四个时间维度对应是统计最近一个月抽检不合格率,其对应的统计时间段是第四数据统计时间段(例如当前系统日期为2018年8月31日,则第四数据统计时间段为2018年7月)。例如在第一目标网址集合的网页数据中以猪肉为关键词,以所述第四数据统计时间段为查询条件,可以查到猪肉的最近一个月抽检不合格率。
第五个时间维度对应是统计最近三个月抽检不合格率,其对应的统计时间段是第五数据统计时间段(例如当前系统日期为2018年8月31日,则第五数据统计时间段为2018年6月-2018年8月)。例如在第一目标网址集合的网页数据中以猪肉为关键词,以所述第五数据统计时间段为查询条件,可以查到猪肉的最近三个月抽检不合格率。
当针对每一食品细类名称均获取上述5个维度的特征值,即可组成与该食品细类名称对应的历史特征向量。
例如,当前系统日期为2018年8月31日,猪肉这一食品细类名称对应的历史特征向量为[0.30.30.40.50.6],表示猪肉的历史总抽检不合格率为0.3,猪肉的历史同期抽检不合格率为0.3,猪肉的历史同期及同期上下月抽检不合格率为0.4,猪肉的最近一个月抽检不合格率为0.5,猪肉的最近三个月抽检不合格率为0.6。通过将多时间段维度的不合格率组成历史特征向量,能够作为多特征其中之一以提高预测的准确率。
S10112、从第二目标网址集合对应的网页数据中采集获取舆情数据采集时间区间内的舆情数据集合,根据所述舆情数据集合统计获取各食品细类名称对应的舆情数量,以得到与各食品细类名称对应的舆情特征值。
在本实施例中,为了获取各食品细类名称分别对应的舆情特征值,需要去所述第二目标网址集合(例如微博、新华网等)对应的网页数据中采集获取舆情数据集合,而且采集舆情数据的时间限定在所述上一食品风险预测日期与所述当前系统日期之间的时间区间。例如当前系统日期为2018年8月31日,可以2018年8月一整月为舆情数据采集时间区间。当从第二目标网址集合对应的网页数据中采集获取2018年8月一整月的舆情数据集合后,由于每一舆情数据是一篇新闻稿或是一篇微博文章,若该新闻稿或微博文章中出现猪肉这一关键词,表示这一新闻稿或微博文章对猪肉增加了一次舆情数据。若2018年8月一整月有40篇新闻稿或微博文章出现了猪肉的关键词,则2018年8月一整月猪肉的舆情数量为40,此时根据猪肉的舆情数量40进行运算后,即可得到与猪肉对应的舆情特征值。其他食品细类名称对应的舆情特征值的获取过程,可以参考猪肉的舆情特征值的获取过程。通过这一方式,能客观且准确的获取各食品细类名称对应的舆情特征值。
其中,所述舆情数据采集时间区间、以及后续的天气数据采集时间区间、投诉数据采集时间区间和进货数据采集时间区间均为上一食品风险预测日期与当前系统日期之间的时间区间
在一实施例中,步骤S10112包括:
将所述舆情数据集合中每一篇舆情数据输入至预先训练的舆情数据摘要抽取模型进行摘要抽取,得到与每一篇舆情数据分别对应的舆情摘要;其中,所述舆情数据摘要抽取模型为TextRank算法模型;
判断每一篇舆情数据分别对应的舆情摘要是否包括所述食品细类集合中的若干个食品细类名称;
若有舆情数据对应的舆情摘要包括所述食品细类集合中的若干个食品细类名称,则将对应食品细类名称的舆情统计数量累加1,以得到各食品细类名称对应的舆情数量;
判断各食品细类名称对应的舆情数量是否超出预先设置的舆情数量阈值;
若有食品细类名称对应的舆情数量超出所述食品细类名称对应的舆情数量,则将对应食品细类名称相应的舆情特征值设置为1;
若有食品细类名称对应的舆情数量未超出所述食品细类名称对应的舆情数量,则将对应食品细类名称相应的舆情特征值设置为0。
在本实施例中,当服务器中采集了对应时间段的舆情数据集合后,由于新闻稿或微博文章可能是字数较多的大篇幅文章,此时可以通过舆情数据摘要抽取模型获取每一篇舆情数据分别对应的舆情摘要。
具体实施时,舆情数据摘要抽取模型采用TextRank算法模型,TextRank算法是一种抽取式的无监督的文本摘要方法。该模型的输入是文章文本,输出的是与文本文章对应的文本摘要。TextRank是受到谷歌的PageRank算法的启发,通过把文本分割成若干组成单元(单词、句子)并建立图模型,利用投票机制对文本中的重要成分进行排序,仅利用单篇文档本身的信息即可实现关键词提取、文摘。
例如,当获取了2018年8月各食品细类名称对应的舆情数量后,此时判断各食品细类名称对应的舆情数量是否超出所述舆情数量阈值,也就是设置一个舆情数量阈值来判断当月各食品细类名称是否为热点关键词。
若有食品细类名称对应的舆情数量超出所述食品细类名称对应的舆情数量,表示当月该食品细类名称是热点关键词,可将该食品细类名称相应的舆情特征值设置为1。若有食品细类名称对应的舆情数量未超出所述食品细类名称对应的舆情数量,表示当月该食品细类名称不是热点关键词,可将该食品细类名称相应的舆情特征值设置为0。将舆情特征值作为多特征其中之一,可提高预测的准确率。
S10113、从第三目标网址集合对应的网页数据中采集获取天气数据采集时间区间内的天气数据集合,根据所述天气数据集合及各食品细类名称对应的食品敏感类型,获取各食品细类名称对应的天气特征向量;
其中,根据所述天气数据集合及各食品细类名称对应的食品敏感类型,获取各食品细类名称对应的天气特征向量包括:若所述天气数据集合中满足预设的连续高温条件或满足预设的连续雨天条件,根据满足连续高温条件的天气数据集合或满足连续雨天条件的天气数据集合、以及各食品细类名称对应的高温敏感性食品类型或湿度敏感性食品类型,获取各食品细类名称对应的天气特征向量;所述连续高温条件为超出预设的总天数阈值为晴天且超出预设的温度阈值,所述连续雨天条件为超出预设的总天数阈值为雨天(例如将总天数阈值设为6,且将温度阈值设置为28℃,则所述连续高温条件为连续七天或超过连续七天均为晴天且气温超过28℃,连续雨天条件为连续七天或超过连续七天均为雨天)。
在本实施例中,为了充分考虑天气状况对食品抽检不合格率的影响,此时还需从第三目标网址集合(例如各类天气预报类型的网站)对应的网页数据中采集获取天气数据集合,一般将天气数据采集时间区间设置为以当前系统日期的后一天为起始时间点,往后推算一个月为终止时间点。例如当前系统日期为2018年8月31日,则天气数据采集时间区间为2018年9月1日至2018年9月30日。此时若所述天气数据集合中满足预设的连续高温条件或满足预设的连续雨天条件,表示一些高温敏感性食品或湿度敏感性食品会受到天气影响而进一步影响其抽检不合格率。通过这一方式,能客观且准确的获取各食品细类名称对应的天气特征向量。
在一实施例中,所述若所述天气数据集合中满足预设的连续高温条件或满足预设的连续雨天条件,根据满足连续高温条件的天气数据集合或满足连续雨天条件的天气数据集合、以及各食品细类名称对应的高温敏感性食品类型或湿度敏感性食品类型,获取各食品细类名称对应的天气特征向量,包括:
若所述天气数据集合中满足所述连续高温条件且食品细类名称对应高温敏感性食品类型,则将对应食品细类名称相应的天气特征向量中第一天气特征值设置为1;
若所述天气数据集合中满足所述连续高温条件且食品细类名称对应非高温敏感性食品类型,则将对应食品细类名称相应的天气特征向量中第一天气特征值设置为0;
若所述天气数据集合中满足所述连续雨天条件且食品细类名称对应湿度敏感性食品类型,则将对应食品细类名称相应的天气特征向量中第二天气特征值设置为1;
若所述天气数据集合中满足所述连续雨天条件且食品细类名称对应非湿度敏感性食品类型,则将对应食品细类名称相应的天气特征向量中第二天气特征值设置为0。
在本实施例中,为了获取各食品细类名称分别对应的天气特征向量,需要获取各食品细类名称分别对应的第一天气特征值和第二天气特征值,以组成与各食品细类名称分别对应的天气特征向量。其中,第一天气特征值用于表示该食品细类名称是否受连续高温天气的影响而提高抽检不合格率,第一天气特征值用于表示该食品细类名称是否受连续雨天的影响而提高抽检不合格率。
例如,2018年9月1日至2018年9月30日这一段时间区间内,2018年9月1日至2018年9月8日连续8天为晴天且气温超过28℃,且猪肉属于高温敏感性食品类型,此时可以将猪肉这一食品细类名称对应的第一天气特征值设置为1;且由于猪肉属于非湿度敏感性食品类型,此时可以将猪肉这一食品细类名称对应的第二天气特征值设置为0;故猪肉这一食品细类名称对应的天气特征向量为[10]。其他食品细类名称的天气特征向量获取过程可以参考猪肉的天气特征向量的获取过程。将天气特征向量作为多特征其中之一,可提高预测的准确率。
S10114、从第四目标网址集合对应的网页数据中采集获取投诉数据采集时间区间内的投诉信息数据集合,根据所述投诉信息数据集合统计获取各食品细类名称对应的投诉数量,以得到与各食品细类名称对应的投诉特征值。
在本实施例中,为了获取各食品细类名称分别对应的投诉特征值,需要去所述第四目标网址集合(例如市场监管部门提供的官方网站)对应的网页数据中采集获取投诉信息数据集合,而且采投诉信息数据集合的时间限定在上一食品风险预测日期与所述当前系统日期之间。例如当前系统日期为2018年8月31日,上一食品风险预测日期2018年7月31日,可以2018年7月31日-2018年8月31日为投诉数据采集时间区间。当从第四目标网址集合对应的网页数据中采集获取2018年7月31日-2018年8月31日的投诉信息数据集合后,由于每一投诉信息均是针对一种食品细类名称,若投诉信息数据集合有投诉信息数据存在某一食品细类名称,则该食品细类名称对应的投诉特征值为1;若投诉信息数据集合各投诉信息数据不存在食品细类名称,表示投诉数据采集时间区间内无任何针对某一食品细类名称的投诉数据,故每一食品细类名称对应的投诉特征值为0。通过这一方式,能客观且准确的获取各食品细类名称对应的投诉特征值。
在一实施例中,步骤S10114包括:
统计获取各食品细类名称对应的投诉数量;
判断是否有食品细类名称对应的投诉数量大于预设的投诉阈值;
若有各食品细类名称对应的投诉数量大于所述投诉阈值,则将食品细类名称对应的投诉特征值设置为1;
若有各食品细类名称对应的投诉数量等于所述投诉阈值,则将食品细类名称对应的投诉特征值设置为0。
在本实施例中,也即一旦在投诉数据采集时间区间存在有食品细类名称对应的投诉数量大于预设的投诉阈值(例如设置投诉阈值为0),则该食品细类名称对应的投诉特征值设置为1,其他情况则设置为0。将投诉特征值作为多特征其中之一,可提高预测的准确率。
S10115、从第五目标网址集合对应的网页数据中采集获取进货数据采集时间区间内的进货信息数据集合,根据所述进货信息数据集合统计获取各食品细类名称对应的当月进货数量,根据当月进货数量与上一月进货数量之比,以对应得到与各食品细类名称对应的进货特征值。
在一实施例中,步骤S10115包括:
判断各食品细类名称对应的当月进货数量与上一月进货数量之比是否大于预设的进货数量阈值;
若有食品细类名称对应的当月进货数量与上一月进货数量之比大于所述进货数量阈值,则将对应食品细类名称相应的进货特征值设置为1;
若有食品细类名称对应的当月进货数量与上一月进货数量之比小于或等于所述进货数量阈值,则将对应食品细类名称相应的进货特征值设置为0。
在本实施例中,获取某一食品细类名称相应的进货特征值时,其判定原则是判断该食品细类名称相应的当月进货数量是否大于上一月进货数量,一旦某一食品细类名称相应的当月进货数量大于上一月进货数量,下月该食品细类名称应重点抽检,也即若有食品细类名称对应的当月进货数量与上一月进货数量之比大于所述进货数量阈值(例如将进货数量阈值设置为1),则将对应食品细类名称相应的进货特征值设置为1;若有食品细类名称对应的当月进货数量与上一月进货数量之比小于或等于所述进货数量阈值,则将对应食品细类名称相应的进货特征值设置为0。通过这一方式,能客观且准确的获取各食品细类名称对应的进货特征值。将进货特征值作为多特征其中之一,可提高预测的准确率。
S102、获取所述食品细类集合中各食品细类名称对应的多维度特征向量,所述多维度特征向量包括历史特征向量、舆情特征值、天气特征向量、投诉特征值和进货特征值。
在本实施例中,若已经获取了所述食品细类集合中各食品细类名称对应的历史特征向量、舆情特征值、天气特征向量、投诉特征值、进货特征值,此时可以将上述特征向量及特征值进行组合得到与各食品细类名称对应的多维度特征向量,这样处理后即可输入至食品风险预设模型。
在一实施例中,步骤S102包括:
由各食品细类名称对应的历史特征向量中各历史特征值、舆情特征值、天气特征向量中各天气特征值、投诉特征值、进货特征值依顺序进行串接,组成与各食品细类名称对应的多维度特征向量。
在本实施例中,例如猪肉对应的历史特征向量为[0.30.30.40.50.6],猪肉对应的舆情特征值为1,猪肉对应的天气特征向量为[10],猪肉对应的投诉特征值为1,猪肉对应的进货特征值为1,则与猪肉对应的多维度特征向量由0.3、0.3、0.4、0.5、0.6、1、1、0、1、1依顺序进行串接,从而得到与猪肉对应的多维度特征向量,具体表示为[0.30.30.40.50.611011]。
S103、将各食品细类名称对应的多维度特征向量均作为输入预先训练训练的食品风险预设模型进行运算,得到各食品细类名称对应的预测抽检不合格率。
在本实施例中,在预先训练食品风险预设模型时,是以食品细类集合中各食品细类名称对应的历史多维度特征向量为待训练食品风险预设模型的输入,以每一历史多维度特征向量对应的标注值为待训练食品风险预设模型的输出,通过这一方式训练得到的食品风险预设模型,能以当前系统日期对应获取的各食品细类名称对应的多维度特征向量作为模型输入,预测下一个月各食品细类名称对应的预测抽检不合格率。具体实施时,所述食品风险预设模型为神经网络模型。
S104、获取各食品细类名称对应的预测抽检不合格率中高于预设的不合格率阈值的预测抽检不合格率所对应的食品细类名称,以组成下月抽查食品细类名称清单。
在本实施例中,得到各食品细类名称对应的预测抽检不合格率后,预测抽检不合格率超出不合格率阈值的食品细类名称则被选中,以组成下月抽查食品细类名称清单,这样即可自动根据多维度数据预测确定下月应抽检的食品细类。
该方法实现了基于各食品的多维度特征向量分别作为食品风险预设模型的输入,获取各食品的下月预测抽检不合格率,之后可自动筛选下月预测抽检不合格率高于不合格率阈值的食品细类名称以组成下月抽查食品细类名称清单,提高了筛选名单的效率。
本发明实施例还提供一种食品风险预测装置,该食品风险预测装置用于执行前述食品风险预测方法的任一实施例。具体地,请参阅图4,图4是本发明实施例提供的食品风险预测装置的示意性框图。该食品风险预测装置100可以配置于服务器中。
如图4所示,食品风险预测装置100包括:食品细类集合获取单元101、多维度特征向量获取单元102、预测抽检不合格率获取单元103、下月抽查清单生成单元104。
食品细类集合获取单元101,用于调用预先设置的食品细类集合,并获取当前系统日期;其中,所述食品细类集合中包括多个食品细类名称。
在一实施例中,食品风险预测装置100还包括:
食品特征值获取单元1011,用于若当前系统日期与上一食品风险预测日期时间之差等于所述间隔周期,获取所述食品细类集合中各食品细类名称对应的历史特征向量、舆情特征值、天气特征向量、投诉特征值和进货特征值。
在一实施例中,如图5所示,食品特征值获取单元1011包括:
历史特征向量获取单元10111,用于以所述食品细类集合中包括的各食品细类名称为关键词、并以数据统计时间段集合为查询条件,从第一目标网址集合对应的网页数据中采集获取与各食品细类名称对应的历史不合格率数据,以得到与各食品细类名称对应的历史特征向量。
在一实施例中,所述数据统计时间段集合包括以当前系统日期为数据统计时间段终止时间点、且以第一目标网址集合的历史数据起始统计日期为数据统计时间段起始时间点的第一数据统计时间段,以当前系统日期的上一年同月份对应的第二数据统计时间段,以第二数据统计时间段及第二数据统计时间段的前一月份和后一月份组成的第三数据统计时间段,以当前系统日期的上一月份对应的第四数据统计时间段,以当前系统日期的前三个月份对应组成的第五数据统计时间段。
在一实施例中,历史特征向量获取单元10111包括:
多特征值获取单元,用于所述食品细类集合中包括的各食品细类名称为关键词,并分别以所述第一数据统计时间段、所述第二数据统计时间段、所述第三数据统计时间段、所述第四数据统计时间段和所述第五数据统计时间段作为查询条件,分别从所述第一目标网址集合对应的网页数据中采集获取各个数据统计时间段内与各食品细类名称对应的历史总抽检不合格率,以得到与各食品细类名称对应的第一特征值、第二特征值、第三特征值、第四特征值和第五特征值;
历史特征值组合单元,用于由各食品细类名称分别对应的第一特征值、第二特征值、第三特征值、第四特征值、第五特征值,以组成与各食品细类名称分别对应的历史特征向量。
舆情特征值获取单元10112,用于从第二目标网址集合对应的网页数据中采集获取舆情数据采集时间区间内的舆情数据集合,根据所述舆情数据集合统计获取各食品细类名称对应的舆情数量,以得到与各食品细类名称对应的舆情特征值。
在一实施例中,舆情特征值获取单元10112包括:
舆情摘要抽取单元,用于将所述舆情数据集合中每一篇舆情数据输入至预先训练的舆情数据摘要抽取模型进行摘要抽取,得到与每一篇舆情数据分别对应的舆情摘要;其中,所述舆情数据摘要抽取模型为TextRank算法模型;
舆情摘要判断单元,用于判断每一篇舆情数据分别对应的舆情摘要是否包括所述食品细类集合中的若干个食品细类名称;
舆情数量累加单元,用于若有舆情数据对应的舆情摘要包括所述食品细类集合中的若干个食品细类名称,则将对应食品细类名称的舆情统计数量累加1,以得到各食品细类名称对应的舆情数量;
舆情数量判断单元,用于判断各食品细类名称对应的舆情数量是否超出预先设置的舆情数量阈值;
第一舆情特征值设置单元,用于若有食品细类名称对应的舆情数量超出所述食品细类名称对应的舆情数量,则将对应食品细类名称相应的舆情特征值设置为1;
第二舆情特征值设置单元,用于若有食品细类名称对应的舆情数量未超出所述食品细类名称对应的舆情数量,则将对应食品细类名称相应的舆情特征值设置为0。
天气特征向量获取单元10113,用于从第三目标网址集合对应的网页数据中采集获取天气数据采集时间区间内的天气数据集合,根据所述天气数据集合及各食品细类名称对应的食品敏感类型,获取各食品细类名称对应的天气特征向量。
在一实施例中,天气特征向量获取单元10113还用于若所述天气数据集合中满足预设的连续高温条件或满足预设的连续雨天条件,根据满足连续高温条件的天气数据集合或满足连续雨天条件的天气数据集合、以及各食品细类名称对应的高温敏感性食品类型或湿度敏感性食品类型,获取各食品细类名称对应的天气特征向量;所述连续高温条件为超出预设的总天数阈值为晴天且超出预设的温度阈值,所述连续雨天条件为超出预设的总天数阈值为雨天(例如将总天数阈值设为6,且将温度阈值设置为28℃,则所述连续高温条件为连续七天或超过连续七天均为晴天且气温超过28℃,连续雨天条件为连续七天或超过连续七天均为雨天)。
其中所述天气特征向量获取单元10113包括:
第一天气值设置单元,用于若所述天气数据集合中满足所述连续高温条件且食品细类名称对应高温敏感性食品类型,则将对应食品细类名称相应的天气特征向量中第一天气特征值设置为1;
第二天气值设置单元,用于若所述天气数据集合中满足所述连续高温条件且食品细类名称对应非高温敏感性食品类型,则将对应食品细类名称相应的天气特征向量中第一天气特征值设置为0;
第三天气值设置单元,用于若所述天气数据集合中满足所述连续雨天条件且食品细类名称对应湿度敏感性食品类型,则将对应食品细类名称相应的天气特征向量中第二天气特征值设置为1;
第四天气值设置单元,用于若所述天气数据集合中满足所述连续雨天条件且食品细类名称对应非湿度敏感性食品类型,则将对应食品细类名称相应的天气特征向量中第二天气特征值设置为0。
投诉特征值获取单元10114,用于从第四目标网址集合对应的网页数据中采集获取投诉数据采集时间区间内的投诉信息数据集合,根据所述投诉信息数据集合统计获取各食品细类名称对应的投诉数量,以得到与各食品细类名称对应的投诉特征值。
在一实施例中,投诉特征值获取单元10114包括:
投诉数量获取单元,用于统计获取各食品细类名称对应的投诉数量;
投诉数量判断单元,用于判断是否有食品细类名称对应的投诉数量大于预设的投诉阈值;
第一投诉特征值设置单元,用于若有各食品细类名称对应的投诉数量大于所述投诉阈值,则将食品细类名称对应的投诉特征值设置为1;
第二投诉特征值设置单元,用于若有各食品细类名称对应的投诉数量等于所述投诉阈值,则将食品细类名称对应的投诉特征值设置为0。
进货特征值获取单元10115,用于从第五目标网址集合对应的网页数据中采集获取进货数据采集时间区间内的进货信息数据集合,根据所述进货信息数据集合统计获取各食品细类名称对应的当月进货数量,根据当月进货数量与上一月进货数量之比,以对应得到与各食品细类名称对应的进货特征值。
在一实施例中,进货特征值获取单元10115包括:
当月进货数量判断单元,用于判断各食品细类名称对应的当月进货数量与上一月进货数量之比是否大于预设的进货数量阈值;
第一进货特征值设置单元,用于若有食品细类名称对应的当月进货数量与上一月进货数量之比大于所述进货数量阈值,则将对应食品细类名称相应的进货特征值设置为1;
第二进货特征值设置单元,用于若有食品细类名称对应的当月进货数量与上一月进货数量之比小于或等于所述进货数量阈值,则将对应食品细类名称相应的进货特征值设置为0。
多维度特征向量获取单元102,用于获取所述食品细类集合中各食品细类名称对应的多维度特征向量,所述多维度特征向量包括历史特征向量、舆情特征值、天气特征向量、投诉特征值和进货特征值。
在一实施例中,多维度特征向量获取单元102包括:
特征值串接单元,用于由各食品细类名称对应的历史特征向量中各历史特征值、舆情特征值、天气特征向量中各天气特征值、投诉特征值、进货特征值依顺序进行串接,组成与各食品细类名称对应的多维度特征向量。
预测抽检不合格率获取单元103,用于将各食品细类名称对应的多维度特征向量均作为输入预先训练训练的食品风险预设模型进行运算,得到各食品细类名称对应的预测抽检不合格率。
下月抽查清单生成单元104,用于获取各食品细类名称对应的预测抽检不合格率中高于预设的不合格率阈值的预测抽检不合格率所对应的食品细类名称,以组成下月抽查食品细类名称清单。
该装置实现了基于各食品的多维度特征向量分别作为食品风险预设模型的输入,获取各食品的下月预测抽检不合格率,之后可自动筛选下月预测抽检不合格率高于不合格率阈值的食品细类名称以组成下月抽查食品细类名称清单,提高了筛选名单的效率。
上述食品风险预测装置可以实现为计算机程序的形式,该计算机程序可以在如图6所示的设备上运行。
请参阅图6,图6是本发明实施例提供的设备的示意性框图。该设备500是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图6,该设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行食品风险预测方法。
该处理器502用于提供计算和控制能力,支撑整个设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行食品风险预测方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图6中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的设备500的限定,具体的设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现本发明实施例公开的食品风险预测方法。
本领域技术人员可以理解,图6中示出的设备的实施例并不构成对设备具体构成的限定,在其他实施例中,设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图6所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现本发明实施例公开的食品风险预测方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种食品风险预测方法,其特征在于,包括:
调用预先设置的食品细类集合,并获取当前系统日期;其中,所述食品细类集合中包括多个食品细类名称;
获取所述食品细类集合中各食品细类名称对应的多维度特征向量,所述多维度特征向量包括历史特征向量、舆情特征值、天气特征向量、投诉特征值和进货特征值;
将各食品细类名称对应的多维度特征向量均作为输入预先训练训练的食品风险预设模型进行运算,得到各食品细类名称对应的预测抽检不合格率;以及
获取各食品细类名称对应的预测抽检不合格率中高于预设的不合格率阈值的预测抽检不合格率所对应的食品细类名称,以组成下月抽查食品细类名称清单。
2.根据权利要求1所述的食品风险预测方法,其特征在于,所述获取所述食品细类集合中各食品细类名称对应的多维度特征向量,包括:
以所述食品细类集合中包括的各食品细类名称为关键词、并以数据统计时间段集合为查询条件,从第一目标网址集合对应的网页数据中采集获取与各食品细类名称对应的历史不合格率数据,以得到与各食品细类名称对应的历史特征向量;
从第二目标网址集合对应的网页数据中采集获取舆情数据采集时间区间内的舆情数据集合,根据所述舆情数据集合统计获取各食品细类名称对应的舆情数量,以得到与各食品细类名称对应的舆情特征值;
从第三目标网址集合对应的网页数据中采集获取天气数据采集时间区间内的天气数据集合,根据所述天气数据集合及各食品细类名称对应的食品敏感类型,获取各食品细类名称对应的天气特征向量;
从第四目标网址集合对应的网页数据中采集获取投诉数据采集时间区间内的投诉信息数据集合,根据所述投诉信息数据集合统计获取各食品细类名称对应的投诉数量,以得到与各食品细类名称对应的投诉特征值;
从第五目标网址集合对应的网页数据中采集获取进货数据采集时间区间内的进货信息数据集合,根据所述进货信息数据集合统计获取各食品细类名称对应的当月进货数量,根据当月进货数量与上一月进货数量之比,以对应得到与各食品细类名称对应的进货特征值;
其中,所述舆情数据采集时间区间、天气数据采集时间区间、投诉数据采集时间区间和进货数据采集时间区间均为上一食品风险预测日期与当前系统日期之间的时间区间。
3.根据权利要求2所述的食品风险预测方法,其特征在于,所述数据统计时间段集合包括以当前系统日期为数据统计时间段终止时间点、且以第一目标网址集合的历史数据起始统计日期为数据统计时间段起始时间点的第一数据统计时间段,以当前系统日期的上一年同月份对应的第二数据统计时间段,以第二数据统计时间段及第二数据统计时间段的前一月份和后一月份组成的第三数据统计时间段,以当前系统日期的上一月份对应的第四数据统计时间段,以当前系统日期的前三个月份对应组成的第五数据统计时间段;
所述以所述食品细类集合中包括的各食品细类名称为关键词、并以数据统计时间段集合为查询条件,从第一目标网址集合对应的网页数据中采集获取与各食品细类名称对应的历史不合格率数据,以得到与各食品细类名称对应的历史特征向量,包括:
所述食品细类集合中包括的各食品细类名称为关键词,并分别以所述第一数据统计时间段、所述第二数据统计时间段、所述第三数据统计时间段、所述第四数据统计时间段和所述第五数据统计时间段作为查询条件,分别从所述第一目标网址集合对应的网页数据中采集获取各个数据统计时间段内与各食品细类名称对应的历史总抽检不合格率,以得到与各食品细类名称对应的第一特征值、第二特征值、第三特征值、第四特征值和第五特征值;
由各食品细类名称分别对应的第一特征值、第二特征值、第三特征值、第四特征值、第五特征值,以组成与各食品细类名称分别对应的历史特征向量。
4.根据权利要求2所述的食品风险预测方法,其特征在于,所述根据所述舆情数据集合统计获取各食品细类名称对应的舆情数量,以得到与各食品细类名称对应的舆情特征值,包括:
将所述舆情数据集合中每一篇舆情数据输入至预先训练的舆情数据摘要抽取模型进行摘要抽取,得到与每一篇舆情数据分别对应的舆情摘要;
判断每一篇舆情数据分别对应的舆情摘要是否包括所述食品细类集合中的若干个食品细类名称;
若有舆情数据对应的舆情摘要包括所述食品细类集合中的若干个食品细类名称,则将对应食品细类名称的舆情统计数量累加1,以得到各食品细类名称对应的舆情数量;
判断各食品细类名称对应的舆情数量是否超出预先设置的舆情数量阈值;
若有食品细类名称对应的舆情数量超出所述食品细类名称对应的舆情数量,则将对应食品细类名称相应的舆情特征值设置为1;
若有食品细类名称对应的舆情数量未超出所述食品细类名称对应的舆情数量,则将对应食品细类名称相应的舆情特征值设置为0。
5.根据权利要求2所述的食品风险预测方法,其特征在于,所述根据所述天气数据集合及各食品细类名称对应的食品敏感类型,获取各食品细类名称对应的天气特征向量,包括:
若所述天气数据集合中满足预设的连续高温条件或满足预设的连续雨天条件,根据满足连续高温条件的天气数据集合或满足连续雨天条件的天气数据集合、以及各食品细类名称对应的高温敏感性食品类型或湿度敏感性食品类型,获取各食品细类名称对应的天气特征向量;其中,所述连续高温条件为超出预设的总天数阈值为晴天且超出预设的温度阈值,所述连续雨天条件为超出预设的总天数阈值为雨天;
所述若所述天气数据集合中满足预设的连续高温条件或满足预设的连续雨天条件,根据满足连续高温条件的天气数据集合或满足连续雨天条件的天气数据集合、以及各食品细类名称对应的高温敏感性食品类型或湿度敏感性食品类型,获取各食品细类名称对应的天气特征向量,包括:
若所述天气数据集合中满足所述连续高温条件且食品细类名称对应高温敏感性食品类型,则将对应食品细类名称相应的天气特征向量中第一天气特征值设置为1;
若所述天气数据集合中满足所述连续高温条件且食品细类名称对应非高温敏感性食品类型,则将对应食品细类名称相应的天气特征向量中第一天气特征值设置为0;
若所述天气数据集合中满足所述连续雨天条件且食品细类名称对应湿度敏感性食品类型,则将对应食品细类名称相应的天气特征向量中第二天气特征值设置为1;
若所述天气数据集合中满足所述连续雨天条件且食品细类名称对应非湿度敏感性食品类型,则将对应食品细类名称相应的天气特征向量中第二天气特征值设置为0。
6.根据权利要求2所述的食品风险预测方法,其特征在于,所述根据所述投诉信息数据集合统计获取各食品细类名称对应的投诉数量,以得到与各食品细类名称对应的投诉特征值,包括:
统计获取各食品细类名称对应的投诉数量;
判断是否有食品细类名称对应的投诉数量大于预设的投诉阈值;
若有各食品细类名称对应的投诉数量大于所述投诉阈值,则将食品细类名称对应的投诉特征值设置为1;
若有各食品细类名称对应的投诉数量等于所述投诉阈值,则将食品细类名称对应的投诉特征值设置为0。
7.根据权利要求2所述的食品风险预测方法,其特征在于,所述根据当月进货数量与上一月进货数量之比,以对应得到与各食品细类名称对应的进货特征值,包括:
判断各食品细类名称对应的当月进货数量与上一月进货数量之比是否大于预设的进货数量阈值;
若有食品细类名称对应的当月进货数量与上一月进货数量之比大于所述进货数量阈值,则将对应食品细类名称相应的进货特征值设置为1;
若有食品细类名称对应的当月进货数量与上一月进货数量之比小于或等于所述进货数量阈值,则将对应食品细类名称相应的进货特征值设置为0。
8.一种食品风险预测装置,其特征在于,包括:
食品细类集合获取单元,用于调用预先设置的食品细类集合,并获取当前系统日期;其中,所述食品细类集合中包括多个食品细类名称;
多维度特征向量获取单元,用于获取所述食品细类集合中各食品细类名称对应的多维度特征向量,所述多维度特征向量包括历史特征向量、舆情特征值、天气特征向量、投诉特征值和进货特征值;
预测抽检不合格率获取单元,用于将各食品细类名称对应的多维度特征向量均作为输入预先训练训练的食品风险预设模型进行运算,得到各食品细类名称对应的预测抽检不合格率;以及
下月抽查清单生成单元,用于获取各食品细类名称对应的预测抽检不合格率中高于预设的不合格率阈值的预测抽检不合格率所对应的食品细类名称,以组成下月抽查食品细类名称清单。
9.一种设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的食品风险预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的食品风险预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011172563.0A CN112101819B (zh) | 2020-10-28 | 2020-10-28 | 食品风险预测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011172563.0A CN112101819B (zh) | 2020-10-28 | 2020-10-28 | 食品风险预测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112101819A true CN112101819A (zh) | 2020-12-18 |
CN112101819B CN112101819B (zh) | 2024-08-23 |
Family
ID=73784930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011172563.0A Active CN112101819B (zh) | 2020-10-28 | 2020-10-28 | 食品风险预测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101819B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114254951A (zh) * | 2021-12-27 | 2022-03-29 | 南方电网物资有限公司 | 一种基于数字化技术的电网设备到货抽检方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103473646A (zh) * | 2013-09-12 | 2013-12-25 | 袁晓红 | 一种食品安全风险预警系统的建设方法 |
CN108830492A (zh) * | 2018-06-22 | 2018-11-16 | 成都博宇科技有限公司 | 一种基于大数据的确定抽检商家的方法 |
CN108830507A (zh) * | 2018-06-29 | 2018-11-16 | 成都数之联科技有限公司 | 一种食品安全风险预警方法 |
CN109740896A (zh) * | 2018-12-21 | 2019-05-10 | 上海瑞涯信息科技有限公司 | 一种基于神经网络技术的食品安全精准监管方法 |
CN110458425A (zh) * | 2019-07-25 | 2019-11-15 | 腾讯科技(深圳)有限公司 | 风险主体的风险分析方法、装置、可读介质及电子设备 |
WO2019218514A1 (zh) * | 2018-05-14 | 2019-11-21 | 平安科技(深圳)有限公司 | 网页目标信息的提取方法、装置及存储介质 |
CN111027908A (zh) * | 2019-12-10 | 2020-04-17 | 福建瑞达精工股份有限公司 | 一种基于机器学习的智能粮仓管控方法及终端 |
CN111597327A (zh) * | 2020-04-22 | 2020-08-28 | 哈尔滨工业大学 | 一种面向舆情分析的无监督式多文档文摘生成方法 |
CN111600894A (zh) * | 2020-05-20 | 2020-08-28 | 新华三信息安全技术有限公司 | 一种网络攻击检测方法及装置 |
CN111738549A (zh) * | 2020-05-21 | 2020-10-02 | 平安国际智慧城市科技股份有限公司 | 食品安全风险评估方法、装置、设备及存储介质 |
-
2020
- 2020-10-28 CN CN202011172563.0A patent/CN112101819B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103473646A (zh) * | 2013-09-12 | 2013-12-25 | 袁晓红 | 一种食品安全风险预警系统的建设方法 |
WO2019218514A1 (zh) * | 2018-05-14 | 2019-11-21 | 平安科技(深圳)有限公司 | 网页目标信息的提取方法、装置及存储介质 |
CN108830492A (zh) * | 2018-06-22 | 2018-11-16 | 成都博宇科技有限公司 | 一种基于大数据的确定抽检商家的方法 |
CN108830507A (zh) * | 2018-06-29 | 2018-11-16 | 成都数之联科技有限公司 | 一种食品安全风险预警方法 |
CN109740896A (zh) * | 2018-12-21 | 2019-05-10 | 上海瑞涯信息科技有限公司 | 一种基于神经网络技术的食品安全精准监管方法 |
CN110458425A (zh) * | 2019-07-25 | 2019-11-15 | 腾讯科技(深圳)有限公司 | 风险主体的风险分析方法、装置、可读介质及电子设备 |
CN111027908A (zh) * | 2019-12-10 | 2020-04-17 | 福建瑞达精工股份有限公司 | 一种基于机器学习的智能粮仓管控方法及终端 |
CN111597327A (zh) * | 2020-04-22 | 2020-08-28 | 哈尔滨工业大学 | 一种面向舆情分析的无监督式多文档文摘生成方法 |
CN111600894A (zh) * | 2020-05-20 | 2020-08-28 | 新华三信息安全技术有限公司 | 一种网络攻击检测方法及装置 |
CN111738549A (zh) * | 2020-05-21 | 2020-10-02 | 平安国际智慧城市科技股份有限公司 | 食品安全风险评估方法、装置、设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114254951A (zh) * | 2021-12-27 | 2022-03-29 | 南方电网物资有限公司 | 一种基于数字化技术的电网设备到货抽检方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112101819B (zh) | 2024-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109190017B (zh) | 热点信息的确定方法、装置、服务器及存储介质 | |
CN109657138B (zh) | 一种视频推荐方法、装置、电子设备及存储介质 | |
EP2211281B1 (en) | System and method for using banded topic relevance and time for article prioritization | |
CN103593350B (zh) | 一种推荐推广关键词价格参数的方法和装置 | |
CN107862022B (zh) | 文化资源推荐系统 | |
JP4797069B2 (ja) | キーワード管理プログラム、キーワード管理システムおよびキーワード管理方法 | |
CN106649334B (zh) | 关联词语集合的处理方法及装置 | |
Bandi et al. | Socio-analyzer: A sentiment analysis using social media data | |
CN108897821B (zh) | 自动生成数据结论的方法及装置 | |
JP5435249B2 (ja) | イベント分析装置、イベント分析方法、およびプログラム | |
CN113961810A (zh) | 新闻推送方法、装置、计算机设备和存储介质 | |
JP5424393B2 (ja) | 単語テーマ関連度算出装置、単語テーマ関連度算出用プログラムおよび情報検索装置 | |
CN102156746A (zh) | 搜索引擎的性能评价方法 | |
CN107784387A (zh) | 一种微博事件信息传播的连续动态预测方法 | |
CN113392329A (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN111832727B (zh) | 跨数据、信息、知识模态与量纲的本质识别方法及组件 | |
CN104992318B (zh) | 行事历主动推荐事件的方法 | |
CN113485989A (zh) | 一种监管数据的综合分析方法、系统、介质和设备 | |
CN112101819A (zh) | 食品风险预测方法、装置、设备及存储介质 | |
CN113468394A (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN107729206A (zh) | 告警日志的实时分析方法、系统和计算机处理设备 | |
WO2020057237A1 (zh) | 适用于关注对象的影响力检测方法、电子终端及存储介质 | |
Hidayat et al. | Decision support system for selection of staples food and food commodity price prediction post-covid-19 using simple additive weighting and multiple linear regression methods | |
CN113282807B (zh) | 基于二部图的关键词扩展方法、装置、设备及介质 | |
JP6446851B2 (ja) | レコメンドシステム、レコメンド方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |