CN107133703A - 一种基于需求驱动的不相容工件组在线分批加工方法 - Google Patents
一种基于需求驱动的不相容工件组在线分批加工方法 Download PDFInfo
- Publication number
- CN107133703A CN107133703A CN201710405175.4A CN201710405175A CN107133703A CN 107133703 A CN107133703 A CN 107133703A CN 201710405175 A CN201710405175 A CN 201710405175A CN 107133703 A CN107133703 A CN 107133703A
- Authority
- CN
- China
- Prior art keywords
- msub
- mrow
- state
- action
- decision
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 11
- 238000004519 manufacturing process Methods 0.000 claims abstract description 61
- 238000012545 processing Methods 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims abstract description 18
- 230000005012 migration Effects 0.000 claims abstract description 9
- 238000013508 migration Methods 0.000 claims abstract description 9
- 238000003754 machining Methods 0.000 claims abstract description 4
- 230000009471 action Effects 0.000 claims description 36
- 238000003860 storage Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 5
- 230000003139 buffering effect Effects 0.000 claims 1
- 239000002699 waste material Substances 0.000 abstract description 4
- 230000008569 process Effects 0.000 abstract description 3
- 238000004378 air conditioning Methods 0.000 abstract 1
- 230000000875 corresponding effect Effects 0.000 description 4
- 239000011521 glass Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 229960000074 biopharmaceutical Drugs 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 238000010923 batch production Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 238000007514 turning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06312—Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Manufacturing & Machinery (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于需求驱动的不相容工件组在线分批加工方法,包括:1、首先把工件随机到达的在线加工过程描述为半Markov决策过程,并初始化在线生产系统的控制策略表;2、令k=1,初始化Q值表;3、在第k个决策时刻,观察系统的当前状态,并根据控制策略表控制系统进行加工;4、计算状态转移过程中产生的累计代价,并通过差分公式和Q值更新公式,更新Q值表;5、由Q值表更新控制策略表;6、将k+1赋值给k,并返回步骤3,以更新后的控制策略表来控制在线生产系统进行加工,直到所述控制策略表不再变化为止。本发明能对需求驱动下的生产加工系统进行有效的在线优化控制,从而能在满足随机需求的同时减少生产资源以及库存空间的浪费。
Description
技术领域
本发明属于生产调度技术领域,具体的说是一种基于需求驱动的不相容工件组在线分批加工方法。
背景技术
调度在大多数生产制造系统以及信息处理环境中扮演着重要的角色。在生产制造业中,合理的调度方案可以大幅提高生产效益和资源利用率,节省生产成本,从而增强企业的竞争力,推动生产制造业的发展。不相容工件组的分批加工问题属于调度问题,其广泛存在于生产生活中,如钢铁生产、生物制药、金属镀膜和货物运输等。由于生产调度问题的广泛性和重要性,国内外学者对该领域进行了深入的研究;但是,过去的研究主要集中在工件加工信息确定的问题。Lozano等人以安防玻璃制造为研究背景,针对安防玻璃的预热、加工和冷却等分批加工过程进行优化控制,其中相同防护等级的待制品属于相容工件组,并且假设工件的处理时间确定可知,见文献Lozano A J,MedagliaA.Scheduling ofparallelmachines with sequence-dependentbatches andproduct incompatibilities in anautomotive glass facility[J].Journal ofScheduling,2014,17(6):521-540。
由于现实生产环境中的调度问题通常是多约束、多目标、具有随机性的不确定优化问题。通过确定性调度方法获得的调度方案应用在调度信息具有随机性的现实生产环境中,将引起生产系统不能长期稳定运行、加工浪费以及生产效率低下等现象。此外,已有生产系统通常以最大化系统生产效率为目标;但是在现代化市场中,顾客或下游厂商对产品具有个性化和随机性需求,所以单纯的以生产效率最大化为目标的企业必将出现产能过剩和生产浪费现象。
发明内容
本发明是为解决上述现有技术存在的不足之处,提出一种基于需求驱动的不相容工件组在线分批加工方法,以期能对需求驱动下的生产加工系统进行有效的在线优化控制,从而能在满足随机需求的同时减少生产资源以及库存空间的浪费。
本发明为解决技术问题采用如下技术方案:
本发明一种基于需求驱动的不相容工件组在线分批加工方法的特点是应用于由传送带、工件、自动搬运设备、缓存库、批处理机器和成品库组成的在线生产系统中;在所述在线生产系统中,工件随机到达,并存放在所述缓冲库中等待所述批处理机器加工,加工完成的工件存放在所述成品库中;假设所述缓冲库和成品库中各存在m个不相容工件组,令所述缓冲库中属于第j个不相容工件组的工件个数为bfj、所述成品库中属于第j个不相容工件组的工件个数为bkj;从所述成品库的m个不相容工件组中各取一个工件所形成的一套成品即能响应随机到达的一次需求;所述基于需求驱动的不相容工件组在线分批加工方法是按如下步骤进行:
步骤1、定义所述在线生产系统的状态空间Φ={s|s=(bf1,bf2,…,bfm,bk1,bk2,…,bkm)},其中,s为所述状态空间Φ中的任一状态,s∈Φ;
定义所述在线生产系统的行动空间为D={v0,v1,…,vj,…,vm};v0表示所述批处理机器等待一个工件到达缓冲库中,vj表示所述批处理机器选择第j个不相容工件组进行加工;
定义所述在线生产系统的决策时刻为所述批处理机器空闲,且有一个工件到达所述缓冲库的时刻,或为所述批处理机器完成加工的时刻;
步骤2、利用所述在线生产系统在所有历史状态下所采取的行动来初始化控制策略表;
步骤3、定义变量k,并初始化k=1,设置玻尔兹曼常数K和温度T;
定义Q值表中的元素为状态-行动对值,并初始化所述Q值表中的元素均为“0”;
步骤4、在所述在线生产系统的第k个决策时刻,观察所述在线生产系统的当前状态并记为sk,令所述第k个决策时刻的当前状态sk在Q值表中所对应的状态记为s′,则sk=s′;令所述第k个决策时刻的当前状态sk下采取的行动记为 在第k个决策时刻的当前状态sk下,从行动空间D中选择任意行动vr,并以概率将vr赋值给以概率将vs′赋值给其中,Q(s′,vr)表示第k个决策时刻的状态sk=s′时采取行动vr的状态-行动对值;Q(s′,vs′)表示第k个决策时刻的状态sk=s′下采取行动vs′的状态-行动对值;采取行动后,系统在第k+1个决策时刻的当前状态sk转移到下一状态sk+1,将下一状态sk+1在Q值表中所对应的状态记为s″,则sk+1=s″;其中,s′,s″∈Φ;
步骤5、利用式(1)计算所述在线生产系统从第k个决策时刻的当前状态sk,采取行动转移到第k+1个决策时刻的状态sk+1的状态转移过程中产生的累计代价
式(1)中,N表示所述状态转移过程中产生随机需求的总数;R表示所述状态转移过程中随机需求得到响应的次数,并有R=min(min(bk1,bk2,…,bkm),N);W表示一次需求未得到响应所产生的惩罚代价;Lj表示所述成品库中单位时间存储第j个不相容工件组的代价;Δti表示第i次需求与第i+1次需求的时间间隔,i=0时表示第k个决策时刻与第i+1次需求的时间间隔,i=R时表示第R次需求与第k+1个决策时刻的时间间隔;
步骤6、利用式(2)和式(3)所示的差分公式和Q值更新公式,更新所述Q值表中当前状态sk下采取行动的状态-行动对值得到更新后的当前状态sk下采取行动的状态-行动对值
式(2)中,ΔTk,k+1表示第k个决策时刻与第k+1个决策时刻的时间间隔;表示在第k个决策时刻之前所有状态为s′时采取行动vs′转移到下一状态s″过程中产生的累计代价的平均估计值;vr表示所述行动空间D中的任一行动;Q(sk+1,vr)表示转移到第k+1个决策时刻的状态sk+1下采取任一行动vr的状态-行动对值;
式(3)中,为第k个决策时刻的当前状态sk下采取行动的学习步长;
步骤7、选择更新后Q值表中每行最小的状态-行动对值所对应的行动构成当前行动集合,并利用当前行动集合更新所述控制策略表;
步骤8、将k+1赋值给k,并返回步骤4,直到所述控制策略表不再变化为止,从而以最终的控制策略表对m个不相容工件组进行在线分批加工。
与现有技术相比,本发明的有益效果在于:
1、本发明以最大化需求满足率和最小化工件的存储代价为优化目标,通过Q学习方法对不相容工件组的在线分批加工问题进行优化控制;相比单纯以最大化生产效率为目标的生产加工,本发明在满足了随机需求的同时,减少了生产资源以及库存空间的浪费。
2、本发明以缓冲库和成品库为在线生产系统的联合状态;以批处理机器空闲,且有一个工件到达缓冲库的时刻,或批处理机器完成加工的时刻为决策时刻;把工件随机到达的在线生产加工过程描述为半Markov决策过程,并根据系统的实时状态采取相应行动;因此本发明能够有效的处理工件和需求随机到达的不相容工件组在线分批加工问题。
3、本发明通过Q学习方法对不相容工件组的在线分批加工问题进行优化控制,相比理论求解方法,本发明不需要模型的完整参数,并且可以根据实际生产系统的加工过程进行在线学习;
4、本发明给出的生产调度方法,实现简单且效果明显,可用于生物制药、金属镀膜等带有不相容工件组的生产调度问题。
附图说明
图1为本发明方法流程图;
图2为本发明在线生产系统的示意图。
具体实施方式
本实施例中,一种基于需求驱动的不相容工件组在线分批加工方法,应用于如图2所示传送带1、工件2、自动化搬运设备4、缓存库5、批处理机器6和成品库7组成的在线生产系统中;在线生产系统中,工件2沿传送带1随机到达,且工件2分别属于m个不相容工件组;不相容工件组是指属于不同组的工件不能被安排在同一批中加工。随机到达的工件2在固定捡取点3处,由自动化搬运设备4捡取到缓冲库5中等待批处理机器6加工,加工完成的工件2存放在成品库7中;并且批处理机器6的容量有限。假设缓冲库5和成品库7中各存在m个不相容工件组,令缓冲库5中属于第j个不相容工件组的工件个数为bfj、成品库7中属于第j个不相容工件组的工件个数为bkj;从成品库7的m个不相容工件组中各取一个工件所形成的一套成品即能响应随机到达的一次需求。
如图1所示,该基于需求驱动的不相容工件组在线分批加工方法是按如下步骤进行:
步骤1、定义在线生产系统的状态空间Φ={s|s=(bf1,bf2,…,bfm,bk1,bk2,…,bkm)},其中,s为状态空间Φ中的任一状态,s∈Φ;
定义在线生产系统的行动空间为D={v0,v1,…,vj,…,vm};v0表示批处理机器6等待一个工件2到达缓冲库5中,vj表示批处理机器6选择第j个不相容工件组进行加工;
定义在线生产系统的决策时刻为批处理机器空闲,且有一个工件到达缓冲库的时刻,或为批处理机器完成加工的时刻;
步骤2、利用在线生产系统在所有历史状态下所采取的行动来初始化控制策略表;控制策略表如所示,其中表示在状态sn下采取的行动,且sn∈Φ,N表示状态空间Φ中的状态总数。在线生产系统的历史数据可以是已有的控制策略表,或者是通过历史生产数据仿真得到的控制策略表。
步骤3、定义变量k,并初始化k=1;设置玻尔兹曼常数K和温度T;
定义Q值表中的元素为状态-行动对值,并初始化Q值表中的元素均为“0”;Q值表的形
式如所示,表中的行对应状态,列对应行动。
步骤4、在线生产系统的第k个决策时刻,通过传感器等设备获得缓冲库5和成品库7中工件2存储情况,并得到在线生产系统的当前状态sk;令第k个决策时刻的当前状态sk在Q值表中所对应的状态记为s′,则sk=s′;令第k个决策时刻的当前状态sk下采取的行动记为在第k个决策时刻的当前状态sk下,从行动空间D中选择任意行动vr,并以概率将vr赋值给以概率将vs′赋值给其中,Q(s′,vr)表示第k个决策时刻的状态sk=s′时采取行动vr的状态-行动对值;Q(s′,vs′)表示第k个决策时刻的状态sk=s′下采取行动vs′的状态-行动对值;采取行动后,系统在第k+1个决策时刻的当前状态sk转移到下一状态sk+1,将下一状态sk+1在Q值表中所对应的状态记为s″,则sk+1=s″;其中,s′,s″∈Φ;
步骤5、利用式(1)计算在线生产系统从第k个决策时刻的当前状态sk,采取行动转移到第k+1个决策时刻的状态sk+1的状态转移过程中产生的累计代价
式(1)中,N表示状态转移过程中产生随机需求的总数;R表示状态转移过程中随机需求得到响应的次数,并有R=min(min(bk1,bk2,…,bkm),N);W表示一次需求未得到响应所产生的惩罚代价;Lj表示成品库中单位时间存储第j个不相容工件组的代价;Δti表示第i次需求与第i+1次需求的时间间隔,i=0时表示第k个决策时刻与第i+1次需求的时间间隔;i=R时表示第R次需求与第k+1个决策时刻的时间间隔;
步骤6、利用式(2)和式(3)所示的差分公式和Q值更新公式,更新Q值表中当前状态sk下采取行动的状态-行动对值得到更新后的当前状态sk下采取行动的状态-行动对值
式(2)中,ΔTk,k+1表示第k个决策时刻与第k+1个决策时刻的时间间隔;表示在第k个决策时刻之前所有状态为s′时采取行动vs′转移到下一状态s″过程中产生的累计代价的平均估计值;vr表示行动空间D中的任一行动;Q(sk+1,vr)表示转移到第k+1个决策时刻的状态sk+1下采取任一行动vr的状态-行动对值;
式(3)中,为第k个决策时刻的当前状态sk下采取行动的学习步长;
步骤7、选择更新后Q值表中每行最小的状态-行动对值所对应的行动构成当前行动集合,并利用当前行动集合更新控制策略表;
步骤8、将k+1赋值给k,并返回步骤4,直到控制策略表不再变化为止,从而以最终的控制策略表对m个不相容工件组进行在线分批加工。
Claims (1)
1.一种基于需求驱动的不相容工件组在线分批加工方法,其特征是应用于由传送带、工件、自动搬运设备、缓存库、批处理机器和成品库组成的在线生产系统中;在所述在线生产系统中,工件随机到达,并存放在所述缓冲库中等待所述批处理机器加工,加工完成的工件存放在所述成品库中;假设所述缓冲库和成品库中各存在m个不相容工件组,令所述缓冲库中属于第j个不相容工件组的工件个数为bfj、所述成品库中属于第j个不相容工件组的工件个数为bkj;从所述成品库的m个不相容工件组中各取一个工件所形成的一套成品即能响应随机到达的一次需求;所述基于需求驱动的不相容工件组在线分批加工方法是按如下步骤进行:
步骤1、定义所述在线生产系统的状态空间Φ={s|s=(bf1,bf2,…,bfm,bk1,bk2,…,bkm)},其中,s为所述状态空间Φ中的任一状态,s∈Φ;
定义所述在线生产系统的行动空间为D={v0,v1,…,vj,…,vm};v0表示所述批处理机器等待一个工件到达缓冲库中,vj表示所述批处理机器选择第j个不相容工件组进行加工;
定义所述在线生产系统的决策时刻为所述批处理机器空闲,且有一个工件到达所述缓冲库的时刻,或为所述批处理机器完成加工的时刻;
步骤2、利用所述在线生产系统在所有历史状态下所采取的行动来初始化控制策略表;
步骤3、定义变量k,并初始化k=1,设置玻尔兹曼常数K和温度T;
定义Q值表中的元素为状态-行动对值,并初始化所述Q值表中的元素均为“0”;
步骤4、在所述在线生产系统的第k个决策时刻,观察所述在线生产系统的当前状态并记为sk,令所述第k个决策时刻的当前状态sk在Q值表中所对应的状态记为s′,则sk=s′;令所述第k个决策时刻的当前状态sk下采取的行动记为在第k个决策时刻的当前状态sk下,从行动空间D中选择任意行动vr,并以概率将vr赋值给以概率将vs′赋值给其中,Q(s′,vr)表示第k个决策时刻的状态sk=s′时采取行动vr的状态-行动对值;Q(s′,vs′)表示第k个决策时刻的状态sk=s′下采取行动vs′的状态-行动对值;采取行动后,系统在第k+1个决策时刻的当前状态sk转移到下一状态sk+1,将下一状态sk+1在Q值表中所对应的状态记为s″,则sk+1=s″;其中,s′,s″∈Φ;
步骤5、利用式(1)计算所述在线生产系统从第k个决策时刻的当前状态sk,采取行动转移到第k+1个决策时刻的状态sk+1的状态转移过程中产生的累计代价
<mrow>
<mi>f</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
</msub>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>0</mn>
</mrow>
<mi>R</mi>
</munderover>
<msub>
<mi>&Delta;t</mi>
<mi>i</mi>
</msub>
<mo>&CenterDot;</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>m</mi>
</munderover>
<msub>
<mi>L</mi>
<mi>j</mi>
</msub>
<mo>&CenterDot;</mo>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>bk</mi>
<mi>j</mi>
</msub>
<mo>-</mo>
<mi>i</mi>
<mo>,</mo>
<mn>0</mn>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>W</mi>
<mo>&CenterDot;</mo>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
<mrow>
<mo>(</mo>
<mi>N</mi>
<mo>-</mo>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
<mo>(</mo>
<mrow>
<msub>
<mi>bk</mi>
<mn>1</mn>
</msub>
<mo>,</mo>
<msub>
<mi>bk</mi>
<mn>2</mn>
</msub>
<mo>,</mo>
<mo>...</mo>
<mo>,</mo>
<msub>
<mi>bk</mi>
<mi>m</mi>
</msub>
</mrow>
<mo>)</mo>
<mo>,</mo>
<mn>0</mn>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
式(1)中,N表示所述状态转移过程中产生随机需求的总数;R表示所述状态转移过程中随机需求得到响应的次数,并有R=min(min(bk1,bk2,…,bkm),N);W表示一次需求未得到响应所产生的惩罚代价;Lj表示所述成品库中单位时间存储第j个不相容工件组的代价;Δti表示第i次需求与第i+1次需求的时间间隔,i=0时表示第k个决策时刻与第i+1次需求的时间间隔,i=R时表示第R次需求与第k+1个决策时刻的时间间隔;
步骤6、利用式(2)和式(3)所示的差分公式和Q值更新公式,更新所述Q值表中当前状态sk下采取行动的状态-行动对值得到更新后的当前状态sk下采取行动的状态-行动对值
<mrow>
<msub>
<mi>c</mi>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
</msub>
<mo>=</mo>
<mi>f</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
</msub>
<mo>,</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<msub>
<mi>&Delta;T</mi>
<mrow>
<mi>k</mi>
<mo>,</mo>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mover>
<mi>&eta;</mi>
<mo>~</mo>
</mover>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
</msub>
<mo>+</mo>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mrow>
<msup>
<mi>v</mi>
<mi>r</mi>
</msup>
<mo>&Element;</mo>
<mi>D</mi>
</mrow>
</munder>
<mi>Q</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<msup>
<mi>v</mi>
<mi>r</mi>
</msup>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mi>Q</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msup>
<mi>Q</mi>
<mo>&prime;</mo>
</msup>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
</msub>
<mo>)</mo>
</mrow>
<mo>:</mo>
<mo>=</mo>
<mi>Q</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
</msub>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>&gamma;</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
</msub>
<mo>)</mo>
</mrow>
<msub>
<mi>c</mi>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
</msub>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
式(2)中,ΔTk,k+1表示第k个决策时刻与第k+1个决策时刻的时间间隔;表示在第k个决策时刻之前所有状态为s′时采取行动vs′转移到下一状态s″过程中产生的累计代价的平均估计值;vr表示所述行动空间D中的任一行动;Q(sk+1,vr)表示转移到第k+1个决策时刻的状态sk+1下采取任一行动vr的状态-行动对值;
式(3)中,为第k个决策时刻的当前状态sk下采取行动的学习步长;
步骤7、选择更新后Q值表中每行最小的状态-行动对值所对应的行动构成当前行动集合,并利用当前行动集合更新所述控制策略表;
步骤8、将k+1赋值给k,并返回步骤4,直到所述控制策略表不再变化为止,从而以最终的控制策略表对m个不相容工件组进行在线分批加工。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710405175.4A CN107133703A (zh) | 2017-06-01 | 2017-06-01 | 一种基于需求驱动的不相容工件组在线分批加工方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710405175.4A CN107133703A (zh) | 2017-06-01 | 2017-06-01 | 一种基于需求驱动的不相容工件组在线分批加工方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107133703A true CN107133703A (zh) | 2017-09-05 |
Family
ID=59734288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710405175.4A Pending CN107133703A (zh) | 2017-06-01 | 2017-06-01 | 一种基于需求驱动的不相容工件组在线分批加工方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107133703A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108215202A (zh) * | 2018-01-15 | 2018-06-29 | 合肥工业大学 | 一种考虑打印质量的3d打印分批控制方法 |
CN111260144A (zh) * | 2020-01-20 | 2020-06-09 | 合肥工业大学 | 一种差异工件随机到达情况下单机批调度问题的求解方法 |
CN111517112A (zh) * | 2020-04-21 | 2020-08-11 | 合肥工业大学 | 一种改进的tp+lcm全贴合系统及控制方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030220828A1 (en) * | 2002-05-23 | 2003-11-27 | Chih-An Hwang | Polymer production scheduling using transition models |
CN102938102A (zh) * | 2012-10-19 | 2013-02-20 | 北京理工大学 | 一种带有批处理机的跨作业单元调度方法 |
CN104635772A (zh) * | 2014-12-08 | 2015-05-20 | 南京信息工程大学 | 一种制造系统自适应动态调度方法 |
-
2017
- 2017-06-01 CN CN201710405175.4A patent/CN107133703A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030220828A1 (en) * | 2002-05-23 | 2003-11-27 | Chih-An Hwang | Polymer production scheduling using transition models |
CN102938102A (zh) * | 2012-10-19 | 2013-02-20 | 北京理工大学 | 一种带有批处理机的跨作业单元调度方法 |
CN104635772A (zh) * | 2014-12-08 | 2015-05-20 | 南京信息工程大学 | 一种制造系统自适应动态调度方法 |
Non-Patent Citations (1)
Title |
---|
李博川: "两品种工件混流的多站点CSPS系统最优控制研究", 《中国优秀硕士学位论文全文数据库 基础科学辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108215202A (zh) * | 2018-01-15 | 2018-06-29 | 合肥工业大学 | 一种考虑打印质量的3d打印分批控制方法 |
CN108215202B (zh) * | 2018-01-15 | 2020-02-11 | 合肥工业大学 | 一种考虑打印质量的3d打印分批控制方法 |
CN111260144A (zh) * | 2020-01-20 | 2020-06-09 | 合肥工业大学 | 一种差异工件随机到达情况下单机批调度问题的求解方法 |
CN111517112A (zh) * | 2020-04-21 | 2020-08-11 | 合肥工业大学 | 一种改进的tp+lcm全贴合系统及控制方法 |
CN111517112B (zh) * | 2020-04-21 | 2021-09-24 | 合肥工业大学 | 一种改进的tp+lcm全贴合系统及控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liang et al. | Intelligent manufacturing systems: a review | |
CN103942610B (zh) | 基于任务的可重组制造系统多态构型优化方法 | |
CN110598941A (zh) | 一种基于仿生策略的粒子群优化制造系统双目标排产方法 | |
CN114186791B (zh) | 一种面向多型号小批量的复杂装备产品装调生产动态调度方法 | |
CN111882215A (zh) | 一种含有agv的个性化定制柔性作业车间调度方法 | |
CN107133703A (zh) | 一种基于需求驱动的不相容工件组在线分批加工方法 | |
Yamazaki et al. | Design method of material handling systems for lean automation—Integrating equipment for reducing wasted waiting time | |
CN111861167A (zh) | 基于分解的多目标优化算法的生产线在线动态调度方法 | |
CN108197833A (zh) | 一种面向离散车间的完全实时调度系统和调度方法 | |
CN111401611B (zh) | 一种化工厂设备巡检点路线优化方法 | |
Liao et al. | Optimization and simulation of job-shop supply chain scheduling in manufacturing enterprises based on particle swarm optimization | |
CN116880424A (zh) | 一种基于多目标优化的多机器人调度方法以及装置 | |
Wang et al. | Genetic algorithm in flexible work shop scheduling based on multi-objective optimization | |
CN111667091A (zh) | 一种基于粒子群算法的输送系统智能控制方法 | |
CN112418478A (zh) | 一种柔性流水车间下的低碳调度模型及节能优化方法 | |
CN115018180B (zh) | 一种锡工艺品原料节能配送与加工的超启发式调度方法、系统 | |
CN112926792B (zh) | 基于滚动时间窗的焊接车间订单变更动态调度方法及系统 | |
CN118011978A (zh) | 考虑随机干扰的柔性流水车间动态调度与维护优化方法 | |
CN117647960A (zh) | 一种基于深度强化学习的车间调度方法、装置和系统 | |
CN116300756A (zh) | 带运输机器人柔性制造车间的双目标优化调度方法及系统 | |
CN115629584A (zh) | 一种基于改进乌鸦搜索算法的订单排产优化方法 | |
CN116861571A (zh) | 一种金属模具制造加工岛的加工工序选择方法 | |
CN115062936A (zh) | 一种考虑区域责任制的汽车装配线动态周期性物料配送调度方法 | |
Liu et al. | Scheduling optimization of flexible flow shop | |
CN110147078B (zh) | 一种无故障rgv智能系统二道工序加工动态调度方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170905 |