-
TECHNISCHES GEBIET
-
Die vorliegende Erfindung betrifft ein Spritzgießmaschinensystem, das maschinelles Lernen verwendet.
-
STAND DER TECHNIK
-
Im Allgemeinen weisen Spritzgießmaschinen eine Spritzvorrichtung und eine Formklemmvorrichtung auf. Beispielsweise besteht die Einspritzvorrichtung aus einem Heizzylinder und einer Schnecke, die in dem Heizzylinder angeordnet ist, um in einer Drehrichtung und einer axialen Richtung angetrieben werden zu können. Andererseits besteht die Formklemmvorrichtung beispielsweise aus einer festen Scheibe, an der eine feste Matrize befestigt ist, einer beweglichen Scheibe, an der eine bewegliche Matrize befestigt ist, und einem Matrizenbefestigungsmechanismus zum Öffnen oder Schließen der beweglichen Matrize in Bezug auf die feste Matrize. Die Schnecke wird rotatorisch angetrieben und dem Heizzylinder wird Harzmaterial zugeführt, wobei geschmolzenes Harzmaterial an der Spitze des Heizzylinders gemessen und in den Hohlraum der befestigten Matrizen eingespritzt wird, um diesen aufzufüllen. Ein Formprodukt mit einer vorgeschriebenen Form wird erhalten, indem die bewegliche Matrize geöffnet wird, nachdem das Harzmaterial abgekühlt und verfestigt ist.
-
Im Allgemeinen variieren die Formbedingungen wie eine Einspritzgeschwindigkeit, ein Einspritzhub, eine Zylindertemperatur, eine Werkzeugbefestigungskraft und eine Druckhaltezeit von einem Formprodukt zum anderen. Die Formbedingungen werden normalerweise durch wiederholtes Spritzgießen eingestellt, um gute Formprodukte herzustellen. Eine solche Einstellung der Formbedingungen (welches als „Bestimmung der Formbedingungen“ bezeichnet wird) erfordert im Allgemeinen die Fähigkeiten eines Bedieners. Wenn ein Formfehler aufgetreten ist, beurteilt ein Bediener dessen Art (genauer gesagt einen Fehlertyp wie eine Sinkmarke, einen Grat oder einen Hohlraum) und passt die Formbedingungen entsprechend dem Fehlertyp an. Wenn beispielsweise ein Formprodukt eine Sinkmarke aufweist, passt der Bediener die Einspritzgeschwindigkeit, den Einspritzhub, den Haltedruck usw. an.
-
LITERATURLISTE
-
PATENTLITERATUR
-
- PTL 1: JP-A-2017-30152
- PTL 2: JP-A-2017-30221
-
PTL 1 schlägt ein Spritzgießmaschinensystem vor, bei dem die Spritzgießbedingungen von einem Maschinenlerner angepasst werden, der durch das sogenannte Verstärkungslernen lernt. Der in PTL 1 offenbarte Maschinenlerner steuert eine Spritzgießmaschine als Agent, während er durch Verstärkungslernen lernt.
-
Wenn ein Agent beim Verstärkungslernen eine Aktion (Aktion) auswählt, wenn sich ein Kontrollziel in einem vorgeschriebenen Zustand (Zustand) befindet, wechselt der Zustand des Kontrollziels im Allgemeinen in einen anderen Zustand und der Agent erhält eine Belohnung (Belohnung). Der Agent erhält eine Wertefunktion, die zukünftige Belohnungen (d.h. kumulative Belohnungen) angibt, die der Agent erhalten kann, wenn er weiterhin Aktionen gemäß einer vorgeschriebenen Richtlinie (Richtlinie) bestimmt. Wertefunktionen umfassen eine Zustandswertefunktion, die nur durch einen Zustand ausgedrückt wird, eine Aktionswertefunktion, die einen Wert einer vorgeschriebenen Aktion in einem bestimmten Zustand anzeigt usw. Der Agent lernt wiederholt, um eine solche Wertefunktion zu aktualisieren und die kumulative Belohnung zu maximieren.
-
Der in PTL 1 beschriebene Agent führt das Lernen durch, während physikalische Größen, die sich auf das Spritzgießen beziehen, als Zustand verwendet werden, Manipulationsbedingungen (d.h. Formbedingungen) als Aktion behandelt werden und eine berechnete Belohnung erhalten wird. Der Agent kann verschiedene Bewertungsziele bei der Berechnung einer Belohnung berücksichtigen; beispielsweise kann der Agent die Formqualität (gut/oder nicht gut) als Bewertungsziel verwenden. In diesem Fall erhält der Agent eine positive Belohnung, wenn ein Formprodukt gut ist, und eine negative Belohnung, wenn ein Formprodukt einen Formfehler aufweist. Wenn das Lernen der Bewertungsfunktion ausreichend verlaufen ist, können optimale Formbedingungen in einem vorgeschriebenen Zustand erhalten werden, wenn eine Aktion (d.h. Formbedingungen) ausgewählt wird, welche die Ausgabe der Bewertungsfunktion maximiert.
-
PTL 2 bietet eine Abnormalitätsdiagnosevorrichtung an, die eine Abnormalitätsdiagnose auf einer Spritzgießmaschine durch Lernen durch sogenanntes überwachtes Lernen durchführt. Die in PTL 2 offenbarte Abnormalitätsdiagnosevorrichtung verwendet einen Maschinenlerner mit einem Algorithmus wie einem SVM oder einem neuronalen Netzwerk und verwendet interne oder externe Zustandsdaten in der Spritzgießmaschine als Eingabedaten und verwendet abnormale oder normale Daten der Spritzgießmaschine als Ausgangsdaten (d.h. Lehrsignal). Beispiele für die internen oder externen Zustandsdaten sind eine Last der Antriebseinheit, eine Frequenzcharakteristik der Achse, ein Harzdruck und eine Alarmgenerierungshistorie. Wenn das Lernen der Abnormalitätsdiagnosevorrichtung ausreichend fortgeschritten ist, kann richtig beurteilt werden, ob die Spritzgießmaschine für vorgeschriebene Zustandsdaten normal arbeitet.
-
ZUSAMMENFASSUNG DER ERFINDUNG
-
TECHNISCHES PROBLEM
-
Sobald die Formbedingungen einer Spritzgießmaschine von einem Bediener bestimmt wurden, können Formprodukte in Massenproduktion hergestellt werden, indem die Spritzgießmaschine kontinuierlich betrieben wird. Wenn jedoch unter bestimmten Formbedingungen wiederholt Spritzguss durchgeführt wird, kann ein Formfehler auftreten. Mit anderen Worten kann ein Formfehler selbst unter den gleichen Formbedingungen aufgrund einer Änderung des Zustands der Spritzgießmaschine auftreten, die durch eine Änderung in einer äußeren Umgebung (z. B. eine Änderung der Außentemperatur oder eine Änderung der Maschinentemperatur) oder Verschleiß mechanischer Komponenten wie einer Schraube, eines Rückflussverhinderungsrings, eines Kniehebels oder einer Buchse aufgrund einer Alterungsverschlechterung verursacht wird. Selbst wenn ein Formfehler aufgetreten ist, können die Formbedingungen neu eingestellt werden, wenn ein Bediener ihn bald findet. Ein Formfehler kann jedoch weiterhin bestehen, wenn in der Nähe der Spritzgießmaschine kein Bediener vorhanden ist, wie im Fall eines Nachtbetriebs.
-
Eine beispielhafte Maßnahme gegen das obige Phänomen wäre das automatische Einstellen der Formbedingungen durch den in PTL 1 beschriebenen Agent. Wenn die Wertefunktion richtig und ausreichend gelernt wurde, können optimale Formbedingungen gemäß einem aktuellen Zustand der Spritzgießmaschine berechnet werden und ein Formfehler besteht grundsätzlich nicht weiter. Der Zustand (Zustand), der von dem in PTL 1 beschriebenen Agent behandelt wird, ist jedoch nur physikalische Größe, die sich auf das Spritzgießen bezieht. Wenn jede physikalische Größe ein Ziel wäre, könnte der Agent jedes Ereignis theoretisch berücksichtigen. Wenn alle physikalischen Größen wie das Gewicht und die Abmessungen eines Formprodukts und das Aussehen, die Länge, der Winkel, die Fläche, das Volumen usw., die aus Bilddaten des Formprodukts berechnet werden, als Zustand verwendet würden, könnte der Agent optimale Formbedingungen als Aktion (Aktion) ausgeben.
-
In einem Fall, in dem eine große Anzahl physikalischer Größen als Zustand verwendet wird, sind jedoch übermäßige Computerressourcen erforderlich. Darüber hinaus nimmt der Rechenaufwand explosionsartig zu und es ist im Wesentlichen unmöglich, die Wertefunktion in einer begrenzten Zeit richtig zu lernen. Dies kann im Lichte eines Verfahrens erwartet werden, mit dem ein erfahrener Bediener die Formbedingungen einstellt. Beim Einstellen der Formbedingungen stellt ein erfahrener Bediener nicht alle Bedingungen (d.h. Einspritzgeschwindigkeit, Einspritzhub, Zylindertemperatur, Druckhaltezeit, Druckhaltung usw.) gleichzeitig ein. Der Bediener beurteilt einen Fehlertyp, wählt die Formbedingungen aus, die entsprechend dem Fehlertyp eingestellt werden sollen, und beurteilt, ob der Wert jeder dieser Formbedingungen erhöht oder verringert werden soll. Das heißt, der Bediener wählt die Formbedingungen aus, die entsprechend dem Fehlertyp eingestellt werden sollen. Dies ermöglicht eine schnelle Anpassung der Formbedingungen. Im Gegensatz dazu verfügt der in PTL 1 beschriebene Agent nicht über Informationen, die zur Auswahl der Formbedingungen erforderlich sind. Aus diesem Grund muss der Agent eine enorme Menge an Informationen lernen, um unter Verwendung anderer physikalischer Daten ein Urteil fällen zu können, welches einer solchen Auswahl entspricht.
-
Eine andere Maßnahme wäre das Einstellen der Formbedingungen unter Verwendung des in PTL 2 beschriebenen Verfahrens. Insbesondere werden verschiedene physikalische Bedingungen, die sich auf die Spritzgießmaschine beziehen, einer Steuervorrichtung als Eingabedaten unter Verwendung eines neuronalen Netzwerks oder dergleichen gegeben und Formbedingungen welche für diesem Zeitpunkt optimal sind werden dem Steuergerät als Trainingsdaten gegeben. Wenn das Lernen der Steuervorrichtung fortschreitet, sollte die Steuervorrichtung optimale Empfangsbedingungen ausgeben, wenn aktuelle physikalische Daten bezüglich der Spritzgießmaschine empfangen werden. Optimale Formbedingungen sind jedoch im Allgemeinen nicht bekannt und eine enorme Menge an Trainingsdaten, die zum Lernen erforderlich sind, kann nicht erhalten werden. Aus diesem Grund ist es für einen Maschinenlerner, der überwachtes Lernen durchführt, schwierig, die Formbedingungen anzupassen.
-
Eine Ziel der vorliegenden Erfindung ist es, ein Spritzgießmaschinensystem bereitzustellen, das keine übermäßigen Computerressourcen verbraucht, nicht viel Zeit und Kosten zum Lernen erfordert und die Formbedingungen schnell anpassen kann.
-
LÖSUNG DES PROBLEMS
-
- [1] Gemäß einem ersten Aspekt der Erfindung umfasst ein Spritzgießmaschinensystem: ein Agent mit einem Maschinenlerner, wobei der Maschinenlerner ein Verstärkungslernen zum Bestimmen einer Aktion gemäß einer Wertefunktion durchführt, während dieser für Aktionen, die in verschiedenen Zuständen ausgeführt wurden und für das Lernen der Wertefunktion Belohnungen erhält und eine Spritzgießmaschine, die konfiguriert ist, um ein Formprodukt unter vorgeschriebenen Formbedingungen herzustellen; und das Spritzgießmaschinensystem konfiguriert ist, um die Formbedingungen unter Verwendung des Agents einzustellen, in dem der Maschinenlerner konfiguriert ist, zum: Verwenden von physikalischen Daten, die von der Spritzgießmaschine erhalten wurden, und einem Fehlertyp, der einen Typ eines Formfehlers des Formprodukts darstellt, als Zustände; Verwenden der Formbedingungen als Aktion; und Verwenden eines Erfassungszustands, der ein Fehlergrad eines Formfehlers anzeigt, als Belohnung.
- [2] Gemäß einem zweiten Aspekt der Erfindung umfasst das Spritzgießmaschinensystem nach dem ersten Aspekt ferner: eine Fehlerbeurteilungsvorrichtung, die konfiguriert ist, um das Formprodukt zu messen; und ein Klassifizierer, der konfiguriert ist, um Lernen durch überwachtes Lernen durchzuführen; wobei der Maschinenlerner konfiguriert ist, um als Fehlertyp und Fehlerzustand Ausgabedaten zu verwenden, die vom Klassifizierer erhalten werden, wenn Eingabedaten einschließlich Messdaten des Formprodukts, die unter Verwendung der Fehlerbeurteilungsvorrichtung gemessen wurden, in den Klassifizierer eingegeben werden, der das Lernen durchgeführt hat.
- [3] Gemäß einem dritten Aspekt der Erfindung ist der Klassifizierer gemäß des zweiten Aspekts dazu konfiguriert das Lernen unter Verwendung mehrerer tatsächlicher Produktdatensätze auszuführen, die jeweils die Messdaten, den Fehlertyp und den Fehlerzustand des tatsächlichen Formprodukts und mehrerer Quasi-Datensätze enthalten, und wobei die Quasi-Datensätze die Messdaten, den Fehlertyp und den Fehlerzustand enthalten, die durch Ändern der tatsächlichen Produktdatensätze erhalten werden.
-
VERTEILHAFTE EFFEKTE DER ERFINDUNG
-
Der oben beschriebene erste Aspekt ermöglicht es, die Formbedingungen des Spritzgießmaschinensystems mittels des Agents auf optimale einzustellen. Damit der Agent richtig lernen kann, um die Formbedingungen optimal einstellen zu können, werden physikalische Daten, die von der Spritzgießmaschine erhalten wurden, und ein Fehlertyp, der eine Art Formfehler des Formprodukts darstellt, als Zustand verwendet (Zustand). Die Formbedingungen werden als Aktion (Aktion) verwendet, und ein Fehlerzustand, der einen Fehlergrad eines Formfehlers anzeigt, ist die Belohnung (Belohnung). Da der Zustand einen Fehlertyp enthält, wählt der Agent eine Formbedingung aus, die gemäß einem Fehlertyp eingestellt werden soll, und bestimmt, ob der Wert der ausgewählten Formbedingung auf die erhöht oder verringert werden soll, in gleicher Weise wie es ein erfahrener Bediener macht. Mit der obigen Konfiguration kann der Agent in relativ kurzer Zeit lernen und somit die Lerneffizienz erhöhen und die Lernkosten senken. Infolgedessen verbraucht der Agent während des Lernens keine übermäßigen Computerressourcen. Somit verbraucht das Spritzgießmaschinensystem gemäß diesem Aspekt keine übermäßigen Computerressourcen, erfordert nicht viel Zeit und Kosten zum Lernen und kann die Formbedingungen schnell anpassen.
-
Gemäß dem oben beschriebenen zweiten Aspekt ist das Spritzgießmaschinensystem mit einer Fehlerbeurteilungsvorrichtung ausgestattet, die das Formprodukt misst, und einem Klassifizierer, der durch überwachtes Lernen lernt. Der Maschinenlerner verwendet als Fehlertyp und Fehlerzustand Ausgabedaten, die von dem Klassifizierer erhalten werden, der gelernt hat, wenn Messdaten des Formprodukts, die unter Verwendung der Fehlerbewertungsvorrichtung gemessen wurden, in den Klassifizierer eingegeben werden. Das heißt, der Klassifizierer gibt einen Fehlertyp und einen Fehlerzustand auf der Basis von Messdaten eines Formprodukts aus und leitet sie an den Agent weiter. Mit anderen Worten, Informationen werden vom Klassifizierer an den Agent ohne Beteiligung eines Bedieners weitergegeben. Infolgedessen kann ein optimaler Formzustand (Aktion) gemäß einem Zustand (Zustand) des Zyklus in jedem Formzyklus erhalten werden. Somit können die Formbedingungen automatisch angepasst werden, während die Spritzgießmaschine kontinuierlich arbeitet. Ein Beispiel für die Fehlerbeurteilungsvorrichtung ist eine Kamera. In einem Fall, in dem eine Kamera als Fehlerbeurteilungsvorrichtung verwendet wird, dienen die von der Kamera aufgenommenen Bilddaten als Beispiel für Messdaten.
-
Gemäß dem oben beschriebenen dritten Aspekt lernt der Klassifizierer, indem er mehrere tatsächliche Produktdatensätze verwendet, die jeweils Messdaten, einen Fehlertyp und einen Fehlerzustand eines tatsächlichen Formprodukts und mehrere Quasi-Datensätze enthalten. Jeder der mehreren Quasi-Datensätze enthält Messdaten, einen Fehlertyp und einen Fehlerzustand, die durch Modifizieren eines tatsächlichen Produktdatensatzes erhalten werden. Im Allgemeinen ist eine große Anzahl von Datensätzen erforderlich, damit Maschinenlerner, welche durch überwachtes Lernen lernen, richtig lernen. Tatsächliche Proben mit einem Defektfehler können jedoch nicht in sehr großer Anzahl erhalten werden. Das heißt, im Allgemeinen können tatsächliche Produktdatensätze, die jeweils Messdaten, einen Fehlertyp und einen Fehlerzustand eines tatsächlichen Formprodukts enthalten, nicht in einer großen Anzahl erhalten werden. Im Gegensatz dazu kann in diesem Aspekt, da Quasi-Datensätze durch Modifizieren tatsächlicher Produktdatensätze erhalten werden, eine große Anzahl von Datensätzen, die zum Lernen erforderlich sind, relativ leicht erhalten werden. Infolgedessen wird die Effizienz des Lernens des Klassifizierers erhöht, und daher kann der Klassifizierer einen Fehlertyp und einen Fehlerzustand eines Formprodukts mit hoher Genauigkeit ausgeben.
-
Figurenliste
-
- [1] 1 ist ein Blockdiagramm, das schematisch ein Spritzgießmaschinensystem gemäß einer Ausführungsform der vorliegenden Erfindung zeigt.
- [2] 2 ist ein Flussdiagramm zur Beschreibung eines Prozesses, der von einem Generator ausgeführt wird, und einer Arbeit, die von einem Bediener in dem Spritzgießmaschinensystem gemäß der Ausführungsform der Erfindung ausgeführt wird.
- [3] 3 ist ein Diagramm, das einen Klassifizierer des Spritzgießmaschinensystems gemäß der Ausführungsform der Erfindung zeigt.
- [4] 4 ist ein Blockdiagramm, das schematisch ein Spritzgießmaschinensystem gemäß einer Ausführungsform der vorliegenden Erfindung zeigt, welches mit einem Agent versehen ist, das einen Agent-Kritiker-Algorithmus verwendet.
-
BESCHREIBUNG DER AUSFÜHRUNGSBEISPIELE
-
Ein Spritzgießmaschinensystem 1 gemäß einer Ausführungsform ist ein System, bei dem die Formbedingungen einer Spritzgießmaschine 2 unter Verwendung von maschinellem Lernen (d.h. als KI bezeichnet) eingestellt werden. Wie in 1 vereinfacht gezeigt, besteht die Spritzgießmaschine 2 wie bei herkömmlichen Spritzgießmaschinen aus einer Formspannvorrichtung, einer Spritzvorrichtung usw. Eine Entnahmevorrichtung 3 zum Herausnehmen eines von der Spritzgießmaschine 2 hergestellten Formprodukts, und eine Kamera 4 zum Ablichten des herausgenommenen Formprodukts werden neben der Spritzgießmaschine 2 installiert. Jedes Mal, wenn ein Formprodukt von der Spritzgießmaschine 2 hergestellt wird, werden Bilddaten des Formprodukts von der Kamera 4 erfasst.
-
Ein KI-System zum Einstellen der Formbedingungen in dem Spritzgießmaschinensystem 1 ist auf einem vorgeschriebenen Computer aufgebaut und weist mehrere Funktionsblöcke auf. Erstens hat das KI-System ein Agent 6, der die Formbedingungen für die Spritzgießmaschine 2 einstellt. Der Agent 6 hat einen Maschinenlerner, der durch Verstärkungslernen lernt. Der Agent 6 wird später ausführlich beschrieben.
-
Unter anderen Funktionsblöcken, die das KI-System umfassen, sind ein Klassifizierer 7 und ein Generator 8. Wie später beschrieben, hat der Klassifizierer 7 einen Maschinenlerner, der durch überwachtes Lernen lernt. Der Klassifizierer 7 ist konfiguriert, um zu beurteilen, ob ein Formprodukt fehlerhaft ist, und um eine Art von Fehler auszugeben (d.h. einen Fehlertyp und einen Fehlerzustand, d.h. einen Fehlergrad). Um den Klassifizierer 7 zu veranlassen, überwachtes Lernen durchzuführen, ist es notwendig, für den Klassifizierer 7 eine große Anzahl von Datensätzen vorzubereiten, genauer gesagt Eingabedaten und Ausgabedaten (d.h. Datensätze). Zu diesem Zweck erzeugt der Generator 8 als Datensätze eine große Anzahl von Quasi-Datensätzen einschließlich Quasi-Daten. Im Folgenden werden Arbeiten beschrieben, die von einem Bediener ausgeführt werden müssen, und ein Prozess, der vom Generator 8 ausgeführt werden muss, um eine große Anzahl von Datensätzen vorzubereiten.
-
Eine Kombination von Eingabedaten und Ausgabedaten als Datensatz kann beliebige Arten von Daten enthalten; jede Kombination von Daten ist möglich, solange sie dem Klassifizierer 7 ermöglicht, ein Formprodukt zu beurteilen und einen Fehlertyp und einen Fehlerzustand auszugeben. Die Ausführungsform verwendet eine Kombination von Datensätzen, in denen die Eingabedaten Bilddaten eines Formprodukts sind und die Ausgabedaten ein Fehlertyp und ein Fehlerzustand sind. Die Bilddaten werden von der Kamera 4 aufgenommen. Die Bilddaten können von beliebiger Art sein; die Bilddaten können ein Satz von mehreren Bilddaten sein, die aus zwei oder drei Richtungen aufgenommen wurden, oder Bilddaten, die aus einer einzelnen Richtung aufgenommen wurden. Darüber hinaus können die Bilddaten aus mehreren Bilddaten bestehen, die bei Projektion von Lichtstrahlen aus verschiedenen Richtungen aufgenommen wurden. Unabhängig davon, welche Bedingungen angewendet werden, können die Bilddaten von der Kamera 4 unter einheitlichen Bedingungen in Bezug auf alle Formprodukte erhalten werden.
-
Der Fehlertyp der Ausgabedaten umfasst mehrere Daten, die das Auftreten/Nichtauftreten eines Fehlers für die jeweiligen Fehlertypen anzeigen, und 1/0 Daten, die das Auftreten/Nichtauftreten einer Senkenmarke anzeigen, 1/0 Daten, die das Auftreten/Nichtauftreten eines Grats anzeigen usw. Der Fehlerzustand ist eine Datei, die den Fehlergrad unabhängig vom Fehlertyp angeben. Das heißt, der Fehlerzustand besteht aus Daten, die sich nur auf den Fehlergrad beziehen und für die Frage, ob der Fehlertyp eine Senkenmarkierung oder eine Leere ist, irrelevant sind. Diese Daten können durch einen beliebigen numerischen Wert ausgedrückt werden. Beispielsweise können die Fehlerzustände eines guten Produkts, eines Produkts mit einem Fehler geringen Grades und einem Produkt mit einem Fehler hohen Grades jeweils als numerische Werte „1,0“, „-0,3“ und „-0,7“ definiert werden.
-
In dem in 2 gezeigten Schritt S1 bereitet ein Bediener eine Probe eines guten Formprodukts und Proben von fehlerhaften Formprodukten verschiedener Fehlertypen vor. Zum Beispiel bereitet der Bediener ein oder mehrere fehlerhafte Produkte mit einer Senkenmarkierung und ein oder mehrere fehlerhafte Produkte mit einem Grat vor; der Bediener bereitet für jeden der anderen Fehlertypen eine oder mehrere Proben vor. Der Bediener bestimmt einen numerischen Wert, der einen Fehlerzustand jeder vorbereiteten fehlerhaften Produktprobe darstellt (Schritt S2). Dann erfasst der Bediener Bilddaten von jeder guten Produktprobe und jeder fehlerhaften Produktprobe (Schritt S3). Die so erhaltenen Datensätze, die jeweils aus Bilddaten und einer Kombination aus einem Fehlertyp und einem Fehlerzustand bestehen, werden aus den Proben eines tatsächlich guten Produkts und tatsächlich fehlerhafter Produkte erhalten und entsprechen dem oben genannten Begriff „tatsächliche Produktdatensätze“.
-
Der Generator 8 erzeugt eine große Anzahl von Quasi-Datensätzen, indem er die tatsächlichen Produktdatensätze durch Berechnung modifiziert (Schritt S4). Für jeden Fehlertyp werden Quasi-Datensätze generiert. Beispielsweise modifiziert der Generator 8 für fehlerhafte Produkte, deren Fehlertyp „Senkenmarkierung“ ist, die tatsächlichen Produktdatensätze von „Senkenmarkierung“. Insbesondere modifiziert der Generator 8 eine Bilddatei, indem er eine Position einer tatsächlichen Senkenmarke durch parallele Übersetzung der Bildverarbeitung verschiebt oder die Größe einer Senkenmarke durch Vergrößern/Verkleinern der Bildverarbeitung ändert. Beim Vergrößern oder Verkleinern der Größe einer Senkenmarke ändert der Generator 8 auch den Fehlerzustandswert entsprechend der Größe der Senkenmarke. Der Generator 8 erfasst Quasi-Datensätze auf die obige Weise. Der Generator 8 erzeugt auf die gleiche Weise Quasi-Datensätze für andere Fehlertypen. Jede bekannte Technik, wie oben beschrieben, kann als eine Technik zum automatischen Ändern von Bilddaten durch Bildverarbeitung verwendet werden. Die im Generator 8 durchgeführte Verarbeitung kann ein Verfahren verwenden, das maschinelles Lernen verwendet, wie beispielsweise ein GAN.
-
Der Klassifizierer 7 ist ein Maschinenlerner, der überwachtes Lernen durchführt, und es gibt keine Einschränkungen hinsichtlich des Typs eines im Klassifizierer 7 verwendeten Algorithmus. Beispielsweise kann der Klassifizierer 7 eine SVM, eine Methode der kleinsten Quadrate, eine schrittweise Methode oder dergleichen verwenden. Es ist jedoch bevorzugt, dass ein Algorithmus verwendet wird, der eine nichtlineare Eingabe-Ausgabe-Beziehung ausdrücken kann, da erwartet wird, dass die Eingabe-Ausgabe-Beziehung eines Datensatzes, in dem die Eingabedaten Bilddaten sind und die Ausgabedaten einen Fehlertyp enthalten und der Fehlerzustand nichtlinear wird. In der Ausführungsform wird der Klassifizierer 7 durch ein neuronales Netzwerk gebildet. Wie in 3 gezeigt, weist der Klassifizierer 7 ein neuronales Netzwerk auf, das sich in mehreren Schichten befindet und so konfiguriert ist, dass Bilddaten auf die Neuronen in einer Eingangsschicht angewendet werden und Fehlertypen und ein Fehlerzustand von dem Neuron in einer Ausgabeschicht ausgegeben werden.
-
Bilddaten werden als Eingabe auf den Klassifizierer 7 angewendet, und der entsprechende Fehlertyp und der entsprechende Fehlerzustand werden als Lehrsignale auf den Klassifizierer 7 angewendet, damit der Klassifizierer 7 unter Verwendung einer großen Anzahl von Datensätzen einschließlich tatsächlicher Produktdatensätze und Quasidaten lernt einstellen. Danach kann der Klassifizierer 7, der richtig gelernt hat, einen Fehlertyp und einen Fehlerzustand genau ausgeben, wenn Bilddaten eines Formprodukts in ihn eingegeben werden. In dem Spritzgießmaschinensystem 1 wird ein Formprodukt von der Entnahmevorrichtung 3 herausgenommen und von der Kamera 4 jedes Mal aufgenommen, wenn das Spritzgießen von der Spritzgießmaschine 2 durchgeführt wird. Von der Kamera 4 aufgenommene Bilddaten werden an den Klassifizierer gesendet 7 und der Klassifizierer 7 gibt einen Fehlertyp und einen Fehlerzustand aus.
-
Der in der Ausführungsform verwendete Agent 6 wird beschrieben. Im Allgemeinen steuert ein Maschinenlerner, der ein Verstärkungslernen durchführt, ein Kontrollziel oder eine Umgebung und wird als „Agent“ bezeichnet. Der Agent bestimmt eine Aktion at (Aktion) auf der Grundlage eines Zustands st (Zustand) eines Kontrollziels und das Kontrollziel macht einen Übergang vom Zustand st zu einem anderen Zustand st + 1. Zu diesem Zeitpunkt erhält der Agent eine Belohnung rt (Belohnung) vom Kontrollziel. Der Agent lernt, um Aktionen zu bestimmen, die eine Ansammlung zukünftiger Belohnungen rt maximieren, die er erhalten soll. Um dies zu realisieren, erhalten viele Agenten eine vorgeschriebene Wertefunktion und aktualisieren diese durch Lernen. Wenn ein vorgeschriebener Zustand st gegeben ist, bestimmt der Agent eine Aktion, die den Wert der Wertefunktion in einem Zustand maximiert, in dem das Lernen fortgeschritten ist. Die Wertefunktion kann von beliebiger Art sein. Der Lernalgorithmus kann ein bekannter Algorithmus sein, wie beispielsweise Q-Lernen, eine SARSA-Technik, TD-Lernen, eine Monte-Carlo-Methode oder eine Agent-Kritiker-Methode. Das heißt, die Erfindung ist nicht in der Art einer Wertefunktion oder eines Algorithmus charakterisiert, sondern welche Daten den Zustand st, die Aktion at und die Belohnung rt umfassen, die von dem in der Ausführungsform verwendeten Agent 6 behandelt werden.
-
Die von dem Agent 6 gemäß der Ausführungsform zu handhabende Aktion at umfasst Formbedingungen wie eine Einspritzgeschwindigkeit, einen Einspritzhub und eine Zylindertemperatur. Dies liegt daran, dass der Agent 6 optimale Formbedingungen als eine Aktion at bestimmen kann, wenn ein vorgeschriebener Zustand st gegeben ist. Der Zustand st, der von dem Agent 6 gemäß der Ausführungsform behandelt werden soll, umfasst verschiedene physikalische Daten, die von der Spritzgießmaschine 2 erhalten wurden. Die physikalischen Daten umfassen verschiedene Daten, die in Verbindung mit der Spritzgießmaschine 2 erhalten wurden, wie beispielsweise einen Spritzdruck, eine Harz Temperatur und eine Außentemperatur. Der Zustand st kann andere Daten als diese physikalischen Daten enthalten, und andere Daten können dem Zustand st hinzugefügt werden, wenn dies erforderlich ist. Im Übrigen reicht ein solcher Zustand st für den Agent 6 nicht aus, um optimale Formbedingungen zu bestimmen. Um die Auswahl eines Formzustands anzupassen, der eingestellt werden soll, enthält der Zustand st, der von dem Agent 6 gemäß der Ausführungsform behandelt werden soll, einen Fehlertyp, der vom Klassifizierer 7 als Zustand st ausgegeben wird.
-
Da der Zustand st einen Fehlertyp enthält, kann das Mittel 6 gemäß einem Fehlertyp beurteilen, welcher Formungszustand zu einem Anpassungsziel gemacht werden sollte, und daher können optimale Formbedingungen als eine Aktion unter einem gegebenen Zustand st richtig bestimmt werden. Die Belohnung rt, die dem Agenten 6 gemäß der Ausführungsform gegeben wird, ist ein Fehlerzustand, der vom Klassifizierer 7 ausgegeben wird. Der Agent 6 kann ein Verstärkungslernen durchführen, indem er den obigen Zustand st, die Aktion at und Belohnung rt verwendet. Die zu einem Anpassungsziel zu machenden Formbedingungen können für jeden Fehlertyp regelbasiert eingegrenzt werden, indem das Wissen eines Fachmanns genutzt wird. Zum Beispiel kann für den Gratfehler der Agent 6 zum Lernen gebracht werden, indem ihm eine Regel gegeben wird, die willkürlich die Aktionsauswahlwahrscheinlichkeiten der Einspritzgeschwindigkeit und des Haltedrucks erhöht. Als anderes Beispiel kann der Agent 6 dazu gebracht werden, zu lernen, indem er dem Algorithmus, wie in der Zeichnung usw. der Ausführungsform gezeigt, überlässt, wie eine Aktionsverzweigung in Abhängigkeit vom Fehlertyp auftreten soll.
-
Es wird ein Beispiel beschrieben, in dem der Agent
6 gemäß der Ausführungsform veranlasst wird, ein Verstärkungslernen durch ein Akteur-Kritiker-Verfahren durchzuführen. In diesem Fall besteht der Agent
6, wie in
4 gezeigt, aus einem Akteur
10 und einem Bewerter
11. Um eine Aktion nach dem Akteur-Kritiker-Verfahren zu bestimmen, wird im Bewerter
11 eine Zustandswertefunktion V(st) als Wertefunktion bereitgestellt. Die Zustandswertefunktion V(st) ist eine Funktion, die angibt, wie gut der Zustand s
t ist. Die Zustandswertefunktion V(st) kann auf irgendeine Weise konfiguriert werden. Beispielsweise kann die Zustandswertefunktion V(st) durch eine Matrix gebildet werden, die V-Werte speichert, die den jeweiligen Werten des Zustands s
t oder einer SVM oder eines neuronalen Netzwerks entsprechen, das eine Eingabe-Ausgabe-Beziehung darstellt. Die Zustandswertefunktion V(st), die durch Verstärkungslernen aktualisiert wird, kann gemäß einem beliebigen Algorithmus aktualisiert werden. In einem Fall, in dem die Zustandswertefunktion V(st) durch ein TD-Lernverfahren aktualisiert wird, kann sie beispielsweise gemäß dem folgenden Ausdruck 1 berechnet werden.
[Ausdruck 1]
wobei
- Lernkoeffizient α: 0 ≤ α ≤ 1; und
- Rabattsatz γ: 0 ≤ γ ≤ 1.
-
Wenn in der Spritzgießmaschine 2 ein vorgeschriebener Zustand st mit einem vorgeschriebenen Fehlertyp und physikalischen Daten angegeben wird, wird ein Formprodukt erhalten, indem die Formbedingungen als Aktion beim Spritzgießen bestimmt und durchgeführt werden. Der Klassifizierer 7 beurteilt einen Fehlerzustand des Formprodukts und der Bewerter 11 erhält ihn als Belohnung rt. Dann werden die nächsten Formbedingungen für einen Zustand bestimmt, der den Fehlertyp enthält, der ein Beurteilungsergebnis des Klassifizierers 7 ist, und die Spritzgießmaschine 2 führt das Spritzgießen durch. Die Zustandswertefunktion V(st) kann gemäß Ausdruck 1 aktualisiert werden, da ein solcher Formvorgang wiederholt ausgeführt wird.
-
Andererseits erhält der Akteur
10 eine Richtlinie π(s
t, a
t; w
t), die angibt, über welche Aktion at entschieden werden soll, wenn ein Zustand st gegeben wird. Die Richtlinie π(s
t, a
t; w
t) ist eine Wahrscheinlichkeitsverteilungsfunktion, die die Wahrscheinlichkeit darstellt, mit der die Aktion at unter dem Zustand s
t festgelegt wird, und w
t ist der Anpassungsparameter, der die Richtlinie π(s
t, at; w
t) bestimmt. Zum Beispiel kann in einem Fall, in dem die Richtlinie π(s
t, at; w
t) als Normalverteilung N (µ, σ) ausgedrückt wird, wobei µ der Durchschnitt und σ die Standardabweichung ist, gesagt werden, dass Anpassen des Anpassungsparameter w
t im Wesentlichen eine Anpassung des Mittelwerts µ und der Standardabweichung σ, welche Funktionen von w
t sind, bedeutet. Wenn die Richtlinie π(s
t, at; w
t) durch Anpassen des Anpassungsparameters w
t durch Lernen zu einer geeigneten Wahrscheinlichkeitsverteilungsfunktion gemacht wird, wird die Wahrscheinlichkeit, dass eine richtige Aktion at entschieden wird, wenn ein vorgeschriebener Zustand s
t gegeben wird, hoch und die Wahrscheinlichkeit, dass sich für eine unangemessene Aktion a
t entschieden wird, wird niedrig. Ein Beispiel für eine Einstellmethode des Anpassungsparameters w
t ist die folgende Methode. Zunächst wird der Angemessenheitsgrad der Richtlinie π(s
t, a
t; w
t) als die Angemessenheit et durch Gleichung 2-1 definiert. Dann wird die Angemessenheit mit einer Historie D
t durch Gleichung 2-2 unter Verwendung eines Rabattsatzes β definiert. Infolgedessen kann der Anpassungsparameter w
t gemäß Ausdruck 2-3 unter Verwendung der als Fehlerzustand empfangenen Belohnung rt und der Zustandswertefunktion V(st) aktualisiert werden.
[Formel (Ausdruck) 2]
wobei Rabattsatz β: 0 ≤ β ≤ 1.
wobei
- Lernkoeffizient α: 0 ≤ α ≤ 1; und
- TD Fehler δt: δt = rt + γV(St+1) - V(st).
-
Wenn der Lernprozess wiederholt ausgeführt wird, konvergieren sowohl die Zustandswertefunktion V(st) als auch die Richtlinie π(st, at; wt) und der TD-Fehler δt nähert sich 0. Das heißt, es wird ein Zustand hergestellt, in dem der Agent 6 durch verstärkendes Lernen gelernt hat. Wenn ein Zustand st durch die in diesem Zustand gerenderte Richtlinie π(st, at; wt) gegeben ist, kann eine optimale Aktion at (d.h. eine optimale Formbedingung) berechnet werden.
-
Der Agent
6 gemäß der Ausführungsform kann eine andere Konfiguration als die obige Beschreibung aufweisen. Beispielsweise wird eine Aktionswertefunktion Q(s
t, a
t) als Wertefunktion verwendet, und eine optimale Aktion at, d.h. optimale Formbedingungen, kann durch die Aktionswertefunktion Q(s
t, a
t) bestimmt werden. Die Aktionswertefunktion Q(s
t, a
t) ist eine Bewertungsfunktion, die angibt, wie gut eine vorgeschriebene Aktion at ist. Die Aktionswertefunktion Q(s
t, a
t) kann ebenso wie die Zustandswertefunktion V(st) auf verschiedene Arten konfiguriert werden. Beispielsweise kann die Aktionswertefunktion Q(st, at) durch eine Matrix gebildet werden, in der Q-Werte, welche Mengen eines Zustand st-Werts und eines Aktion at-Werts entsprechen, gesetzt sind, d.h. eine Q-Tabelle. Die Aktionswertefunktion Q(s
t, a
t) kann gemäß dem folgenden Ausdruck durch Q-Lernen aktualisiert werden:
[Ausdruck 3]
wobei
- Lernkoeffizient α: 0 ≤ α ≤ 1; und
- Rabattsatz γ: 0 ≤ γ ≤ 1.
-
Wenn das Spritzgießen und der Lernprozess wiederholt ausgeführt werden, konvergiert die Aktionswertefunktion Q(st, at) und optimale Formbedingungen können unter Verwendung der gelernten Aktionswertefunktion Q(st, at) bestimmt werden. Das heißt, wenn ein vorgeschriebener Zustand st gegeben ist, wird nach einer Aktion at gesucht, welche die Aktionswertefunktion Q(st, at) maximiert. Eine solche Wirkung ist eine optimale Formbedingung.
-
In einem Fall, in dem die Aktionswertefunktion Q(st, at) durch eine Q-Tabelle gebildet wird, werden jeder der Zustände st und die Aktion at als diskrete Werte behandelt. Obwohl jeder von ihnen im Wesentlichen als kontinuierliche Werte behandelt werden kann, wenn die Q-Tabellenmatrix groß gemacht wird, verursacht dies eine hohe Berechnungslast. Wenn im Gegensatz dazu die Aktionswertefunktion Q(st, at) beispielsweise durch einen sogenannten Funktionsapproximator wie ein neuronales Netzwerk gebildet wird, kann jeder Zustand st und jede Aktion at als kontinuierliche Werte behandelt werden und die Rechenlast kann relativ gering sein.
-
Die vorliegende Erfindung ist nicht auf die obige Ausführungsform beschränkt, und verschiedene Modifikationen können innerhalb der Grenzen der Erfindung vorgenommen werden. Beispielsweise ist die Erfindung nicht auf die oben beschriebene Ausführungsform beschränkt, und Modifikationen, Verbesserungen usw. können nach Bedarf vorgenommen werden. Weiterhin können das Material, die Form, die Abmessungen, die Anzahl, die Position usw. jedes Bestandteils oder jedes Satzes von Bestandteilen gemäß der oben beschriebenen Ausführungsform auf gewünschte Weise bestimmt werden, das heißt, sie unterliegen keinen Einschränkungen, solange die Erfindung realisiert werden kann.
-
Obwohl die obige Ausführungsform mit der Annahme beschrieben wurde, dass das Lernen konvergiert, muss beispielsweise die Konvergenz zu einem Endzustand in bestimmten Algorithmen nicht sichergestellt werden. Darüber hinaus können Algorithmen, wie im Beispiel für Aktor-Kritiker beschrieben, die Richtlinie explizit aktualisieren. Wie im Q-Lernbeispiel beschrieben, kann der Algorithmus innerhalb der Aktualisierung der Wertefunktion eingeschränkt sein.
-
Als weiteres Beispiel wurde erklärt, dass die Wertefunktion durch wiederholtes Durchführen des tatsächlichen Formens in der oben beschriebenen Ausführungsform gelernt wurde. Das heißt, es wurde erklärt, dass das Lernen durchgeführt wird, während das eigentliche Formen wiederholt durchgeführt wird (Online-Lernen). Die Wertefunktion kann jedoch im Voraus offline gelernt werden. Selbst wenn das tatsächliche Formen nicht wiederholt durchgeführt wird, kann die Wertefunktion unter Verwendung dieser Daten gelernt werden, wenn eine bestimmte Datenmenge über eine Beziehung zwischen einem Zustand st, einer Aktion at und einer Belohnung rt im Voraus erfasst werden kann. Eine frühe Konvergenz kann erreicht werden, wenn wie oben beschrieben das Lernen der Wertefunktion durchgeführt wird, während das tatsächliche Formen in einem Zustand durchgeführt wird, in dem das Lernen der Wertefunktion bis zu einem gewissen Grad fortgeschritten ist.
-
Als eine andere Modifikation können Eingabedaten in den Klassifizierer 7 modifiziert werden. Obwohl die Ausführungsform so beschrieben wurde, dass Eingabedaten in den Klassifizierer 7 nur Bilddaten eines Formprodukts sind, können physikalische Daten, die sich auf ein Formprodukt beziehen, wie ein Gewicht des Formprodukts, die Chromatizität des Formprodukts und ein Brechungsindex des Formprodukts dem Klassifizierer 7 als Eingabedaten gegeben werden. Dies ermöglicht es, eine Beurteilung über mehr Arten von Fehlertypen vorzunehmen.
-
Weiterhin kann das Spritzgießmaschinensystem gemäß der Ausführungsform in ein System mit mehreren Spritzgießmaschinen modifiziert werden. Das heißt, in einem Fall, in dem dasselbe Formprodukt durch mehrere Formmaschinen hergestellt werden soll, können Informationen zwischen Agenten ausgetauscht werden. Die Lerneffizienz kann durch Informationsaustausch und Schwarmverstärkungslernen gesteigert werden.
-
Darüber hinaus können der Zustand st und die Aktion at, die vom Agenten 6 ausgeführt werden, irgendeine Art von Daten sein. Die Formbedingungen, die als Aktion at behandelt werden, können tatsächliche Werte einer Einspritzgeschwindigkeit, eines Einspritzhubs, einer Zylindertemperatur usw. sein. Änderungen der Formbedingungen können ausgeführt werden. Das heißt, ein Betrag der Änderung einer Einspritzgeschwindigkeit, ein Betrag der Änderung eines Einspritzhubs, ein Betrag der Änderung einer Zylindertemperatur usw. können ausgeführt werden. Wenn außerdem Daten von jedem des Zustands st, der Aktion at und der Belohnung rt verarbeitet werden, können die Daten konvertiert werden, indem sie im Voraus normalisiert werden, so dass sie einen numerischen Wertebereich von 0 bis 1 haben, oder konvertiert werden, so dass sie einen numerischer Wertebereich von -1 bis 1 haben.
-
Darüber hinaus werden in der Ausführungsform Bilddaten, die von der Kamera 4 aufgenommen wurden, beispielsweise zur Fehlerbeurteilung eines Formprodukts verwendet. In dem erfindungsgemäßen Spritzgießmaschinensystem können jedoch, solange das Aussehen usw. eines Formprodukts gemessen werden kann, eine andere Fehlerbewertungsvorrichtung als die Kamera 4 und Messdaten, die von dieser Fehlerbewertungsvorrichtung gemessen werden, beispielsweise als Fehlerbeurteilung eines Formprodukts verwendet werden.
-
Die vorliegende Anmeldung basiert auf der am 23. März 2018 eingereichten
japanischen Patentanmeldung Nr. 2018-055633 , auf deren Offenbarung hiermit ausdrücklich Bezug genommen wird.
-
INDUSTRIELLE ANWENDBARKEIT
-
Das erfindungsgemäße Spritzgießmaschinensystem ermöglicht es, einen übermäßigen Verbrauch von Computerressourcen zu vermeiden, die zum Lernen erforderliche Zeit und Kosten zu reduzieren und die Formbedingungen schnell anzupassen. Die Erfindung, die diese Vorteile bietet, kann beispielsweise auf Systeme angewendet werden, die ein Spritzformen eines Harzmaterials durchführen.
-
Bezugszeichenliste
-
- 1:
- Spritzgießmaschinensystem
- 2:
- Spritzgießmaschine
- 3:
- Entnahmevorrichtung
- 4:
- Kamera (Fehlerbeurteilungsvorrichtung)
- 6:
- Agent
- 7:
- Klassifizierer
- 8:
- Generator
- 10:
- Aktor
- 11:
- Bewerter
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- JP 2017030152 A [0003]
- JP 201730221 A [0003]
- JP 2018055633 A [0042]