WO2012093496A1 - マルチタスクスケジューリング方法、およびマルチコアプロセッサシステム - Google Patents
マルチタスクスケジューリング方法、およびマルチコアプロセッサシステム Download PDFInfo
- Publication number
- WO2012093496A1 WO2012093496A1 PCT/JP2011/050219 JP2011050219W WO2012093496A1 WO 2012093496 A1 WO2012093496 A1 WO 2012093496A1 JP 2011050219 W JP2011050219 W JP 2011050219W WO 2012093496 A1 WO2012093496 A1 WO 2012093496A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- thread
- cpu
- target
- time
- processing time
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
Definitions
- the present invention relates to a multitask scheduling method for assigning threads to a multicore processor and a multicore processor system.
- a technology multitask
- a CPU Central Processing Unit
- the application program is referred to as a process.
- multi-thread a technique in which one process is divided into a plurality of functions and the CPU executes the plurality of functions in parallel by time-sharing processing.
- each divided function is referred to as a thread.
- the execution order between threads is fixed.
- a multi-core processor system when performing multitasking / multithreading, threads of a plurality of processes are mixed on each CPU.
- the execution order determined in one process may vary due to the influence of a thread of another process assigned to the same CPU as one thread of one process.
- An object of the present invention is to provide a multitask scheduling method and a multicore processor system capable of observing the execution order between threads without changing a code in order to solve the above-described problems caused by the prior art. To do.
- a first thread is assigned to a first CPU, a second thread that is executed after the first thread is detected, and a third thread that generates a second thread is assigned to the CPU.
- a first time until the second thread is started is calculated based on the load, a second time is calculated until the execution of the first thread is finished, and the second time is greater than the first time.
- a multitask scheduling method for changing a first time slice of one CPU to a second time slice and a multicore processor system are provided.
- This multitask scheduling method and multicore processor system have the effect of being able to observe the execution order between threads without changing the code.
- FIG. It is explanatory drawing which shows the example of allocation of each thread
- FIG. 12 is a flowchart showing a detailed example of T1 calculation processing (step S1103) shown in FIG. 12 is a flowchart illustrating a detailed example of the process (step S1104) illustrated in FIG. 12 is a flowchart (part 1) illustrating a detailed example of a time slice calculation process (step S1107) illustrated in FIG. 12 is a flowchart (part 2) illustrating a detailed example of the time slice calculation process (step S1107) illustrated in FIG. 12 is a flowchart (part 1) illustrating a detailed example of T1 calculation processing (step S1114) illustrated in FIG. 12 is a flowchart (part 2) illustrating a detailed example of a T1 calculation process (step S1114) illustrated in FIG.
- FIG. 12 is a flowchart (part 1) illustrating a detailed example of a T0 calculation process (step S1115) illustrated in FIG. 12 is a flowchart (part 2) illustrating a detailed example of the T0 calculation process (step S1115) illustrated in FIG. 12 is a flowchart (part 1) illustrating a detailed example of a time slice calculation process (step S1116) illustrated in FIG. 12 is a flowchart (part 2) illustrating a detailed example of the time slice calculation process (step S1116) illustrated in FIG. It is a flowchart which shows the information processing procedure by each CPU. 5 is a flowchart illustrating a setting processing procedure by a clock supply circuit 210.
- the multi-core processor is a processor in which a plurality of cores are mounted. If a plurality of cores are mounted, a single processor having a plurality of cores may be used, or a processor group in which single core processors are arranged in parallel may be used. In the present embodiment, in order to simplify the explanation, a processor group in which single-core processors are arranged in parallel will be described as an example.
- FIG. 1 is an explanatory view showing an embodiment of the present invention. Another thread 1 and another thread 2 are assigned to CPU # 0 of the multi-core processor. CPU # 1 of the multi-core processor is assigned with a generation thread of a subsequent thread defined to be executed following the target thread and another thread 3.
- the time slice of CPU # 0 is 30 [ms], and the time slice of CPU # 1 is 90 [ms].
- the time slice is a processing time per execution of each thread when each CPU switches and executes a plurality of threads assigned to the CPU.
- the time slice of the assignment destination CPU of the target thread is t1
- the time slice of the assignment destination CPU of the generation thread is t0.
- CPU # 0 detects the subsequent thread of the target thread. It is determined whether or not the scheduled execution end time of the target thread is before the execution start time of the subsequent thread.
- the execution start time of the subsequent thread is assumed to be the execution end scheduled time of the generation thread that generates the subsequent thread.
- the first time (T0) from the generation time of the target thread to the scheduled end time of execution of the generation thread is 250 [ms].
- the second time (T1) from the generation time of the target thread to the scheduled execution end time of the target thread is 280 [ms].
- the CPU # 0 determines that the scheduled execution end time of the generation thread is after the scheduled execution end time of the target thread.
- the time slice of CPU # 0 is adjusted so that Specifically, for example, the CPU # 0 calculates the time slice of the CPU # 0 based on the processing time of the thread assigned to the CPU # 0 and the number of execution times that the target thread is executed until the end of execution. . It is assumed that the time slice of the assignment destination CPU of the target thread whose scheduled execution end time of the generation thread is after the scheduled execution end time of the target thread is t1 '.
- the target thread is executed four times.
- a time slice calculated by setting the number of executions (n1 ′) of the target thread as one is assumed to be t1 ′.
- the processing time of the other thread 1 is 50 [ms]
- the processing time of the other thread 2 is 150 [ms]
- the processing time of the target thread is 100 [ms].
- CPU # 0 calculates the time slice of CPU # 0 as follows.
- CPU # 0 sets the time slice of CPU # 0, which is the assignment destination CPU of the target thread, to 100 [ms].
- the scheduled execution end time of the generation source thread is after the scheduled execution end time of the target thread, so that the execution of the subsequent thread can be started after the execution of the target thread is completed.
- the time slice of the assignment destination CPU of the target thread is adjusted.
- the time slice of the assignment destination CPU of the generation thread that generates the subsequent thread is adjusted. Also good.
- FIG. 2 is a block diagram showing hardware of the multi-core processor system.
- the multi-core processor system 200 includes a CPU # 0, a CPU # 1, a primary cache 201, a primary cache 202, a snoop circuit 203, and a secondary cache 204.
- the multi-core processor system 200 includes a keyboard 206, a display 205, an I / F 207 (Interface), a memory controller 208, a shared memory 209, and a clock supply circuit 210.
- the secondary cache 204, keyboard 206, display 205, I / F 207, memory controller 208, and clock supply circuit 210 are connected via a bus 216.
- CPU # 0 and CPU # 1 each have a register and a core.
- the CPU # 0 is a master CPU, and controls the entire multi-core processor system 200, and executes the OS 221 (Operating System).
- the OS 221 is a master OS, has a function of controlling which CPU of which multi-core processor the generated thread is assigned to, and executes the thread assigned to the CPU # 0.
- the OS 221 has a scheduler 231, and the scheduler 231 has a function of switching and executing a thread assigned to the CPU # 0 for each time slice.
- CPU # 1 is a slave CPU and executes the OS 222.
- the OS 222 is a slave OS and executes a thread assigned to the CPU # 1.
- the OS 222 has a scheduler 232, and the scheduler 232 has a function of switching and executing threads assigned to the CPU # 1 for each time slice.
- CPU # 0 is connected to each unit via a primary cache 201, a snoop circuit 203, and a secondary cache 204.
- the primary cache 201 and the primary cache 202 each have a cache memory and a cache controller.
- the primary cache 201 temporarily stores a writing process from the thread executed by the OS 221 to the shared memory 209.
- the primary cache 201 temporarily stores data read from the shared memory 209.
- the primary cache 202 temporarily stores a writing process from the thread executed by the OS 222 to the shared memory 209.
- the primary cache 202 temporarily stores data read from the shared memory 209.
- the snoop circuit 203 detects the update and updates the other cache.
- the secondary cache 204 has a cache memory and a cache controller.
- the secondary cache 204 stores data evicted from the primary cache 201 and the primary cache 202.
- the secondary cache 204 stores data shared between the OS 221 and the OS 222.
- the secondary cache 204 has a larger storage capacity and a lower access speed from the CPU than the primary cache 201 and the primary cache 202.
- the secondary cache 204 has a smaller storage capacity and a higher access speed from the CPU than the shared memory 209.
- the display 205 displays data such as a document, an image, and function information as well as a cursor, an icon, or a tool box.
- a TFT liquid crystal display can be adopted as the display 205.
- the keyboard 206 has keys for inputting numbers, various instructions, etc., and inputs data.
- the keyboard 206 may be a touch panel type input pad or a numeric keypad.
- the I / F 207 is connected to a network such as a LAN (Local Area Network), a WAN (Wide Area Network), or the Internet through a communication line, and is connected to another device via the network.
- the I / F 207 controls an internal interface with the network, and controls input / output of data from an external device.
- a modem or a LAN adapter can be used as the I / F 207.
- the shared memory 209 is a memory shared by the CPU # 0 and the CPU # 1, and specifically, for example, ROM 212 (Read Only Memory), RAM 211 (Random Access Memory), flash ROM 213, and flash ROM controller. 214, flash ROM 215, and the like.
- the ROM 212 stores a program such as a boot program.
- the RAM 211 is used as a work area for the CPU.
- the flash ROM 213 stores system software such as the OS 221 and the OS 222, application software, a thread management table described later, thread dependency information, and the like. For example, when updating each OS, the multi-core processor system 200 receives the new OS by the I / F 207 and updates the old OS stored in the flash ROM 213 to the received new OS.
- the flash ROM controller 214 controls reading / writing of data with respect to the flash ROM 215 according to the control of each CPU.
- the flash ROM 215 stores data written under the control of the flash ROM controller 214. Specific examples of the data include image data and video data acquired by the user using the multi-core processor system 200 through the I / F 207.
- the clock supply circuit 210 supplies a clock to each part.
- a clock having a frequency of either 500 [MHz] or 1 [GHz] can be supplied to each CPU.
- the clock supply circuit 210 has a flag for each CPU. When the flag is 0, the clock supply circuit 210 supplies a clock of 500 [MHz] to the CPU corresponding to the flag, and when the flag is 1, the clock supply circuit 210 supplies a clock of 1 [GHz]. This is supplied to the CPU corresponding to the flag.
- the clock supply circuit 210 when the clock supply circuit 210 receives a notification of CPU identification information and a set value of a flag (referred to as “clock frequency setting notification”) from each CPU, the clock supply circuit 210 sets a flag corresponding to the received CPU identification information. Set to the set value of the received flag. After the setting, the clock supply circuit 210 transmits the completion of the change to the transmission source CPU of the clock frequency setting notification.
- clock frequency setting notification a notification of CPU identification information and a set value of a flag
- FIG. 3 is an explanatory diagram showing an example of thread dependency information.
- the thread dependency relationship information 300 is information including information indicating the execution order defined between threads and the processing time of each thread.
- the thread dependency information 300 includes a process ID item 301, a thread ID item 302, a processing time item 303, a preceding thread item 304, a succeeding thread item 305, a generation thread item 306, have.
- the process ID item 301 stores process identification information.
- the thread ID item 302 stores the identification information of a thread included in the process whose identification information is stored in the process ID item 301.
- a thread is an execution unit of processing performed in an application program as is well known.
- a process is an execution unit including at least one thread.
- a process that contains only one thread is essentially a thread. Therefore, it is indicated that the process in which the identification information is not stored in the thread ID item 302 includes only one thread.
- the processing time item 303 stores the processing time of each thread.
- the processing time is a time calculated by a developer using a clock frequency (referred to as “reference clock frequency”) that is a reference of each CPU using a verification tool such as ESL (Electronic System Level).
- the preceding thread item 304 has a dependency relationship with the thread in which the identification information is stored in the thread ID item 302 and the output order, and the identification information of the thread executed prior to the thread is stored.
- the succeeding thread item 305 has a dependency relationship with the thread in which the identification information is stored in the thread ID item 302 and the output order, and the identification information of the thread to be executed following the thread is stored.
- identification information of a generation thread that generates a thread whose identification information is stored in the thread ID item 302 is stored.
- the process # 0 has a thread # 0 to a thread # 3.
- Thread # 0 of process # 0 generates thread # 1 of process # 0 and thread # 2 of process # 0, and thread # 1 of process # 0 generates thread # 3 of process # 0.
- Thread # 0 of process # 0, thread # 1 of process # 0, process # 1, and process # 2 have no output dependency with other threads.
- the thread dependency relationship information 300 is stored in the shared memory 209, but may be stored in the secondary cache 204.
- FIG. 4 is an explanatory diagram showing an example of a thread management table.
- the thread management table 400 is information for registering which CPU a thread of each process is assigned to.
- thread identification information is registered for each process by the OS 221 which is a master OS.
- the thread management table 400 includes a process ID item 401, a thread ID item 402, an assignment destination CPU item 403, a clock frequency item 404, an execution start time item 405, and an execution end scheduled time item 406. And have.
- the process ID item 401 stores process identification information.
- the thread ID item 402 stores thread identification information of a process whose identification information is stored in the process ID item 401.
- the process in which the identification information is not stored in the thread ID item 402 indicates that only one thread is included.
- the identification information of the assignment destination CPU of the thread whose identification information is stored in the thread ID item 402 is stored. Further, when the CPU identification information is registered in the item 403 of the assignment destination CPU corresponding to the thread at the time of generating the thread, the thread is assigned to the CPU.
- the clock frequency item 404 stores the CPU clock frequency when executing the thread whose identification information is stored in the thread ID item 402.
- the reference clock frequency is set to 500 [MHz].
- the scheduled execution end time item 406 stores the time obtained by adding the second time calculated in the present embodiment to the thread generation time.
- FIG. 5 is a functional block diagram of the multi-core processor system 200.
- the multi-core processor system 200 includes an allocation unit 501, a detection unit 502, a first calculation unit 503, a second calculation unit 504, a time slice calculation unit 505, a setting unit 506, and a change unit 507507.
- a program having an assigning unit 501 to a changing unit 507 is stored in a storage device such as the shared memory 209.
- the CPU # 0 and CPU # 1 access the storage device, read the program, and execute the processing coded in the program, whereby the processing from the allocation unit 501 to the changing unit 507 is executed.
- the assigning unit 501 assigns the first thread to the first CPU.
- the detection unit 502 detects a second thread that is executed after the first thread. Furthermore, the detection unit 502 detects the second thread based on the thread dependency relationship information.
- the first thread is a target thread, and the second thread is a subsequent thread.
- the first calculation unit 503 calculates the first time until the second thread is started based on the load of the CPU to which the third thread that generates the second thread is assigned.
- the third thread is a generation thread of the subsequent thread.
- the second calculation unit 504 calculates a second time until the execution of the first thread is completed.
- the setting unit 506 changes the first time slice of the first CPU to the second time slice when the second time is greater than the first time.
- the first time slice of the first CPU is a set time slice.
- the time slice calculation unit 505 calculates the second time slice so that the first time is substantially equal to the second time. Also, the setting unit 506 changes the first time slice of the first CPU to the second time slice calculated by the time slice calculation unit 505 when the second time is greater than the first time.
- the changing unit 507 changes the clock frequency while the first thread is executed. Furthermore, the assigning unit 501 assigns the second thread to the CPU having the smallest load.
- the assigning unit 501 assigns the second thread to the first CPU when the second time slice cannot be obtained by the time slice calculating unit 505. Based on the above, details will be described using the first and second embodiments.
- Example 1 In the first embodiment, an example in which a preceding thread is assigned among threads in which the execution order is defined will be described. Specifically, the multi-core processor system 200 detects that a preceding thread has been assigned to the first CPU of the multi-core processors. The multi-core processor system 200 is assigned to a second CPU different from the first CPU, and the scheduled execution end time of the generation thread of the subsequent thread following the preceding thread is earlier than the scheduled execution end time of the preceding thread. Determine whether or not.
- the multi-core processor system 200 determines at least one of the first core and the second core.
- the time slice is adjusted so that the scheduled execution end time of the generation thread is after the scheduled execution end time of the preceding thread.
- the multi-core processor system 200 executes the time slice of the one core until the processing time of the thread assigned to the one core and the processing of the preceding thread or the generation thread finish. Based on and.
- the multi-core processor system 200 sets the time slice of one core to the calculated time slice.
- the multi-core processor system 200 assigns the target thread to the second CPU when the time slice of one CPU whose scheduled execution end time of the generation thread is after the scheduled execution end time of the preceding thread cannot be calculated. Then, when the target thread is assigned to the second CPU, the multi-core processor system 200 does not change the time slice of one core. Further, when the target thread is assigned to the second CPU, when the subsequent thread is generated, the multi-core processor system 200 assigns the subsequent thread to the second CPU.
- the multi-core processor system 200 determines that the scheduled execution end time of the generation thread is after the scheduled execution end time of the preceding thread, the multi-core processor system 200 does not change the time slice of one core. Details will be described with reference to FIGS.
- FIG. 6 is an explanatory diagram showing an example of assignment of each thread.
- thread # 1 of process # 0 is assigned to CPU # 0
- process # 1 and process # 2 are assigned to CPU # 1.
- the OS 221 detects the generation of thread # 2 of process # 0. Then, the OS 221 specifies the generation time of the thread # 2 of the process # 0.
- the OS 221 detects the subsequent thread of the thread # 2 of the process # 0 based on the thread dependency information 300. Specifically, for example, the OS 221 refers to the identification information of the thread registered in the item 305 of the subsequent thread corresponding to the thread # 2 of the process # 0 in the thread dependency relationship information 300, so that the subsequent thread is Can be detected.
- the thread # 3 of the process # 0 is detected as the subsequent thread of the thread # 2 of the process # 0 from the item 305 of the subsequent thread corresponding to the thread # 2 of the process # 0 in the thread dependency information 300. .
- the OS 221 calculates the total processing time of the threads allocated to each CPU based on the thread dependency relationship information 300, thereby specifying the CPU with the smallest load.
- the total processing time of threads assigned to CPU # 0 is 250 [ms]
- the total processing time of threads assigned to CPU # 1 is 200 [ms]. Therefore, CPU # 1 is specified as the CPU with the smallest load.
- the OS 221 sets the identified CPU # 1 as the temporary allocation destination CPU of the thread # 2 of the process # 0, and the OS 221 notifies the OS 222 of the temporary allocation of the thread # 2 of the process # 0 via the snoop circuit 203.
- the OS 222 When the OS 222 accepts the temporary allocation of the thread # 2 of the process # 0, the OS 222 obtains the second time (T1) from the generation time of the thread # 2 of the process # 0 to the scheduled execution end time of the thread # 2 of the process # 0. calculate.
- the OS 222 calculates T1 using the following formula (1).
- N is the total number of threads assigned to the temporary assignment destination CPU (CPU # 1 in this case) and the target thread.
- the n-th thread indicates a thread that is selected in order from the thread assigned to the temporary assignment destination CPU (CPU # 1 in this case) and the target thread.
- t1 is a time slice of the temporary allocation destination CPU.
- n1 is the number of executions executed by switching to another thread before the target thread finishes processing.
- n1 is calculated by the following formula (2). n1 is rounded up after the decimal point.
- N1 Processing time of the target thread / t1 (2)
- the first time from the generation time of the thread # 2 of the process # 0 to the scheduled execution end time of the generation thread that generates the thread # 3 of the process # 0, which is a subsequent thread of the thread # 2 of the process # 0, (T0) is calculated.
- the generation thread that generates the thread # 3 of the process # 0 is the thread # 1 of the process # 0.
- the OS 222 calculates T0 using the following equation (3).
- M is the number of threads assigned to the assignment destination CPU (here, CPU # 0) of the generation thread that generates the subsequent thread.
- the m-th thread indicates a thread that is sequentially selected from the threads that have been assigned to the assignment destination CPU (here, CPU # 0) of the generation thread.
- t0 is the time slice of the assignment destination CPU of the generation thread.
- n0 is the number of times the target thread is switched before the execution is completed, and is calculated by the following equation (4). n0 is rounded up after the decimal point.
- N0 Processing time of source thread / t0 (4)
- FIG. 7 is an explanatory diagram showing T0 and T1.
- the CPU # 1 that is the temporary assignment destination CPU of the target thread the CPU # 0 that is the assignment destination CPU of the generation thread that generates the subsequent thread, and the time slice of each are 30 [ms]. Since only thread # 1 of process # 0 is assigned to CPU # 0, T0 is 250 [ms].
- Process # 1 and process # 2 are assigned to CPU # 1. Since the processing time of process # 1 is 50 [ms] and the processing time of thread # 2 of process # 0 is 100 [ms], the processing time of process # 1 is thread # of process # 0 that is the target thread. 2 or less. Therefore, the processing time of process # 1 is added to T1.
- the processing time of process # 2 is 150 [ms] and the processing time of thread # 2 of process # 0 is 100 [ms], the processing time of process # 2 is thread # of process # 0 that is the target thread. Greater than 2. Therefore, n1 ⁇ t1 is added to T1. Furthermore, the processing time of thread # 2 of process # 0, which is the target thread, is added to T1.
- the OS 222 determines whether the calculated T1 is equal to or less than the calculated T0. Since T0 is 250 [ms] and T1 is 270 [ms], the OS 222 determines that T1 is not less than T0. If T1 is not less than or equal to T0, execution of thread # 1 of process # 0 is terminated before thread # 2 of process # 0 is terminated, and process # that is a thread subsequent to thread # 2 of process # 0 This indicates that execution of thread # 3 of 0 is started.
- the OS 222 calculates a time slice (t1 ′) in which T1 ′ and T0 match using the following formula (5).
- n1 ′ is calculated in order from 1 until the value of t1 ′ becomes t1 or less.
- ⁇ N1 ' 1
- FIG. 8 is an explanatory diagram showing t1 'when n1' is 1.
- T0 remains at 250 [ms]. If n1 'is 1, t1' is 100 [ms], and T0 and T1 match. That is, since the execution of the thread # 2 of the process # 0 is finished and the execution of the thread # 1 of the process # 0 is finished, the execution order with the subsequent thread subsequent to the thread # 2 of the process # 0 can be maintained. it can.
- n1 ′ 2
- n1 ′ 3
- n1 ′ 4
- the OS 222 determines any t1 ′ from 1 to 3 as n1 ′ as a new time slice of CPU # 1.
- the OS 222 notifies the OS 221 that is the master OS of the allocation permission of t1 'and the target thread via the snoop circuit 203. Then, when the OS 221 as the master OS accepts t1 'and target thread allocation permission, the OS 221 allocates the target thread to the target CPU and changes the time slice of the target CPU from t1 to t1'.
- Example 2 Next, in the second embodiment, an example in which the clock frequency is changed when a thread having a subsequent thread is executed will be described.
- the reference clock frequency is 500 [MHz] described above, and the clock frequency (referred to as “overclock frequency”) when executing a thread having a subsequent thread is 1 [GHz].
- overclock frequency the clock frequency
- T0 and T1 A difference between the calculation of T0 and T1 from the first embodiment will be described.
- the actual processing time of a thread having a succeeding thread is a value obtained by multiplying the processing time stored in the thread dependency relationship information 300 by (reference clock frequency / overclocking frequency).
- Actual processing time of a thread having a subsequent thread processing time in the thread dependency information 300 ⁇ (reference clock frequency / overclock frequency)
- Process # 1 and process # 2 are assigned to CPU # 1. Since the processing time of process # 1 is 50 [ms] and the actual processing time of thread # 2 of process # 0 is 50 [ms], the processing time of process # 1 is the actual time of thread # 2 of process # 0. Less than processing time. Therefore, the processing time of process # 1 is added to T1.
- the processing time of process # 2 is 150 [ms] and the actual processing time of thread # 2 of process # 0 is 50 [ms], the processing time of process # 2 is the actual time of thread # 2 of process # 0. Greater than processing time. Therefore, n1 ⁇ t1 is added to T1. Further, the actual processing time of thread # 2 of process # 0 is added to T1.
- the OS determines that T0> T1, and the OS notifies the OS that is the master OS of the allocation permission.
- the OS allocates the target thread to CPU # 1.
- the OS registers 1 [GHz] in the clock frequency item 404 of the thread management table 400 corresponding to the identification information of the target thread.
- FIGS. 9 to 14 are flowcharts corresponding to the above-described first embodiment, and FIGS. 9 to 14 are flowcharts corresponding to the above-described second embodiment.
- step S901 which is the master CPU, determines whether or not thread generation has been detected (step S901). If it is determined that thread generation has not been detected (step S901: No), the process proceeds to step S901. Return.
- step S901 determines that the generation of the thread has been detected (step S901: Yes)
- step S902 the generation time of the generated thread is specified (step S902), and whether or not the assignment destination CPU of the target thread has been determined. Judgment is made (step S903).
- step S903 determines that the allocation destination CPU of the target thread has been determined (step S903: Yes)
- the allocation unit 501 allocates the target thread to the determined allocation destination CPU (step S904). Then, the CPU # 0 outputs the allocation result and the generation time of the target thread (step S905), and the series of processing ends.
- That the assignment destination CPU of the target thread has been determined indicates that the CPU identification information is registered in the item 403 of the assignment destination CPU corresponding to the target thread in the thread management table 400.
- the target CPU of the target thread has been determined. For example, assume that the target thread has a preceding thread. When the preceding thread is generated, if it is determined that the scheduled execution end time of the preceding thread is later than the scheduled execution start time of the target thread, the target thread is assigned to the same CPU as the preceding thread. Therefore, when assigning the preceding thread, the assignment destination of the target thread is determined as the assignment destination CPU of the preceding thread.
- Step S903 when the CPU # 0 determines that the assignment destination CPU of the target thread has not been determined (Step S903: No), the CPU with the minimum load is specified as the target CPU (Step S906).
- the CPU # 0 detects the subsequent thread of the target thread by the detection unit 502 (step S907), and determines whether or not the subsequent thread is detected (step S908). Specifically, the CPU # 0 detects the subsequent thread by referring to the item 305 of the subsequent thread corresponding to the target thread in the thread dependency relationship information 300.
- step S908: No When CPU # 0 determines that the subsequent thread is not detected (step S908: No), the process proceeds to step S911. The fact that the subsequent thread is not detected indicates that the target thread has no subsequent thread, and that the identification information of the thread is not registered in the subsequent thread item 305 corresponding to the target thread in the thread dependency relationship information 300. Yes.
- step S908: Yes When CPU # 0 determines that the succeeding thread has been detected (step S908: Yes), the target CPU is notified of temporary allocation of the target thread (step S909), and whether or not allocation permission or non-allocation is accepted from the target CPU. Is determined (step S910).
- CPU # 0 determines that it does not accept allocation permission or non-allocation from the target CPU (step S910: No), it returns to step S910.
- CPU # 0 determines that the allocation permission has been received from the target CPU (step S910: allocation permission)
- the target thread is allocated to the target CPU (step S911), the allocation result is output (step S912), and a series of processing is performed. finish.
- step S910 when CPU # 0 determines that assignment is impossible from the target CPU (step S919: assignment is impossible), the target thread is assigned to the assignment destination CPU of the generation thread of the subsequent thread (step S913).
- the CPU # 0 determines the allocation destination CPU of the subsequent thread of the target thread as the allocation destination CPU of the generation thread of the subsequent thread (step S914), and outputs the allocation result and the determination result (step S915).
- the CPU # 0 registers the identification information of the determined assignment destination CPU in the item 403 of the assignment destination CPU of the thread having the same identification information in the thread management table 400 stored in the shared memory 209. .
- FIG. 11 is an explanatory diagram showing a calculation processing procedure by the target CPU.
- the target CPU which is the temporary allocation destination CPU of the target thread, has received the temporary allocation of the target thread (step S1101). If the target CPU determines that provisional assignment of the target thread has not been received (step S1101: No), the process returns to step S1101.
- the generation source thread that generates the subsequent thread is specified. (Step S1102). Specifically, the target CPU identifies the generation thread by referring to the generation thread item 305 corresponding to the subsequent thread in the thread dependency relationship information 300. Then, the target CPU executes T1 calculation processing by the second calculation unit 504 (step S1103). T1 is the second time from the generation time of the target thread to the scheduled execution end time of the target thread. The target CPU executes T0 calculation processing by the first calculation unit 503 (step S1104). T0 is the first time from the generation time of the target thread to the execution start time of the subsequent thread.
- step S1105 it is determined whether or not the target CPU is T0> T1 (step S1105).
- step S1105: Yes the allocation permission is notified to the master CPU (step S1106).
- step S1113. the time slice calculation unit 505 executes time slice (t1 ') calculation processing (step S1107).
- the target CPU determines whether t1 'satisfying the dependency relationship between the target thread and the subsequent thread has been calculated (step S1108).
- the setting unit 506 sets the time slice of the target CPU to t1 ′ (step S1109). .
- the target CPU notifies the allocation permission to the master CPU (step S1110), outputs the generation time of the target thread and the scheduled execution end time (step S1111), and ends the series of processes.
- the target CPU registers the generation time in the execution start time item 405 of the identification information corresponding to the target thread in the thread dependency relationship information 300, and executes it in the execution end time 406 of the identification information. Register the scheduled end time.
- the scheduled execution end time is a time obtained by adding T1 'to the generation time.
- step S1108 when the target CPU determines that t1 'satisfying the dependency relationship between the target thread and the subsequent thread has not been calculated (step S1108: No), the master CPU is notified of the assignment impossible (step S1112). Then, the target CPU outputs the generation time of the target thread (step S1113) and ends a series of processing.
- FIG. 12 is a flowchart showing a detailed example of the T1 calculation process (step S1103) shown in FIG.
- the target CPU identifies a thread that has been allocated to the temporary allocation destination CPU of the target thread (step S1201).
- the processing time of the target thread is specified based on the identification information of the target thread from the thread dependency information 300.
- the target CPU determines whether there is an unselected thread among the threads assigned to the temporary allocation destination CPU and the target thread (step S1205). If the target CPU determines that there is an unselected thread among the threads assigned to the temporary allocation destination CPU and the target thread (step S1205: Yes), an arbitrary thread (selected thread) is selected from the unselected threads. (Step S1206).
- the target CPU determines whether or not the processing time of the target thread> the processing time of the selected thread (step S1207).
- the processing time of the selected thread is specified from the thread dependency information 300 based on the identification information of the selected thread.
- T1 T1 + the processing time of the selected thread (step S1208), and the process returns to step S1205.
- T1 T1 + n1 ⁇ t1 is set (step S1209), and the process returns to step S1205.
- step S1205 when the target CPU determines that there is no unselected thread (step S1205: No), T1 is output (step S1210), and the process proceeds to step S1104.
- the target CPU stores it in an accessible storage device.
- FIG. 13 is a flowchart showing a detailed example of the process (step S1104) shown in FIG.
- the target CPU specifies an assignment destination CPU of a generation thread that generates a subsequent thread of the target thread (step S1301).
- the target CPU identifies a thread that has been assigned to the assignment destination CPU of the generation thread (step S1302).
- the processing time of the generation thread is specified from the thread dependency information 300 based on the identification information of the generation thread.
- step S1306 Yes
- an arbitrary thread selected from the unselected threads (step S1307)
- the processing time of the generation thread> selected thread It is determined whether or not it is the processing time (step S1308).
- the processing time of the selected thread is specified from the thread dependency information 300 based on the identification information of the selected thread.
- step S1308 Yes
- the process returns to step S1306.
- step S1306 if the target CPU determines that there is no unselected thread among the threads allocated to the allocation destination CPU of the generation thread (step S1306: No), T0 is output (step S1311). The process proceeds to step S1105.
- the output format is stored in a storage device accessible by the target CPU.
- step S1107 are flowcharts showing a detailed example of the time slice calculation processing (step S1107) shown in FIG.
- n1 ' indicates the number of execution times that the target thread is executed before the end of processing.
- the target CPU determines whether there is an unselected thread among the threads already assigned to the temporary allocation destination CPU and the target thread (step S1404).
- the target CPU determines that there is an unselected thread among the threads and target threads assigned to the temporary allocation destination CPU (step S1404: Yes)
- an arbitrary thread selected thread is selected from the unselected threads. (Step S1405).
- the target CPU determines whether or not the processing time of the target thread> the processing time of the selected thread (step S1406).
- the processing time of the target thread is specified based on the identification information of the target thread from the thread dependency information 300.
- the processing time of the selected thread is specified from the thread dependency information 300 based on the identification information of the selected thread.
- step S1406 No
- T1 ′ T1 ′ + n1 ′ ⁇ t1 ′ is set (step S1408), and the process returns to step S1403.
- T1 ′ T1 ′ + the processing time of the selected thread (step S1407), and the process returns to step S1403.
- the output format is stored in a storage device accessible by the target CPU.
- step S1114 is executed instead of step S1103
- step S1115 is executed instead of step S1104
- step S1116 is executed instead of step S1107.
- FIGS. 16 and 17 are flowcharts showing a detailed example of the T1 calculation process (step S1114) shown in FIG.
- the target CPU identifies a thread that has been allocated to the temporary allocation destination CPU of the target thread (step S1601).
- the target CPU determines that there is a subsequent thread in the target thread (step S1603: Yes)
- the actual processing time of the target thread the processing time of the target thread ⁇ (reference clock frequency / overclocking frequency) (step S1604).
- the process moves to S1606.
- the processing time of the target thread is specified based on the identification information of the target thread from the thread dependency information 300.
- the target CPU determines that there is an unselected thread among the threads and target threads assigned to the temporary allocation destination CPU (step S1608: Yes)
- an arbitrary thread selected thread is selected from the unselected threads. (Step S1609).
- the processing time of the selected thread is specified from the thread dependency information 300 based on the identification information of the selected thread.
- step S1608 when the target CPU determines that there is no unselected thread among the threads assigned to the allocation destination CPU and the target thread (step S1608: No), T1 is output (step S1616), and step S1115.
- T1 is output (step S1616), and step S1115.
- Migrate to As an output format for example, the target CPU stores it in an accessible storage device.
- the target CPU specifies an assignment destination CPU of a generation thread that generates a subsequent thread of the target thread (step S1801), and specifies a thread already assigned to the assignment destination CPU of the generation thread (step S1802).
- the processing time of the generation thread is specified from the thread dependency information 300 based on the identification information of the generation thread. If the target CPU determines that there is no subsequent thread in the target thread (step S1804: No), the real processing time of the generation thread is equal to the processing time of the generation thread (step S1806), and the process proceeds to step S1807.
- n0 is the number of times that the generation thread is executed by the end of processing.
- the target CPU determines whether there is a subsequent thread in the selected thread (step S1811).
- the target CPU determines that there is a subsequent thread in the selected thread (step S1811: Yes)
- the actual processing time of the selected thread the processing time of the selected thread ⁇ (reference clock frequency / overclock frequency) (step S1812)
- step S1814 the processing time of the selected thread is specified from the thread dependency information 300 based on the identification information of the selected thread.
- the target CPU determines that there is no subsequent thread in the selected thread (step S1811: No)
- the actual processing time of the selected thread is set to the processing time of the selected thread (step S1813), and the process proceeds to step S1814.
- step S1812 or step S1813 the target CPU determines whether or not the actual processing time of the generation thread> the actual processing time of the selected thread (step S1814).
- T0 T0 + the actual processing time of the selected thread (step S1815)
- the process returns to step S1809. .
- T0 T0 + n0 ⁇ t0 is set (step S1816), and the process returns to step S1809.
- step S1809 when the target CPU determines that there is no unselected thread among the threads assigned to the allocation destination CPU and the target thread (step S1809: No), T1 is output (step S1817), and step S1105.
- Migrate to As an output format for example, the target CPU stores it in an accessible storage device.
- the clock frequency at the time of execution of the thread is different for each thread, the clock frequency is changed at each CPU at each task switch, task dispatch, and processing end. An example in which the clock frequency is changed will be described with reference to FIGS.
- step S1116 are flowcharts showing a detailed example of the time slice calculation process (step S1116) shown in FIG.
- n1 ' indicates the number of execution times that the target thread is executed before the end of processing.
- the target CPU determines whether there is an unselected thread among the threads already assigned to the temporary allocation destination CPU and the target thread (step S2004).
- step S2004 determines that there is an unselected thread among the threads and target threads assigned to the temporary allocation destination CPU (step S2004: Yes)
- an arbitrary thread (selected thread) is selected from the unselected threads. (Step S2005).
- the processing time of the selected thread is specified from the thread dependency information 300 based on the identification information of the selected thread.
- step S2007 or step S2008 the target CPU determines whether or not the processing time of the target thread ⁇ (reference clock frequency / overclocking frequency)> the actual processing time of the selected thread (step S2009).
- step S2009 the processing time of the selected thread
- step S2009 No
- T1 ′ T1 ′ + n1 ′ ⁇ t1 ′ is set (step S2010). )
- step S2003 The processing time of the target thread is specified based on the identification information of the target thread from the thread dependency information 300.
- step S2013 Yes
- step S2014 it is determined whether or not t1 ' ⁇ t1 (step S2014).
- step S2014 it is determined whether or not t1 ' ⁇ t1 (step S2014).
- step S2014 No
- the output format is stored in a storage device accessible by the target CPU.
- FIG. 22 is a flowchart showing an information processing procedure by each CPU. The processing by each CPU will be described by taking CPU # 0 as an example.
- CPU # 0 determines whether or not an event has been detected (step S2201). If CPU # 0 determines that no event has been detected (step S2201: No), the process returns to step S2201.
- step S2201 end of thread processing
- step S2202 determines whether there is an executable thread.
- step S2202 determines that there is no executable thread (step S2202: No)
- step S2202 determines that there is no executable thread (step S2202: No)
- step S2202 determines that there is no executable thread (step S2202: No)
- step S2203 determines that there is an executable thread (step S2203)
- CPU # 0 determines whether a task dispatch or task switch has been detected (step S2201: task dispatch or task switch). It determines whether the thread in which the event has been detected or the selected thread has a succeeding thread (step S2204). When the CPU # 0 determines that the thread in which the event is detected or the selected thread has a succeeding thread (step S2204: Yes), the CPU # 0 notifies the clock supply circuit 210 of the setting of the overclock frequency (step S2205).
- step S2204 determines that the thread in which the event is detected or the selected thread has no subsequent thread.
- the change unit 507 notifies the clock supply circuit 210 of the setting of the reference clock frequency.
- Step S2206 the frequency setting notification is transmitted to the clock supply circuit 210 in association with the CPU identification information and the frequency.
- step S2207 determines whether or not frequency change completion has been received.
- step S2207: NO determines that the frequency change completion has not been received
- step S2207: Yes determines that the frequency change completion has been received
- step S2208 the CPU # 0 starts executing (step S2208) and returns to step S2201.
- FIG. 23 is a flowchart showing a setting processing procedure by the clock supply circuit 210.
- the clock supply circuit 210 determines whether or not a frequency setting notification has been received (step S2301). If the clock supply circuit 210 determines that the frequency setting notification has not been received (step S2301: No), the process returns to step S2301.
- the clock supply circuit 210 determines that the frequency setting notification has been received (step S2301: Yes)
- the frequency supplied to the setting notification transmission source CPU is set to the frequency included in the setting notification (step S2302). ).
- the clock frequency setting as described above, when the clock supply circuit 210 receives a clock frequency setting notification from each CPU, the flag corresponding to the received identification information of the CPU is set to the set value of the received flag. Then, the clock supply circuit 210 notifies the completion of the frequency change (step S2303).
- the time slice in which T0 and T1 match is calculated by a calculation formula.
- the present invention is not limited to this, and T0 and T1 match while changing the time slice every predetermined time.
- a time slice to be identified may be specified.
- the execution end of the preceding thread assigned to the second CPU is executed by the execution end of the succeeding thread assigned to the second CPU. It is determined whether it is before the end. That is, the time slice of each CPU is adjusted so that the execution start of the subsequent thread is regarded as the execution end of the generation thread, and the execution end of the preceding thread assigned to the first CPU is before the execution end of the generation thread .
- the program code becomes unnecessary, and the execution order defined between threads can be maintained without degrading performance due to waiting for execution.
- the subsequent thread can be executed after the processing of the preceding thread is completed. Can keep.
- the subsequent thread is assigned to the first CPU in the same manner as the preceding thread. This is the same as executing the preceding thread and the succeeding thread in the single core processor system, and the execution order can be maintained.
- the subsequent thread is assigned to the CPU with the smallest load.
- the processing time of the process including the preceding thread, the succeeding thread, and the generation thread can be shortened.
- the clock frequency of the clock supplied to the first CPU is made faster than the clock frequency when other threads are executed.
- the actual processing time of the preceding thread can be shortened.
- power saving can be achieved by increasing the clock frequency only while the preceding thread is executed and not increasing the clock frequency while another thread is executed.
- subsequent threads are detected based on the thread dependency information. As a result, it is possible to omit the process of analyzing the code of the process having the subsequent thread at the time of scheduling, and to shorten the processing time of the process.
- the multitask scheduling method can be realized by executing a prepared program on any one of the multicore processors.
- the program may be recorded on a recording medium readable by CPU # 0 or CPU # 1, such as a flash ROM, and executed by being read from the recording medium by CPU # 0 or CPU # 1.
- the program may be distributed through a network such as the Internet.
- Multi-core processor system 300 Thread dependency relationship information 501 Allocation unit 502 Detection unit 503 First calculation unit 504 Second calculation unit 505 Time slice calculation unit 506 Setting unit 507 Change unit
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
- Power Sources (AREA)
Abstract
対象スレッドがCPU#0に割り当てられると、CPU#0が、対象スレッドの実行終了予定時刻が対象スレッドに後続して実行される後続スレッドの実行開始時刻(後続スレッドの生成元スレッドの実行終了予定時刻)以前であるか否かを判断する。対象スレッドの生成時刻から生成元スレッドの終了時刻までのT0が250[ms]であり、対象スレッドの生成時刻から対象スレッドの実行終了予定時刻までのT1が280[ms]であるため、対象スレッドの実行終了前に後続スレッドの実行が開始されてしまう。CPU#0のタイムスライスが30[ms]であるため、対象スレッドが処理終了までに実行される実行回数は4回である。該実行回数を1回とすると、CPU#0のタイムスライスは100[ms]となり、生成元スレッドの実行終了予定時刻が対象スレッドの実行終了予定時刻以降となり、後続スレッドを対象スレッドの後に実行させることができる。
Description
本発明は、マルチコアプロセッサにスレッドを割り当てるマルチタスクスケジューリング方法、およびマルチコアプロセッサシステムに関する。
CPU(Central Processing Unit)が、複数のアプリケーションプログラムを順番に切り替えて実行することにより、ユーザには複数のアプリケーションプログラムが同時に実行されているように見せる技術(マルチタスク)が知られている。ここでは、アプリケーションプログラムをプロセスと称する。
さらに、1プロセスが複数の機能に分割され、CPUが時分割処理により複数の機能を平行して実行する技術(マルチスレッド)が知られている。ここで、分割された各機能をスレッドと称する。シングルコアプロセッサシステムにおいて、マルチスレッドを行う場合、スレッド間の実行順序は固定である。
マルチコアプロセッサシステムにおいて、マルチタスク・マルチスレッドを行う場合、各CPU上で複数のプロセスのスレッドが混在する。一のプロセスの一のスレッドと同一CPUに割り当てられた他のプロセスのスレッドの影響により、一のプロセスで定められた実行順序が変動する場合がある。
シングルコアプロセッサシステム上で動作していたマルチスレッドプログラム(従来のプログラム)がマルチコアプロセッサシステムに移行された場合、スレッド間の実行順序のずれにより、スレッド間で共有する共有データへのアクセス順序がずれる問題点があった。これにより、共有データが不正確な値となる問題点があった。従来、共有データが不正確な値となる問題点を解決するために、開発者が従来のプログラムコード中に同期コードを埋め込むこと(たとえば、以下特許文献1参照。)により、スレッド間の実行順序が固定されている。
しかしながら、従来のプログラムコードは膨大な規模であり、コードの埋め込みおよび品質保証を行うと、開発コストが大幅に増大してしまう。タイミングクリティカルな箇所などはアセンブラ言語で書かれていることもあり、その箇所に対しても同期コードを埋め込むと、埋め込みによる性能劣化が要求性能に対して大きくなるという問題点があった。
本発明は、上述した従来技術による問題点を解消するため、コードを変更することなく、スレッド間の実行順序を遵守することができるマルチタスクスケジューリング方法、およびマルチコアプロセッサシステムを提供することを目的とする。
本発明の一観点によれば、第1スレッドを第1のCPUに割り当て、第1スレッドの後に実行される第2スレッドを検出し、第2スレッドを生成する第3スレッドが割り当てられたCPUの負荷に基づいて第2スレッドが開始されるまでの第1時間を算出し、第1スレッドの実行が終了するまでの第2時間を算出し、第2時間が第1時間よりも大きいときに第1のCPUの第1タイムスライスを第2タイムスライスに変更するマルチタスクスケジューリング方法、およびマルチコアプロセッサシステムが提供される。
本マルチタスクスケジューリング方法、およびマルチコアプロセッサシステムによれば、コードを変更することなく、スレッド間の実行順序を遵守することができるという効果を奏する。
以下に添付図面を参照して、本発明にかかるマルチタスクスケジューリング方法、およびマルチコアプロセッサシステムの好適な実施の形態を詳細に説明する。ここで、マルチコアプロセッサシステムにおいて、マルチコアプロセッサとは、コアが複数搭載されたプロセッサである。コアが複数搭載されていれば、複数のコアが搭載された単一のプロセッサでもよく、シングルコアのプロセッサが並列されているプロセッサ群でもよい。なお、本実施の形態では、説明を単純化するため、シングルコアのプロセッサが並列されているプロセッサ群を例に挙げて説明する。
図1は、本発明の一実施例を示す説明図である。マルチコアプロセッサのうちのCPU#0には、他のスレッド1と他のスレッド2とが割り当てられている。マルチコアプロセッサのうちのCPU#1には、対象スレッドに後続して実行されると定義された後続スレッドの生成元スレッドと他のスレッド3とが割り当てられている。
CPU#0のタイムスライスは30[ms]であり、CPU#1のタイムスライスは90[ms]である。タイムスライスとは、各CPUにおいて、該CPUに割り当てられた複数のスレッドを切り替えて実行する際に、各スレッドの1実行あたりの処理時間である。対象スレッドの割当先CPUのタイムスライスをt1とし、生成元スレッドの割当先CPUのタイムスライスをt0とする。
対象スレッドがCPU#0に割り当てられると、CPU#0が、対象スレッドの後続スレッドを検出する。対象スレッドの実行終了予定時刻が後続スレッドの実行開始時刻以前であるか否かを判断する。ここでは、後続スレッドの実行開始時刻は該後続スレッドを生成する生成元スレッドの実行終了予定時刻とする。対象スレッドの生成時刻から生成元スレッドの実行終了予定時刻までの第1時間(T0)が250[ms]である。対象スレッドの生成時刻から対象スレッドの実行終了予定時刻までの第2時間(T1)が280[ms]である。
よって、生成元スレッドの実行終了予定時刻が先行スレッドの実行終了予定時刻より前であると判断されるため、CPU#0が、生成元スレッドの実行終了予定時刻が対象スレッドの実行終了予定時刻以降となるようにCPU#0のタイムスライスを調整する。具体的には、たとえば、CPU#0が、CPU#0に割り当てられたスレッドの処理時間と、対象スレッドが実行終了までに実行される実行回数とに基づいてCPU#0のタイムスライスを算出する。なお、生成元スレッドの実行終了予定時刻が対象スレッドの実行終了予定時刻以降となる対象スレッドの割当先CPUのタイムスライスをt1’とする。
CPU#0のタイムスライスが30[ms]の場合、対象スレッドの実行回数は4回である。ここでは、対象スレッドの実行回数(n1’)を1回として算出されるタイムスライスをt1’とする。詳細な算出式については実施例1で後述する。他のスレッド1の処理時間が50[ms]であり、他のスレッド2の処理時間が150[ms]であり、対象スレッドの処理時間が100[ms]である。そして、CPU#0が、CPU#0のタイムスライスを下記のように算出する。
T0=他のスレッド1の処理時間+n1’×t1’+対象スレッドの処理時間
250[ms]=50[ms]+t1’+100
t1’=100[ms]
250[ms]=50[ms]+t1’+100
t1’=100[ms]
そして、CPU#0が、対象スレッドの割当先CPUであるCPU#0のタイムスライスを100[ms]に設定する。これにより、生成元スレッドの実行終了予定時刻が対象スレッドの実行終了予定時刻以降となるため、後続スレッドの実行を対象スレッドの実行終了後に開始させることができる。
また、図1で説明した例では、対象スレッドの割当先CPUのタイムスライスが調整されているが、これに限らず、後続スレッドを生成する生成元スレッドの割当先CPUのタイムスライスが調整されてもよい。
(マルチコアプロセッサシステムのハードウェア)
図2は、マルチコアプロセッサシステムのハードウェアを示すブロック図である。図2において、マルチコアプロセッサシステム200は、CPU#0と、CPU#1と、1次キャッシュ201と、1次キャッシュ202と、スヌープ回路203と、2次キャッシュ204と、を有している。さらに、マルチコアプロセッサシステム200は、キーボード206と、ディスプレイ205と、I/F207(InterFace)と、メモリコントローラ208と、共有メモリ209と、クロック供給回路210と、を有している。2次キャッシュ204と、キーボード206と、ディスプレイ205と、I/F207と、メモリコントローラ208と、クロック供給回路210とは、バス216を介して接続されている。
図2は、マルチコアプロセッサシステムのハードウェアを示すブロック図である。図2において、マルチコアプロセッサシステム200は、CPU#0と、CPU#1と、1次キャッシュ201と、1次キャッシュ202と、スヌープ回路203と、2次キャッシュ204と、を有している。さらに、マルチコアプロセッサシステム200は、キーボード206と、ディスプレイ205と、I/F207(InterFace)と、メモリコントローラ208と、共有メモリ209と、クロック供給回路210と、を有している。2次キャッシュ204と、キーボード206と、ディスプレイ205と、I/F207と、メモリコントローラ208と、クロック供給回路210とは、バス216を介して接続されている。
まず、CPU#0とCPU#1とは、それぞれレジスタとコアとを有している。CPU#0はマスタCPUであり、マルチコアプロセッサシステム200の全体の制御を司り、OS221(Operating System)を実行する。OS221はマスタOSであり、生成されたスレッドをどのマルチコアプロセッサのうちのいずれのCPUに割り当てるかを制御する機能を有し、該CPU#0に割り当てられたスレッドを実行する。OS221はスケジューラ231を有し、スケジューラ231はCPU#0に割り当てられたスレッドをタイムスライスごとに切り替えて実行する機能を有する。
CPU#1はスレーブCPUであり、OS222を実行する。OS222は、スレーブOSであり、該CPU#1に割り当てられたスレッドを実行する。OS222はスケジューラ232を有し、スケジューラ232はCPU#1に割り当てられたスレッドをタイムスライスごとに切り替えて実行する機能を有する。
CPU#0は、1次キャッシュ201とスヌープ回路203と2次キャッシュ204とを介して各部に接続されている。1次キャッシュ201と1次キャッシュ202とは、それぞれキャッシュメモリとキャッシュコントローラとを有している。1次キャッシュ201はOS221が実行するスレッドから共有メモリ209への書込処理を一時的に記憶する。
また、1次キャッシュ201は、共有メモリ209から読み出されたデータを一時的に記憶する。1次キャッシュ202はOS222が実行するスレッドから共有メモリ209への書込処理を一時的に記憶する。また、1次キャッシュ202は、共有メモリ209から読み出されたデータを一時的に記憶する。
スヌープ回路203は、1次キャッシュ201と1次キャッシュ202とで共有するデータがいずれか一方のキャッシュで更新された場合、該更新を検出し、他方のキャッシュも更新する。
2次キャッシュ204は、キャッシュメモリとキャッシュコントローラとを有している。2次キャッシュ204では、1次キャッシュ201や1次キャッシュ202から追い出されたデータを記憶する。2次キャッシュ204では、OS221とOS222とで共有するデータを記憶する。2次キャッシュ204は、1次キャッシュ201や1次キャッシュ202よりも、記憶容量が大きくかつCPUからのアクセス速度が遅い。2次キャッシュ204は共有メモリ209より、記憶容量が小さくかつCPUからのアクセス速度が速い。
ディスプレイ205は、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する。このディスプレイ205は、たとえば、TFT液晶ディスプレイなどを採用することができる。
キーボード206は、数字、各種指示などの入力のためのキーを有し、データの入力を行う。また、キーボード206は、タッチパネル式の入力パッドやテンキーなどであってもよい。
I/F207は、通信回線を通じてLAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどのネットワークに接続され、ネットワークを介して他の装置に接続される。そして、I/F207は、ネットワークと内部のインターフェースを司り、外部装置からのデータの入出力を制御する。I/F207には、たとえばモデムやLANアダプタなどを採用することができる。
共有メモリ209は、CPU#0とCPU#1に共有されるメモリであり、具体的には、たとえば、ROM212(Read Only Memory)と、RAM211(Random Access Memory)と、フラッシュROM213と、フラッシュROMコントローラ214と、フラッシュROM215と、などを有している。
ROM212は、ブートプログラムなどのプログラムを記憶している。RAM211は、CPUのワークエリアとして使用される。フラッシュROM213は、OS221やOS222などのシステムソフトウェアやアプリケーションソフトウェアや後述するスレッド管理テーブルおよびスレッド依存関係情報などを記憶している。たとえば、各OSを更新する場合、マルチコアプロセッサシステム200は、I/F207によって新しいOSを受信し、フラッシュROM213に格納されている古いOSを、受信した新しいOSに更新する。
フラッシュROMコントローラ214は、各CPUの制御に従ってフラッシュROM215に対するデータのリード/ライトを制御する。フラッシュROM215は、フラッシュROMコントローラ214の制御で書き込まれたデータを記憶する。データの具体例としては、マルチコアプロセッサシステム200を使用するユーザがI/F207を通して取得した画像データ、映像データなどである。フラッシュROM215は、たとえば、メモリカード、SDカードなどを採用することができる。
クロック供給回路210は各部にクロックを供給する。ここで、本実施の形態では、各CPUへは、500[MHz]と1[GHz]のうちのいずれか一方の周波数のクロックを供給できることとする。たとえば、クロック供給回路210はCPUごとにフラグを有している。該フラグは1ビットであり、クロック供給回路210は、フラグが0であれば500[MHz]のクロックを該フラグに対応するCPUに供給し、フラグが1であれば1[GHz]のクロックを該フラグに対応するCPUに供給する。
たとえば、クロック供給回路210は、各CPUからCPUの識別情報とフラグの設定値との通知(「クロック周波数の設定通知」と称する。)を受信すると、受信したCPUの識別情報に対応するフラグを受信したフラグの設定値に設定する。そして、設定後、クロック供給回路210は、変更完了をクロック周波数の設定通知の送信元CPUに送信する。
図3は、スレッド依存関係情報の一例を示す説明図である。スレッド依存関係情報300は、スレッド間で定義された実行順序を示す情報と各スレッドの処理時間とを有する情報である。スレッド依存関係情報300は、プロセスIDの項目301と、スレッドIDの項目302と、処理時間の項目303と、先行スレッドの項目304と、後続スレッドの項目305と、生成元スレッドの項目306と、を有している。
プロセスIDの項目301にはプロセスの識別情報が記憶されている。スレッドIDの項目302にはプロセスIDの項目301に識別情報が記憶されているプロセスが有するスレッドの識別情報が記憶されている。ここで、スレッドは、周知のようにアプリケーションプログラム内で行われる処理の実行単位である。そして、プロセスは少なくとも1以上のスレッドを含む実行単位である。スレッドを1のみしか含まないプロセスは、実質的にスレッドである。よって、スレッドIDの項目302に識別情報が記憶されていないプロセスはスレッドを1のみしか含まないことを示している。
処理時間の項目303には各スレッドの処理時間が記憶されている。ここでは、処理時間は、開発者がESL(Electronic System Level)などの検証ツールを用いて各CPUの基準となるクロック周波数(「基準クロック周波数」と称する。)を用いて算出した時間である。
先行スレッドの項目304は、スレッドIDの項目302に識別情報が記憶されているスレッドと出力順序に依存関係があり、該スレッドよりも先行して実行されるスレッドの識別情報が記憶されている。後続スレッドの項目305は、スレッドIDの項目302に識別情報が記憶されているスレッドと出力順序に依存関係があり、該スレッドに後続して実行されるスレッドの識別情報が記憶されている。生成元スレッドの項目306は、スレッドIDの項目302に識別情報が記憶されているスレッドを生成する生成元スレッドの識別情報が記憶されている。
たとえば、プロセス#0は、スレッド#0~スレッド#3を有している。プロセス#0のスレッド#0はプロセス#0のスレッド#1とプロセス#0のスレッド#2とを生成し、プロセス#0のスレッド#1はプロセス#0のスレッド#3を生成する。プロセス#0のスレッド#2とプロセス#0のスレッド#3とには出力依存関係があり、プロセス#0のスレッド#2の実行終了後に、プロセス#0のスレッド#3が後続して実行される。プロセス#0のスレッド#0と、プロセス#0のスレッド#1と、プロセス#1と、プロセス#2とは、出力依存関係が他のスレッドとない。また、上述のようにスレッド依存関係情報300は共有メモリ209に記憶されているが、2次キャッシュ204にも記憶されていてもよい。
図4は、スレッド管理テーブルの一例を示す説明図である。スレッド管理テーブル400は、各プロセスのスレッドがどのCPUにわりあてられているかが登録される情報である。スレッド管理テーブル400では、プロセスが起動されると、マスタOSであるOS221によってプロセスごとにスレッドの識別情報が登録される。スレッド管理テーブル400は、プロセスIDの項目401と、スレッドIDの項目402と、割当先CPUの項目403と、クロック周波数の項目404と、実行開始時刻の項目405と、実行終了予定時刻の項目406と、を有している。
プロセスIDの項目401にはプロセスの識別情報が記憶されている。スレッドIDの項目402にはプロセスIDの項目401に識別情報が記憶されているプロセスが有するスレッドの識別情報が記憶されている。スレッドIDの項目402に識別情報が記憶されていないプロセスはスレッドを1のみしか含まないことを示している。
割当先CPUの項目403には、スレッドIDの項目402に識別情報が記憶されているスレッドの割当先CPUの識別情報が記憶されている。また、スレッドの生成時に、該スレッドに対応する割当先CPUの項目403にCPUの識別情報が登録されている場合、該CPUにスレッドが割り当てられることとする。
クロック周波数の項目404には、スレッドIDの項目402に識別情報が記憶されたスレッドを実行するときのCPUのクロック周波数が記憶されている。本実施の形態では基準クロック周波数を500[MHz]とする。
実行開始時刻の項目405には、スレッドIDの項目402に識別情報が記憶されたスレッドの生成時刻が登録される。実行終了予定時刻の項目406は、スレッドの生成時刻に本実施の形態で算出する第2時間が加算された時刻が記憶される。
(マルチコアプロセッサシステム200の機能ブロック図)
図5は、マルチコアプロセッサシステム200の機能ブロック図である。マルチコアプロセッサシステム200は、割当部501と、検出部502と、第1の算出部503と、第2の算出部504と、タイムスライス算出部505と、設定部506と、変更部507507と、を有している。具体的には、割当部501~変更部507を有するプログラムが共有メモリ209などの記憶装置に記憶されている。CPU#0やCPU#1が該記憶装置にアクセスして該プログラムを読み出し、該プログラム内にコーディングされている処理を実行することにより、該割当部501から変更部507の処理が実行される。
図5は、マルチコアプロセッサシステム200の機能ブロック図である。マルチコアプロセッサシステム200は、割当部501と、検出部502と、第1の算出部503と、第2の算出部504と、タイムスライス算出部505と、設定部506と、変更部507507と、を有している。具体的には、割当部501~変更部507を有するプログラムが共有メモリ209などの記憶装置に記憶されている。CPU#0やCPU#1が該記憶装置にアクセスして該プログラムを読み出し、該プログラム内にコーディングされている処理を実行することにより、該割当部501から変更部507の処理が実行される。
割当部501は、第1スレッドを第1のCPUに割り当てる。検出部502は、第1スレッドの後に実行される第2スレッドを検出する。さらに、検出部502は、スレッド依存関係情報に基づいて第2スレッドを検出する。第1スレッドが対象スレッドであり、第2スレッドが後続スレッドである。
第1の算出部503は、第2スレッドを生成する第3スレッドが割り当てられたCPUの負荷に基づいて第2スレッドが開始されるまでの第1時間を算出する。第3スレッドが後続スレッドの生成元スレッドである。
第2の算出部504は、第1スレッドの実行が終了するまでの第2時間を算出する。設定部506は、第2時間が第1時間よりも大きいときに第1のCPUの第1タイムスライスを第2タイムスライスに変更する。第1のCPUの第1タイムスライスは設定済のタイムスライスである。
タイムスライス算出部505は、第1時間が第2時間と実質的に等しくなるように第2タイムスライスを算出する。また、設定部506は、第2時間が第1時間よりも大きいときに第1のCPUの第1タイムスライスをタイムスライス算出部505により算出された第2タイムスライスに変更する。
変更部507は、第1スレッドが実行される間、クロック周波数を変更する。さらに、割当部501は、第2スレッドを負荷が最小であるCPUに割り当てる。
また、割当部501は、タイムスライス算出部505によって第2タイムスライスが得られないときには第2スレッドを第1のCPUに割り当てる。以上を踏まえて、詳細を実施例1と実施例2を用いて説明する。
(実施例1)
実施例1では、実行順序が定義されたスレッドのうちの、先行スレッドが割り当てられた場合の例について説明する。具体的には、マルチコアプロセッサシステム200が、マルチコアプロセッサのうちの第1のCPUに先行スレッドが割り当てられたことを検出する。そして、マルチコアプロセッサシステム200が、第1のCPUと異なる第2のCPUに割り当てられ、先行スレッドに後続する後続スレッドの生成元スレッドの実行終了予定時刻が先行スレッドの実行終了予定時刻より前であるか否かを判断する。
実施例1では、実行順序が定義されたスレッドのうちの、先行スレッドが割り当てられた場合の例について説明する。具体的には、マルチコアプロセッサシステム200が、マルチコアプロセッサのうちの第1のCPUに先行スレッドが割り当てられたことを検出する。そして、マルチコアプロセッサシステム200が、第1のCPUと異なる第2のCPUに割り当てられ、先行スレッドに後続する後続スレッドの生成元スレッドの実行終了予定時刻が先行スレッドの実行終了予定時刻より前であるか否かを判断する。
そして、マルチコアプロセッサシステム200が、生成元スレッドの実行終了予定時刻が先行スレッドの実行終了予定時刻より前であると判断した場合、第1のコアまたは第2のコアのうちの少なくとも一方のコアのタイムスライスを生成元スレッドの実行終了予定時刻が先行スレッドの実行終了予定時刻以降となるように調整する。具体的には、マルチコアプロセッサシステム200が、該一方のコアのタイムスライスを、一方のコアに割り当てられたスレッドの処理時間と、先行スレッドまたは生成元スレッドの処理が終了するまでに実行する実行回数とに基づいて算出する。マルチコアプロセッサシステム200が、一方のコアのタイムスライスを算出されたタイムスライスに設定する。
マルチコアプロセッサシステム200が、生成元スレッドの実行終了予定時刻が先行スレッドの実行終了予定時刻以降となる一方のCPUのタイムスライスが算出できなかった場合、対象スレッドを第2のCPUに割り当てる。そして、マルチコアプロセッサシステム200が、対象スレッドが第2のCPUに割り当てられた場合、一方のコアのタイムスライスを変更しない。さらに、対象スレッドが第2のCPUに割り当てられた場合、後続スレッドが生成されると、マルチコアプロセッサシステム200が、後続スレッドを第2のCPUに割り当てる。
また、マルチコアプロセッサシステム200が、生成元スレッドの実行終了予定時刻が先行スレッドの実行終了予定時刻以降であると判断された場合、一方のコアのタイムスライスを変更しない。詳細については図6~図8を用いて説明する。
図6は、各スレッドの割り当て例を示す説明図である。図6では、CPU#0にプロセス#0のスレッド#1が割り当てられ、CPU#1にプロセス#1とプロセス#2とが割り当てられている。
まず、OS221が、プロセス#0のスレッド#2の生成を検出する。そして、OS221が、プロセス#0のスレッド#2の生成時刻を特定する。OS221が、プロセス#0のスレッド#2の後続スレッドをスレッド依存関係情報300に基づいて検出する。具体的には、たとえば、OS221が、スレッド依存関係情報300内のプロセス#0のスレッド#2に対応する後続スレッドの項目305に登録されているスレッドの識別情報を参照することにより、後続スレッドを検出することができる。ここでは、スレッド依存関係情報300内のプロセス#0のスレッド#2に対応する後続スレッドの項目305から、プロセス#0のスレッド#2の後続スレッドとして、プロセス#0のスレッド#3が検出される。
そして、OS221が、スレッド依存関係情報300に基づいて各CPUに割り当てられているスレッドの処理時間の合計を算出することにより、最も負荷が小さいCPUを特定する。ここでは、CPU#0に割り当てられているスレッドの処理時間の合計は250[ms]であり、CPU#1に割り当てられているスレッドの処理時間の合計は200[ms]である。よって、最も負荷が小さいCPUとしてCPU#1が特定される。つぎに、OS221が、特定したCPU#1をプロセス#0のスレッド#2の仮割当先CPUとし、OS221がOS222へスヌープ回路203を介してプロセス#0のスレッド#2の仮割当を通知する。
OS222がプロセス#0のスレッド#2の仮割当を受け付けると、OS222がプロセス#0のスレッド#2の生成時刻からプロセス#0のスレッド#2の実行終了予定時刻までの第2時間(T1)を算出する。OS222が下記式(1)を用いてT1を算出する。
ここで、Nは、仮割当先CPU(ここではCPU#1)に割当済のスレッドと対象スレッドとのスレッドの総数である。n番目のスレッドとは、仮割当先CPU(ここではCPU#1)に割当済のスレッドと対象スレッドとのうちのスレッドから、順に選択されたスレッドを示している。t1は仮割当先CPUのタイムスライスである。n1は対象スレッドが処理終了するまでに他のスレッドと切り替えられることにより実行される実行回数である。n1については下記式(2)によって算出される。n1は小数点以下を切り上げている。
n1=対象スレッドの処理時間/t1 ・・・(2)
OS222が、プロセス#0のスレッド#2の生成時刻から、プロセス#0のスレッド#2の後続スレッドであるプロセス#0のスレッド#3を生成する生成元スレッドの実行終了予定時刻までの第1時間(T0)を算出する。ここで、プロセス#0のスレッド#3を生成する生成元スレッドは、プロセス#0のスレッド#1である。OS222が下記式(3)を用いてT0を算出する。
ここで、Mは、後続スレッドを生成する生成元スレッドの割当先CPU(ここではCPU#0)に割当済のスレッドのスレッド数である。m番目のスレッドとは、生成元スレッドの割当先CPU(ここではCPU#0)に割当済のスレッドから、順に選択されたスレッドを示している。t0は生成元スレッドの割当先CPUのタイムスライスである。n0は対象スレッドが実行終了するまでに切り替えられる切り替え回数であり、下記式(4)によって算出される。n0は小数点以下を切り上げている。
n0=生成元スレッドの処理時間/t0 ・・・(4)
図7は、T0とT1とを示す説明図である。ここで、対象スレッドの仮割当先CPUであるCPU#1と、後続スレッドを生成する生成元スレッドの割当先CPUであるCPU#0と、それぞれのタイムスライスが30[ms]であるとする。CPU#0にはプロセス#0のスレッド#1のみが割り当てられているため、T0は250[ms]である。
つぎに、T1の算出について説明する。
・T1=0
・n1=プロセス#0のスレッド#2の処理時間/CPU#1のタイムスライス
=100[ms]/30[ms]
=4
・n1×t1=4×30[ms]
=120[ms]
・T1=0
・n1=プロセス#0のスレッド#2の処理時間/CPU#1のタイムスライス
=100[ms]/30[ms]
=4
・n1×t1=4×30[ms]
=120[ms]
すなわち、n1が4であるため、4回に分割されてプロセス#0のスレッド#2が実行される。CPU#1にはプロセス#1とプロセス#2が割り当てられている。プロセス#1の処理時間は50[ms]であり、プロセス#0のスレッド#2の処理時間は100[ms]であるため、プロセス#1の処理時間が対象スレッドであるプロセス#0のスレッド#2以下である。よって、T1にプロセス#1の処理時間が加算される。
プロセス#2の処理時間は150[ms]であり、プロセス#0のスレッド#2の処理時間は100[ms]であるため、プロセス#2の処理時間が対象スレッドであるプロセス#0のスレッド#2より大きい。よって、T1にn1×t1が加算される。さらに、対象スレッドであるプロセス#0のスレッド#2の処理時間がT1に加算される。
・T1=プロセス#1の処理時間+n1×t1+プロセス#0のスレッド#2の処理時間
=50[ms]+120[ms]+100[ms]
=270[ms]
=50[ms]+120[ms]+100[ms]
=270[ms]
OS222が、算出したT1が算出したT0以下であるか否かを判断する。T0が250[ms]であり、T1が270[ms]であるため、OS222がT1はT0以下でないと判断する。T1がT0以下でないとは、プロセス#0のスレッド#2が終了する前に、プロセス#0のスレッド#1の実行が終了してしまい、プロセス#0のスレッド#2の後続スレッドであるプロセス#0のスレッド#3の実行が開始されてしまうことを示している。
そして、OS222が、下記式(5)を用いてT1’とT0が一致するタイムスライス(t1’)を算出する。
ここで、n1’については1から順にt1’の値がt1以下となるまで算出する。
・n1’=1
・T1’=プロセス#1の処理時間+n1’×t1’+プロセス#0のスレッド#2の処理時間=T0
50[ms]+t1’+100[ms]=250[ms]
t1’=250[ms]-150[ms]
t1’=100[ms]
・n1’=1
・T1’=プロセス#1の処理時間+n1’×t1’+プロセス#0のスレッド#2の処理時間=T0
50[ms]+t1’+100[ms]=250[ms]
t1’=250[ms]-150[ms]
t1’=100[ms]
図8は、n1’が1の場合のt1’を示す説明図である。T0は250[ms]のままである。n1’が1であると、t1’が100[ms]となり、T0とT1とが一致する。すなわち、プロセス#0のスレッド#2の実行が終了すると共に、プロセス#0のスレッド#1の実行が終了するため、プロセス#0のスレッド#2に後続する後続スレッドとの実行順序を保つことができる。
つぎに、n1’が2の場合について説明する。
・n1’=2
・T1’=プロセス#1の処理時間+n1’×t1’+プロセス#0のスレッド#2の処理時間=T0
50[ms]+2×t1’+100[ms]=250[ms]
2×t1’=250[ms]-150[ms]
t1’=50[ms]
・n1’=2
・T1’=プロセス#1の処理時間+n1’×t1’+プロセス#0のスレッド#2の処理時間=T0
50[ms]+2×t1’+100[ms]=250[ms]
2×t1’=250[ms]-150[ms]
t1’=50[ms]
つぎに、n1’が3の場合について説明する。
・n1’=3
・T1’=プロセス#1の処理時間+n1’×t1’+プロセス#0のスレッド#2の処理時間=T0
50[ms]+3×t1’+100[ms]=250[ms]
3・t1’=250[ms]-150[ms]
t1’=33.33[ms]
・n1’=3
・T1’=プロセス#1の処理時間+n1’×t1’+プロセス#0のスレッド#2の処理時間=T0
50[ms]+3×t1’+100[ms]=250[ms]
3・t1’=250[ms]-150[ms]
t1’=33.33[ms]
つぎに、n1’が4の場合について説明する。
・n1’=4
・T1’=プロセス#1の処理時間+n1’×t1’+プロセス#0のスレッド#2の処理時間=T0
50[ms]+4×t1’+100[ms]=250[ms]
250[ms]-150[ms]=4・t1’
t1’=25[ms]
・n1’=4
・T1’=プロセス#1の処理時間+n1’×t1’+プロセス#0のスレッド#2の処理時間=T0
50[ms]+4×t1’+100[ms]=250[ms]
250[ms]-150[ms]=4・t1’
t1’=25[ms]
n1’が4の場合、t1’がt1よりも小さくなるため、OS222が、n1’が1~3のうちのいずれかのt1’をあらたなCPU#1のタイムスライスに決定する。OS222が、t1’と対象スレッドの割当許可をマスタOSであるOS221へスヌープ回路203を介して通知する。そして、マスタOSであるOS221が、t1’と対象スレッドの割当許可を受け付けると、OS221が、対象スレッドを対象CPUに割り当て、対象CPUのタイムスライスをt1からt1’に変更する。
(実施例2)
つぎに、実施例2では、後続スレッドを有するスレッドの実行時にクロック周波数を変更する例について説明する。基準クロック周波数は上述の500[MHz]であり、後続スレッドを有するスレッドを実行する場合のクロック周波数(「オーバークロック周波数」と称する。)は1[GHz]とする。T0とT1の算出における実施例1との違いについて説明する。
つぎに、実施例2では、後続スレッドを有するスレッドの実行時にクロック周波数を変更する例について説明する。基準クロック周波数は上述の500[MHz]であり、後続スレッドを有するスレッドを実行する場合のクロック周波数(「オーバークロック周波数」と称する。)は1[GHz]とする。T0とT1の算出における実施例1との違いについて説明する。
後続スレッドを有するスレッドの実処理時間は、スレッド依存関係情報300に記憶されている処理時間に(基準クロック周波数/オーバークロック周波数)を掛けた値である。
・後続スレッドを有するスレッドの実処理時間=スレッド依存関係情報300内の処理時間×(基準クロック周波数/オーバークロック周波数)
・後続スレッドを有するスレッドの実処理時間=スレッド依存関係情報300内の処理時間×(基準クロック周波数/オーバークロック周波数)
・T1=0
・プロセス#0のスレッド#2の実処理時間=プロセス#0のスレッド#2の処理時間×(500[MHz]/1[GHz])
=100[ms]×(1/2)
=50[ms]
・n1=プロセス#0のスレッド#2の実処理時間/CPU#1のタイムスライス
=50[ms]/30[ms]
=2(小数点以下切り上げ)
・n1×t1=2×30[ms]
=60[ms]
・プロセス#0のスレッド#2の実処理時間=プロセス#0のスレッド#2の処理時間×(500[MHz]/1[GHz])
=100[ms]×(1/2)
=50[ms]
・n1=プロセス#0のスレッド#2の実処理時間/CPU#1のタイムスライス
=50[ms]/30[ms]
=2(小数点以下切り上げ)
・n1×t1=2×30[ms]
=60[ms]
CPU#1にはプロセス#1とプロセス#2が割り当てられている。プロセス#1の処理時間は50[ms]であり、プロセス#0のスレッド#2の実処理時間が50[ms]であるため、プロセス#1の処理時間がプロセス#0のスレッド#2の実処理時間以下である。よって、T1にプロセス#1の処理時間が加算される。
プロセス#2の処理時間は150[ms]であり、プロセス#0のスレッド#2の実処理時間が50[ms]であるため、プロセス#2の処理時間がプロセス#0のスレッド#2の実処理時間より大きい。よって、T1にn1×t1が加算される。さらに、プロセス#0のスレッド#2の実処理時間がT1に加算される。
・T1=プロセス#1の処理時間+n1×t1+プロセス#0のスレッド#2の実処理時間
=50[ms]+60[ms]+50[ms]
=160[ms]
=50[ms]+60[ms]+50[ms]
=160[ms]
T0は250[ms]であり、T1が160[ms]であるため、OSが、T0>T1であると判断し、OSが、割当許可をマスタOSであるOSへ通知する。OSが、割当許可を受け付けると、対象スレッドをCPU#1に割り当てる。OSが、対象スレッドに後続スレッドがある場合、対象スレッドの識別情報に対応するスレッド管理テーブル400のクロック周波数の項目404に1[GHz]を登録する。
(スケジュール処理手順)
つぎに、マスタCPUと対象スレッドの仮割当先である対象CPUによる対象スレッドのスケジュール処理手順について図9から図14を用いて説明する。図9から図14は上述の実施例1に対応するフローチャートであり、図9から図14は上述の実施例2に対応するフローチャートである。
つぎに、マスタCPUと対象スレッドの仮割当先である対象CPUによる対象スレッドのスケジュール処理手順について図9から図14を用いて説明する。図9から図14は上述の実施例1に対応するフローチャートであり、図9から図14は上述の実施例2に対応するフローチャートである。
図9および図10は、マスタCPUによるスケジュール処理手順を示すフローチャートである。まず、マスタCPUであるCPU#0が、スレッドの生成を検出したか否かを判断し(ステップS901)、スレッドの生成を検出していないと判断した場合(ステップS901:No)、ステップS901へ戻る。
CPU#0が、スレッドの生成を検出したと判断した場合(ステップS901:Yes)、生成されたスレッドの生成時刻を特定し(ステップS902)、対象スレッドの割当先CPUが決定済か否かを判断する(ステップS903)。CPU#0が、対象スレッドの割当先CPUが決定済であると判断した場合(ステップS903:Yes)、割当部501により、決定済の割当先CPUに対象スレッドを割り当てる(ステップS904)。そして、CPU#0が、割当結果と対象スレッドの生成時刻を出力し(ステップS905)、一連の処理を終了する。
対象スレッドの割当先CPUが決定済であるとは、スレッド管理テーブル400内の対象スレッドに対応する割当先CPUの項目403にCPUの識別情報が登録されていることを示している。ここで、対象スレッドの割手先CPUが決定されている場合について説明する。たとえば、対象スレッドに先行スレッドがあるとする。該先行スレッドの生成時に、該先行スレッドの実行終了予定時刻が該対象スレッドの実行開始予定時刻より後であると判断された場合、対象スレッドが該先行スレッドと同一のCPUに割り当てる。そのため、先行スレッドの割り当て時に、対象スレッドの割当先が先行スレッドの割当先CPUに決定される。
ステップS903において、CPU#0が、対象スレッドの割当先CPUが決定済でないと判断した場合(ステップS903:No)、最小負荷のCPUを対象CPUとして特定する(ステップS906)。つぎに、CPU#0が、検出部502により、対象スレッドの後続スレッドを検出し(ステップS907)、後続スレッドが検出されたか否かを判断する(ステップS908)。具体的には、CPU#0が、スレッド依存関係情報300内の対象スレッドに対応する後続スレッドの項目305を参照することにより、後続スレッドを検出する。
CPU#0が、後続スレッドが検出されなかったと判断した場合(ステップS908:No)、ステップS911へ移行する。後続スレッドが検出されないとは、対象スレッドに後続スレッドがないことを示し、スレッド依存関係情報300内の対象スレッドに対応する後続スレッドの項目305にスレッドの識別情報が登録されていないことを示している。CPU#0が、後続スレッドが検出されたと判断した場合(ステップS908:Yes)、対象CPUに対象スレッドの仮割当を通知し(ステップS909)、対象CPUから割当許可または割当不可を受け付けたか否かを判断する(ステップS910)。
CPU#0が、対象CPUから割当許可または割当不可を受け付けていないと判断した場合(ステップS910:No)、ステップS910に戻る。CPU#0が、対象CPUから割当許可を受け付けたと判断した場合(ステップS910:割当許可)、対象CPUに対象スレッドを割り当て(ステップS911)、割当結果を出力し(ステップS912)、一連の処理を終了する。
ステップS910において、CPU#0が、対象CPUから割当不可を受け付けたと判断した場合(ステップS919:割当不可)、後続スレッドの生成元スレッドの割当先CPUに対象スレッドを割り当てる(ステップS913)。CPU#0が、対象スレッドの後続スレッドの割当先CPUを該後続スレッドの生成元スレッドの割当先CPUに決定し(ステップS914)、割当結果および決定結果を出力する(ステップS915)。具体的には、たとえば、CPU#0が、共有メモリ209に記憶されたスレッド管理テーブル400内において識別情報が一致するスレッドの割当先CPUの項目403へ決定した割当先CPUの識別情報を登録する。
図11は、対象CPUによる算出処理手順を示す説明図である。図11において、対象スレッドの仮割当先CPUとされた対象CPUが、対象スレッドの仮割当を受け付けたか否かを判断する(ステップS1101)。対象CPUが、対象スレッドの仮割当を受け付けていないと判断した場合(ステップS1101:No)、ステップS1101へ戻る。
対象CPUが、対象スレッドの仮割当を受け付けたと判断した場合(ステップS1101:Yes)、後続スレッドを生成する生成元スレッドを特定する。(ステップS1102)。具体的には、対象CPUが、スレッド依存関係情報300内の後続スレッドに対応する生成元スレッドの項目305を参照することにより、生成元スレッドを特定する。そして、対象CPUが、第2の算出部504により、T1の算出処理を実行する(ステップS1103)。T1は対象スレッドの生成時刻から対象スレッドの実行終了予定時刻までの第2時間である。対象CPUが、第1の算出部503により、T0の算出処理を実行する(ステップS1104)。T0は対象スレッドの生成時刻から後続スレッドの実行開始時刻までの第1時間である。
そして、対象CPUが、T0>T1であるか否かを判断し(ステップS1105)、T0>T1であると判断した場合(ステップS1105:Yes)、割当許可をマスタCPUに通知し(ステップS1106)、ステップS1113へ移行する。ステップS1105において、対象CPUが、T0>T1でないと判断した場合(ステップS1105:No)、タイムスライス算出部505により、タイムスライス(t1’)の算出処理を実行する(ステップS1107)。対象CPUが、対象スレッドと後続スレッドとの依存関係を満たすt1’が算出されたか否かを判断する(ステップS1108)。
対象CPUが、対象スレッドと後続スレッドとの依存関係を満たすt1’を算出されたと判断した場合(ステップS1108:Yes)、設定部506により、対象CPUのタイムスライス=t1’とする(ステップS1109)。対象CPUが、割当許可をマスタCPUに通知し(ステップS1110)、対象スレッドの生成時刻および実行終了予定時刻を出力し(ステップS1111)、一連の処理を終了する。具体的には、対象CPUが、スレッド依存関係情報300内の対象スレッドに該当する識別情報の実行開始時刻の項目405に生成時刻を登録し、該識別情報の実行終了予定時刻の項目406に実行終了予定時刻を登録する。実行終了予定時刻は生成時刻にT1’が加算された時刻である。
ステップS1108において、対象CPUが、対象スレッドと後続スレッドとの依存関係を満たすt1’が算出されなかったと判断した場合(ステップS1108:No)、割当不可をマスタCPUに通知する(ステップS1112)。そして、対象CPUが、対象スレッドの生成時刻を出力し(ステップS1113)、一連の処理を終了する。
図12は、図11で示したT1の算出処理(ステップS1103)の詳細な一例を示すフローチャートである。対象CPUが、対象スレッドの仮割当先CPUに割当済のスレッドを特定する(ステップS1201)。対象CPUが、t1=仮割当先CPUのタイムスライスとし(ステップS1202)、n1(小数点以下切り上げ)=対象スレッドの処理時間/t1とし(ステップS1203)、T1=0とする(ステップS1204)。対象スレッドの処理時間は、スレッド依存関係情報300から対象スレッドの識別情報に基づいて特定される。
対象CPUが、仮割当先CPUに割当済のスレッドおよび対象スレッドのうち、未選択のスレッドがあるか否かを判断する(ステップS1205)。対象CPUが、仮割当先CPUに割当済のスレッドおよび対象スレッドのうち、未選択のスレッドがあると判断した場合(ステップS1205:Yes)、未選択のスレッドから任意のスレッド(選択スレッド)を選択する(ステップS1206)。
対象CPUが、対象スレッドの処理時間>選択スレッドの処理時間であるか否かを判断する(ステップS1207)。選択スレッドの処理時間は、スレッド依存関係情報300から選択スレッドの識別情報に基づいて特定される。対象CPUが、対象スレッドの処理時間>選択スレッドの処理時間であると判断した場合(ステップS1207:Yes)、T1=T1+選択スレッドの処理時間とし(ステップS1208)、ステップS1205へ戻る。対象CPUが、対象スレッドの処理時間>選択スレッドの処理時間でないと判断した場合(ステップS1207:No)、T1=T1+n1×t1とし(ステップS1209)、ステップS1205へ戻る。
ステップS1205において、対象CPUが、未選択のスレッドがないと判断した場合(ステップS1205:No)、T1を出力し(ステップS1210)、ステップS1104へ移行する。出力形式としては、たとえば、対象CPUが、アクセス可能な記憶装置に記憶する。
図13は、図11で示した処理(ステップS1104)の詳細な一例を示すフローチャートである。まず、対象CPUが、対象スレッドの後続スレッドを生成する生成元スレッドの割当先CPUを特定する(ステップS1301)。対象CPUが、生成元スレッドの割当先CPUに割当済のスレッドを特定する(ステップS1302)。対象CPUが、t0=生成元スレッドの割当先CPUのタイムスライスとし(ステップS1303)、n0(小数点以下切り上げ)=生成元スレッドの処理時間/t0とする(ステップS1304)。生成元スレッドの処理時間は、スレッド依存関係情報300から生成元スレッドの識別情報に基づいて特定される。
対象CPUが、T0=0とし(ステップS1305)、生成元スレッドの割当先CPUに割当済のスレッドのうち、未選択のスレッドがあるか否かを判断する(ステップS1306)。対象CPUが、未選択のスレッドがあると判断した場合(ステップS1306:Yes)、未選択のスレッドから任意のスレッド(選択スレッド)を選択し(ステップS1307)、生成元スレッドの処理時間>選択スレッドの処理時間であるか否かを判断する(ステップS1308)。選択スレッドの処理時間は、スレッド依存関係情報300から選択スレッドの識別情報に基づいて特定される。
対象CPUが、生成元スレッドの処理時間>選択スレッドの処理時間であると判断した場合(ステップS1308:Yes)、T0=T0+選択スレッドの処理時間とし(ステップS1309)、ステップS1306へ戻る。対象CPUが、生成元スレッドの処理時間>選択スレッドの処理時間でないと判断した場合(ステップS1308:No)、T0=T0+n0×t0とし(ステップS1310)、ステップS1306へ戻る。
また、ステップS1306において、対象CPUが、生成元スレッドの割当先CPUに割当済のスレッドのうち、未選択のスレッドがないと判断した場合(ステップS1306:No)、T0を出力し(ステップS1311)、ステップS1105へ移行する。出力形式としては、たとえば、対象CPUがアクセス可能な記憶装置に記憶する。
図14および図15は、図11で示したタイムスライスの算出処理(ステップS1107)の詳細な一例を示すフローチャートである。まず、対象CPUが、対象スレッドの仮割当先CPUに割当済のスレッドを特定し(ステップS1401)、n1’=1とし(ステップS1402)、T1’=0とする(ステップS1403)。ここで、n1’は対象スレッドが処理終了までに実行される実行回数を示している。
対象CPUが、仮割当先CPUに割当済のスレッドおよび対象スレッドのうち、未選択のスレッドがあるか否かを判断する(ステップS1404)。対象CPUが、仮割当先CPUに割当済のスレッドおよび対象スレッドのうち、未選択のスレッドがあると判断した場合(ステップS1404:Yes)、未選択のスレッドから任意のスレッド(選択スレッド)を選択する(ステップS1405)。
つぎに、対象CPUが、対象スレッドの処理時間>選択スレッドの処理時間であるか否かを判断する(ステップS1406)。対象スレッドの処理時間は、スレッド依存関係情報300から対象スレッドの識別情報に基づいて特定される。選択スレッドの処理時間は、スレッド依存関係情報300から選択スレッドの識別情報に基づいて特定される。
対象CPUが、対象スレッドの処理時間>選択スレッドの処理時間でないと判断した場合(ステップS1406:No)、T1’=T1’+n1’×t1’とし(ステップS1408)、ステップS1403へ戻る。対象CPUが、対象スレッドの処理時間>選択スレッドの処理時間であると判断した場合(ステップS1406:Yes)、T1’=T1’+選択スレッドの処理時間とし(ステップS1407)、ステップS1403へ戻る。
ステップS1404において、対象CPUが、仮割当先CPUに割当済のスレッドおよび対象スレッドのうち、未選択のスレッドがないと判断した場合(ステップS1404:No)、T1’=T0となるt1’を算出し(ステップS1409)、解があるか否かを判断する(ステップS1410)。T1’=T0となるt1’を算出するとは、具体的には、たとえば、上記式(5)=T0の一次方程式の解を算出することである。
対象CPUが、解があると判断した場合(ステップS1410:Yes)、t1’<t1であるか否かを判断する(ステップS1411)。対象CPUが、t1’<t1でないと判断した場合(ステップS1411:No)、n1’とt1’とを関連付けて出力し(ステップS1412)、n1’=n1’+1とし(ステップS1413)、ステップS1403へ戻る。出力形式としては、たとえば、対象CPUがアクセス可能な記憶装置に記憶する。
ステップS1410において、解がないと判断した場合(ステップS1410:No)、実行回数が1からn1’-1の算出したタイムスライスから、任意のタイムスライスをt1’として選択し(ステップS1414)、ステップS1108へ移行する。ただし、n1’=1において、解が無い場合、何も選択されていないこととする。1からn1’-1の実行回数のうちのいずれの実行回数のタイムスライスが選択されるかについては任意であり、設計者が決定することとしてよい。ステップS1411において、対象CPUが、t1’<t1であると判断した場合(ステップS1411:Yes)、ステップS1414に移行する。
つぎに、上述の実施例2に対応するフローチャートについて説明する。上述したように、実施例2では、後続スレッドを有するスレッドを実行中には該スレッドが割り当てられたCPUのクロック周波数をオーバークロック周波数に設定する。実施例1と実施例2との違いは、図11で示したステップS1103とステップS1104とステップS1107である。実施例2ではステップS1103に代わってステップS1114が実行され、ステップS1104に代わってステップS1115が実行され、ステップS1107に代わってステップS1116が実行される。
図16および図17は、図11で示したT1の算出処理(ステップS1114)の詳細な一例を示すフローチャートである。対象CPUが、対象スレッドの仮割当先CPUに割当済のスレッドを特定する(ステップS1601)。対象CPUが、t1=仮割当先CPUのタイムスライスとし(ステップS1602)、対象スレッドに後続スレッドがあるか否かを判断する(ステップS1603)。
対象CPUが、対象スレッドに後続スレッドがあると判断した場合(ステップS1603:Yes)、対象スレッドの実処理時間=対象スレッドの処理時間×(基準クロック周波数/オーバークロック周波数)とし(ステップS1604)、ステップS1606へ移行する。対象スレッドの処理時間は、スレッド依存関係情報300から対象スレッドの識別情報に基づいて特定される。
対象CPUが、対象スレッドに後続スレッドがないと判断した場合(ステップS1603:No)、対象スレッドの実処理時間=対象スレッドの処理時間とし(ステップS1605)、ステップS1606へ移行する。ステップS1604またはステップS1605のつぎに、対象CPUが、n1=対象スレッドの実処理時間/t1とする(ステップS1606)。
対象CPUが、T1=0とし(ステップS1607)、割当先CPUに割当済のスレッドおよび対象スレッドのうち、未選択のスレッドがあるか否かを判断する(ステップS1608)。対象CPUが、仮割当先CPUに割当済のスレッドおよび対象スレッドのうち、未選択のスレッドがあると判断した場合(ステップS1608:Yes)、未選択のスレッドから任意のスレッド(選択スレッド)を選択する(ステップS1609)。
そして、対象CPUが、選択スレッドに後続スレッドがあるか否かを判断する(ステップS1610)。対象CPUが、選択スレッドに後続スレッドがあると判断した場合(ステップS1610:Yes)、選択スレッドの実処理時間=選択スレッドの処理時間×(基準クロック周波数/オーバークロック周波数)とし(ステップS1611)、ステップS1613へ移行する。選択スレッドの処理時間は、スレッド依存関係情報300から選択スレッドの識別情報に基づいて特定される。対象CPUが、選択スレッドに後続スレッドがないと判断した場合(ステップS1610:No)、選択スレッドの実処理時間=選択スレッドの処理時間とし(ステップS1612)、ステップS1613へ移行する。
ステップS1611またはステップS1612のつぎに、対象CPUが、対象スレッドの実処理時間>選択スレッドの実処理時間であるか否かを判断する(ステップS1613)。対象CPUが、対象スレッドの実処理時間>選択スレッドの実処理時間であると判断した場合(ステップS1613:Yes)、T1=T1+選択スレッドの実処理時間とし(ステップS1614)、ステップS1608へ戻る。対象CPUが、対象スレッドの実処理時間>選択スレッドの実処理時間でないと判断した場合(ステップS1613:No)、T1=T1+n1×t1とし(ステップS1615)、ステップS1608へ戻る。
ステップS1608において、対象CPUが、割当先CPUに割当済のスレッドおよび対象スレッドのうち、未選択のスレッドがないと判断した場合(ステップS1608:No)、T1を出力し(ステップS1616)、ステップS1115へ移行する。出力形式としては、たとえば、対象CPUが、アクセス可能な記憶装置に記憶する。
図18および図19は、図11で示したT0の算出処理(ステップS1115)の詳細な一例を示すフローチャートである。対象CPUが、対象スレッドの後続スレッドを生成する生成元スレッドの割当先CPUを特定し(ステップS1801)、生成元スレッドの割当先CPUに割当済のスレッドを特定する(ステップS1802)。対象CPUが、t0=生成元スレッドの割当先CPUのタイムスライスとし(ステップS1803)、対象スレッドに後続スレッドがあるか否かを判断する(ステップS1804)。
対象CPUが、対象スレッドに後続スレッドがあると判断した場合(ステップS1804:Yes)、生成元スレッドの実処理時間=生成元スレッドの処理時間×(基準クロック周波数/オーバークロック周波数)とし(ステップS1805)、ステップS1807へ移行する。生成元スレッドの処理時間は、スレッド依存関係情報300から生成元スレッドの識別情報に基づいて特定される。対象CPUが、対象スレッドに後続スレッドがないと判断した場合(ステップS1804:No)、生成元スレッドの実処理時間=生成元スレッドの処理時間とし(ステップS1806)、ステップS1807へ移行する。
ステップS1805またはステップS1806のつぎに、n0(小数点以下切り上げ)=生成元スレッドの実処理時間/t0とする(ステップS1807)。n0は生成元スレッドが処理終了までに実行される実行回数である。対象CPUが、T0=0とし(ステップS1808)、割当先CPUに割当済のスレッドのうち、未選択のスレッドがあるか否かを判断する(ステップS1809)。対象CPUが、割当先CPUに割当済のスレッドおよび対象スレッドのうち、未選択のスレッドがあると判断した場合(ステップS1809:Yes)、未選択のスレッドから任意のスレッド(選択スレッド)を選択する(ステップS1810)。
そして、対象CPUが、選択スレッドに後続スレッドがあるか否かを判断する(ステップS1811)。対象CPUが、選択スレッドに後続スレッドがあると判断した場合(ステップS1811:Yes)、選択スレッドの実処理時間=選択スレッドの処理時間×(基準クロック周波数/オーバークロック周波数)とし(ステップS1812)、ステップS1814へ移行する。選択スレッドの処理時間は、スレッド依存関係情報300から選択スレッドの識別情報に基づいて特定される。対象CPUが、選択スレッドに後続スレッドがないと判断した場合(ステップS1811:No)、選択スレッドの実処理時間=選択スレッドの処理時間とし(ステップS1813)、ステップS1814へ移行する。
ステップS1812またはステップS1813のつぎに、対象CPUが、生成元スレッドの実処理時間>選択スレッドの実処理時間であるか否かを判断する(ステップS1814)。対象CPUが、生成元スレッドの実処理時間>選択スレッドの実処理時間であると判断した場合(ステップS1814:Yes)、T0=T0+選択スレッドの実処理時間とし(ステップS1815)、ステップS1809へ戻る。対象CPUが、生成元スレッドの実処理時間>選択スレッドの実処理時間でないと判断した場合(ステップS1814:No)、T0=T0+n0×t0とし(ステップS1816)、ステップS1809へ戻る。
ステップS1809において、対象CPUが、割当先CPUに割当済のスレッドおよび対象スレッドのうち、未選択のスレッドがないと判断した場合(ステップS1809:No)、T1を出力し(ステップS1817)、ステップS1105へ移行する。出力形式としては、たとえば、対象CPUが、アクセス可能な記憶装置に記憶する。
また、スレッドごとに該スレッドの実行時のクロック周波数が異なるため、各CPUではタスクスイッチ、タスクディスパッチ、処理終了ごとにクロックの周波数が変更される。クロック周波数が変更される例を図20と図21を用いて説明する。
図20および図21は、図11で示したタイムスライスの算出処理(ステップS1116)の詳細な一例を示すフローチャートである。まず、対象CPUが、対象スレッドの仮割当先CPUに割当済のスレッドを特定し(ステップS2001)、n1’=1とし(ステップS2002)、T1’=0とする(ステップS2003)。ここで、n1’は対象スレッドが処理終了までに実行される実行回数を示している。
対象CPUが、仮割当先CPUに割当済のスレッドおよび対象スレッドのうち、未選択のスレッドがあるか否かを判断する(ステップS2004)。対象CPUが、仮割当先CPUに割当済のスレッドおよび対象スレッドのうち、未選択のスレッドがあると判断した場合(ステップS2004:Yes)、未選択のスレッドから任意のスレッド(選択スレッド)を選択する(ステップS2005)。
つぎに、対象CPUが、選択スレッドに後続スレッドがあるか否かを判断する(ステップS2006)。対象CPUが、選択スレッドに後続スレッドがあると判断した場合(ステップS2006:Yes)、選択スレッドの実処理時間=選択スレッドの処理時間×(基準クロック周波数/オーバークロック周波数)とし(ステップS2007)、ステップS2009へ移行する。選択スレッドの処理時間は、スレッド依存関係情報300から選択スレッドの識別情報に基づいて特定される。対象CPUが、選択スレッドに後続スレッドがないと判断した場合(ステップS2006:No)、選択スレッドの実処理時間=選択スレッドの処理時間とし(ステップS2008)、ステップS2009へ移行する。
ステップS2007またはステップS2008のつぎに、対象CPUが、対象スレッドの処理時間×(基準クロック周波数/オーバークロック周波数)>選択スレッドの実処理時間であるか否かを判断する(ステップS2009)。対象CPUが、対象スレッドの処理時間×(基準クロック周波数/オーバークロック周波数)>選択スレッドの処理時間でないと判断した場合(ステップS2009:No)、T1’=T1’+n1’×t1’とし(ステップS2010)、ステップS2003へ戻る。対象スレッドの処理時間は、スレッド依存関係情報300から対象スレッドの識別情報に基づいて特定される。
対象CPUが、対象スレッドの処理時間×(基準クロック周波数/オーバークロック周波数)>選択スレッドの処理時間であると判断した場合(ステップS2009:Yes)、T1’=T1’+選択スレッドの処理時間とし(ステップS2011)、ステップS2003へ戻る。ステップS2004において、対象CPUが、仮割当先CPUに割当済のスレッドおよび対象スレッドのうち、未選択のスレッドがないと判断した場合(ステップS2004:No)、T1’=T0となるt1’を算出し(ステップS2012)、解があるか否かを判断する(ステップS2013)。T1’=T0となるt1’を算出するとは、具体的には、たとえば、上記式(5)=T0の一次方程式の解を算出することである。
対象CPUが、解があると判断した場合(ステップS2013:Yes)、t1’<t1であるか否かを判断する(ステップS2014)。対象CPUが、t1’<t1でないと判断した場合(ステップS2014:No)、n1’とt1’とを関連付けて出力し(ステップS2015)、n1’=n1’+1とし(ステップS2016)、ステップS2003へ戻る。出力形式としては、たとえば、対象CPUがアクセス可能な記憶装置に記憶する。
ステップS2013において、解があると判断した場合(ステップS2013:No)、ステップS2017へ移行する。ステップS2014において、対象CPUが、t1’<t1であると判断した場合(ステップS2014:Yes)、ステップS2017に移行する。ステップS2013のNoの場合またはステップS2014のYesの場合のつぎに、実行回数が1からn1’-1の算出したタイムスライスから、任意のタイムスライスをt1’として選択し(ステップS2017)、ステップS1108へ移行する。ただし、n1’=1において、解が無い場合、何も選択されていないこととする。1からn1’-1の実行回数のうちのいずれの実行回数のタイムスライスが選択されるかについては任意であり、設計者が決定することとしてよい。
図22は、各CPUによる情報処理手順を示すフローチャートである。各CPUによる処理であるが、代表してCPU#0を例に挙げて説明する。CPU#0が、イベントを検出したか否かを判断する(ステップS2201)。CPU#0が、イベントを検出していないと判断した場合(ステップS2201:No)、ステップS2201へ戻る。
CPU#0が、スレッドの処理終了を検出したと判断した場合(ステップS2201:スレッドの処理終了)、実行可能なスレッドがあるか否かを判断する(ステップS2202)。CPU#0が、実行可能なスレッドがないと判断した場合(ステップS2202:No)、ステップS2201へ戻る。CPU#0が、実行可能なスレッドがあると判断した場合(ステップS2202:Yes)、実行可能なスレッドから任意のスレッドを選択し(ステップS2203)、ステップS2204へ移行する。
CPU#0が、タスクディスパッチまたはタスクスイッチを検出したと判断した場合(ステップS2201:タスクディスパッチまたはタスクスイッチ)、イベントが検出されたスレッドまたは選択したスレッドが後続スレッドを有するか否かを判断する(ステップS2204)。CPU#0が、イベントが検出されたスレッドまたは選択したスレッドが後続スレッドを有すると判断した場合(ステップS2204:Yes)、クロック供給回路210にオーバークロック周波数の設定を通知する(ステップS2205)。
CPU#0が、イベントが検出されたスレッドまたは選択したスレッドが後続スレッドを有さないと判断した場合(ステップS2204:No)、変更部507により、クロック供給回路210に基準クロック周波数の設定を通知する(ステップS2206)。周波数の設定通知については、具体的には、CPUの識別情報と、周波数と、を関連付けてクロック供給回路210に送信する。
ステップS2205またはステップS2206のつぎに、CPU#0が、周波数の変更完了を受信したか否かを判断する(ステップS2207)。CPU#0が、周波数の変更完了を受信していないと判断した場合(ステップS2207:No)、ステップS2207へ戻る。CPU#0が、周波数の変更完了を受信したと判断した場合(ステップS2207:Yes)、実行開始し(ステップS2208)、ステップS2201へ戻る。
図23は、クロック供給回路210による設定処理手順を示すフローチャートである。クロック供給回路210が、周波数の設定通知を受信したか否かを判断する(ステップS2301)。そして、クロック供給回路210が、周波数の設定通知を受信していないと判断した場合(ステップS2301:No)、ステップS2301へ戻る。
一方、クロック供給回路210が、周波数の設定通知を受信したと判断した場合(ステップS2301:Yes)、設定通知の送信元CPUへ供給する周波数を該設定通知に含まれる周波数に設定する(ステップS2302)。クロック周波数の設定については、上述したように、クロック供給回路210が各CPUからクロック周波数の設定通知を受信すると、受信したCPUの識別情報に対応するフラグを受信したフラグの設定値に設定する。そして、クロック供給回路210が、周波数の変更完了を通知する(ステップS2303)。
また、実施例1および実施例2ではT0とT1とが一致するタイムスライスは計算式で算出されているが、これに限らず、タイムスライスを所定時間ごとに変化させながら、T0とT1が一致するタイムスライスが特定されてもよい。
以上説明したように、マルチタスクスケジューリング方法、およびマルチコアプロセッサシステムによれば、第1のCPUに割り当てられた先行スレッドの実行終了が第2のCPUに割り当てられた、後続スレッドの生成元スレッドの実行終了以前か否かを判断する。すなわち、後続スレッドの実行開始を生成元スレッドの実行終了として、第1のCPUに割り当てられた先行スレッドの実行終了が生成元スレッドの実行終了以前となるように、各CPUのタイムスライスを調整する。これにより、プログラムコードが不要となり、実行待ちによって性能劣化させずにスレッド間で定義された実行順序を保つことができる。
また、第1時間が第2時間と実質的に等しくなるように第1のCPUのタイムスライスを計算することにより、先行スレッドの処理終了後に、後続スレッドを実行させることができるため、実行順序を保つことができる。
また、第1時間が第2時間と実質的に等しくなる第1のCPUのタイムスライスが計算により得られなかった場合、後続スレッドを先行スレッドと同様に第1のCPUに割り当てる。これにより、先行スレッドと後続スレッドとをシングルコアプロセッサシステムで実行させることと同一となり、実行順序を保つことができる。
また、第1時間が第2時間と実質的に等しくなるように第1のCPUのタイムスライスが調整された場合、後続スレッドを負荷が最小であるCPUに割り当てる。これにより、先行スレッドと後続スレッドと生成元スレッドとを含むプロセスの処理時間を短縮させることができる。
また、先行スレッドが実行される間、第1のCPUに供給するクロックのクロック周波数を他のスレッドを実行時のクロック周波数よりも早くする。これにより、先行スレッドの実処理時間を短縮させることができる。さらに、先行スレッドが実行される間のみクロック周波数を早くし、他のスレッドが実行される間はクロック周波数を早くしないことで、省電力化を図ることができる。
また、スレッド依存関係情報に基づいて後続スレッドを検出する。これにより、スケジューリング時に後続スレッドを有するプロセスのコードを解析する処理を省くことができ、該プロセスの処理時間を短縮させることができる。
なお、マルチタスクスケジューリング方法は、予め用意されたプログラムをマルチコアプロセッサのうちのいずれかのコアで実行することにより実現することができる。また、該プログラムは、フラッシュROMなどのCPU#0またはCPU#1が読み取り可能な記録媒体に記録され、CPU#0またはCPU#1によって記録媒体から読み出されることによって実行されてもよい。また、該プログラムは、インターネット等のネットワークを介して配布されてもよい。
200 マルチコアプロセッサシステム
300 スレッド依存関係情報
501 割当部
502 検出部
503 第1の算出部
504 第2の算出部
505 タイムスライス算出部
506 設定部
507 変更部
300 スレッド依存関係情報
501 割当部
502 検出部
503 第1の算出部
504 第2の算出部
505 タイムスライス算出部
506 設定部
507 変更部
Claims (7)
- マルチタスクスケジューリング方法において、
第1スレッドを第1のCPU(Central Processing Unit)に割り当て、
前記第1スレッドの後に実行される第2スレッドを検出し、
前記第2スレッドを生成する第3スレッドが割り当てられたCPUの負荷に基づいて前記第2スレッドが開始されるまでの第1時間を算出し、
前記第1スレッドの実行が終了するまでの第2時間を算出し、
前記第2時間が前記第1時間よりも大きいときに前記第1のCPUの第1タイムスライスを第2タイムスライスに変更すること、
を特徴とするマルチタスクスケジューリング方法。 - 前記第1時間が前記第2時間と実質的に等しくなるように前記第2タイムスライスが計算されること、
を特徴とする請求項1に記載のマルチタスクスケジューリング方法。 - 前記計算によって前記第2タイムスライスが得られないときには前記第2スレッドを前記第1のCPUに割り当てること、
を特徴とする請求項2に記載のマルチタスクスケジューリング方法。 - 前記第2スレッドを負荷が最小であるCPUに割り当てること、
を特徴とする請求項1または請求項2に記載のマルチタスクスケジューリング方法。 - 前記第1スレッドが実行される間、クロック周波数を変更すること、
を特徴とする請求項1、請求項2および請求項4の何れか一に記載のマルチタスクスケジューリング方法。 - スレッド依存関係情報に基づいて前記第2スレッドが検出されること、
を特徴とする請求項1乃至請求項4の何れか一に記載のマルチタスクスケジューリング方法。 - 第1スレッドを第1のCPUに割り当てる割当手段と、
前記割当手段によって前記第1のCPUに割り当てられた第1スレッドの後に実行される第2スレッドを検出する検出手段と、
前記検出手段により検出された第2スレッドを生成する第3スレッドが割り当てられたCPUの負荷に基づいて前記第2スレッドが開始されるまでの第1時間を算出する第1の算出手段と、
前記第1スレッドの実行が終了するまでの第2時間を算出する第2の算出手段と、
前記第2の算出手段により算出された第2時間が前記第1の算出手段により算出された第1時間よりも大きいときに前記第1のCPUの第1タイムスライスを第2タイムスライスに設定する設定手段と、
を備えることを特徴とするマルチコアプロセッサシステム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2011/050219 WO2012093496A1 (ja) | 2011-01-07 | 2011-01-07 | マルチタスクスケジューリング方法、およびマルチコアプロセッサシステム |
JP2012551787A JP5720699B2 (ja) | 2011-01-07 | 2011-01-07 | マルチタスクスケジューリング方法、およびマルチコアプロセッサシステム |
US13/934,696 US9563465B2 (en) | 2011-01-07 | 2013-07-03 | Multi-task scheduling method for assigning threads based on time slices to multi-core processors and multi-core processor system therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2011/050219 WO2012093496A1 (ja) | 2011-01-07 | 2011-01-07 | マルチタスクスケジューリング方法、およびマルチコアプロセッサシステム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US13/934,696 Continuation US9563465B2 (en) | 2011-01-07 | 2013-07-03 | Multi-task scheduling method for assigning threads based on time slices to multi-core processors and multi-core processor system therefor |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2012093496A1 true WO2012093496A1 (ja) | 2012-07-12 |
Family
ID=46457361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2011/050219 WO2012093496A1 (ja) | 2011-01-07 | 2011-01-07 | マルチタスクスケジューリング方法、およびマルチコアプロセッサシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9563465B2 (ja) |
JP (1) | JP5720699B2 (ja) |
WO (1) | WO2012093496A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111427686A (zh) * | 2020-03-23 | 2020-07-17 | 贵阳块数据城市建设有限公司 | 一种处理器多线程并发方法 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9268609B2 (en) * | 2013-04-30 | 2016-02-23 | Hewlett Packard Enterprise Development Lp | Application thread to cache assignment |
US9892024B2 (en) * | 2015-11-02 | 2018-02-13 | Sony Interactive Entertainment America Llc | Backward compatibility testing of software in a mode that disrupts timing |
CN109416642A (zh) * | 2016-07-04 | 2019-03-01 | 华为技术有限公司 | 计算机模拟服务器上的电子硬件设计的性能评估技术 |
KR101805462B1 (ko) | 2017-06-29 | 2018-01-10 | 주식회사 티맥스소프트 | 스레드에서 처리되는 서비스 처리량을 증가시키기 위한 방법 및 컴퓨팅 장치 |
KR102452205B1 (ko) * | 2017-11-20 | 2022-10-06 | 삼성전자주식회사 | 멀티 코어 제어 시스템 |
CN112799793B (zh) * | 2019-11-13 | 2022-03-15 | 上海商汤智能科技有限公司 | 调度方法及装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07281909A (ja) * | 1994-04-05 | 1995-10-27 | Mitsubishi Heavy Ind Ltd | リアルタイム・タスク周期実行管理システム |
JPH09128351A (ja) * | 1995-10-27 | 1997-05-16 | Fujitsu Ltd | 並列計算機における並列プロセススケジューリング方法および並列計算機用処理装置 |
JPH1074150A (ja) * | 1996-06-28 | 1998-03-17 | Fujitsu Ltd | プロセススケジューリング方法ならびにそのためのプロセススケジューリング装置およびプログラム記憶媒体 |
JPH11306037A (ja) * | 1998-04-16 | 1999-11-05 | Sony Corp | 並列演算処理装置およびその方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02113363A (ja) * | 1988-10-24 | 1990-04-25 | Nec Corp | マルチプロセッサシステムにおけるタイムスライス制御方式 |
JP3039953B2 (ja) * | 1989-04-28 | 2000-05-08 | 株式会社日立製作所 | 並列化装置 |
JPH0319036A (ja) * | 1989-06-16 | 1991-01-28 | Nec Corp | タイムスライスインターバルを使用したダイナミックディスパッチング方式 |
EP0592080A2 (en) * | 1992-09-24 | 1994-04-13 | International Business Machines Corporation | Method and apparatus for interprocess communication in a multicomputer system |
US6581089B1 (en) | 1998-04-16 | 2003-06-17 | Sony Corporation | Parallel processing apparatus and method of the same |
US7412703B2 (en) * | 2002-09-19 | 2008-08-12 | Sedna Patent Services, Llc | Low cost, highly accurate video server bit-rate compensation |
JP2009069921A (ja) * | 2007-09-11 | 2009-04-02 | Hitachi Ltd | マルチプロセッサシステム |
US7657683B2 (en) * | 2008-02-01 | 2010-02-02 | Redpine Signals, Inc. | Cross-thread interrupt controller for a multi-thread processor |
US9201673B2 (en) * | 2008-07-30 | 2015-12-01 | Microsoft Technology Licensing, Llc | Efficient detection and response to spin waits in multi-processor virtual machines |
US8560876B2 (en) * | 2010-07-06 | 2013-10-15 | Sap Ag | Clock acceleration of CPU core based on scanned result of task for parallel execution controlling key word |
-
2011
- 2011-01-07 WO PCT/JP2011/050219 patent/WO2012093496A1/ja active Application Filing
- 2011-01-07 JP JP2012551787A patent/JP5720699B2/ja not_active Expired - Fee Related
-
2013
- 2013-07-03 US US13/934,696 patent/US9563465B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07281909A (ja) * | 1994-04-05 | 1995-10-27 | Mitsubishi Heavy Ind Ltd | リアルタイム・タスク周期実行管理システム |
JPH09128351A (ja) * | 1995-10-27 | 1997-05-16 | Fujitsu Ltd | 並列計算機における並列プロセススケジューリング方法および並列計算機用処理装置 |
JPH1074150A (ja) * | 1996-06-28 | 1998-03-17 | Fujitsu Ltd | プロセススケジューリング方法ならびにそのためのプロセススケジューリング装置およびプログラム記憶媒体 |
JPH11306037A (ja) * | 1998-04-16 | 1999-11-05 | Sony Corp | 並列演算処理装置およびその方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111427686A (zh) * | 2020-03-23 | 2020-07-17 | 贵阳块数据城市建设有限公司 | 一种处理器多线程并发方法 |
CN111427686B (zh) * | 2020-03-23 | 2023-03-24 | 贵阳块数据城市建设有限公司 | 一种处理器多线程并发方法 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2012093496A1 (ja) | 2014-06-09 |
US9563465B2 (en) | 2017-02-07 |
JP5720699B2 (ja) | 2015-05-20 |
US20130298137A1 (en) | 2013-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5720699B2 (ja) | マルチタスクスケジューリング方法、およびマルチコアプロセッサシステム | |
US8214831B2 (en) | Runtime dependence-aware scheduling using assist thread | |
CN104823154B (zh) | 包括虚拟加载存储队列的处理器和系统 | |
CN104583942B (zh) | 乱序加载的基于锁的和基于同步的方法 | |
CN104583975B (zh) | 无消歧乱序加载存储队列 | |
CN104583943B (zh) | 拥有具有分布式结构的动态分派窗口的虚拟加载存储队列 | |
EP2711839A1 (en) | Parallel processing device, parallel processing method, optimization device, optimization method, and computer program | |
US8612978B2 (en) | Code execution utilizing single or multiple threads | |
CN104583936B (zh) | 具有组成按序从存储器进行读取的加载的存储器一致性模型中的乱序加载的信号量方法和系统 | |
WO2010067377A2 (en) | Method for reorganizing tasks for optimization of resources | |
JP7554795B2 (ja) | 複数の計算コア上のデータドリブンスケジューラ | |
CN104583956B (zh) | 用于实现加载存储重新排序和优化的指令定义 | |
CN104011705A (zh) | 多形异构性多核架构 | |
JPWO2012093488A1 (ja) | スケジューリング方法、およびマルチコアプロセッサシステム | |
JPWO2012120654A1 (ja) | タスクスケジューリング方法およびマルチコアシステム | |
JPWO2013140518A1 (ja) | スケジューリングプログラム、マルチコアプロセッサシステム、およびスケジューリング方法 | |
CN1983164A (zh) | 用于矢量处理的可扩展并行流水线浮点单元 | |
JP5321748B2 (ja) | マルチコアプロセッサシステム、スレッド制御方法、およびスレッド制御プログラム | |
Volkov | A microbenchmark to study GPU performance models | |
Min et al. | Flexer: Out-of-order scheduling for multi-npus | |
JP5725040B2 (ja) | マルチコアプロセッサシステム、およびスケジューリング方法 | |
Kim et al. | System-wide time versus density tradeoff in real-time multicore fluid scheduling | |
Puka et al. | Deterministic constructive vN-NEH+ algorithm to solve permutation flow shop scheduling problem with makespan criterion | |
Osborne et al. | Simultaneous multithreading applied to real time | |
JPWO2012086040A1 (ja) | マルチコアプロセッサシステム、および電力制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 11855187 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2012551787 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 11855187 Country of ref document: EP Kind code of ref document: A1 |