JP2013073247A - Simdプロセッサ及びコントロールプロセッサ並びにプロセッサ要素 - Google Patents
Simdプロセッサ及びコントロールプロセッサ並びにプロセッサ要素 Download PDFInfo
- Publication number
- JP2013073247A JP2013073247A JP2011209455A JP2011209455A JP2013073247A JP 2013073247 A JP2013073247 A JP 2013073247A JP 2011209455 A JP2011209455 A JP 2011209455A JP 2011209455 A JP2011209455 A JP 2011209455A JP 2013073247 A JP2013073247 A JP 2013073247A
- Authority
- JP
- Japan
- Prior art keywords
- log
- address
- local address
- local
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015654 memory Effects 0.000 claims abstract description 93
- 238000012546 transfer Methods 0.000 claims description 12
- 238000000034 method Methods 0.000 abstract description 19
- 238000012545 processing Methods 0.000 abstract description 13
- 230000014509 gene expression Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8007—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
- G06F15/8023—Two dimensional arrays, e.g. mesh, torus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/0207—Addressing or allocation; Relocation with multidimensional access, e.g. row/column, matrix
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/06—Addressing a physical block of locations, e.g. base addressing, module addressing, memory dedication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
- G06F9/3887—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by a single instruction for multiple data lanes [SIMD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/10—Providing a specific technical effect
- G06F2212/1056—Simplification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Processing (AREA)
Abstract
【解決手段】CP150は、ローカルメモリに格納された、2次元データにおける座標値が(X,Y)である先頭データから行方向に並ぶN個のデータのローカルアドレスをPEアレイ110に対して指定する際に、アドレス算出部により得られた、ローカルアドレスA1と、ローカルアドレスA2と、閾値番号Zとを放送する。各PEは、閾値番号Zと、自身の番号との大小関係を比較すると共に、比較結果に応じてローカルアドレスA1とローカルアドレスA2のいずれかを選択する。
【選択図】図1
Description
図1は、本発明の第1の実施の形態にかかるSIMDプロセッサ100を示す。SIMDプロセッサ100は、PEアレイ110、制御ユニット130を備える。
A2=BASEADDRESS+floor(Y/M)×(M×W/N)+floor(X/N)×M+Y%M+M (2)
Z=X%N (3)
但し,
X:先頭データのX方向座標値
Y:先頭データのY方向座標値
N:プロセッサ要素の数
W:2次元データの横幅
M:ブロックの行数
「/」は、左側の値と右側の値の割り算を示す。例えば、「Y/M」は、YとMの割り算を示す。また、「×」は、左側の値と右側の値の乗算を示す。
第1の実施の形態にかかるSIMDプロセッサ100におけるCP150は、式(1)〜式(3)の演算を行うことによりローカルアドレスA1、ローカルアドレスA2、通常の閾値番号Zを得ている。コントロールプロセッサは、通常、汎用的なプロセッサが持つものと類似した命令セットしか持たないため、式(1)と式(2)の演算を実行するためには、多くの処理サイクルを必要とし、結果的には、大きなオーバーヘッドが発生してしまう恐れがある。CP150におけるアドレス算出部160を工夫して、上記オーバーヘッドを抑制する技術に関して、第2の実施の形態を用いて説明する。
A1=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(X>>log2N)<<log2M (4)
A2=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(X>>log2N)<<log2M+M (5)
Z=X&N1 (6)
このように、本発明の第2の実施の形態のSIMDプロセッサは、PE数Nが2のべき乗であると共に、ブロックの行数Mも2のべき乗に制限すると共に、アドレス算出部200により演算を行うことにより、ローカルアドレスA1、ローカルアドレスA2、閾値番号Zを算出するための乗算回数と除算回数を減らしている。その結果、回路の実現コストを低減すると共に、ローカルアドレスA1などを算出するためのオーバーヘッドを抑制することができる。
本発明の第3の実施の形態は、第2の実施の形態にかかるSIMDプロセッサに対して、アドレス算出部200の代わりに、図5に示すアドレス算出部300が設けられたSIMDプロセッサである。
A1=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(X>>log2N)<<log2M (4)
A2=BASEADDRESS+(Y>>log2M)×Q+Y&M1+((X>>log2N)+1)<<log2M (7)
Z=X&N1 (6)
本発明の第4の実施の形態は、第2の実施の形態にかかるSIMDプロセッサに対して、アドレス算出部200の代わりに、図6に示すアドレス算出部400が設けられたSIMDプロセッサである。
Z=X&N1 (8)
A1=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(BID+Z)<<log2M (9)
A2=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(BID+Z)<<log2M+M (10)
本発明の第5の実施の形態は、第4の実施の形態にかかるSIMDプロセッサに対して、アドレス算出部400の代わりに、図7に示すアドレス算出部500が設けられたSIMDプロセッサである。
本発明の第6の実施の形態は、図5に示すアドレス算出部300と、図6に示すアドレス算出部400とを組み合わせたアドレス算出回路600が設けられたSIMDプロセッサである。
Z=X&N1 (8)
A1=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(BID+Z)<<log2M (9)
A2=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(BID+Z+1)<<log2M (11)
これらの式が示す演算も、式(1)〜式(3)が示す演算と等価である。
本発明の第7の実施の形態は、図7に示すアドレス算出部500と、図8に示すアドレス算出部600とを組み合わせたアドレス算出回路700が設けられたSIMDプロセッサである。
30 PEアレイ 42 一時記憶装置
44 ローカルメモリ 46 MEMCTL
48 演算部 100 SIMDプロセッサ
110 PEアレイ 112 バッファ
114 ローカルメモリ 116 メモリコントローラ
120 アドレス選択部 122 比較器
124 デマルチプレクサ 118 演算部
130 制御ユニット 140 DMAコントローラ
150 CP 160 アドレス算出部
200 アドレス算出部 201 演算回路
211〜216 記憶部 221 算術シフト回路
222 論理積回路 223 乗算器
224〜226 加算器 231 算術シフト回路
232 算術シフト回路 233〜234 加算器
240 論理積回路 300 アドレス算出部
301 演算回路 331 加算器
332 算術シフト回路 333 加算器
400 アドレス算出部 401 演算回路
414 記憶部 431 加算器
432 算術シフト回路 500 アドレス算出部
501 演算回路 600 アドレス算出回路
601 演算回路 700 アドレス算出回路
701 演算回路 A ローカルアドレス
A1 ローカルアドレス A2 ローカルアドレス
Mブロックの行数 N PE数
BID ブロック番号 PEID PE番号
W 横幅 Z 閾値番号
Claims (17)
- リング状に接続され、順次番号が付与されたN個(N:2以上の整数)のプロセッサ要素と、前記N個のプロセッサ要素を制御するコントロールプロセッサとを有し、横幅がNより大きいW(W:Nの整数倍)である2次元データを幅がNであり、行数がM(M:1以上の整数)であるブロックに分割し、上に位置するブロックほど優先的に転送され、同一のブロック内の同一行のN個のデータが前記N個のプロセッサ要素のローカルメモリの同一のローカルアドレスに夫々格納されるように前記2次元データを外部メモリから前記ローカルメモリに転送するSIMD(Single InstructioN Multiple Data)プロセッサであって、
前記コントロールプロセッサは、
前記ローカルメモリに格納された、前記2次元データにおける座標値が(X,Y)である先頭データから行方向に並ぶN個のデータのローカルアドレスのなり得るローカルアドレスA1と、ローカルアドレスA2と、該2つのローカルアドレスのうちのいずれか1つを選択するための基準となるプロセッサ要素の番号の閾値である閾値番号Zとを、X、Y、M、W、Nに基づいて算出するアドレス算出部を備え、
前記N個のデータのローカルアドレスを前記N個のプロセッサ要素に対して指定する際に、前記アドレス算出部により得られた、前記ローカルアドレスA1と、前記ローカルアドレスA2と、前記閾値番号Zとを前記N個のプロセッサ要素に放送し、
前記N個のプロセッサ要素は、
前記閾値番号Zと、自身の番号との大小関係を比較すると共に、比較結果に応じて前記ローカルアドレスA1とローカルアドレスA2のいずれかを選択するアドレス選択部を有することを特徴とするSIMDプロセッサ。 - 前記アドレス算出部は、
前記2次元データの左上端のデータの座標値を(0,0)とした場合に、式(1)〜式(3)に従って、前記ローカルアドレスA1、前記ローカルアドレスA2、前記閾値番号Zを夫々算出することを特徴とする請求項1に記載のSIMDプロセッサ。
A1=BASEADDRESS+floor(Y/M)×(M×W/N)+floor(X/N)×M+Y%M (1)
A2=BASEADDRESS+floor(Y/M)×(M×W/N)+floor(X/N)×M+Y%M+M (2)
Z=X%N (3)
但し,
X:先頭データのX方向座標値
Y:先頭データのY方向座標値
N:プロセッサ要素の数
W:2次元データの横幅
M:ブロックの行数 - 前記プロセッサ要素の数Nと前記ブロックの行数Mは、2のべき乗であり、
前記アドレス算出部は、
前記Mと、「M−1」であるM1と、log2Mと、「(W>>log2N)<<log2M」であるQと、「N−1」であるN1と、log2Nとを記憶するパラメータ記憶部と、
前記パラメータ記憶部に記憶された各パラメータを用いて、式(4)〜式(6)が示す演算を行って前記ローカルアドレスA1、前記ローカルアドレスA2、前記閾値番号Zを得る演算回路とを備えることを特徴とする請求項2に記載のSIMDプロセッサ。
A1=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(X>>log2N)<<log2M (4)
A2=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(X>>log2N)<<log2M+M (5)
Z=X&N1 (6) - 前記パラメータ記憶部は、「M−1」であるM1と、log2Mと、「(W>>log2N)<<log2M」であるQと、「N−1」であるN1と、log2Nとを記憶するものであり、
前記演算回路は、式(5)の代わりに式(7)に従って前記ローカルアドレスA2を算出することを特徴とする請求項3に記載のSIMDプロセッサ。
A2=BASEADDRESS+(Y>>log2M)×Q+Y&M1+((X>>log2N)+1)<<log2M (7) - 前記プロセッサ要素の数Nと前記ブロックの行数Mは、2のべき乗であり、
前記アドレス算出部は、
前記Mと、「M−1」であるM1と、log2Mと、「(W>>log2N)<<log2M」であるQと、「N−1」であるN1と、前記先頭データが位置するブロックの番号BIDとを記憶するパラメータ記憶部と、
前記パラメータ記憶部に記憶された各パラメータを用いて、式(8)〜式(10)が示す演算を行って前記ローカルアドレスA1、前記ローカルアドレスA2、前記閾値番号Zを得る演算回路とを備えることを特徴とする請求項2に記載のSIMDプロセッサ。
Z=X&N1 (8)
A1=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(BID+Z)<<log2M (9)
A2=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(BID+Z)<<log2M+M (10) - 前記演算回路は、外部から前記閾値番号Zが入力され、
前記パラメータ記憶部は、前記Mと、「M−1」であるM1と、log2Mと、「(W>>log2N)<<log2M」であるQと、前記先頭データが位置するブロックの番号BIDとを記憶するものであり、
前記演算回路は、入力された前記閾値番号Zと、前記パラメータ記憶部に記憶された各パラメータを用いて、式(9)と式(10)に従ってローカルアドレスA1とローカルアドレスA2を算出することを特徴とする請求項5に記載のSIMDプロセッサ。 - 前記パラメータ記憶部は、「M−1」であるM1と、log2Mと、「(W>>log2N)<<log2M」であるQと、「N−1」であるN1と、前記先頭データが位置するブロックの番号BIDとを記憶するものであり、
前記演算回路は、式(10)の代わりに式(11)に従って前記ローカルアドレスA2を算出することを特徴とする請求項5に記載のSIMDプロセッサ。
A2=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(BID+Z+1)<<log2M (11) - 前記演算回路は、外部から前記閾値番号Zが入力され、
前記パラメータ記憶部は、「M−1」であるM1と、log2Mと、「(W>>log2N)<<log2M」であるQと、前記先頭データが位置するブロックの番号BIDとを記憶するものであり、
前記演算回路は、入力された前記閾値番号Zと、前記パラメータ記憶部に記憶された各パラメータを用いて、式(9)と式(11)に従ってローカルアドレスA1とローカルアドレスA2を算出することを特徴とする請求項7に記載のSIMDプロセッサ。 - リング状に接続され、順次番号が付与されたN個(N:2以上の整数)のプロセッサ要素を有し、横幅がNより大きいW(W:Nの整数倍)である2次元データを幅がNであり、行数がM(M:1以上の整数)であるブロックに分割し、上に位置するブロックほど優先的に転送され、同一のブロック内の同一行のN個のデータが前記N個のプロセッサ要素のローカルメモリの同一のローカルアドレスに夫々格納されるように前記2次元データを外部メモリから前記ローカルメモリに転送するSIMD(Single InstructioN Multiple Data)プロセッサにおける前記N個のプロセッサ要素を制御するコントロールプロセッサであって、
前記ローカルメモリに格納された、前記2次元データにおける座標値が(X,Y)である先頭データから行方向に並ぶN個のデータのローカルアドレスのなり得るローカルアドレスA1と、ローカルアドレスA2と、該2つのローカルアドレスのうちのいずれか1つを選択するための基準となるプロセッサ要素の番号の閾値である閾値番号Zとを、X、Y、M、W、Nに基づいて算出するアドレス算出部を備え、
前記N個のデータのローカルアドレスを前記N個のプロセッサ要素に対して指定する際に、前記アドレス算出部により得られた、前記ローカルアドレスA1と、前記ローカルアドレスA2と、前記閾値番号Zとを前記N個のプロセッサ要素に放送することを特徴とするコントロールプロセッサ。 - 前記アドレス算出部は、
前記2次元データの左上端のデータの座標値を(0,0)とした場合に、式(12)〜式(14)に従って、前記ローカルアドレスA1、前記ローカルアドレスA2、前記閾値番号Zを夫々算出することを特徴とする請求項9に記載のコントロールプロセッサ。
A1=BASEADDRESS+floor(Y/M)×(M×W/N)+floor(X/N)×M+Y%M (12)
A2=BASEADDRESS+floor(Y/M)×(M×W/N)+floor(X/N)×M+Y%M+M (13)
Z=X%N (14)
但し,
X:先頭データのX方向座標値
Y:先頭データのY方向座標値
N:プロセッサ要素の数
W:2次元データの横幅
M:ブロックの行数 - 前記プロセッサ要素の数Nと前記ブロックの行数Mは、2のべき乗であり、
前記アドレス算出部は、
前記Mと、「M−1」であるM1と、log2Mと、「(W>>log2N)<<log2M」であるQと、「N−1」であるN1と、log2Nとを記憶するパラメータ記憶部と、
前記パラメータ記憶部に記憶された各パラメータを用いて、式(15)〜式(17)が示す演算を行って前記ローカルアドレスA1、前記ローカルアドレスA2、前記閾値番号Zを得る演算回路とを備えることを特徴とする請求項10に記載のコントロールプロセッサ。
A1=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(X>>log2N)<<log2M (15)
A2=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(X>>log2N)<<log2M+M (16)
Z=X&N1 (17) - 前記パラメータ記憶部は、「M−1」であるM1と、log2Mと、「(W>>log2N)<<log2M」であるQと、「N−1」であるN1と、log2Nとを記憶するものであり、
前記演算回路は、式(16)の代わりに式(18)に従って前記ローカルアドレスA2を算出することを特徴とする請求項11に記載のコントロールプロセッサ。
A2=BASEADDRESS+(Y>>log2M)×Q+Y&M1+((X>>log2N)+1)<<log2M (18) - 前記プロセッサ要素の数Nと前記ブロックの行数Mは、2のべき乗であり、
前記アドレス算出部は、
前記Mと、「M−1」であるM1と、log2Mと、「(W>>log2N)<<log2M」であるQと、「N−1」であるN1と、前記先頭データが位置するブロックの番号BIDとを記憶するパラメータ記憶部と、
前記パラメータ記憶部に記憶された各パラメータを用いて、式(19)〜式(21)が示す演算を行って前記ローカルアドレスA1、前記ローカルアドレスA2、前記閾値番号Zを得る演算回路とを備えることを特徴とする請求項10に記載のコントロールプロセッサ。
Z=X&N1 (19)
A1=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(BID+Z)<<log2M (20)
A2=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(BID+Z)<<log2M+M (21) - 前記演算回路は、外部から前記閾値番号Zが入力され、
前記パラメータ記憶部は、前記Mと、「M−1」であるM1と、log2Mと、「(W>>log2N)<<log2M」であるQと、前記先頭データが位置するブロックの番号BIDとを記憶するものであり、
前記演算回路は、入力された前記閾値番号Zと、前記パラメータ記憶部に記憶された各パラメータを用いて、式(20)と式(21)に従ってローカルアドレスA1とローカルアドレスA2を算出することを特徴とする請求項13に記載のコントロールプロセッサ。 - 前記パラメータ記憶部は、「M−1」であるM1と、log2Mと、「(W>>log2N)<<log2M」であるQと、「N−1」であるN1と、前記先頭データが位置するブロックの番号BIDとを記憶するものであり、
前記演算回路は、式(21)の代わりに式(22)に従って前記ローカルアドレスA2を算出することを特徴とする請求項13に記載のコントロールプロセッサ。
A2=BASEADDRESS+(Y>>log2M)×Q+Y&M1+(BID+Z+1)<<log2M (22) - 前記演算回路は、外部から前記閾値番号Zが入力され、
前記パラメータ記憶部は、「M−1」であるM1と、log2Mと、「(W>>log2N)<<log2M」であるQと、前記先頭データが位置するブロックの番号BIDとを記憶するものであり、
前記演算回路は、入力された前記閾値番号Zと、前記パラメータ記憶部に記憶された各パラメータを用いて、式(20)と式(22)に従ってローカルアドレスA1とローカルアドレスA2を算出することを特徴とする請求項15に記載のコントロールプロセッサ。 - リング状に接続され、順次番号が付与されたN個(N:2以上の整数)のプロセッサ要素と、前記N個のプロセッサ要素を制御するコントロールプロセッサとを有し、横幅がNより大きいW(W:Nの整数倍)である2次元データを幅がNであり、行数がM(M:1以上の整数)であるブロックに分割し、上に位置するブロックほど優先的に転送され、同一のブロック内の同一行のN個のデータが前記N個のプロセッサ要素のローカルメモリの同一のローカルアドレスに夫々格納されるように前記2次元データを外部メモリから前記ローカルメモリに転送するSIMD(Single InstructioN Multiple Data)プロセッサにおける前記プロセッサ要素であって、
各前記プロセッサ要素は、
前記コントロールプロセッサから放送されたローカルアドレスA1と、ローカルアドレスA2と、閾値番号Zとを受信した際に、前記閾値番号Zと、自身の番号との大小関係を比較すると共に、比較結果に応じて前記ローカルアドレスA1とローカルアドレスA2のいずれかを選択するアドレス選択部を有することを特徴とするプロセッサ要素。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011209455A JP5739779B2 (ja) | 2011-09-26 | 2011-09-26 | Simdプロセッサ及びコントロールプロセッサ並びにプロセッサ要素 |
US13/561,505 US9158737B2 (en) | 2011-09-26 | 2012-07-30 | SIMD processor and control processor, and processing element with address calculating unit |
US14/839,285 US20150370755A1 (en) | 2011-09-26 | 2015-08-28 | Simd processor and control processor, and processing element with address calculating unit |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011209455A JP5739779B2 (ja) | 2011-09-26 | 2011-09-26 | Simdプロセッサ及びコントロールプロセッサ並びにプロセッサ要素 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013073247A true JP2013073247A (ja) | 2013-04-22 |
JP5739779B2 JP5739779B2 (ja) | 2015-06-24 |
Family
ID=47912564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011209455A Active JP5739779B2 (ja) | 2011-09-26 | 2011-09-26 | Simdプロセッサ及びコントロールプロセッサ並びにプロセッサ要素 |
Country Status (2)
Country | Link |
---|---|
US (2) | US9158737B2 (ja) |
JP (1) | JP5739779B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11797473B2 (en) * | 2014-05-29 | 2023-10-24 | Altera Corporation | Accelerator architecture on a programmable platform |
KR102277439B1 (ko) | 2014-10-21 | 2021-07-14 | 삼성전자주식회사 | 재구성 가능 프로세서 및 그 동작 방법 |
EP3018587B1 (en) * | 2014-11-05 | 2018-08-29 | Renesas Electronics Europe GmbH | Memory access unit |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010531502A (ja) * | 2007-06-26 | 2010-09-24 | テールズ | 並列プロセッサ用のアドレス指定装置 |
JP2011134085A (ja) * | 2009-12-24 | 2011-07-07 | Renesas Electronics Corp | 画像処理装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5253308A (en) * | 1989-06-21 | 1993-10-12 | Amber Engineering, Inc. | Massively parallel digital image data processor using pixel-mapped input/output and relative indexed addressing |
JP3096387B2 (ja) | 1994-01-28 | 2000-10-10 | 三菱電機株式会社 | 数値演算処理装置 |
JP2000122919A (ja) * | 1998-10-13 | 2000-04-28 | Mitsubishi Electric Corp | プロセッサ及びメモリ制御方法 |
US20070250688A1 (en) | 2004-11-05 | 2007-10-25 | Nec Corporation | Simd Type Parallel Arithmetic Device, Processing Element and Control System of Simd Type Parallel Arithmetic Device |
FR2885710B1 (fr) * | 2005-05-11 | 2007-08-03 | Stmicroelectronics Maroc | Selection d'adresse pour bus i2c |
-
2011
- 2011-09-26 JP JP2011209455A patent/JP5739779B2/ja active Active
-
2012
- 2012-07-30 US US13/561,505 patent/US9158737B2/en active Active
-
2015
- 2015-08-28 US US14/839,285 patent/US20150370755A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010531502A (ja) * | 2007-06-26 | 2010-09-24 | テールズ | 並列プロセッサ用のアドレス指定装置 |
JP2011134085A (ja) * | 2009-12-24 | 2011-07-07 | Renesas Electronics Corp | 画像処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5739779B2 (ja) | 2015-06-24 |
US20150370755A1 (en) | 2015-12-24 |
US20130080739A1 (en) | 2013-03-28 |
US9158737B2 (en) | 2015-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180137414A1 (en) | Convolution operation device and convolution operation method | |
CN109885407B (zh) | 数据处理方法和装置、电子设备、存储介质 | |
US20170206089A1 (en) | Information processing apparatus and computational method | |
US10816989B2 (en) | Methods and systems of distributing task areas for cleaning devices, and cleaning devices | |
JP5739779B2 (ja) | Simdプロセッサ及びコントロールプロセッサ並びにプロセッサ要素 | |
US8953904B2 (en) | Image processing apparatus and method of operating image processing apparatus | |
JP2018197906A (ja) | 情報処理装置、マルチスレッド行列演算方法、およびマルチスレッド行列演算プログラム | |
JP5548087B2 (ja) | 演算装置および演算方法 | |
JP2010009405A (ja) | 物体検出制御装置、物体検出システム、物体検出制御方法およびプログラム | |
JP2011141823A (ja) | データ処理装置および並列演算装置 | |
JP5917907B2 (ja) | 画像処理装置 | |
JP5865696B2 (ja) | 画像処理装置 | |
US20150363357A1 (en) | Memory controller and simd processor | |
JP6503902B2 (ja) | 並列計算機システム、並列計算方法及びプログラム | |
JP4970378B2 (ja) | メモリコントローラおよび画像処理装置 | |
US20120093410A1 (en) | Image processing apparatus and method for operating image processing apparatus | |
JP2009071569A (ja) | 動画像符号化における動き探索装置 | |
EP3474224B1 (en) | Graphics processing method and device | |
US9996500B2 (en) | Apparatus and method of a concurrent data transfer of multiple regions of interest (ROI) in an SIMD processor system | |
US10387997B2 (en) | Information processing device, information processing method, and storage medium | |
KR101688435B1 (ko) | 블록 구조를 이용한 적분 영상 생성 장치 및 그 방법 | |
US8416252B2 (en) | Image processing apparatus and memory access method thereof | |
US8934736B2 (en) | Image processing apparatus, image processing system, and method for having computer process image | |
CN112395009A (zh) | 运算方法、装置、计算机设备和存储介质 | |
JP2011134085A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140417 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150309 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150331 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150424 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5739779 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |