JP2019525271A - Command arbitration for high-speed memory interface - Google Patents
Command arbitration for high-speed memory interface Download PDFInfo
- Publication number
- JP2019525271A JP2019525271A JP2018524749A JP2018524749A JP2019525271A JP 2019525271 A JP2019525271 A JP 2019525271A JP 2018524749 A JP2018524749 A JP 2018524749A JP 2018524749 A JP2018524749 A JP 2018524749A JP 2019525271 A JP2019525271 A JP 2019525271A
- Authority
- JP
- Japan
- Prior art keywords
- sub
- memory
- arbiter
- controller
- command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015654 memory Effects 0.000 title claims abstract description 496
- 238000012545 processing Methods 0.000 claims abstract description 57
- 239000004744 fabric Substances 0.000 claims description 33
- 238000000034 method Methods 0.000 claims description 16
- 238000010586 diagram Methods 0.000 description 24
- 239000003795 chemical substances by application Substances 0.000 description 16
- 230000002093 peripheral effect Effects 0.000 description 14
- 230000004044 response Effects 0.000 description 12
- 238000012546 transfer Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 8
- 230000002457 bidirectional effect Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 101000711846 Homo sapiens Transcription factor SOX-9 Proteins 0.000 description 4
- 101100232371 Hordeum vulgare IAT3 gene Proteins 0.000 description 4
- 102100034204 Transcription factor SOX-9 Human genes 0.000 description 4
- 230000004913 activation Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000003213 activating effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000003990 capacitor Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
- G06F13/1668—Details of memory controller
- G06F13/1689—Synchronisation and timing concerns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/36—Handling requests for interconnection or transfer for access to common bus or bus system
- G06F13/362—Handling requests for interconnection or transfer for access to common bus or bus system with centralised access control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
- G06F13/1605—Handling requests for interconnection or transfer for access to memory bus based on arbitration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
- G06F13/1605—Handling requests for interconnection or transfer for access to memory bus based on arbitration
- G06F13/1642—Handling requests for interconnection or transfer for access to memory bus based on arbitration with request queuing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/40—Bus structure
- G06F13/4063—Device-to-bus coupling
- G06F13/4068—Electrical coupling
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Bus Control (AREA)
- Memory System (AREA)
- Dram (AREA)
- Read Only Memory (AREA)
Abstract
一形態では、メモリコントローラは、コマンドキューと、アービタと、を含む。コマンドキューは、メモリアクセス要求を受信して記憶する。アービタは、コントローラサイクル中にメモリアクセス要求の中から対応する複数のサブアービトレーション勝者を提供する複数のサブアービタであって、対応するコントローラサイクルにおいて複数のメモリコマンドを提供するために複数のサブアービトレーション勝者の中から何れかを選択する複数のサブアービタを含む。他の形態では、データ処理システムは、メモリアクセス要求を提供するメモリアクセスエージェントと、メモリシステムと、メモリアクセスエージェント及びメモリシステムに接続されたメモリコントローラと、を含む。
【選択図】図6In one form, the memory controller includes a command queue and an arbiter. The command queue receives and stores the memory access request. The arbiter is a plurality of sub-arbiters that provide corresponding sub-arbitration winners from among memory access requests during a controller cycle, and the sub-arbitration winners are provided to provide a plurality of memory commands in the corresponding controller cycle. A plurality of sub-arbiters for selecting one of them are included. In another form, a data processing system includes a memory access agent that provides a memory access request, a memory system, and a memory controller connected to the memory access agent and the memory system.
[Selection] Figure 6
Description
本開示は、概して、データ処理システムに関し、より詳細には、高速メモリインタフェースを有するデータ処理システムで使用されるメモリコントローラに関する。 The present disclosure relates generally to data processing systems, and more particularly to memory controllers for use in data processing systems having high speed memory interfaces.
コンピュータシステムは、通常、安価で高密度のダイナミックランダムアクセスメモリ(DRAM)チップをメインメモリとして使用する。今日販売されている多くのDRAMチップは、半導体技術協会(JEDEC:Joint Electron Devices Engineering Council)によって公布された様々なダブルデータレート(DDR)DRAM規格と互換性がある。DDR DRAMは、高速アクセス回路を有する従来のDRAMメモリセルアレイを使用して、高い転送レートを達成し、メモリバスの利用を改善する。例えば、DDR4 DRAMは、12〜15ナノ秒(ns)のアクセス時間を必要とするメモリセルアレイを使用するが、1.6ギガヘルツ(GHz)のメモリクロック周波数に対応して最大3.2ギガトランスファー毎秒(GT/秒)の速度で大量のデータにアクセスし、データをシリアル化する。転送は、良好な伝送ライン性能のために、オンダイターミネーション(on-die termination)を有する疑似オープンドレイン技術を使用する。そのレートでポイントツーポイントインタフェースを動作させて高速転送を達成することが可能であるが、メモリコントローラがメモリアクセスをスケジュールするのに十分な速度で動作することが、ますます困難になっている。 Computer systems typically use inexpensive, high density dynamic random access memory (DRAM) chips as main memory. Many DRAM chips sold today are compatible with various double data rate (DDR) DRAM standards promulgated by the Joint Electron Devices Engineering Council (JEDEC). DDR DRAM uses a conventional DRAM memory cell array with high-speed access circuitry to achieve high transfer rates and improve memory bus utilization. For example, DDR4 DRAM uses a memory cell array that requires an access time of 12-15 nanoseconds (ns), but up to 3.2 gigatransfers per second corresponding to a memory clock frequency of 1.6 gigahertz (GHz). A large amount of data is accessed at a rate of (GT / second), and the data is serialized. The transfer uses a pseudo open drain technique with on-die termination for good transmission line performance. Although it is possible to operate the point-to-point interface at that rate to achieve high-speed transfers, it becomes increasingly difficult for the memory controller to operate at a rate sufficient to schedule memory accesses.
典型的なDDRメモリコントローラは、待ち状態の読出し及び書込み要求を記憶するためにキューを維持して、メモリコントローラが、待ち状態の要求をアウトオブオーダで選択することによって、効率を高めるのを可能にする。例えば、メモリコントローラは、現在の行をプリチャージし、別の行を繰り返しアクティブにするオーバヘッドを回避するために、メモリの所定ランク内の同じ行に対する複数のメモリアクセス要求(「ページヒット」と呼ばれる)をアウトオブオーダでキューから取り出し、これらの要求を連続してメモリシステムに発行することができる。しかしながら、DDR4等の最新のメモリ技術で利用可能なバス帯域幅を活用しながら、深いキューからのアクセスをスキャン及び取り出すことを、既知のメモリコントローラを用いて達成することが困難になってきている。 A typical DDR memory controller maintains a queue to store pending read and write requests, allowing the memory controller to increase efficiency by selecting pending requests out of order To. For example, the memory controller may request multiple memory access requests (called “page hits”) for the same row in a given rank of memory to avoid the overhead of precharging the current row and repeatedly activating another row. ) From the queue out of order and these requests can be issued to the memory system in succession. However, scanning and retrieving accesses from deep queues while taking advantage of the bus bandwidth available with modern memory technologies such as DDR4 has become difficult to achieve using known memory controllers. .
以下の説明において、異なる図面において同じ参照番号を使用することは、類似又は同一の項目を示している。特に断らない限り、「接続された」という用語及びこれに関連する動詞形は、当技術分野において既知の手段による直接接続及び間接的な電気接続の両方を含む。特に断らない限り、直接接続の説明は、適切な形態の間接的な電気接続を使用する代替の実施形態をも意味する。 In the following description, the use of the same reference numerals in different drawings indicates similar or identical items. Unless otherwise noted, the term “connected” and its related verb forms include both direct and indirect electrical connections by means known in the art. Unless otherwise stated, the description of direct connection also means an alternative embodiment using an appropriate form of indirect electrical connection.
以下の一形態で説明するように、メモリコントローラは、コマンドキューと、アービタと、を含む。コマンドキューは、メモリアクセス要求を受信及び記憶するためのものである。アービタは、コントローラサイクル中にメモリアクセス要求の中から対応する複数のサブアービトレーションの勝者(winner)を提供する複数のサブアービタを含み、複数のサブアービトレーションの勝者の中から何れかを選択して、対応するコントローラサイクルにおいて複数のメモリコマンドを提供する。いくつかの実施形態では、メモリコマンドサイクルは、コントローラサイクルより短くてもよい。例えば、コントローラは、コントローラクロック信号に従って動作する一方で、メモリサイクルは、コントローラクロック信号よりも高い周波数を有するメモリクロック信号によって規定される。複数のサブアービタは、コマンドキュー内のページヒットコマンドの中から第1サブアービトレーション勝者を選択する第1サブアービタと、コマンドキュー内のページ競合コマンドの中から第2サブアービトレーション勝者を選択する第2サブアービタと、コマンドキュー内のページミスコマンドの中から第3サブアービトレーション勝者を選択する第3サブアービタと、を含むことができる。アービタは、第1サブアービトレーション勝者、第2サブアービトレーション勝者、及び、第3サブアービトレーション勝者の中から何れかを選択するための最終アービタ(final arbiter)をさらに含むことができる。 As will be described in one form below, the memory controller includes a command queue and an arbiter. The command queue is for receiving and storing a memory access request. The arbiter includes multiple sub-arbiters that provide winners of the corresponding sub-arbitration from among the memory access requests during the controller cycle, and select one of the multiple sub-arbitration winners to respond A plurality of memory commands are provided in the controller cycle. In some embodiments, the memory command cycle may be shorter than the controller cycle. For example, the controller operates in accordance with the controller clock signal while the memory cycle is defined by a memory clock signal having a higher frequency than the controller clock signal. The plurality of sub-arbiters include a first sub-arbiter that selects a first sub-arbitration winner from page hit commands in the command queue, and a second sub-arbiter that selects a second sub-arbitration winner from page conflict commands in the command queue; A third sub-arbiter for selecting a third sub-arbitration winner from the page miss commands in the command queue. The arbiter may further include a final arbiter for selecting one of the first sub-arbitration winner, the second sub-arbitration winner, and the third sub-arbitration winner.
別の形態では、データ処理システムは、複数のメモリアクセス要求を提供するメモリアクセスエージェントと、メモリシステムと、メモリアクセスエージェント及びメモリシステムに接続されたメモリコントローラと、を含む。メモリコントローラは、コマンドキューと、アービタとを含む。コマンドキューは、メモリアクセスエージェントから受信したメモリアクセスコマンドを記憶する。アービタは、コントローラサイクル中にメモリアクセス要求の中から対応する複数のサブアービトレーション勝者を提供し、複数のサブアービトレーション勝者の中から何れかを選択して、対応するコントローラサイクルにおいて複数のメモリコマンドを提供する複数のサブアービタを含む。 In another form, a data processing system includes a memory access agent that provides a plurality of memory access requests, a memory system, and a memory controller connected to the memory access agent and the memory system. The memory controller includes a command queue and an arbiter. The command queue stores a memory access command received from the memory access agent. The arbiter provides corresponding sub-arbitration winners from among the memory access requests during the controller cycle, and selects one of the sub-arbitration winners to provide multiple memory commands in the corresponding controller cycle Including multiple sub-arbiters.
さらに別の形態では、性能及び効率を向上させるために、メモリアクセス要求間でアービトレーションを行う方法を使用することができる。複数のメモリアクセス要求が受信され、コマンドキューに記憶される。第1コントローラサイクル中に、メモリアクセス要求の中から複数のサブアービトレーション勝者が選択される。複数のサブアービトレーション勝者の中から複数のメモリコマンドが選択され、対応する複数のメモリコマンドサイクルにおいて提供される。 In yet another aspect, a method of arbitrating between memory access requests can be used to improve performance and efficiency. Multiple memory access requests are received and stored in the command queue. During the first controller cycle, a plurality of sub-arbitration winners are selected from the memory access requests. A plurality of memory commands are selected from the plurality of sub-arbitration winners and provided in a corresponding plurality of memory command cycles.
図1は、いくつかの実施形態によるデータ処理システム100のブロック図である。データ処理システム100は、概して、アクセラレーテッドプロセッシングユニット(APU)の形態のデータプロセッサ110と、メモリシステム120と、周辺機器相互接続エクスプレス(PCIe)システム150と、ユニバーサルシリアルバス(USB)システム160と、ディスクドライブ170と、を含む。データプロセッサ110は、データ処理システム100の中央処理装置(CPU)として動作し、現代のコンピュータシステムにおいて有用な様々なバス及びインタフェースを提供する。これらのインタフェースには、2つのダブルデータレート(DDRx)メモリチャネルと、PCIeリンクへの接続用のPCIeルートコンプレックスと、USBネットワークへの接続用のUSBコントローラと、SATA(Serial Advanced Technology Attachment)大容量記憶デバイスへのインタフェースと、が含まれる。
FIG. 1 is a block diagram of a
メモリシステム120は、メモリチャネル130と、メモリチャネル140と、を含む。メモリチャネル130は、本例において別々のランクに対応する代表的なDIMM134,136,138を含む、DDRxバス132に接続されたデュアルインラインメモリモジュール(DIMM)のセットを含む。同様に、メモリチャネル140は、代表的なDIMM144,146,148を含む、DDRxバス142に接続されたDIMMのセットを含む。
PCIeシステム150は、データプロセッサ110内のPCIeルートコンプレックスに接続されたPCIeスイッチ152と、PCIeデバイス154と、PCIeデバイス156と、PCIeデバイス158と、を含む。PCIeデバイス156は、システム基本入出力システム(BIOS)メモリ157に接続されている。システムBIOSメモリ157は、例えばリードオンリメモリ(ROM)、フラッシュEEPROM(electrically erasable programmable ROM)等の様々な不揮発性メモリタイプの何れかであってもよい。
The
USBシステム160は、データプロセッサ110内のUSBマスタに接続されたUSBハブ162と、USBハブ162にそれぞれ接続された代表的なUSBデバイス164,166,168と、を含む。USBデバイス164,166,168は、例えばキーボード、マウス、フラッシュEEPROMポート等のデバイスであってもよい。
The
ディスクドライブ170は、SATAバスを介してデータプロセッサ110に接続されており、オペレーティングシステム、アプリケーションプログラム、アプリケーションファイル等のための大容量ストレージを提供する。
The
データ処理システム100は、メモリチャネル130及びメモリチャネル140を提供することによって、最新のコンピューティングアプリケーションでの使用に適している。各メモリチャネル130,140は、例えばDDRバージョン4(DDR4)、低電力DDR4(LPDDR4)、グラフィックスDDRバージョン5(GDDR5)及び高帯域幅メモリ(HBM)等の最新のDDRメモリに接続されてもよいし、将来のメモリ技術に適応されてもよい。これらのメモリは、高いバス帯域幅及び高速動作を提供する。同時に、これらは、ラップトップコンピュータ等のバッテリ駆動アプリケーションの電力を節約する低電力モードを提供し、組み込み型サーマルモニタリングも提供する。
図2は、図1のデータ処理システム100での使用に適したAPU200のブロック図である。APU200は、概して、中央処理装置(CPU)コアコンプレックス210と、グラフィックスコア220と、ディスプレイエンジン230のセットと、メモリ管理ハブ240と、データファブリック250と、周辺コントローラ260のセットと、周辺バスコントローラ270のセットと、システム管理ユニット(SMU)280と、メモリコントローラ290のセットと、を含む。
FIG. 2 is a block diagram of an
CPUコアコンプレックス210は、CPUコア212と、CPUコア214と、を含む。本例において、CPUコアコンプレックス210は2つのCPUコアを含むが、他の実施形態では、CPUコアコンプレックス210は任意の数のCPUコアを含んでもよい。各CPUコア212,214は、制御ファブリックを形成するシステム管理ネットワーク(SMN)及びデータファブリック250に対して双方向に接続されており、メモリアクセス要求をデータファブリック250に提供することができる。各CPUコア212,214は、単一コアであってもよいし、例えばキャッシュ等の特定のリソースを共有する2つ以上の単一コアを有するコアコンプレックスであってもよい。
The
グラフィックスコア220は、例えば、頂点処理、フラグメント処理、シェーディング、テクスチャブレンド等のグラフィックス操作を、高度に統合された並列形式で実行することの可能な高性能グラフィックス処理ユニット(GPU)である。グラフィックスコア220は、SMN及びデータファブリック250に対して双方向に接続されており、メモリアクセス要求をデータファブリック250に提供することができる。これに関して、APU200は、CPUコアコンプレックス210及びグラフィックスコア220が同じメモリ空間を共有するユニファイドメモリアーキテクチャ、又は、CPUコアコンプレックス210及びグラフィックスコア220がメモリ空間の一部を共有するメモリアーキテクチャをサポートしてもよいが、グラフィックスコア220は、CPUコアコンプレックス210がアクセスできない専用のグラフィックスメモリも使用する。
The
ディスプレイエンジン230は、グラフィックスコア220によって生成されたオブジェクトをレンダリング及びラスタライズして、モニタに表示する。グラフィックスコア220及びディスプレイエンジン230は、メモリシステム120の適切なアドレスに一様に変換されるために共通のメモリ管理ハブ240に対して双方向に接続されており、メモリ管理ハブ240は、かかるメモリアクセスを生成し、メモリシステムから返された読出しデータを受信するために、データファブリック250に対して双方向に接続されている。
The
データファブリック250は、任意のメモリアクセスエージェントとメモリコントローラ290との間でメモリアクセス要求及びメモリ応答をルーティングするためのクロスバースイッチを含む。また、データファブリック250は、システム構成に基づくメモリアクセスの宛先と、仮想接続毎のバッファとを判断するためのシステムメモリマップであって、BIOSによって定義されたシステムメモリマップを含む。
周辺コントローラ260は、USBコントローラ262と、SATAインタフェースコントローラ264と、を含み、これらの各々が、システムハブ266及びSMNバスに対して双方向に接続されている。これらの2つのコントローラは、APU200で使用可能な周辺コントローラの単なる例示である。
The
周辺バスコントローラ270は、システムコントローラ(即ち「サウスブリッジ」(SB))272と、PCIeコントローラ274と、を含み、これらの各々が、入出力(I/O)ハブ276及びSMNバスに対して双方向に接続されている。また、I/Oハブ276は、システムハブ266及びデータファブリック250に対して双方向に接続されている。したがって、例えば、CPUコアは、データファブリック250がI/Oハブ276を介してルーティングするアクセスを通じて、USBコントローラ262、SATAインタフェースコントローラ264、SB272、又は、PCIeコントローラ274内のレジスタをプログラムすることができる。
SMU280は、APU200上のリソースの動作を制御し、それらの間の通信を同期させるローカルコントローラである。SMU280は、APU200上の様々なプロセッサのパワーアップシーケンシングを管理し、リセット、イネーブル及び他の信号を介して複数のオフチップデバイスを制御する。SMU280は、APU200の各コンポーネントにクロック信号を提供するために、図2に示されていない1つ以上のクロック源(例えば位相同期ループ(PLL)等)を含む。また、SMU280は、様々なプロセッサ及び他の機能ブロックの電力を管理し、CPUコア212,214及びグラフィックスコア220から測定された電力消費値を受信して、適切な電力状態を判断してもよい。
The
また、APU200は、様々なシステムモニタリング及び省電力機能を実装する。特に、1つのシステムモニタリング機能は、サーマルモニタリングである。例えば、SMU280は、APU200が高温になると、CPUコア212,214及び/又はグラフィックスコア220の周波数及び電圧を低減させてもよい。APU200が非常に高温になった場合には、APU200が完全にシャットダウンされてもよい。サーマルイベントは、SMU280によって、外部センサからSMNバスを介して受信されてもよく、SMU280は、これに応じてクロック周波数及び/又は電源電圧を低下させてもよい。
The
図3は、いくつかの実施形態による、図2のAPU200での使用に適したメモリコントローラ300及び関連する物理インタフェース(PHY)330のブロック図である。メモリコントローラ300は、メモリチャネル310と、電力エンジン320と、を含む。メモリチャネル310は、ホストインタフェース312と、メモリチャネルコントローラ314と、物理インタフェース316と、を含む。ホストインタフェース312は、メモリチャネルコントローラ314を、スケーラブルデータポート(SDP)を介してデータファブリック250に双方向に接続する。物理インタフェース316は、メモリチャネルコントローラ314を、DDR−PHYインタフェース仕様(DFI)に準拠するバスを介してPHY330に双方向に接続する。電力エンジン320は、SMNバスを介してSMU280に双方向に接続されており、APB(Advanced Peripheral Bus)を介してPHY330に双方向に接続されており、メモリチャネルコントローラ314にも双方向に接続されている。PHY330は、例えば図1のメモリチャネル130又はメモリチャネル140等のメモリチャネルに対する双方向接続を有する。メモリコントローラ300は、単一のメモリチャネルコントローラ314を使用した単一のメモリチャネル用のメモリコントローラの例示であり、以下にさらに説明するメモリチャネルコントローラ314の動作を制御するための電力エンジン320を有する。
FIG. 3 is a block diagram of a
図4は、いくつかの実施形態による、図2のAPU200での使用に適した別のメモリコントローラ400及び関連するPHY440,450のブロック図である。メモリコントローラ400は、メモリチャネル410,420と、電力エンジン430と、を含む。メモリチャネル410は、ホストインタフェース412と、メモリチャネルコントローラ414と、物理インタフェース416と、を含む。ホストインタフェース412は、メモリチャネルコントローラ414を、SDPを介してデータファブリック250に双方向に接続する。物理インタフェース416は、DFI仕様に準拠しており、メモリチャネルコントローラ414をPHY440に双方向に接続する。メモリチャネル420は、ホストインタフェース422と、メモリチャネルコントローラ424と、物理インタフェース426と、を含む。ホストインタフェース422は、メモリチャネルコントローラ424を、別のSDPを介してデータファブリック250に双方向に接続する。物理インタフェース426は、DFI仕様に準拠しており、メモリチャネルコントローラ424をPHY450に双方向に接続する。電力エンジン430は、SMNバスを介してSMU280に双方向に接続されており、APBを介してPHY440,450に双方向に接続されており、メモリチャネルコントローラ414,424にも双方向に接続されている。PHY440は、例えば図1のメモリチャネル130等のメモリチャネルに対する双方向接続を有する。PHY450は、例えば図1のメモリチャネル140等のメモリチャネルに対する双方向接続を有する。メモリコントローラ400は、2つのメモリチャネルコントローラを有するメモリコントローラの例示であり、共有の電力エンジン430を使用して、以下にさらに説明するように、メモリチャネルコントローラ414及びメモリチャネルコントローラ424の各々の動作を制御する。
FIG. 4 is a block diagram of another
図5は、いくつかの実施形態による、メモリコントローラ500のブロック図である。メモリコントローラ500は、メモリチャネルコントローラ510と、電力コントローラ550と、を含む。メモリチャネルコントローラ510は、インタフェース512と、キュー514と、コマンドキュー520と、アドレス生成器522と、コンテンツアドレス可能メモリ(CAM)524と、再生キュー530と、リフレッシュロジックブロック532と、タイミングブロック534と、ページテーブル536と、アービタ538と、エラー訂正コード(ECC)チェックブロック542と、ECC生成ブロック544と、データバッファ(DB)546と、を含む。
FIG. 5 is a block diagram of a
インタフェース512は、外部バスを介したデータファブリック250との第1双方向接続と、出力と、を有する。メモリコントローラ500において、この外部バスは、「AXI4」として知られている、英国ケンブリッジのARM Holdings,PLCによって仕様化されたアドバンストエクステンシブルインタフェースバージョン4と互換性があるが、他の実施形態では、他のタイプのインタフェースであってもよい。インタフェース512は、FCLK(又はMEMCLK)ドメインとして知られる第1クロックドメインから、UCLKドメインとして知られるメモリコントローラ500の内部の第2クロックドメインへのメモリアクセス要求を変換する。同様に、キュー514は、UCLKドメインから、DFIインタフェースに関連するDFICLKドメインへのメモリアクセスを提供する。
The
アドレス生成器522は、データファブリック250からAXI4バスを介して受信したメモリアクセス要求のアドレスを復号化する。メモリアクセス要求は、正規化されたアドレスとして表わされる物理アドレス空間内のアクセスアドレスを含む。アドレス生成器522は、正規化されたアドレスを、メモリシステム120内の実際のメモリデバイスをアドレス指定し、関連するアクセスを効率的にスケジュールするのに使用可能なフォーマットに変換する。このフォーマットは、メモリアクセス要求を特定のランク、行アドレス、列アドレス、バンクアドレス及びバンクグループに関連付ける領域識別子を含む。システムBIOSは、起動時に、メモリシステム120内のメモリデバイスにクエリしてそのサイズ及び構成を判断し、アドレス生成器522に関連する構成レジスタのセットをプログラムする。アドレス生成器522は、構成レジスタに記憶された構成を使用して、正規化されたアドレスを適切なフォーマットに変換する。コマンドキュー520は、データ処理システム100内のメモリアクセスエージェント(例えば、CPUコア212,214及びグラフィックスコア220等)から受信したメモリアクセス要求のキューである。コマンドキュー520は、アドレス生成器522によって復号化されたアドレスフィールドと、アクセスタイプ及びサービス品質(QoS)識別子を含むメモリアクセスをアービタ538が効率的に選択するのを可能にする他のアドレス情報と、を記憶する。CAM524は、例えばライトアフターライト(WAW)及びリードアフターライト(RAW)順序付けルール等の順序付けルールを実施するための情報を含む。
The
再生キュー530は、例えば、アドレス及びコマンドパリティ応答、DDR4 DRAMの書込み巡回冗長検査(CRC)応答、又は、GDDR5 DRAMの書込み及び読出しCRC応答等の応答を待つアービタ538によって取り出されたメモリアクセスを記憶するための一時的なキューである。再生キュー530は、ECCチェックブロック542にアクセスして、返されたECCが正しいか否か又はエラーを示しているか否かを判別する。再生キュー530は、何れかのサイクルでパリティ又はCRCエラーの場合にアクセスが再生されるのを可能にする。
The
リフレッシュロジック532は、メモリアクセスエージェントから受信した通常の読出し及び書込みメモリアクセス要求とは別に生成される様々なパワーダウン、リフレッシュ、及び、終端抵抗(ZQ)較正サイクルのためのステートマシンを含む。例えば、メモリランクがプリチャージパワーダウンにある場合には、リフレッシュサイクルを実行するために定期的に起動されなければならない。リフレッシュロジック532は、オートリフレッシュコマンドを定期的に生成して、DRAMチップ内のメモリセルのチャージオフストレージキャパシタのリークによって生じるデータエラーを防止する。さらに、リフレッシュロジック532は、ZQを定期的に較正して、システム内の熱変化によるオンダイ終端抵抗のミスマッチを防止する。また、リフレッシュロジック532は、どの場合にDRAMデバイスを別のパワーダウンモードにするのかを決定する。
The
アービタ538は、コマンドキュー520に双方向に接続されており、メモリチャネルコントローラ510の中心部分である。アービタ538は、メモリバスの利用を改善するために、インテリジェントなアクセススケジューリングによって効率を改善する。アービタ538は、タイミングブロック534を使用して、コマンドキュー520内の特定のアクセスの発行に適しているか否かをDRAMタイミングパラメータに基づいて判断することによって、適切なタイミング関係を実施する。例えば、各DRAMは、同じバンクへの起動コマンド間の最小指定時間(「tRC」として知られる)を有する。タイミングブロック534は、再生キュー530に双方向に接続されており、このタイミングパラメータ及びJEDEC仕様で指定された他のタイミングパラメータに基づいて適格性を判断するカウンタのセットを維持する。ページテーブル536は、再生キュー530に双方向に接続されており、アービタ538のメモリチャネルの各バンク及びランクのアクティブページに関する状態情報を維持する。
The
ECC生成ブロック544は、インタフェース512から受信した書込みメモリアクセス要求に応じて、書込みデータに従ってECCを計算する。DB546は、受信したメモリアクセス要求の書込みデータ及びECCを記憶する。アービタ538が、メモリチャネルにディスパッチするための対応する書込みアクセスを選ぶと、DB546は、結合した書込みデータ/ECCをキュー514に出力する。
The
電力コントローラ550は、アドバンストエクテンシブルインタフェースバージョン1(AXI)へのインタフェース552と、APBインタフェース554と、電力エンジン560と、を含む。インタフェース552は、SMNへの第1双方向接続であって、図5に別に示された「イベント_n」と付されたイベント信号を受信するための入力を含む第1双方向接続と、出力と、を含む。APBインタフェース554は、インタフェース552の出力に接続された入力と、APBを介してPHYに接続するための出力と、を有する。電力エンジン560は、インタフェース552の出力に接続された入力と、キュー514の入力に接続された出力と、を有する。電力エンジン560は、構成レジスタ562のセットと、マイクロコントローラ(μC)564と、セルフリフレッシュコントローラ(SLFREF/PE)566と、信頼性のある読出し/書込みトレーニングエンジン(RRW/TE)568と、を含む。構成レジスタ562は、AXIバスを介してプログラムされており、メモリコントローラ500内の様々なブロックの動作を制御するための構成情報を記憶する。したがって、構成レジスタ562は、図5に詳細に示されていないこれらのブロックに接続された出力を有する。セルフリフレッシュコントローラ566は、リフレッシュロジック532によるリフレッシュの自動生成に加えて、リフレッシュの手動生成を可能にするエンジンである。信頼性のある読出し/書込みトレーニングエンジン568は、DDRインタフェース読出しレイテンシトレーニング及びループバックテスト等の目的のために、連続的なメモリアクセスストリームをメモリ又はI/Oデバイスに提供する。
The
メモリチャネルコントローラ510は、関連するメモリチャネルへのディスパッチのためにメモリアクセスを選択することを可能にする回路を含む。アドレス生成器522は、所望のアービトレーションの決定を行うために、アドレス情報を、メモリシステム内のランク、行アドレス、列アドレス、バンクアドレス及びバンクグループを含むプリデコードされた情報に復号化し、コマンドキュー520は、プリデコードされた情報を記憶する。構成レジスタ562は、受信したアドレス情報をアドレス生成器522がどのように復号するのかを決定するために、構成情報を記憶する。アービタ538は、復号化されたアドレス情報と、タイミングブロック534によって示されたタイミング適格性情報と、ページテーブル536によって示されたアクティブページ情報と、を使用して、例えばQoS要件等の他の基準を遵守しながらメモリアクセスを効率的にスケジューリングする。例えば、アービタ538は、メモリページを変更するのに必要なプリチャージ及びアクティブ化コマンドのオーバヘッドを避けるために、オープンページへのアクセスを優先し、或るバンクへのオーバヘッドアクセスを、他のバンクへの読出し及び書込みアクセスをインタリーブすることによって隠す。特に、アービタ538は、通常動作中に、異なるページを選択する前にプリチャージされる必要があるまで、異なるバンク内のページオープンを維持することを決定してもよい。
図6は、いくつかの実施形態による、図5のメモリコントローラ500の一部600のブロック図である。この一部600は、アービタ538と、アービタ538の動作に関連する制御回路660のセットと、を含む。アービタ538は、サブアービタ605のセットと、最終アービタ650と、を含む。サブアービタ605は、サブアービタ610と、サブアービタ620と、サブアービタ630と、を含む。サブアービタ610は、「PH ARB」と付されたページヒットアービタ612と、出力レジスタ614と、を含む。ページヒットアービタ612は、コマンドキュー520に接続された第1入力及び第2入力と、出力と、を有する。レジスタ614は、ページヒットアービタ612の出力に接続されたデータ入力と、UCLK信号を受信するためのクロック入力と、出力と、を有する。サブアービタ620は、「PC ARB」と付されたページ競合アービタ622と、出力レジスタ624と、を含む。ページ競合アービタ622は、コマンドキュー520に接続された第1入力及び第2入力と、出力と、を有する。レジスタ624は、ページ競合アービタ622の出力に接続されたデータ入力と、UCLK信号を受信するためのクロック入力と、出力と、を有する。サブアービタ630は、「PM ARB」と付されたページミスアービタ632と、出力レジスタ634と、を含む。ページミスアービタ632は、コマンドキュー520に接続された第1入力及び第2入力と、出力と、を有する。レジスタ634は、ページミスアービタ632の出力に接続されたデータ入力と、UCLK信号を受信するためのクロック入力と、出力と、を有する。最終アービタ650は、リフレッシュロジック532の出力に接続された第1入力と、ページクローズプレディクタ662からの第2入力と、出力レジスタ614の出力に接続された第3入力と、出力レジスタ624の出力に接続された第4入力と、出力レジスタ634の出力に接続された第5入力と、「CMD1」と付された第1出力であって、第1アービトレーション勝者をキュー514に提供するための第1出力と、「CMD2」と付された第2出力であって、第2アービトレーション勝者をキュー514に提供するための第2出力と、を有する。
FIG. 6 is a block diagram of a
制御回路660は、図5に関して上述したように、タイミングブロック534と、ページテーブル536と、ページクローズプレディクタ662と、を含む。タイミングブロック534は、入力と、ページヒットアービタ612、ページ競合アービタ622及びページミスアービタ632の各々の第1入力に接続された出力と、を有する。ページテーブル534は、再生キュー530の出力に接続された入力と、再生キュー530の入力に接続された出力と、コマンドキュー520の入力に接続された出力と、タイミングブロック534の入力に接続された出力と、ページクローズプレディクタ662の入力に接続された出力と、を有する。ページクローズプレディクタ662は、ページテーブル536の1つの出力に接続された入力と、出力レジスタ614の出力に接続された入力と、最終アービタ650の第2入力に接続された出力と、を有する。
The
アービタ538は、動作中、各エントリのページ状態、各メモリアクセス要求の優先度、及び、要求間の依存関係を考慮することによって、メモリアクセス要求(コマンド)をコマンドキュー520及びリフレッシュロジック532から選択する。優先度は、AXI4バスから受信されコマンドキュー520に記憶された要求のサービス品質(即ちQoS)に関連するが、メモリアクセスのタイプ、及び、アービタ538のダイナミック動作に基づいて変更され得る。アービタ538は、既存の集積回路技術の処理制限と伝送制限との間の不整合に対処するために並行して動作する3つのサブアービタを含む。各サブアービトレーションの勝者は、最終アービタ650に提示される。最終アービタ650は、これらの3つのサブアービトレーション勝者のうち何れかを、リフレッシュロジック532からのリフレッシュ動作と同様に選択し、読出し又は書込みコマンドを、ページクローズプレディクタ662によって決定された自動プリチャージ付き読出し又は書込みコマンドにさらに変更してもよい。
During operation, the
ページヒットアービタ612、ページ競合アービタ622及びページミスアービタ632の各々は、タイミングブロック534の出力に接続された入力を有しており、これらの各々のカテゴリに入るコマンドキュー520内のコマンドのタイミング適格性を判断する。タイミングブロック534は、各ランクの各バンクの特定の動作に関連する期間をカウントするバイナリカウンタのアレイを含む。状態を判断するのに必要なタイマの数は、タイミングパラメータ、所定のメモリタイプのバンク数、及び、所定のメモリチャネル上のシステムによってサポートされるランク数に依存する。次に、順番に実装されるタイミングパラメータの数は、システムに実装されるメモリのタイプに依存する。例えば、GDDR5メモリは、他のDDRxメモリタイプよりも多くのタイミングパラメータに対応するために、より多くのタイマを必要とする。タイミングブロック534は、バイナリカウンタとして実装されたジェネリックタイマのアレイを含むことによって、異なるメモリタイプに対して調整され、再利用され得る。
Each of page hit
ページヒットは、オープンページに対する読出し又は書込みサイクルである。ページヒットアービタ612は、オープンページに対するコマンドキュー520内のアクセス間のアービトレーションを行う。タイミングブロック534内のタイマによって追跡され、ページヒットアービタ612によってチェックされるタイミング適格性パラメータは、例えば、列アドレスストローブ(CAS)に対する行アドレスストローブ(RAS)の遅延時間(tRCD)及びCASレイテンシ(tCL)を含む。例えば、tRCDは、RASサイクルでページが開かれた後に当該ページに読出し又は書込みアクセスする前に経過する必要がある最小時間を指定する。ページヒットアービタ612は、アクセスの割り当てられた優先度に基づいて、サブアービトレーション勝者を選択する。一実施形態では、優先度は4ビットのワンホット値であり、4つの値の中で優先度を示しているが、この4つのレベルの優先度スキームが単なる一例に過ぎないことは明らかである。ページヒットアービタ612が同じ優先度レベルで2つ以上の要求を検出した場合、最も古いエントリが勝者となる。
A page hit is a read or write cycle for an open page. The page hit
ページ競合は、バンク内の他の行が現在アクティブ化されているときの当該バンク内の或る行へのアクセスである。ページ競合アービタ622は、対応するバンク及びランクで現在オープンのページと競合するページに対するコマンドキュー520内のアクセス間のアービトレーションを行う。ページ競合アービタ622は、プリチャージコマンドの発行を引き起こすサブアービトレーション勝者を選択する。タイミングブロック534でタイマによって追跡され、ページ競合アービタ622によってチェックされるタイミング適格性パラメータは、例えば、active to prechargeコマンド期間(tRAS)を含む。ページ競合アービタ622は、アクセスの割り当てられた優先度に基づいて、サブアービトレーション勝者を選択する。ページ競合アービタ622が同じ優先度レベルで2つ以上の要求を検出した場合、最も古いエントリが勝者となる。
A page conflict is an access to a row in that bank when another row in the bank is currently activated. The
ページミスは、プリチャージ状態にあるバンクへのアクセスである。ページミスアービタ632は、プリチャージされたメモリバンクに対するコマンドキュー520内のアクセス間のアービトレーションを行う。タイミングブロック534でタイマによって追跡され、ページミスアービタ632によってチェックされるタイミング適格性パラメータは、例えば、prechargeコマンド期間(tRP)を含む。同じ優先度レベルでページミスである2つ以上の要求が存在する場合、最も古いエントリが勝者となる。
A page miss is an access to a bank that is in a precharge state. The
各サブアービタは、各々のサブアービトレーション勝者の優先度値を出力する。最終アービタ650は、ページヒットアービタ612、ページ競合アービタ622及びページミスアービタ632の各々からのサブアービトレーション勝者の優先度値を比較する。最終アービタ650は、一度に2つのサブアービトレーション勝者を考慮して、相対優先度比較のセットを実行することによって、サブアービトレーション勝者間の相対優先度を決定する。
Each sub-arbiter outputs the priority value of each sub-arbitration winner.
最終アービタ650は、3つのサブアービトレーション勝者間の相対優先度を決定した後に、サブアービトレーション勝者が競合するか否か(即ち、それらが同じバンク及びランクを対象としているかどうか)を判断する。かかる競合がない場合、最終アービタ650は、最高の優先度を有する最大2つのサブアービトレーション勝者を選択する。競合が生じた場合、最終アービタ650は、以下のルールに従う。最終アービタ650は、ページヒットアービタ612のサブアービトレーション勝者の優先度値がページ競合アービタ622の優先度値よりも高く、これらが両方とも同じバンク及びランクに対するものである場合に、ページヒットアービタ612によって示されたアクセスを選択する。最終アービタ650は、ページ競合アービタ622のサブアービトレーション勝者の優先度値がページヒットアービタ612の優先度値よりも高く、これらが両方とも同じバンク及びランクに対するものである場合に、いくつかの追加要因に基づいて勝者を選択する。場合によっては、ページクローズプレディクタ662は、自動プリチャージ属性を設定することによって、ページヒットアービタ612によって示されたアクセスの終了時にページを閉じる。
After determining the relative priority between the three sub-arbitration winners, the
ページヒットアービタ612内では、優先度は、メモリアクセスエージェントからの要求優先度によって最初に設定されるが、アクセスのタイプ(読出し又は書込み)及びアクセスのシーケンスに基づいて動的に調整される。概して、ページヒットアービタ612は、読出しに対してより高い暗黙の優先度を割り当てるが、書込みが完了に向けて進行するのを保証するための優先度上昇メカニズムを実装する。
Within the page hit
ページクローズプレディクタ662は、ページヒットアービタ612が読出し又は書込みコマンドを選択すると、自動プリチャージ(AP)属性を有するコマンドを送信するか否かを決定する。読出し又は書込みサイクル中、自動プリチャージ属性は、事前に定義されたアドレスビットで設定されており、読出し又は書込みサイクルが完了した後に自動プリチャージ属性によってDDRデバイスがページを閉じることによって、メモリコントローラが後でそのバンクに対して別個のプリチャージコマンドを送信する必要性を回避する。ページクローズプレディクタ662は、選択されたコマンドと同じバンクにアクセスする他の要求であって、コマンドキュー520内に既に存在する他のリクエストを考慮する。ページクローズプレディクタ662がメモリアクセスをAPコマンドに変換する場合には、そのページへの次のアクセスはページミスとなる。
The page
アービタ538は、メモリコントローラクロックサイクル毎に1つのコマンド又は2つのコマンドの何れかの発行をサポートする。例えば、DDR4 3200は、1600MHzのメモリクロック周波数で動作するDDR4 DRAMのスピードビンである。集積回路処理技術によって、メモリコントローラ500が1600MHzで動作することができる場合、メモリコントローラ500は、メモリコントローラクロックサイクル毎に1つのメモリアクセスを発行することができる。この場合、最終アービタ650は、メモリコントローラクロックサイクル毎に単一のアービトレーション勝者のみを選択する1Xモードで動作することができる。
但し、DDR4 3600又はLPDDR4 4667等の高速メモリの場合、1600MHzのメモリコントローラのクロック速度は、メモリバスの全帯域幅を使用するには遅すぎる場合がある。アービタ538は、これらの高性能のDRAMに対応するために、最終アービタ650がメモリコントローラクロックサイクル毎に2つのコマンド(CMD1及びCMD2)を選択する2Xモードをサポートする。アービタ538は、このモードを提供して、各サブアービタがより遅いメモリコントローラクロックを使用して並列に動作することを可能にする。図6に示すように、アービタ538は3つのサブアービタを含み、2Xモードでは、最終アービタ650は、3つの勝者のうち最適な2つの勝者として2つのアービトレーション勝者を選択する。
However, for high speed memories such as DDR4 3600 or LPDDR4 4667, the clock speed of the 1600 MHz memory controller may be too slow to use the full bandwidth of the memory bus.
2Xモードでは、メモリコントローラ500は、最高速度よりも遅いメモリコントローラクロック速度で動作して、メモリコントローラコマンド生成をメモリクロックサイクルに合わせることが可能であることに留意されたい。メモリコントローラが、最大1600MHzのクロック速度で動作可能なDDR4 3600の例では、クロック速度を、2Xモードにおいて900MHzまで低減することができる。
Note that in 2X mode, the
異なるメモリアクセスタイプに対して異なるサブアービタを使用することによって、各アービタは、全てのアクセスタイプ(ページヒット、ページミス及びページ競合)間のアービトレーションを行うことが必要な場合よりも単純なロジックで実装され得る。したがって、アービトレーションロジックを単純化することができ、アービタ538のサイズを比較的小さく保つことができる。ページヒット、ページ競合及びページミスのためにサブアービタを使用することによって、アービタ538は、データ転送を伴うアクセスのレイテンシを隠すために、互いに適したペアとなる2つのコマンドの選択を可能にする。
By using different sub-arbiters for different memory access types, each arbiter is implemented with simpler logic than would be required to arbitrate between all access types (page hits, page misses and page conflicts) Can be done. Therefore, the arbitration logic can be simplified and the size of the
他の実施形態では、アービタ538は、2Xモードをサポートするために少なくとも2つのサブアービタを有する限り、異なる数のサブアービタを含むことができる。例えば、アービタ538は、4つのサブアービタを含んでもよく、メモリコントローラクロックサイクル毎に最大4つのアクセスが選択されるのを可能にする。さらに他の実施形態では、アービタ538は、任意の単一タイプの2つ以上のサブアービタを含むことができる。例えば、アービタ538は、2つ以上のページヒットアービタ、2つ以上のページ競合アービタ、及び/又は、2つ以上のページミスアービタを含むことができる。この場合、アービタ538は、各コントローラサイクルで同じタイプの2つ以上のアクセスを選択することができる。
In other embodiments, the
図5及び図6の回路は、ハードウェア及びソフトウェアの様々な組み合わせで実装されてもよい。例えば、ハードウェア回路は、プライオリティエンコーダ、有限ステートマシン、プログラマブルロジックアレイ(PLA)等を含んでもよく、アービタ538は、待ち状態のコマンドの相対タイミング適格性を評価するために、記憶されたプログラム命令を実行するマイクロコントローラで実装され得る。この場合、いくつかの命令は、マイクロコントローラによる実行のために、非一時的なコンピュータメモリ又はコンピュータ可読記憶媒体に記憶されてもよい。様々な実施形態では、非一時的なコンピュータ可読記憶媒体は、磁気若しくは光ディスク記憶デバイス、例えばフラッシュメモリ等のソリッドステート記憶デバイス、又は、他の不揮発性メモリデバイスを含む。非一時的なコンピュータ可読記憶媒体に記憶されたコンピュータ可読命令は、ソースコード、アセンブリ言語コード、オブジェクトコード、又は、1つ以上のプロセッサによって解釈及び/若しくは実行可能な他の命令フォーマットであってもよい。
The circuits of FIGS. 5 and 6 may be implemented with various combinations of hardware and software. For example, the hardware circuit may include a priority encoder, a finite state machine, a programmable logic array (PLA), etc., and the
図1のAPU110、図5のメモリコントローラ500又はこれらの一部(例えば、アービタ538等)は、プログラムによって読出され、集積回路を製造するために直接的若しくは間接的に使用されるデータベース又は他のデータ構造の形態のコンピュータアクセス可能なデータ構造によって記述されてもよいし表現されてもよい。例えば、このデータ構造は、例えばVerilog又はVHDL等の高水準設計言語(HDL)におけるハードウェア機能の動作レベル記述であってもよいし、レジスタ転送レベル(RTL)記述であってもよい。記述は、ゲートのリストを含むネットリストを合成ライブラリから生成するために当該記述を合成し得る合成ツールによって読出されてもよい。ネットリストは、集積回路を含むハードウェアの機能を表すゲートのセットを含む。そして、ネットリストを配置及びルーティングして、マスクに適用される幾何学的形状を記述するデータセットを生成してもよい。マスクは、集積回路を製造するために様々な半導体製造工程で使用されてもよい。或いは、コンピュータアクセス可能な記憶媒体上のデータベースは、所望により、ネットリスト(合成ライブラリ有り若しくは無し)又はデータセットであってもよいし、グラフィックデータシステム(GDS)IIデータであってもよい。
The
特定の実施形態について説明してきたが、これらの実施形態に対する様々な修正が当業者には明らかであろう。例えば、メモリチャネルコントローラ510及び/又は電力エンジン550の内部アーキテクチャは、異なる実施形態において変更することができる。メモリコントローラ500は、例えば高帯域幅メモリ(HBM)、RAMバスDRAM(RDRAM)等のようなDDRxメモリ以外の他のタイプのメモリにインタフェースすることができる。例示された実施形態では、別々のDIMMに対応するメモリの各ランクを示したが、他の実施形態では、各DIMMは複数のランクをサポートすることができる。
Although particular embodiments have been described, various modifications to these embodiments will be apparent to those skilled in the art. For example, the internal architecture of the
したがって、添付の特許請求の範囲によって、開示された実施形態の範囲内に含まれる、開示された実施形態の全ての変更を包含することが意図される。 Accordingly, the appended claims are intended to cover all modifications of the disclosed embodiments that fall within the scope of the disclosed embodiments.
本開示は、概して、データ処理システムに関し、より詳細には、高速メモリインタフェースを有するデータ処理システムで使用されるメモリコントローラに関する。 The present disclosure relates generally to data processing systems, and more particularly to memory controllers for use in data processing systems having high speed memory interfaces.
コンピュータシステムは、通常、安価で高密度のダイナミックランダムアクセスメモリ(DRAM)チップをメインメモリとして使用する。今日販売されている多くのDRAMチップは、半導体技術協会(JEDEC:Joint Electron Devices Engineering Council)によって公布された様々なダブルデータレート(DDR)DRAM規格と互換性がある。DDR DRAMは、高速アクセス回路を有する従来のDRAMメモリセルアレイを使用して、高い転送レートを達成し、メモリバスの利用を改善する。例えば、DDR4 DRAMは、12〜15ナノ秒(ns)のアクセス時間を必要とするメモリセルアレイを使用するが、1.6ギガヘルツ(GHz)のメモリクロック周波数に対応して最大3.2ギガトランスファー毎秒(GT/秒)の速度で大量のデータにアクセスし、データをシリアル化する。転送は、良好な伝送ライン性能のために、オンダイターミネーション(on-die termination)を有する疑似オープンドレイン技術を使用する。そのレートでポイントツーポイントインタフェースを動作させて高速転送を達成することが可能であるが、メモリコントローラがメモリアクセスをスケジュールするのに十分な速度で動作することが、ますます困難になっている。 Computer systems typically use inexpensive, high density dynamic random access memory (DRAM) chips as main memory. Many DRAM chips sold today are compatible with various double data rate (DDR) DRAM standards promulgated by the Joint Electron Devices Engineering Council (JEDEC). DDR DRAM uses a conventional DRAM memory cell array with high-speed access circuitry to achieve high transfer rates and improve memory bus utilization. For example, DDR4 DRAM uses a memory cell array that requires an access time of 12-15 nanoseconds (ns), but up to 3.2 gigatransfers per second corresponding to a memory clock frequency of 1.6 gigahertz (GHz). A large amount of data is accessed at a rate of (GT / second), and the data is serialized. The transfer uses a pseudo open drain technique with on-die termination for good transmission line performance. Although it is possible to operate the point-to-point interface at that rate to achieve high-speed transfers, it becomes increasingly difficult for the memory controller to operate at a rate sufficient to schedule memory accesses.
典型的なDDRメモリコントローラは、待ち状態の読出し及び書込み要求を記憶するためにキューを維持して、メモリコントローラが、待ち状態の要求をアウトオブオーダで選択することによって、効率を高めるのを可能にする。例えば、メモリコントローラは、現在の行をプリチャージし、別の行を繰り返しアクティブにするオーバヘッドを回避するために、メモリの所定ランク内の同じ行に対する複数のメモリアクセス要求(「ページヒット」と呼ばれる)をアウトオブオーダでキューから取り出し、これらの要求を連続してメモリシステムに発行することができる。しかしながら、DDR4等の最新のメモリ技術で利用可能なバス帯域幅を活用しながら、深いキューからのアクセスをスキャン及び取り出すことを、既知のメモリコントローラを用いて達成することが困難になってきている。 A typical DDR memory controller maintains a queue to store pending read and write requests, allowing the memory controller to increase efficiency by selecting pending requests out of order To. For example, the memory controller may request multiple memory access requests (called “page hits”) for the same row in a given rank of memory to avoid the overhead of precharging the current row and repeatedly activating another row. ) From the queue out of order and these requests can be issued to the memory system in succession. However, scanning and retrieving accesses from deep queues while taking advantage of the bus bandwidth available with modern memory technologies such as DDR4 has become difficult to achieve using known memory controllers. .
以下の説明において、異なる図面において同じ参照番号を使用することは、類似又は同一の項目を示している。特に断らない限り、「接続された」という用語及びこれに関連する動詞形は、当技術分野において既知の手段による直接接続及び間接的な電気接続の両方を含む。特に断らない限り、直接接続の説明は、適切な形態の間接的な電気接続を使用する代替の実施形態をも意味する。 In the following description, the use of the same reference numerals in different drawings indicates similar or identical items. Unless otherwise noted, the term “connected” and its related verb forms include both direct and indirect electrical connections by means known in the art. Unless otherwise stated, the description of direct connection also means an alternative embodiment using an appropriate form of indirect electrical connection.
以下の一形態で説明するように、メモリコントローラは、コマンドキューと、アービタと、を含む。コマンドキューは、メモリアクセス要求を受信及び記憶するためのものである。アービタは、コントローラサイクル中にメモリアクセス要求の中から対応する複数のサブアービトレーションの勝者(winner)を提供する複数のサブアービタを含み、複数のサブアービトレーションの勝者の中から何れかを選択して、対応するコントローラサイクルにおいて複数のメモリコマンドを提供する。いくつかの実施形態では、メモリコマンドサイクルは、コントローラサイクルより短くてもよい。例えば、コントローラは、コントローラクロック信号に従って動作する一方で、メモリサイクルは、コントローラクロック信号よりも高い周波数を有するメモリクロック信号によって規定される。複数のサブアービタは、コマンドキュー内のページヒットコマンドの中から第1サブアービトレーション勝者を選択する第1サブアービタと、コマンドキュー内のページ競合コマンドの中から第2サブアービトレーション勝者を選択する第2サブアービタと、コマンドキュー内のページミスコマンドの中から第3サブアービトレーション勝者を選択する第3サブアービタと、を含むことができる。アービタは、第1サブアービトレーション勝者、第2サブアービトレーション勝者、及び、第3サブアービトレーション勝者の中から何れかを選択するための最終アービタ(final arbiter)をさらに含むことができる。 As will be described in one form below, the memory controller includes a command queue and an arbiter. The command queue is for receiving and storing a memory access request. The arbiter includes multiple sub-arbiters that provide winners of the corresponding sub-arbitration from among the memory access requests during the controller cycle, and select one of the multiple sub-arbitration winners to respond A plurality of memory commands are provided in the controller cycle. In some embodiments, the memory command cycle may be shorter than the controller cycle. For example, the controller operates in accordance with the controller clock signal while the memory cycle is defined by a memory clock signal having a higher frequency than the controller clock signal. The plurality of sub-arbiters include a first sub-arbiter that selects a first sub-arbitration winner from page hit commands in the command queue, and a second sub-arbiter that selects a second sub-arbitration winner from page conflict commands in the command queue; A third sub-arbiter for selecting a third sub-arbitration winner from the page miss commands in the command queue. The arbiter may further include a final arbiter for selecting one of the first sub-arbitration winner, the second sub-arbitration winner, and the third sub-arbitration winner.
別の形態では、データ処理システムは、複数のメモリアクセス要求を提供するメモリアクセスエージェントと、メモリシステムと、メモリアクセスエージェント及びメモリシステムに接続されたメモリコントローラと、を含む。メモリコントローラは、コマンドキューと、アービタとを含む。コマンドキューは、メモリアクセスエージェントから受信したメモリアクセスコマンドを記憶する。アービタは、コントローラサイクル中にメモリアクセス要求の中から対応する複数のサブアービトレーション勝者を提供し、複数のサブアービトレーション勝者の中から何れかを選択して、対応するコントローラサイクルにおいて複数のメモリコマンドを提供する複数のサブアービタを含む。 In another form, a data processing system includes a memory access agent that provides a plurality of memory access requests, a memory system, and a memory controller connected to the memory access agent and the memory system. The memory controller includes a command queue and an arbiter. The command queue stores a memory access command received from the memory access agent. The arbiter provides corresponding sub-arbitration winners from among the memory access requests during the controller cycle, and selects one of the sub-arbitration winners to provide multiple memory commands in the corresponding controller cycle Including multiple sub-arbiters.
さらに別の形態では、性能及び効率を向上させるために、メモリアクセス要求間でアービトレーションを行う方法を使用することができる。複数のメモリアクセス要求が受信され、コマンドキューに記憶される。第1コントローラサイクル中に、メモリアクセス要求の中から複数のサブアービトレーション勝者が選択される。複数のサブアービトレーション勝者の中から複数のメモリコマンドが選択され、対応する複数のメモリコマンドサイクルにおいて提供される。 In yet another aspect, a method of arbitrating between memory access requests can be used to improve performance and efficiency. Multiple memory access requests are received and stored in the command queue. During the first controller cycle, a plurality of sub-arbitration winners are selected from the memory access requests. A plurality of memory commands are selected from the plurality of sub-arbitration winners and provided in a corresponding plurality of memory command cycles.
図1は、いくつかの実施形態によるデータ処理システム100のブロック図である。データ処理システム100は、概して、アクセラレーテッドプロセッシングユニット(APU)の形態のデータプロセッサ110と、メモリシステム120と、周辺機器相互接続エクスプレス(PCIe)システム150と、ユニバーサルシリアルバス(USB)システム160と、ディスクドライブ170と、を含む。データプロセッサ110は、データ処理システム100の中央処理装置(CPU)として動作し、現代のコンピュータシステムにおいて有用な様々なバス及びインタフェースを提供する。これらのインタフェースには、2つのダブルデータレート(DDRx)メモリチャネルと、PCIeリンクへの接続用のPCIeルートコンプレックスと、USBネットワークへの接続用のUSBコントローラと、SATA(Serial Advanced Technology Attachment)大容量記憶デバイスへのインタフェースと、が含まれる。
FIG. 1 is a block diagram of a
メモリシステム120は、メモリチャネル130と、メモリチャネル140と、を含む。メモリチャネル130は、本例において別々のランクに対応する代表的なDIMM134,136,138を含む、DDRxバス132に接続されたデュアルインラインメモリモジュール(DIMM)のセットを含む。同様に、メモリチャネル140は、代表的なDIMM144,146,148を含む、DDRxバス142に接続されたDIMMのセットを含む。
PCIeシステム150は、データプロセッサ110内のPCIeルートコンプレックスに接続されたPCIeスイッチ152と、PCIeデバイス154と、PCIeデバイス156と、PCIeデバイス158と、を含む。PCIeデバイス156は、システム基本入出力システム(BIOS)メモリ157に接続されている。システムBIOSメモリ157は、例えばリードオンリメモリ(ROM)、フラッシュEEPROM(electrically erasable programmable ROM)等の様々な不揮発性メモリタイプの何れかであってもよい。
The
USBシステム160は、データプロセッサ110内のUSBマスタに接続されたUSBハブ162と、USBハブ162にそれぞれ接続された代表的なUSBデバイス164,166,168と、を含む。USBデバイス164,166,168は、例えばキーボード、マウス、フラッシュEEPROMポート等のデバイスであってもよい。
The
ディスクドライブ170は、SATAバスを介してデータプロセッサ110に接続されており、オペレーティングシステム、アプリケーションプログラム、アプリケーションファイル等のための大容量ストレージを提供する。
The
データ処理システム100は、メモリチャネル130及びメモリチャネル140を提供することによって、最新のコンピューティングアプリケーションでの使用に適している。各メモリチャネル130,140は、例えばDDRバージョン4(DDR4)、低電力DDR4(LPDDR4)、グラフィックスDDRバージョン5(GDDR5)及び高帯域幅メモリ(HBM)等の最新のDDRメモリに接続されてもよいし、将来のメモリ技術に適応されてもよい。これらのメモリは、高いバス帯域幅及び高速動作を提供する。同時に、これらは、ラップトップコンピュータ等のバッテリ駆動アプリケーションの電力を節約する低電力モードを提供し、組み込み型サーマルモニタリングも提供する。
図2は、図1のデータ処理システム100での使用に適したAPU200のブロック図である。APU200は、概して、中央処理装置(CPU)コアコンプレックス210と、グラフィックスコア220と、ディスプレイエンジン230のセットと、メモリ管理ハブ240と、データファブリック250と、周辺コントローラ260のセットと、周辺バスコントローラ270のセットと、システム管理ユニット(SMU)280と、メモリコントローラ290のセットと、を含む。
FIG. 2 is a block diagram of an
CPUコアコンプレックス210は、CPUコア212と、CPUコア214と、を含む。本例において、CPUコアコンプレックス210は2つのCPUコアを含むが、他の実施形態では、CPUコアコンプレックス210は任意の数のCPUコアを含んでもよい。各CPUコア212,214は、制御ファブリックを形成するシステム管理ネットワーク(SMN)及びデータファブリック250に対して双方向に接続されており、メモリアクセス要求をデータファブリック250に提供することができる。各CPUコア212,214は、単一コアであってもよいし、例えばキャッシュ等の特定のリソースを共有する2つ以上の単一コアを有するコアコンプレックスであってもよい。
The
グラフィックスコア220は、例えば、頂点処理、フラグメント処理、シェーディング、テクスチャブレンド等のグラフィックス操作を、高度に統合された並列形式で実行することの可能な高性能グラフィックス処理ユニット(GPU)である。グラフィックスコア220は、SMN及びデータファブリック250に対して双方向に接続されており、メモリアクセス要求をデータファブリック250に提供することができる。これに関して、APU200は、CPUコアコンプレックス210及びグラフィックスコア220が同じメモリ空間を共有するユニファイドメモリアーキテクチャ、又は、CPUコアコンプレックス210及びグラフィックスコア220がメモリ空間の一部を共有するメモリアーキテクチャをサポートしてもよいが、グラフィックスコア220は、CPUコアコンプレックス210がアクセスできない専用のグラフィックスメモリも使用する。
The
ディスプレイエンジン230は、グラフィックスコア220によって生成されたオブジェクトをレンダリング及びラスタライズして、モニタに表示する。グラフィックスコア220及びディスプレイエンジン230は、メモリシステム120の適切なアドレスに一様に変換されるために共通のメモリ管理ハブ240に対して双方向に接続されており、メモリ管理ハブ240は、かかるメモリアクセスを生成し、メモリシステムから返された読出しデータを受信するために、データファブリック250に対して双方向に接続されている。
The
データファブリック250は、任意のメモリアクセスエージェントとメモリコントローラ290との間でメモリアクセス要求及びメモリ応答をルーティングするためのクロスバースイッチを含む。また、データファブリック250は、システム構成に基づくメモリアクセスの宛先と、仮想接続毎のバッファとを判断するためのシステムメモリマップであって、BIOSによって定義されたシステムメモリマップを含む。
周辺コントローラ260は、USBコントローラ262と、SATAインタフェースコントローラ264と、を含み、これらの各々が、システムハブ266及びSMNバスに対して双方向に接続されている。これらの2つのコントローラは、APU200で使用可能な周辺コントローラの単なる例示である。
The
周辺バスコントローラ270は、システムコントローラ(即ち「サウスブリッジ」(SB))272と、PCIeコントローラ274と、を含み、これらの各々が、入出力(I/O)ハブ276及びSMNバスに対して双方向に接続されている。また、I/Oハブ276は、システムハブ266及びデータファブリック250に対して双方向に接続されている。したがって、例えば、CPUコアは、データファブリック250がI/Oハブ276を介してルーティングするアクセスを通じて、USBコントローラ262、SATAインタフェースコントローラ264、SB272、又は、PCIeコントローラ274内のレジスタをプログラムすることができる。
SMU280は、APU200上のリソースの動作を制御し、それらの間の通信を同期させるローカルコントローラである。SMU280は、APU200上の様々なプロセッサのパワーアップシーケンシングを管理し、リセット、イネーブル及び他の信号を介して複数のオフチップデバイスを制御する。SMU280は、APU200の各コンポーネントにクロック信号を提供するために、図2に示されていない1つ以上のクロック源(例えば位相同期ループ(PLL)等)を含む。また、SMU280は、様々なプロセッサ及び他の機能ブロックの電力を管理し、CPUコア212,214及びグラフィックスコア220から測定された電力消費値を受信して、適切な電力状態を判断してもよい。
The
また、APU200は、様々なシステムモニタリング及び省電力機能を実装する。特に、1つのシステムモニタリング機能は、サーマルモニタリングである。例えば、SMU280は、APU200が高温になると、CPUコア212,214及び/又はグラフィックスコア220の周波数及び電圧を低減させてもよい。APU200が非常に高温になった場合には、APU200が完全にシャットダウンされてもよい。サーマルイベントは、SMU280によって、外部センサからSMNバスを介して受信されてもよく、SMU280は、これに応じてクロック周波数及び/又は電源電圧を低下させてもよい。
The
図3は、いくつかの実施形態による、図2のAPU200での使用に適したメモリコントローラ300及び関連する物理インタフェース(PHY)330のブロック図である。メモリコントローラ300は、メモリチャネル310と、電力エンジン320と、を含む。メモリチャネル310は、ホストインタフェース312と、メモリチャネルコントローラ314と、物理インタフェース316と、を含む。ホストインタフェース312は、メモリチャネルコントローラ314を、スケーラブルデータポート(SDP)を介してデータファブリック250に双方向に接続する。物理インタフェース316は、メモリチャネルコントローラ314を、DDR−PHYインタフェース仕様(DFI)に準拠するバスを介してPHY330に双方向に接続する。電力エンジン320は、SMNバスを介してSMU280に双方向に接続されており、APB(Advanced Peripheral Bus)を介してPHY330に双方向に接続されており、メモリチャネルコントローラ314にも双方向に接続されている。PHY330は、例えば図1のメモリチャネル130又はメモリチャネル140等のメモリチャネルに対する双方向接続を有する。メモリコントローラ300は、単一のメモリチャネルコントローラ314を使用した単一のメモリチャネル用のメモリコントローラの例示であり、以下にさらに説明するメモリチャネルコントローラ314の動作を制御するための電力エンジン320を有する。
FIG. 3 is a block diagram of a
図4は、いくつかの実施形態による、図2のAPU200での使用に適した別のメモリコントローラ400及び関連するPHY440,450のブロック図である。メモリコントローラ400は、メモリチャネル410,420と、電力エンジン430と、を含む。メモリチャネル410は、ホストインタフェース412と、メモリチャネルコントローラ414と、物理インタフェース416と、を含む。ホストインタフェース412は、メモリチャネルコントローラ414を、SDPを介してデータファブリック250に双方向に接続する。物理インタフェース416は、DFI仕様に準拠しており、メモリチャネルコントローラ414をPHY440に双方向に接続する。メモリチャネル420は、ホストインタフェース422と、メモリチャネルコントローラ424と、物理インタフェース426と、を含む。ホストインタフェース422は、メモリチャネルコントローラ424を、別のSDPを介してデータファブリック250に双方向に接続する。物理インタフェース426は、DFI仕様に準拠しており、メモリチャネルコントローラ424をPHY450に双方向に接続する。電力エンジン430は、SMNバスを介してSMU280に双方向に接続されており、APBを介してPHY440,450に双方向に接続されており、メモリチャネルコントローラ414,424にも双方向に接続されている。PHY440は、例えば図1のメモリチャネル130等のメモリチャネルに対する双方向接続を有する。PHY450は、例えば図1のメモリチャネル140等のメモリチャネルに対する双方向接続を有する。メモリコントローラ400は、2つのメモリチャネルコントローラを有するメモリコントローラの例示であり、共有の電力エンジン430を使用して、以下にさらに説明するように、メモリチャネルコントローラ414及びメモリチャネルコントローラ424の各々の動作を制御する。
FIG. 4 is a block diagram of another
図5は、いくつかの実施形態による、メモリコントローラ500のブロック図である。メモリコントローラ500は、メモリチャネルコントローラ510と、電力コントローラ550と、を含む。メモリチャネルコントローラ510は、インタフェース512と、キュー514と、コマンドキュー520と、アドレス生成器522と、コンテンツアドレス可能メモリ(CAM)524と、再生キュー530と、リフレッシュロジックブロック532と、タイミングブロック534と、ページテーブル536と、アービタ538と、エラー訂正コード(ECC)チェックブロック542と、ECC生成ブロック544と、データバッファ(DB)546と、を含む。
FIG. 5 is a block diagram of a
インタフェース512は、外部バスを介したデータファブリック250との第1双方向接続と、出力と、を有する。メモリコントローラ500において、この外部バスは、「AXI4」として知られている、英国ケンブリッジのARM Holdings,PLCによって仕様化されたアドバンストエクステンシブルインタフェースバージョン4と互換性があるが、他の実施形態では、他のタイプのインタフェースであってもよい。インタフェース512は、FCLK(又はMEMCLK)ドメインとして知られる第1クロックドメインから、UCLKドメインとして知られるメモリコントローラ500の内部の第2クロックドメインへのメモリアクセス要求を変換する。同様に、キュー514は、UCLKドメインから、DFIインタフェースに関連するDFICLKドメインへのメモリアクセスを提供する。
The
アドレス生成器522は、データファブリック250からAXI4バスを介して受信したメモリアクセス要求のアドレスを復号化する。メモリアクセス要求は、正規化されたアドレスとして表わされる物理アドレス空間内のアクセスアドレスを含む。アドレス生成器522は、正規化されたアドレスを、メモリシステム120内の実際のメモリデバイスをアドレス指定し、関連するアクセスを効率的にスケジュールするのに使用可能なフォーマットに変換する。このフォーマットは、メモリアクセス要求を特定のランク、行アドレス、列アドレス、バンクアドレス及びバンクグループに関連付ける領域識別子を含む。システムBIOSは、起動時に、メモリシステム120内のメモリデバイスにクエリしてそのサイズ及び構成を判断し、アドレス生成器522に関連する構成レジスタのセットをプログラムする。アドレス生成器522は、構成レジスタに記憶された構成を使用して、正規化されたアドレスを適切なフォーマットに変換する。コマンドキュー520は、データ処理システム100内のメモリアクセスエージェント(例えば、CPUコア212,214及びグラフィックスコア220等)から受信したメモリアクセス要求のキューである。コマンドキュー520は、アドレス生成器522によって復号化されたアドレスフィールドと、アクセスタイプ及びサービス品質(QoS)識別子を含むメモリアクセスをアービタ538が効率的に選択するのを可能にする他のアドレス情報と、を記憶する。CAM524は、例えばライトアフターライト(WAW)及びリードアフターライト(RAW)順序付けルール等の順序付けルールを実施するための情報を含む。
The
再生キュー530は、例えば、アドレス及びコマンドパリティ応答、DDR4 DRAMの書込み巡回冗長検査(CRC)応答、又は、GDDR5 DRAMの書込み及び読出しCRC応答等の応答を待つアービタ538によって取り出されたメモリアクセスを記憶するための一時的なキューである。再生キュー530は、ECCチェックブロック542にアクセスして、返されたECCが正しいか否か又はエラーを示しているか否かを判別する。再生キュー530は、何れかのサイクルでパリティ又はCRCエラーの場合にアクセスが再生されるのを可能にする。
The
リフレッシュロジック532は、メモリアクセスエージェントから受信した通常の読出し及び書込みメモリアクセス要求とは別に生成される様々なパワーダウン、リフレッシュ、及び、終端抵抗(ZQ)較正サイクルのためのステートマシンを含む。例えば、メモリランクがプリチャージパワーダウンにある場合には、リフレッシュサイクルを実行するために定期的に起動されなければならない。リフレッシュロジック532は、オートリフレッシュコマンドを定期的に生成して、DRAMチップ内のメモリセルのチャージオフストレージキャパシタのリークによって生じるデータエラーを防止する。さらに、リフレッシュロジック532は、ZQを定期的に較正して、システム内の熱変化によるオンダイ終端抵抗のミスマッチを防止する。また、リフレッシュロジック532は、どの場合にDRAMデバイスを別のパワーダウンモードにするのかを決定する。
The
アービタ538は、コマンドキュー520に双方向に接続されており、メモリチャネルコントローラ510の中心部分である。アービタ538は、メモリバスの利用を改善するために、インテリジェントなアクセススケジューリングによって効率を改善する。アービタ538は、タイミングブロック534を使用して、コマンドキュー520内の特定のアクセスの発行に適しているか否かをDRAMタイミングパラメータに基づいて判断することによって、適切なタイミング関係を実施する。例えば、各DRAMは、同じバンクへの起動コマンド間の最小指定時間(「tRC」として知られる)を有する。タイミングブロック534は、再生キュー530に双方向に接続されており、このタイミングパラメータ及びJEDEC仕様で指定された他のタイミングパラメータに基づいて適格性を判断するカウンタのセットを維持する。ページテーブル536は、再生キュー530に双方向に接続されており、アービタ538のメモリチャネルの各バンク及びランクのアクティブページに関する状態情報を維持する。
The
ECC生成ブロック544は、インタフェース512から受信した書込みメモリアクセス要求に応じて、書込みデータに従ってECCを計算する。DB546は、受信したメモリアクセス要求の書込みデータ及びECCを記憶する。アービタ538が、メモリチャネルにディスパッチするための対応する書込みアクセスを選ぶと、DB546は、結合した書込みデータ/ECCをキュー514に出力する。
The
電力コントローラ550は、アドバンストエクテンシブルインタフェースバージョン1(AXI)へのインタフェース552と、APBインタフェース554と、電力エンジン560と、を含む。インタフェース552は、SMNへの第1双方向接続であって、図5に別に示された「イベント_n」と付されたイベント信号を受信するための入力を含む第1双方向接続と、出力と、を含む。APBインタフェース554は、インタフェース552の出力に接続された入力と、APBを介してPHYに接続するための出力と、を有する。電力エンジン560は、インタフェース552の出力に接続された入力と、キュー514の入力に接続された出力と、を有する。電力エンジン560は、構成レジスタ562のセットと、マイクロコントローラ(μC)564と、セルフリフレッシュコントローラ(SLFREF/PE)566と、信頼性のある読出し/書込みトレーニングエンジン(RRW/TE)568と、を含む。構成レジスタ562は、AXIバスを介してプログラムされており、メモリコントローラ500内の様々なブロックの動作を制御するための構成情報を記憶する。したがって、構成レジスタ562は、図5に詳細に示されていないこれらのブロックに接続された出力を有する。セルフリフレッシュコントローラ566は、リフレッシュロジック532によるリフレッシュの自動生成に加えて、リフレッシュの手動生成を可能にするエンジンである。信頼性のある読出し/書込みトレーニングエンジン568は、DDRインタフェース読出しレイテンシトレーニング及びループバックテスト等の目的のために、連続的なメモリアクセスストリームをメモリ又はI/Oデバイスに提供する。
The
メモリチャネルコントローラ510は、関連するメモリチャネルへのディスパッチのためにメモリアクセスを選択することを可能にする回路を含む。アドレス生成器522は、所望のアービトレーションの決定を行うために、アドレス情報を、メモリシステム内のランク、行アドレス、列アドレス、バンクアドレス及びバンクグループを含むプリデコードされた情報に復号化し、コマンドキュー520は、プリデコードされた情報を記憶する。構成レジスタ562は、受信したアドレス情報をアドレス生成器522がどのように復号するのかを決定するために、構成情報を記憶する。アービタ538は、復号化されたアドレス情報と、タイミングブロック534によって示されたタイミング適格性情報と、ページテーブル536によって示されたアクティブページ情報と、を使用して、例えばQoS要件等の他の基準を遵守しながらメモリアクセスを効率的にスケジューリングする。例えば、アービタ538は、メモリページを変更するのに必要なプリチャージ及びアクティブ化コマンドのオーバヘッドを避けるために、オープンページへのアクセスを優先し、或るバンクへのオーバヘッドアクセスを、他のバンクへの読出し及び書込みアクセスをインタリーブすることによって隠す。特に、アービタ538は、通常動作中に、異なるページを選択する前にプリチャージされる必要があるまで、異なるバンク内のページオープンを維持することを決定してもよい。
図6は、いくつかの実施形態による、図5のメモリコントローラ500の一部600のブロック図である。この一部600は、アービタ538と、アービタ538の動作に関連する制御回路660のセットと、を含む。アービタ538は、サブアービタ605のセットと、最終アービタ650と、を含む。サブアービタ605は、サブアービタ610と、サブアービタ620と、サブアービタ630と、を含む。サブアービタ610は、「PH ARB」と付されたページヒットアービタ612と、出力レジスタ614と、を含む。ページヒットアービタ612は、コマンドキュー520に接続された第1入力及び第2入力と、出力と、を有する。レジスタ614は、ページヒットアービタ612の出力に接続されたデータ入力と、UCLK信号を受信するためのクロック入力と、出力と、を有する。サブアービタ620は、「PC ARB」と付されたページ競合アービタ622と、出力レジスタ624と、を含む。ページ競合アービタ622は、コマンドキュー520に接続された第1入力及び第2入力と、出力と、を有する。レジスタ624は、ページ競合アービタ622の出力に接続されたデータ入力と、UCLK信号を受信するためのクロック入力と、出力と、を有する。サブアービタ630は、「PM ARB」と付されたページミスアービタ632と、出力レジスタ634と、を含む。ページミスアービタ632は、コマンドキュー520に接続された第1入力及び第2入力と、出力と、を有する。レジスタ634は、ページミスアービタ632の出力に接続されたデータ入力と、UCLK信号を受信するためのクロック入力と、出力と、を有する。最終アービタ650は、リフレッシュロジック532の出力に接続された第1入力と、ページクローズプレディクタ662からの第2入力と、出力レジスタ614の出力に接続された第3入力と、出力レジスタ624の出力に接続された第4入力と、出力レジスタ634の出力に接続された第5入力と、「CMD1」と付された第1出力であって、第1アービトレーション勝者をキュー514に提供するための第1出力と、「CMD2」と付された第2出力であって、第2アービトレーション勝者をキュー514に提供するための第2出力と、を有する。
FIG. 6 is a block diagram of a
制御回路660は、図5に関して上述したように、タイミングブロック534と、ページテーブル536と、ページクローズプレディクタ662と、を含む。タイミングブロック534は、入力と、ページヒットアービタ612、ページ競合アービタ622及びページミスアービタ632の各々の第1入力に接続された出力と、を有する。ページテーブル534は、再生キュー530の出力に接続された入力と、再生キュー530の入力に接続された出力と、コマンドキュー520の入力に接続された出力と、タイミングブロック534の入力に接続された出力と、ページクローズプレディクタ662の入力に接続された出力と、を有する。ページクローズプレディクタ662は、ページテーブル536の1つの出力に接続された入力と、出力レジスタ614の出力に接続された入力と、最終アービタ650の第2入力に接続された出力と、を有する。
The
アービタ538は、動作中、各エントリのページ状態、各メモリアクセス要求の優先度、及び、要求間の依存関係を考慮することによって、メモリアクセス要求(コマンド)をコマンドキュー520及びリフレッシュロジック532から選択する。優先度は、AXI4バスから受信されコマンドキュー520に記憶された要求のサービス品質(即ちQoS)に関連するが、メモリアクセスのタイプ、及び、アービタ538のダイナミック動作に基づいて変更され得る。アービタ538は、既存の集積回路技術の処理制限と伝送制限との間の不整合に対処するために並行して動作する3つのサブアービタを含む。各サブアービトレーションの勝者は、最終アービタ650に提示される。最終アービタ650は、これらの3つのサブアービトレーション勝者のうち何れかを、リフレッシュロジック532からのリフレッシュ動作と同様に選択し、読出し又は書込みコマンドを、ページクローズプレディクタ662によって決定された自動プリチャージ付き読出し又は書込みコマンドにさらに変更してもよい。
During operation, the
ページヒットアービタ612、ページ競合アービタ622及びページミスアービタ632の各々は、タイミングブロック534の出力に接続された入力を有しており、これらの各々のカテゴリに入るコマンドキュー520内のコマンドのタイミング適格性を判断する。タイミングブロック534は、各ランクの各バンクの特定の動作に関連する期間をカウントするバイナリカウンタのアレイを含む。状態を判断するのに必要なタイマの数は、タイミングパラメータ、所定のメモリタイプのバンク数、及び、所定のメモリチャネル上のシステムによってサポートされるランク数に依存する。次に、順番に実装されるタイミングパラメータの数は、システムに実装されるメモリのタイプに依存する。例えば、GDDR5メモリは、他のDDRxメモリタイプよりも多くのタイミングパラメータに対応するために、より多くのタイマを必要とする。タイミングブロック534は、バイナリカウンタとして実装されたジェネリックタイマのアレイを含むことによって、異なるメモリタイプに対して調整され、再利用され得る。
Each of page hit
ページヒットは、オープンページに対する読出し又は書込みサイクルである。ページヒットアービタ612は、オープンページに対するコマンドキュー520内のアクセス間のアービトレーションを行う。タイミングブロック534内のタイマによって追跡され、ページヒットアービタ612によってチェックされるタイミング適格性パラメータは、例えば、列アドレスストローブ(CAS)に対する行アドレスストローブ(RAS)の遅延時間(tRCD)及びCASレイテンシ(tCL)を含む。例えば、tRCDは、RASサイクルでページが開かれた後に当該ページに読出し又は書込みアクセスする前に経過する必要がある最小時間を指定する。ページヒットアービタ612は、アクセスの割り当てられた優先度に基づいて、サブアービトレーション勝者を選択する。一実施形態では、優先度は4ビットのワンホット値であり、4つの値の中で優先度を示しているが、この4つのレベルの優先度スキームが単なる一例に過ぎないことは明らかである。ページヒットアービタ612が同じ優先度レベルで2つ以上の要求を検出した場合、最も古いエントリが勝者となる。
A page hit is a read or write cycle for an open page. The page hit
ページ競合は、バンク内の他の行が現在アクティブ化されているときの当該バンク内の或る行へのアクセスである。ページ競合アービタ622は、対応するバンク及びランクで現在オープンのページと競合するページに対するコマンドキュー520内のアクセス間のアービトレーションを行う。ページ競合アービタ622は、プリチャージコマンドの発行を引き起こすサブアービトレーション勝者を選択する。タイミングブロック534でタイマによって追跡され、ページ競合アービタ622によってチェックされるタイミング適格性パラメータは、例えば、active to prechargeコマンド期間(tRAS)を含む。ページ競合アービタ622は、アクセスの割り当てられた優先度に基づいて、サブアービトレーション勝者を選択する。ページ競合アービタ622が同じ優先度レベルで2つ以上の要求を検出した場合、最も古いエントリが勝者となる。
A page conflict is an access to a row in that bank when another row in the bank is currently activated. The
ページミスは、プリチャージ状態にあるバンクへのアクセスである。ページミスアービタ632は、プリチャージされたメモリバンクに対するコマンドキュー520内のアクセス間のアービトレーションを行う。タイミングブロック534でタイマによって追跡され、ページミスアービタ632によってチェックされるタイミング適格性パラメータは、例えば、prechargeコマンド期間(tRP)を含む。同じ優先度レベルでページミスである2つ以上の要求が存在する場合、最も古いエントリが勝者となる。
A page miss is an access to a bank that is in a precharge state. The
各サブアービタは、各々のサブアービトレーション勝者の優先度値を出力する。最終アービタ650は、ページヒットアービタ612、ページ競合アービタ622及びページミスアービタ632の各々からのサブアービトレーション勝者の優先度値を比較する。最終アービタ650は、一度に2つのサブアービトレーション勝者を考慮して、相対優先度比較のセットを実行することによって、サブアービトレーション勝者間の相対優先度を決定する。
Each sub-arbiter outputs the priority value of each sub-arbitration winner.
最終アービタ650は、3つのサブアービトレーション勝者間の相対優先度を決定した後に、サブアービトレーション勝者が競合するか否か(即ち、それらが同じバンク及びランクを対象としているかどうか)を判断する。かかる競合がない場合、最終アービタ650は、最高の優先度を有する最大2つのサブアービトレーション勝者を選択する。競合が生じた場合、最終アービタ650は、以下のルールに従う。最終アービタ650は、ページヒットアービタ612のサブアービトレーション勝者の優先度値がページ競合アービタ622の優先度値よりも高く、これらが両方とも同じバンク及びランクに対するものである場合に、ページヒットアービタ612によって示されたアクセスを選択する。最終アービタ650は、ページ競合アービタ622のサブアービトレーション勝者の優先度値がページヒットアービタ612の優先度値よりも高く、これらが両方とも同じバンク及びランクに対するものである場合に、いくつかの追加要因に基づいて勝者を選択する。場合によっては、ページクローズプレディクタ662は、自動プリチャージ属性を設定することによって、ページヒットアービタ612によって示されたアクセスの終了時にページを閉じる。
After determining the relative priority between the three sub-arbitration winners, the
ページヒットアービタ612内では、優先度は、メモリアクセスエージェントからの要求優先度によって最初に設定されるが、アクセスのタイプ(読出し又は書込み)及びアクセスのシーケンスに基づいて動的に調整される。概して、ページヒットアービタ612は、読出しに対してより高い暗黙の優先度を割り当てるが、書込みが完了に向けて進行するのを保証するための優先度上昇メカニズムを実装する。
Within the page hit
ページクローズプレディクタ662は、ページヒットアービタ612が読出し又は書込みコマンドを選択すると、自動プリチャージ(AP)属性を有するコマンドを送信するか否かを決定する。読出し又は書込みサイクル中、自動プリチャージ属性は、事前に定義されたアドレスビットで設定されており、読出し又は書込みサイクルが完了した後に自動プリチャージ属性によってDDRデバイスがページを閉じることによって、メモリコントローラが後でそのバンクに対して別個のプリチャージコマンドを送信する必要性を回避する。ページクローズプレディクタ662は、選択されたコマンドと同じバンクにアクセスする他の要求であって、コマンドキュー520内に既に存在する他のリクエストを考慮する。ページクローズプレディクタ662がメモリアクセスをAPコマンドに変換する場合には、そのページへの次のアクセスはページミスとなる。
The page
アービタ538は、メモリコントローラクロックサイクル毎に1つのコマンド又は2つのコマンドの何れかの発行をサポートする。例えば、DDR4 3200は、1600MHzのメモリクロック周波数で動作するDDR4 DRAMのスピードビンである。集積回路処理技術によって、メモリコントローラ500が1600MHzで動作することができる場合、メモリコントローラ500は、メモリコントローラクロックサイクル毎に1つのメモリアクセスを発行することができる。この場合、最終アービタ650は、メモリコントローラクロックサイクル毎に単一のアービトレーション勝者のみを選択する1Xモードで動作することができる。
但し、DDR4 3600又はLPDDR4 4667等の高速メモリの場合、1600MHzのメモリコントローラのクロック速度は、メモリバスの全帯域幅を使用するには遅すぎる場合がある。アービタ538は、これらの高性能のDRAMに対応するために、最終アービタ650がメモリコントローラクロックサイクル毎に2つのコマンド(CMD1及びCMD2)を選択する2Xモードをサポートする。アービタ538は、このモードを提供して、各サブアービタがより遅いメモリコントローラクロックを使用して並列に動作することを可能にする。図6に示すように、アービタ538は3つのサブアービタを含み、2Xモードでは、最終アービタ650は、3つの勝者のうち最適な2つの勝者として2つのアービトレーション勝者を選択する。
However, for high speed memories such as DDR4 3600 or LPDDR4 4667, the clock speed of the 1600 MHz memory controller may be too slow to use the full bandwidth of the memory bus.
2Xモードでは、メモリコントローラ500は、最高速度よりも遅いメモリコントローラクロック速度で動作して、メモリコントローラコマンド生成をメモリクロックサイクルに合わせることが可能であることに留意されたい。メモリコントローラが、最大1600MHzのクロック速度で動作可能なDDR4 3600の例では、クロック速度を、2Xモードにおいて900MHzまで低減することができる。
Note that in 2X mode, the
異なるメモリアクセスタイプに対して異なるサブアービタを使用することによって、各アービタは、全てのアクセスタイプ(ページヒット、ページミス及びページ競合)間のアービトレーションを行うことが必要な場合よりも単純なロジックで実装され得る。したがって、アービトレーションロジックを単純化することができ、アービタ538のサイズを比較的小さく保つことができる。ページヒット、ページ競合及びページミスのためにサブアービタを使用することによって、アービタ538は、データ転送を伴うアクセスのレイテンシを隠すために、互いに適したペアとなる2つのコマンドの選択を可能にする。
By using different sub-arbiters for different memory access types, each arbiter is implemented with simpler logic than would be required to arbitrate between all access types (page hits, page misses and page conflicts) Can be done. Therefore, the arbitration logic can be simplified and the size of the
他の実施形態では、アービタ538は、2Xモードをサポートするために少なくとも2つのサブアービタを有する限り、異なる数のサブアービタを含むことができる。例えば、アービタ538は、4つのサブアービタを含んでもよく、メモリコントローラクロックサイクル毎に最大4つのアクセスが選択されるのを可能にする。さらに他の実施形態では、アービタ538は、任意の単一タイプの2つ以上のサブアービタを含むことができる。例えば、アービタ538は、2つ以上のページヒットアービタ、2つ以上のページ競合アービタ、及び/又は、2つ以上のページミスアービタを含むことができる。この場合、アービタ538は、各コントローラサイクルで同じタイプの2つ以上のアクセスを選択することができる。
In other embodiments, the
図5及び図6の回路は、ハードウェア及びソフトウェアの様々な組み合わせで実装されてもよい。例えば、ハードウェア回路は、プライオリティエンコーダ、有限ステートマシン、プログラマブルロジックアレイ(PLA)等を含んでもよく、アービタ538は、待ち状態のコマンドの相対タイミング適格性を評価するために、記憶されたプログラム命令を実行するマイクロコントローラで実装され得る。この場合、いくつかの命令は、マイクロコントローラによる実行のために、非一時的なコンピュータメモリ又はコンピュータ可読記憶媒体に記憶されてもよい。様々な実施形態では、非一時的なコンピュータ可読記憶媒体は、磁気若しくは光ディスク記憶デバイス、例えばフラッシュメモリ等のソリッドステート記憶デバイス、又は、他の不揮発性メモリデバイスを含む。非一時的なコンピュータ可読記憶媒体に記憶されたコンピュータ可読命令は、ソースコード、アセンブリ言語コード、オブジェクトコード、又は、1つ以上のプロセッサによって解釈及び/若しくは実行可能な他の命令フォーマットであってもよい。
The circuits of FIGS. 5 and 6 may be implemented with various combinations of hardware and software. For example, the hardware circuit may include a priority encoder, a finite state machine, a programmable logic array (PLA), etc., and the
図1のAPU110、図5のメモリコントローラ500又はこれらの一部(例えば、アービタ538等)は、プログラムによって読出され、集積回路を製造するために直接的若しくは間接的に使用されるデータベース又は他のデータ構造の形態のコンピュータアクセス可能なデータ構造によって記述されてもよいし表現されてもよい。例えば、このデータ構造は、例えばVerilog又はVHDL等の高水準設計言語(HDL)におけるハードウェア機能の動作レベル記述であってもよいし、レジスタ転送レベル(RTL)記述であってもよい。記述は、ゲートのリストを含むネットリストを合成ライブラリから生成するために当該記述を合成し得る合成ツールによって読出されてもよい。ネットリストは、集積回路を含むハードウェアの機能を表すゲートのセットを含む。そして、ネットリストを配置及びルーティングして、マスクに適用される幾何学的形状を記述するデータセットを生成してもよい。マスクは、集積回路を製造するために様々な半導体製造工程で使用されてもよい。或いは、コンピュータアクセス可能な記憶媒体上のデータベースは、所望により、ネットリスト(合成ライブラリ有り若しくは無し)又はデータセットであってもよいし、グラフィックデータシステム(GDS)IIデータであってもよい。
The
特定の実施形態について説明してきたが、これらの実施形態に対する様々な修正が当業者には明らかであろう。例えば、メモリチャネルコントローラ510及び/又は電力エンジン550の内部アーキテクチャは、異なる実施形態において変更することができる。メモリコントローラ500は、例えば高帯域幅メモリ(HBM)、RAMバスDRAM(RDRAM)等のようなDDRxメモリ以外の他のタイプのメモリにインタフェースすることができる。例示された実施形態では、別々のDIMMに対応するメモリの各ランクを示したが、他の実施形態では、各DIMMは複数のランクをサポートすることができる。
Although particular embodiments have been described, various modifications to these embodiments will be apparent to those skilled in the art. For example, the internal architecture of the
1つの形態では、本明細書に開示されたメモリコントローラは、コマンドキューと、複数のサブアービタを含むアービタと、を備える。1つの態様によれば、複数のサブアービタは、第1サブアービトレーション勝者、第2サブアービトレーション勝者及び第3サブアービトレーション勝者を提供するための第1サブアービタ、第2サブアービタ及び第3サブアービタと、2つの最終アービトレーション勝者を選択するための最終アービタと、を含み、最終アービタは、第1アービトレーション勝者、第2アービトレーション勝者及び第3アービトレーション勝者とオーバヘッドコマンドとから、2つの最終アービトレーション勝者を選択する。この場合、オーバヘッドコマンドは、パワーダウンコマンド、オートリフレッシュコマンド及び較正コマンドのうち何れかを含んでもよい。In one form, a memory controller disclosed herein comprises a command queue and an arbiter that includes a plurality of sub-arbiters. According to one aspect, the plurality of sub-arbiters are a first sub-arbiter, a second sub-arbiter and a third sub-arbiter for providing a first sub-arbitration winner, a second sub-arbitration winner and a third sub-arbitration winner, and two final A final arbiter for selecting an arbitration winner, and the final arbiter selects two final arbitration winners from the first arbitration winner, the second arbitration winner, and the third arbitration winner and an overhead command. In this case, the overhead command may include any of a power down command, an auto refresh command, and a calibration command.
別の形態では、本明細書に開示されたメモリコントローラは、メモリアクセスエージェントと、メモリシステムと、メモリアクセスエージェント及びメモリシステムに接続されたメモリコントローラと、を含むデータ処理システムの一部である。In another form, the memory controller disclosed herein is part of a data processing system that includes a memory access agent, a memory system, and a memory controller connected to the memory access agent and the memory system.
さらに別の形態では、方法は、複数のメモリアクセス要求を受信することと、複数のメモリアクセス要求をコマンドキューに記憶することと、コマンドキューからメモリアクセス要求を選択することであって、第1コントローラサイクル期間中にメモリアクセス要求の中から複数のサブアービトレーション勝者を選択することと、対応する複数のメモリコマンドサイクルにおいて複数のコマンドを提供するために複数のサブアービトレーション勝者の中から何れかを選択することとを含む、ことと、を含む。1つの態様によれば、方法は、対応する第2の複数のメモリサイクルにおいて第2の複数のメモリコマンドを提供するために、複数のサブアービトレーション勝者の何れかと、オーバーヘッドコマンドとを選択することと、オーバヘッドコマンドを、パワーダウンコマンド、オートリフレッシュコマンド及び較正コマンドのうち何れかとして提供することと、をさらに含む。別の態様によれば、複数のメモリコマンドを提供するために、複数のサブアービトレーション勝者の中から何れかを選択することは、対応する複数のメモリコマンドサイクルにおいて複数のメモリコマンドを提供するために、複数のサブアービトレーション勝者の中から何れかを選択することを含み、メモリコマンドサイクルは、コントローラサイクルよりも短い。さらに別の態様によれば、第1コントローラサイクル中に、メモリアクセス要求の中から複数のサブアービトレーション勝者を選択することは、第1コントローラサイクル中に、メモリアクセス要求の中から同じタイプの第1の複数のサブアービトレーション勝者を選択することを含み、方法は、第1コントローラサイクル中に、同じタイプの2つの最終アービトレーション勝者を選択することをさらに含む。In yet another aspect, the method includes receiving a plurality of memory access requests, storing the plurality of memory access requests in a command queue, and selecting a memory access request from the command queue, Select multiple sub-arbitration winners from memory access requests during the controller cycle and select one of multiple sub-arbitration winners to provide multiple commands in corresponding multiple memory command cycles Including, including. According to one aspect, a method selects any of a plurality of sub-arbitration winners and an overhead command to provide a second plurality of memory commands in a corresponding second plurality of memory cycles. Providing the overhead command as any of a power down command, an auto refresh command and a calibration command. According to another aspect, selecting one of a plurality of sub-arbitration winners to provide a plurality of memory commands is provided to provide a plurality of memory commands in a corresponding plurality of memory command cycles. The memory command cycle is shorter than the controller cycle, including selecting any of the plurality of sub-arbitration winners. According to yet another aspect, selecting a plurality of sub-arbitration winners from among the memory access requests during the first controller cycle means that a first of the same type from among the memory access requests during the first controller cycle. Selecting a plurality of sub-arbitration winners, and the method further includes selecting two final arbitration winners of the same type during the first controller cycle.
したがって、添付の特許請求の範囲によって、開示された実施形態の範囲内に含まれる、開示された実施形態の全ての変更を包含することが意図される。 Accordingly, the appended claims are intended to cover all modifications of the disclosed embodiments that fall within the scope of the disclosed embodiments.
Claims (30)
コントローラサイクル中に前記メモリアクセス要求の中から対応する複数のサブアービトレーション勝者を提供する複数のサブアービタ(605)であって、対応するコントローラサイクルにおいて複数のメモリコマンドを提供するために前記複数のサブアービトレーション勝者の中から何れかを選択する複数のサブアービタ(605)を備えるアービタ(538)と、を備える、
メモリコントローラ(500)。 A command queue (520) for receiving and storing a memory access request;
A plurality of sub-arbiters (605) for providing a corresponding plurality of sub-arbitration winners from among the memory access requests during a controller cycle, the plurality of sub-arbitrations for providing a plurality of memory commands in a corresponding controller cycle An arbiter (538) comprising a plurality of sub-arbiters (605) for selecting any of the winners,
Memory controller (500).
請求項1のメモリコントローラ(500)。 A memory command cycle is shorter than the corresponding controller cycle;
The memory controller (500) of claim 1.
前記メモリコマンドサイクルは、メモリクロック信号によって定義され、
前記メモリクロック信号は、前記コントローラクロック信号よりも高い周波数を有する、
請求項2のメモリコントローラ(500)。 The controller cycle is defined by a controller clock signal;
The memory command cycle is defined by a memory clock signal,
The memory clock signal has a higher frequency than the controller clock signal;
The memory controller (500) of claim 2.
請求項3のメモリコントローラ(500)。 The frequency of the memory clock signal is twice the frequency of the controller clock signal.
The memory controller (500) of claim 3.
前記コマンドキュー(520)に接続された第1サブアービタ(610)であって、コントローラクロック信号に同期して、前記コマンドキュー(520)内のアクティブエントリの中から第1サブアービトレーション勝者を決定する第1サブアービタ(610)と、
前記コマンドキュー(520)に接続された第2サブアービタ(620)であって、前記コントローラクロック信号に同期して、前記コマンドキュー(520)内の前記アクティブエントリの中から前記第1サブアービトレーション勝者とは異なる第2サブアービトレーション勝者を決定する第2サブアービタ(620)と、を備え、
前記メモリコントローラ(500)は、メモリクロック信号の第1サイクルにおいて前記第1サブアービトレーション勝者を第1メモリコマンドとして出力し、前記メモリクロック信号の後続のサイクルにおいて前記第2サブアービトレーション勝者を第2メモリコマンドとして出力するように動作し、前記メモリクロック信号の周波数は、前記コントローラクロック信号の周波数よりも高い、
請求項1のメモリコントローラ(500)。 The plurality of sub-arbiters (605)
A first sub-arbiter (610) connected to the command queue (520), wherein a first sub-arbitration winner is determined from among active entries in the command queue (520) in synchronization with a controller clock signal. 1 sub-arbiter (610),
A second sub-arbiter (620) connected to the command queue (520), wherein the first sub-arbitration winner is selected from among the active entries in the command queue (520) in synchronization with the controller clock signal. A second sub-arbiter (620) for determining different second sub-arbitration winners,
The memory controller (500) outputs the first sub-arbitration winner as a first memory command in a first cycle of a memory clock signal and outputs the second sub-arbitration winner in a second memory in a subsequent cycle of the memory clock signal. It operates to output as a command, the frequency of the memory clock signal is higher than the frequency of the controller clock signal,
The memory controller (500) of claim 1.
前記コマンドキュー(520)に接続された第3サブアービタ(630)であって、前記コントローラクロック信号に同期して、前記コマンドキュー(520)内のアクティブエントリの中から第3サブアービトレーション勝者を決定する第3サブアービタ(630)を備える、
請求項5のメモリコントローラ(500)。 The plurality of sub-arbiters (605)
A third sub-arbiter (630) connected to the command queue (520), and a third sub-arbitration winner is determined from active entries in the command queue (520) in synchronization with the controller clock signal. A third sub-arbiter (630);
The memory controller (500) of claim 5.
前記第1サブアービトレーション勝者、前記第2サブアービトレーション勝者及び前記第3サブアービトレーション勝者の中から2つの最終アービトレーション勝者を選択し、前記2つの最終アービトレーション勝者を前記第1メモリコマンド及び前記第2メモリコマンドとして提供する最終アービタ(650)を備える、
請求項6のメモリコントローラ(500)。 The arbiter (538)
Two final arbitration winners are selected from the first sub-arbitration winner, the second sub-arbitration winner, and the third sub-arbitration winner, and the two final arbitration winners are selected as the first memory command and the second memory command. With a final arbiter (650) to serve as
The memory controller (500) of claim 6.
請求項7のメモリコントローラ(500)。 The final arbiter (650) selects the two final arbitration winners from the first sub-arbitration winner, the second sub-arbitration winner, the third sub-arbitration winner, and an overhead command;
The memory controller (500) of claim 7.
請求項8のメモリコントローラ(500)。 The overhead command includes any one of a power down command, an auto refresh command, and a calibration command.
The memory controller (500) of claim 8.
前記最終アービタ(650)は、前記対応するコントローラサイクルにおいて前記複数のサブアービタ(605)の中から前記同じタイプの2つの最終アービトレーション勝者を選択する、
請求項7のメモリコントローラ(500)。 The plurality of sub-arbiters (605) includes at least one other sub-arbiter of the same type as any of the first sub-arbiter (610), the second sub-arbiter (620), and the third sub-arbiter (630),
The final arbiter (650) selects two final arbitration winners of the same type from the plurality of sub-arbiters (605) in the corresponding controller cycle;
The memory controller (500) of claim 7.
前記第2サブアービタ(620)は、前記コマンドキュー(520)内のページ競合コマンドから前記第2サブアービトレーション勝者を選択し、
前記第3サブアービタ(630)は、前記コマンドキュー(520)内のページミスコマンドから前記第3サブアービトレーション勝者を選択する、
請求項6のメモリコントローラ(500)。 The first sub-arbiter (610) selects the first sub-arbitration winner from page hit commands in the command queue (520),
The second sub-arbiter (620) selects the second sub-arbitration winner from page conflict commands in the command queue (520);
The third sub-arbiter (630) selects the third sub-arbitration winner from a page miss command in the command queue (520).
The memory controller (500) of claim 6.
前記複数のサブアービタ(605)のうち少なくとも2つは、同じタイプのアービトレーション勝者を選択し、
前記アービタ(538)は、前記対応するコントローラサイクルにおいて前記複数のサブアービタ(605)の中から前記同じタイプの2つの最終アービトレーション勝者を選択する、
請求項1のメモリコントローラ(500)。 Each of the plurality of sub-arbiters (605) selects an arbitration winner from among related types of commands in the command queue (520);
At least two of the plurality of sub-arbiters (605) select the same type of arbitration winner;
The arbiter (538) selects two final arbitration winners of the same type from the plurality of sub-arbiters (605) in the corresponding controller cycle;
The memory controller (500) of claim 1.
メモリシステム(120)と、
前記メモリアクセスエージェント(110,210,220)及び前記メモリシステム(120)に接続されたメモリコントローラ(292,500)と、を備え、
前記メモリコントローラ(292,500)は、
前記メモリアクセスエージェント(110,210,220)から受信したメモリアクセスコマンドを記憶するコマンドキュー(520)と、
コントローラサイクル中に前記メモリアクセス要求の中から対応する複数のサブアービトレーション勝者を提供する複数のサブアービタ(605)であって、対応するコントローラサイクルにおいて複数のメモリコマンドを提供するために前記複数のサブアービトレーション勝者の中から何れかを選択する複数のサブアービタ(605)を備えるアービタ(538)と、を備える、
データ処理システム(100)。 A memory access agent (110, 210, 220) for providing a memory access request;
A memory system (120);
A memory controller (292, 500) connected to the memory access agent (110, 210, 220) and the memory system (120);
The memory controller (292,500)
A command queue (520) for storing a memory access command received from the memory access agent (110, 210, 220);
A plurality of sub-arbiters (605) for providing a corresponding plurality of sub-arbitration winners from among the memory access requests during a controller cycle, the plurality of sub-arbitrations for providing a plurality of memory commands in a corresponding controller cycle An arbiter (538) comprising a plurality of sub-arbiters (605) for selecting any of the winners,
Data processing system (100).
中央処理ユニットコア(212,214)と、
グラフィックス処理ユニットコア(220)と、
前記中央処理ユニットコア(212,214)及び前記グラフィックス処理ユニットコア(220)を前記メモリコントローラ(292,500)に相互接続するデータファブリック(250)と、を備える、
請求項13のデータ処理システム(100)。 The memory access agent is
A central processing unit core (212, 214);
A graphics processing unit core (220);
A data fabric (250) interconnecting the central processing unit core (212, 214) and the graphics processing unit core (220) to the memory controller (292, 500);
The data processing system (100) of claim 13.
請求項13のデータ処理システム(100)。 The memory command cycle is shorter than the controller cycle,
The data processing system (100) of claim 13.
前記メモリコマンドサイクルは、メモリクロック信号によって定義され、
前記メモリクロック信号は、前記コントローラクロック信号よりも高い周波数を有する、
請求項15のデータ処理システム(100)。 The controller cycle is defined by a controller clock signal;
The memory command cycle is defined by a memory clock signal,
The memory clock signal has a higher frequency than the controller clock signal;
The data processing system (100) of claim 15.
請求項16のデータ処理システム(100)。 The frequency of the memory clock signal is twice the frequency of the controller clock signal.
The data processing system (100) of claim 16.
前記コマンドキュー(520)に接続された第1サブアービタ(610)であって、コントローラクロック信号に同期して、前記コマンドキュー(520)内のアクティブエントリの中から第1サブアービトレーション勝者を決定する第1サブアービタ(610)と、
前記コマンドキュー(520)に接続された第2サブアービタ(620)であって、前記コントローラクロック信号に同期して、前記コマンドキュー(520)内の前記アクティブエントリの中から前記第1サブアービトレーション勝者とは異なる第2サブアービトレーション勝者を決定する第2サブアービタ(620)と、を備え、
前記メモリコントローラ(500)は、メモリクロック信号の第1サイクルにおいて前記第1サブアービトレーション勝者を第1メモリコマンドとして出力し、前記メモリクロック信号の後続のサイクルにおいて前記第2サブアービトレーション勝者を第2メモリコマンドとして出力するように動作し、前記メモリクロック信号の周波数は、前記コントローラクロック信号の周波数よりも高い、
請求項13のデータ処理システム(100)。 The plurality of sub-arbiters (605)
A first sub-arbiter (610) connected to the command queue (520), wherein a first sub-arbitration winner is determined from among active entries in the command queue (520) in synchronization with a controller clock signal. 1 sub-arbiter (610),
A second sub-arbiter (620) connected to the command queue (520), wherein the first sub-arbitration winner is selected from among the active entries in the command queue (520) in synchronization with the controller clock signal. A second sub-arbiter (620) for determining different second sub-arbitration winners,
The memory controller (500) outputs the first sub-arbitration winner as a first memory command in a first cycle of a memory clock signal and outputs the second sub-arbitration winner in a second memory in a subsequent cycle of the memory clock signal. It operates to output as a command, the frequency of the memory clock signal is higher than the frequency of the controller clock signal,
The data processing system (100) of claim 13.
前記コマンドキュー(520)に接続された第3サブアービタ(630)であって、前記コントローラクロック信号に同期して、前記コマンドキュー(520)内のアクティブエントリの中から第3サブアービトレーション勝者を決定する第3サブアービタ(630)を備える、
請求項18のデータ処理システム(100)。 The plurality of sub-arbiters (605)
A third sub-arbiter (630) connected to the command queue (520), and a third sub-arbitration winner is determined from active entries in the command queue (520) in synchronization with the controller clock signal. A third sub-arbiter (630);
The data processing system (100) of claim 18.
前記第1サブアービトレーション勝者、前記第2サブアービトレーション勝者及び前記第3サブアービトレーション勝者の中から2つの最終アービトレーション勝者を選択し、前記2つの最終アービトレーション勝者を前記第1メモリコマンド及び前記第2メモリコマンドとして提供する最終アービタ(650)を備える、
請求項19のデータ処理システム(100)。 The arbiter (538)
Two final arbitration winners are selected from the first sub-arbitration winner, the second sub-arbitration winner, and the third sub-arbitration winner, and the two final arbitration winners are selected as the first memory command and the second memory command. With a final arbiter (650) to serve as
The data processing system (100) of claim 19.
前記最終アービタ(650)は、前記対応するコントローラサイクルにおいて前記複数のサブアービタ(605)の中から前記同じタイプの2つの最終アービトレーション勝者を選択する、
請求項20のデータ処理システム(100)。 The plurality of sub-arbiters (605) includes at least one other sub-arbiter of the same type as any of the first sub-arbiter (610), the second sub-arbiter (620), and the third sub-arbiter (630),
The final arbiter (650) selects two final arbitration winners of the same type from the plurality of sub-arbiters (605) in the corresponding controller cycle;
The data processing system (100) of claim 20.
前記第2サブアービタ(620)は、前記コマンドキュー(520)内のページ競合コマンドから前記第2サブアービトレーション勝者を選択し、
前記第3サブアービタ(630)は、前記コマンドキュー(520)内のページミスコマンドから前記第3サブアービトレーション勝者を選択する、
請求項19のデータ処理システム(100)。 The first sub-arbiter (610) selects the first sub-arbitration winner from page hit commands in the command queue (520),
The second sub-arbiter (620) selects the second sub-arbitration winner from page conflict commands in the command queue (520);
The third sub-arbiter (630) selects the third sub-arbitration winner from a page miss command in the command queue (520).
The data processing system (100) of claim 19.
前記複数のサブアービタ(605)のうち少なくとも2つは、同じタイプのアービトレーション勝者を選択し、
前記アービタ(538)は、前記対応するコントローラサイクルにおいて前記複数のサブアービタ(605)の中から前記同じタイプの2つの最終アービトレーション勝者を選択する、
請求項13のデータ処理システム(100)。 Each of the plurality of sub-arbiters (605) selects an arbitration winner from among related types of commands in the command queue (520);
At least two of the plurality of sub-arbiters (605) select the same type of arbitration winner;
The arbiter (538) selects two final arbitration winners of the same type from the plurality of sub-arbiters (605) in the corresponding controller cycle;
The data processing system (100) of claim 13.
前記複数のメモリアクセス要求をコマンドキュー(520)に記憶することと、
前記コマンドキュー(520)からメモリアクセス要求を選択することであって、第1コントローラサイクル中に前記メモリアクセス要求の中から複数のサブアービトレーション勝者を選択することと、対応するコントローラサイクルにおいて複数のメモリコマンドを提供するために前記複数のサブアービトレーション勝者の中から何れかを選択することとを含む、ことと、を含む、
方法。 Receiving multiple memory access requests;
Storing the plurality of memory access requests in a command queue (520);
Selecting a memory access request from the command queue (520), selecting a plurality of sub-arbitration winners from the memory access request during a first controller cycle; and a plurality of memories in a corresponding controller cycle. Selecting any of the plurality of sub-arbitration winners to provide a command.
Method.
前記コマンドキュー(520)内のページヒットコマンドから第1サブアービトレーション勝者を選択することと、
前記コマンドキュー(520)内のページ競合コマンドから第2サブアービトレーション勝者を選択することと、
前記コマンドキュー(520)内のページミスコマンドから第3サブアービトレーション勝者を選択することと、を含む、
請求項24の方法。 Selecting the plurality of sub-arbitration winners includes
Selecting a first sub-arbitration winner from a page hit command in the command queue (520);
Selecting a second sub-arbitration winner from the page contention commands in the command queue (520);
Selecting a third sub-arbitration winner from a page miss command in the command queue (520).
25. The method of claim 24.
前記第1コントローラサイクルにおいて、前記第1サブアービトレーション勝者、前記第2サブアービトレーション勝者、前記第3サブアービトレーション勝者及び前記第4サブアービトレーション勝者の中から同じタイプの2つの最終アービトレーション勝者を選択することと、を含む、
請求項25の方法。 Selecting a fourth sub-arbitration winner from any of the page hit command, the page conflict command and the page miss command in the command queue;
Selecting two final arbitration winners of the same type from the first sub-arbitration winner, the second sub-arbitration winner, the third sub-arbitration winner, and the fourth sub-arbitration winner in the first controller cycle; ,including,
26. The method of claim 25.
請求項24の方法。 Selecting any of the plurality of sub-arbitration winners and overhead commands to provide a second plurality of memory commands in a corresponding second plurality of memory cycles;
25. The method of claim 24.
請求項27の方法。 Providing the overhead command as any of a power down command, an auto refresh command, and a calibration command;
28. The method of claim 27.
対応するメモリコマンドサイクルにおいて前記複数のメモリコマンドを提供するために前記複数のサブアービトレーション勝者の中から何れかを選択することであって、前記メモリコマンドサイクルは前記コントローラサイクルよりも短い、ことを含む、
請求項24の方法。 Selecting any of the plurality of sub-arbitration winners to provide the plurality of memory commands;
Selecting any of the plurality of sub-arbitration winners to provide the plurality of memory commands in a corresponding memory command cycle, wherein the memory command cycle is shorter than the controller cycle ,
25. The method of claim 24.
前記第1コントローラサイクル中に前記同じタイプの2つの最終アービトレーション勝者を選択することをさらに含む、
請求項24の方法。 Selecting a plurality of sub-arbitration winners from among the memory access requests during the first controller cycle is a first plurality of sub-arbitration winners of the same type from among the memory access requests during the first controller cycle. Including selecting
Selecting two final arbitration winners of the same type during the first controller cycle;
25. The method of claim 24.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/211,815 | 2016-07-15 | ||
US15/211,815 US10684969B2 (en) | 2016-07-15 | 2016-07-15 | Command arbitration for high speed memory interfaces |
PCT/US2016/053131 WO2018013157A1 (en) | 2016-07-15 | 2016-09-22 | Command arbitration for high speed memory interfaces |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019525271A true JP2019525271A (en) | 2019-09-05 |
JP2019525271A5 JP2019525271A5 (en) | 2019-11-07 |
JP6840145B2 JP6840145B2 (en) | 2021-03-10 |
Family
ID=60940659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018524749A Active JP6840145B2 (en) | 2016-07-15 | 2016-09-22 | Command arbitration for fast memory interface |
Country Status (5)
Country | Link |
---|---|
US (1) | US10684969B2 (en) |
JP (1) | JP6840145B2 (en) |
KR (1) | KR102442078B1 (en) |
CN (1) | CN107924375B (en) |
WO (1) | WO2018013157A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7521132B2 (en) | 2021-03-31 | 2024-07-23 | アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド | Write bank group mask during arbitration |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10037150B2 (en) * | 2016-07-15 | 2018-07-31 | Advanced Micro Devices, Inc. | Memory controller with virtual controller mode |
CN110729006B (en) * | 2018-07-16 | 2022-07-05 | 超威半导体(上海)有限公司 | Refresh Schemes in Memory Controllers |
US11126375B2 (en) * | 2019-07-18 | 2021-09-21 | Micron Technology, Inc. | Arbiter circuit for commands from multiple physical functions in a memory sub-system |
US11200106B2 (en) * | 2019-08-12 | 2021-12-14 | Advanced Micro Devices, Inc. | Data integrity for persistent memory systems and the like |
US20210200695A1 (en) * | 2019-12-27 | 2021-07-01 | Advanced Micro Devices, Inc. | Staging memory access requests |
US12056065B2 (en) * | 2020-03-13 | 2024-08-06 | Altera Corporation | Orthogonal multi-phase scheduling circuitry |
US11222685B2 (en) * | 2020-05-15 | 2022-01-11 | Advanced Micro Devices, Inc. | Refresh management for DRAM |
US11625352B2 (en) * | 2020-06-12 | 2023-04-11 | Advanced Micro Devices, Inc. | DRAM command streak management |
CN111984387B (en) * | 2020-08-26 | 2024-06-25 | 上海兆芯集成电路股份有限公司 | Method and processor for scheduling instructions in issue queues |
CN112466361B (en) * | 2020-11-25 | 2023-11-21 | 海光信息技术股份有限公司 | A DIMM data initialization method, device, system and equipment |
US11379388B1 (en) * | 2021-03-31 | 2022-07-05 | Advanced Micro Devices, Inc. | Credit scheme for multi-queue memory controllers |
US11687281B2 (en) * | 2021-03-31 | 2023-06-27 | Advanced Micro Devices, Inc. | DRAM command streak efficiency management |
US11995008B2 (en) * | 2021-06-22 | 2024-05-28 | Advanced Micro Devices, Inc. | Memory controller with hybrid DRAM/persistent memory channel arbitration |
US11755246B2 (en) * | 2021-06-24 | 2023-09-12 | Advanced Micro Devices, Inc. | Efficient rank switching in multi-rank memory controller |
US12073114B2 (en) * | 2021-09-30 | 2024-08-27 | Advanced Micro Devices, Inc. | Stacked command queue |
US12117945B2 (en) | 2022-06-24 | 2024-10-15 | Advanced Micro Devices, Inc. | Memory controller with pseudo-channel support |
US12154657B2 (en) * | 2022-06-29 | 2024-11-26 | Advanced Micro Devices, Inc. | Channel and sub-channel throttling for memory controllers |
US20240078017A1 (en) * | 2022-09-01 | 2024-03-07 | Advanced Micro Devices, Inc. | Memory controller and near-memory support for sparse accesses |
US12079144B1 (en) | 2022-09-21 | 2024-09-03 | Apple Inc. | Arbitration sub-queues for a memory circuit |
CN115632665B (en) * | 2022-12-20 | 2023-07-14 | 苏州浪潮智能科技有限公司 | Storage verification system and server |
CN116974963B (en) * | 2023-09-25 | 2023-12-15 | 上海云豹创芯智能科技有限公司 | Device for accessing memory, method, chip and storage medium thereof |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030005253A1 (en) * | 2001-06-29 | 2003-01-02 | Ming-Hao Liao | Method for adaptive arbitration of requests for memory access in a multi-stage pipeline engine |
US20070294470A1 (en) * | 2006-06-14 | 2007-12-20 | Nvidia Corporation | Memory interface with independent arbitration of precharge, activate, and read/write |
US20090055566A1 (en) * | 2007-08-22 | 2009-02-26 | Infineon Technologies Ag | Arbitration |
US20100318750A1 (en) * | 2009-06-16 | 2010-12-16 | Nvidia Corporation | Method and system for scheduling memory requests |
US20110276727A1 (en) * | 2010-05-05 | 2011-11-10 | Arntzen Eskild T | Quantum burst arbiter and memory controller |
US8271746B1 (en) * | 2006-11-03 | 2012-09-18 | Nvidia Corporation | Tiering of linear clients |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6138197A (en) * | 1998-09-17 | 2000-10-24 | Sun Microsystems, Inc. | Apparatus and method for limit-based arbitration scheme |
US6295586B1 (en) | 1998-12-04 | 2001-09-25 | Advanced Micro Devices, Inc. | Queue based memory controller |
US7426621B2 (en) | 2005-12-09 | 2008-09-16 | Advanced Micro Devices, Inc. | Memory access request arbitration |
US8838853B2 (en) * | 2010-01-18 | 2014-09-16 | Marvell International Ltd. | Access buffer |
US8615629B2 (en) | 2010-01-18 | 2013-12-24 | Marvell International Ltd. | Access scheduler |
US8977819B2 (en) | 2010-09-21 | 2015-03-10 | Texas Instruments Incorporated | Prefetch stream filter with FIFO allocation and stream direction prediction |
US9911477B1 (en) * | 2014-04-18 | 2018-03-06 | Altera Corporation | Memory controller architecture with improved memory scheduling efficiency |
US9697118B1 (en) * | 2015-12-09 | 2017-07-04 | Nxp Usa, Inc. | Memory controller with interleaving and arbitration scheme |
-
2016
- 2016-07-15 US US15/211,815 patent/US10684969B2/en active Active
- 2016-09-22 JP JP2018524749A patent/JP6840145B2/en active Active
- 2016-09-22 WO PCT/US2016/053131 patent/WO2018013157A1/en active Application Filing
- 2016-09-22 KR KR1020187007540A patent/KR102442078B1/en active IP Right Grant
- 2016-09-22 CN CN201680048862.9A patent/CN107924375B/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030005253A1 (en) * | 2001-06-29 | 2003-01-02 | Ming-Hao Liao | Method for adaptive arbitration of requests for memory access in a multi-stage pipeline engine |
US20070294470A1 (en) * | 2006-06-14 | 2007-12-20 | Nvidia Corporation | Memory interface with independent arbitration of precharge, activate, and read/write |
US8271746B1 (en) * | 2006-11-03 | 2012-09-18 | Nvidia Corporation | Tiering of linear clients |
US20090055566A1 (en) * | 2007-08-22 | 2009-02-26 | Infineon Technologies Ag | Arbitration |
US20100318750A1 (en) * | 2009-06-16 | 2010-12-16 | Nvidia Corporation | Method and system for scheduling memory requests |
US20110276727A1 (en) * | 2010-05-05 | 2011-11-10 | Arntzen Eskild T | Quantum burst arbiter and memory controller |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7521132B2 (en) | 2021-03-31 | 2024-07-23 | アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド | Write bank group mask during arbitration |
Also Published As
Publication number | Publication date |
---|---|
US20180018291A1 (en) | 2018-01-18 |
JP6840145B2 (en) | 2021-03-10 |
KR20190022428A (en) | 2019-03-06 |
CN107924375A (en) | 2018-04-17 |
CN107924375B (en) | 2023-08-08 |
KR102442078B1 (en) | 2022-09-08 |
WO2018013157A1 (en) | 2018-01-18 |
US10684969B2 (en) | 2020-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6840145B2 (en) | Command arbitration for fast memory interface | |
JP6761873B2 (en) | Self-refresh state machine MOP array | |
KR102728014B1 (en) | Refresh method in memory controller | |
CN109564556B (en) | Memory controller arbiter with stripe and read/write transaction management | |
JP6761870B2 (en) | Low power memory throttling | |
JP7521132B2 (en) | Write bank group mask during arbitration | |
JP7506277B1 (en) | Efficient rank switching in a multi-rank memory controller - Patents.com | |
JP2024528414A (en) | MEMORY CONTROLLER WITH HYBRID DRAM/PERSISTENT MEMORY CHANNEL ARBITRATION - Patent application | |
US11782640B2 (en) | Efficient and low latency memory access scheduling | |
KR20230004912A (en) | Efficient memory bus management | |
KR20230023014A (en) | DRAM command stream management | |
EP3270294B1 (en) | Command arbitration for high-speed memory interfaces | |
JP7521133B2 (en) | DRAM command streak efficiency management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181030 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190611 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190924 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190924 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190924 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201030 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6840145 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |