CN112579555A - 一种在微体系结构层面表征区块链系统的方法和装置 - Google Patents
一种在微体系结构层面表征区块链系统的方法和装置 Download PDFInfo
- Publication number
- CN112579555A CN112579555A CN201910923005.4A CN201910923005A CN112579555A CN 112579555 A CN112579555 A CN 112579555A CN 201910923005 A CN201910923005 A CN 201910923005A CN 112579555 A CN112579555 A CN 112579555A
- Authority
- CN
- China
- Prior art keywords
- micro
- events
- architecture
- blockchain system
- performance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2205—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
- G06F11/2236—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test CPU or processors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供一种在微体系结构层面表征区块链系统的方法和装置。该方法包括:收集区块链系统运行基准测试程序时的微体系结构事件,所述微体系结构事件用于反映与微处理器架构交互的性能;基于所收集的微体系结构事件构建微体系结构事件和区块链系统性能之间的关联模型;利用机器学习算法确定所述关联模型的输入微体系结构事件对于区块链系统性能的相关程度,获得微体系结构事件的重要性排序结果。利用本发明的方法和装置能够从微体系结构层面对区块链系统进行表征,从而有助于选择适合的微处理器架构。
Description
技术领域
本发明涉及区块链技术领域,尤其涉及一种基于机器学习在微体系结 构层面表征区块链系统的方法和装置。
背景技术
近年来,区块链技术风靡全球,越来越多的公司与用户都开始使用区 块链应用。区块链作为一项颠覆性技术,正在引领全球新一轮技术变革和 产业变革,有望成为全球技术创新和模式创新的“策源地”,推动“信息 互联网”向“价值互联网”变迁。区块链作为一项前沿技术,需加强区块 链等新技术的创新、试验和应用。
在现有技术中,区块链系统遭受各种性能问题。区块链通常被誉为新 一代数据库系统,但这些系统仍远未取代传统数据处理工作负载中的当前 数据库系统。为了衡量区块链系统的性能,研究者需要使用合适的区块链 基准测试程序。目前最常用的区块链基准测试程序框架是Blockbench和 Hyperledger Caliper,它们均能从系统层面来对区块链系统进行性能评估。 研究者通过使用这两个区块链系统基准测试程序框架,在吞吐、延迟、可扩展性等方面来衡量当前区块链系统的性能。
然而,Blockbench和HyperledgerCaliper均只关注整体方面的性能指 标(如吞吐量、延迟等),却没有从微体系结构层面对区块链系统进行表 征,这将导致无法清楚区块链系统性能不佳的原因。此外,人们同样不知 道应该选择哪种现有的CPU微架构,或者如何设计CPU的微架构来更高 效地运行区块链系统。
发明内容
本发明的目的在于克服上述现有技术的缺陷,提供一种基于机器学习 在微体系结构层面表征区块链系统的方法和装置,通过对微体系结构事件 的重要性排序得出与区块链系统性能密切相关的事件,从而从微体系结构 层面对区块链系统进行表征。
根据本发明的第一方面,提供一种在微体系结构层面表征区块链系统 的方法。该方法包括以下步骤:
收集区块链系统运行基准测试程序时的微体系结构事件,所述微体系 结构事件用于反映与微处理器架构交互的性能;
基于所收集的微体系结构事件构建微体系结构事件和区块链系统性 能之间的关联模型;
利用机器学习算法确定所述关联模型的输入微体系结构事件对于区 块链系统性能的相关程度,获得微体系结构事件的重要性排序结果。
在一个实施例中,所述区块链系统性能是采用所收集的微体系结构事 件来表征的节点级性能。
在一个实施例中,所述区块链系统性能是运行基准测试程序时收集的 每周期指令数。
在一个实施例中,所述收集区块链系统运行基准测试程序时的微体系 结构事件包括:
每次运行区块链系统基准测试程序时收集多个微体系结构事件,其中 包括指令数instruction和周期数cycle,并将每次收集的结果表示为:
vi={IPCi,e1,e2,…,ek}
其中,IPCi是针对第i轮测试的每周期指令数,ek值表示第k个微体系 结构事件。
在一个实施例中,获得所述微体系结构事件的重要性排序包括:
将所述微体系结构事件和区块链系统性能之间的关联模型表示为:
IPC=pred(e1,e2,…en)
其中,ei是第i个微体系结构事件的值,n是输入微体系结构事件的总 数,输出IPC表示每周期的指令数;
利用机器学习算法量化关联模型中每个输入微体系结构事件对于输 出IPC的重要性。
在一个实施例中,所述机器学习算法是随机梯度增强回归树、随机森 林或梯度提升决策树。
在一个实施例中,基于所获得的微体系结构事件的重要性排序结果选 择或定制区块链系统所适用的CPU。
根据本发明的第二方面,提供一种在微体系结构层面表征区块链系统 的装置。该装置包括:
事件收集单元:其用于收集区块链系统运行基准测试程序时的微体系 结构事件,所述微体系结构事件反映与微处理器架构交互的性能;
模型构建单元:其用于基于所收集的微体系结构事件构建微体系结构 事件和区块链系统性能之间的关联模型;
排序单元:其用于利用机器学习算法确定所述关联模型的输入微体系 结构事件对于区块链系统性能的相关程度,获得微体系结构事件的重要性 排序结果。
在一个实施例中,所述区块链系统性能是运行基准测试程序时收集的 每周期指令数。
与现有技术相比,本发明的优点在于:通过收集区块链系统基准测试 程序在运行过程中的微体系结构事件,并对这些事件进行重要性排序得出 重要性排名高的事件,进而从微体系结构层面对区块链系统进行表征。通 过这种方式,能够清楚地显示区块链系统性能不佳的原因,以及帮助人们 选择合适的CPU微架构,或者设计合适的CPU的微架构与不同的区块链 系统相匹配,从而实现更高效地运行不同的区块链系统的目的。
附图说明
以下附图仅对本发明作示意性的说明和解释,并不用于限定本发明的 范围,其中:
图1是根据本发明一个实施例的在微体系结构层面表征区块链系统的 方法的流程图;
图2是根据本发明一个实施例的采集的微体系结构事件的数据关系的 示意图;
图3(a)至图3(c)是根据本发明一个实施例的区块链系统中微体 系结构事件的重要性排序的示意图。
具体实施方式
为了使本发明的目的、技术方案、设计方法及优点更加清楚明了,以 下结合附图通过具体实施例对本发明进一步详细说明。应当理解,此处所 描述的具体实施例仅用于解释本发明,并不用于限定本发明。
在本文示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例 性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的 值。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨 论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
根据本发明的一个实施例,提供一种在微体系结构层面表征区块链系 统的方法,该方法整体上包括两部分,一是收集区块链系统基准测试程序 在运行时的微体系结构事件,二是使用机器学习的算法对这些微体系结构 事件进行重要性排序,选出对于区块链系统性能相对更重要的事件进行分 析。
具体地,参见图1所示,本发明实施例的方法包括以下步骤:
步骤S110,收集区块链系统运行基准测试程序时的微体系结构事件。
在本文中,微体系结构事件是指反映与微体系架构(例如,CPU)交 互的性能指标。例如,微体系结构事件包括但不限于:BMMR,错误预测 的宏分支指令退役数量;BIOT,计算未执行分支指令的已退役数量;CA1P, 挂起L1数据缓存的循环数量;CAS1,由于L1数据缓存未加载而导致执 行停滞数量等。
现代处理器通常有4-8个性能计数器,当需要收集数百个微体系结构 事件时,有两种方法:(1)一个性能计数器收集一个事件,在本文中称之 为OCOE方法;(2)一个性能计数器收集多个微体系结构事件,在本文中 称为多路复用方法(MLPX)。OCOE方法更为准确,但是收集速度很慢。 MLPX方法收集速度很快但是准确度较低。本文第一次提出了在区块链微 体系结构层面对区块链系统性能进行表征的方法,优选地,选择准确度更 高OCOE方法,以验证方法的有效性。
例如,对于硬件配置中每个CPU均有6个性能计数器的情况,每次 运行区块链系统基准测试程序收集六个事件,其中指令数instruction和周 期数cycle这两个微体系结构事件在收集时总是存在的,用来计算得出每 个周期执行的指令数,表示为IPC(instruction per cycle),例如IPC是指 令数instruction与周期数的比,其余四个性能计数器分别替换地统计其他 微体系结构事件的值。
在一个实施例中,共收集了236个微体系结构事件的性能指标,可以 更加全面的从微体系结构层面来表征区块链系统。例如,将来自所有性能 计数器组的统计数据合成形成表形式,供后续处理,参见图2所示,其中, 对于每组性能计数器,均包括指令数instruction和周期数cycle,以及另外 的四个微体系结构事件(如e1至e4或e5至e8等)。具体地,“事件值(event values)”块之外的区域中填充0,据此得到一个稀疏矩阵,每一行是一个 向量,表示为:
vi={IPCi,e1,e2,…,ek,…,e234}
IPCi是对IPC第i轮进行分析,ek值为第k个微体系结构事件,该值取 决于基准测试程序运行的时间。对于每个vi,最多有四个事件是非零值的, 这是由于,使用OCOE的方法每次除了IPC只收集分析四个事件。
应理解的是,除了采用每个周期执行的指令数IPC来衡量区块链系统 中节点级性能之外,也可采用其他的性能指标,例如,每周期的错误指令 数、指令的平均执行时间等。
步骤S120,构建微体系结构事件和区块链系统性能之间的关联模型。
在本文中,以每周期指令数IPC作为节点级性能的可靠指标为例进行 介绍。IPC与节点性能密切相关,值越高表示性能越好。
在一个实施例中,构建微体系结构事件和区块链系统性能之间的关联 模型,以量化事件对IPC(每周期指令数)的重要性。将关联模型通用地 表示为:
IPC=pred(e1,e2,…en)
其中关联模型的输入ei是第i个微结构事件的值,n是输入的微结构事 件的总数,关联模型的输出是每周期指令数IPC。
步骤S130,利用机器学习算法获得关联模型的输入微体系结构事件对 于区块链系统性能重要性的排序结果。
在一个实施例中,使用机器学习算法获得微体系结构事件对于IPC密 切相关程度或称重要性,例如,采用集成学习算法中的随机梯度增强回归 树(SGBRT)来对所构建的关联模型进行训练。关键点在于SGBRT以阶 段方式组合了许多树模型,其中每个树模型都反映了性能的一部分,最终 的模型称为集合模型。通过构建关联模型(或称性能模型),可以利用该 模型来量化微体系结构事件及其交互的重要性。显然,更准确的性能模型 可以产生更好的事件重要性量化。为了使结果表现的更加直观,可以将事 件的重要性标准化,使得所有事件的重要性相加和为100%,每一个事件 的重要性百分比越高,则表明该事件对区块链系统性能的影响越大。
需要说明的是,除了采用随机梯度增强回归树之外,还可采用随机森 林、梯度提升决策树等其他机器学习算法来获得微体系结构事件的重要性 排序结果。
与上述方法相对应,本发明还提供一种在微体系结构层面表征区块链 系统的装置。该装置可以实现上述实施例的一个或多个方面。例如,该装 置包括:事件收集单元,其用于收集区块链系统运行基准测试程序时的微 体系结构事件,所述微体系结构事件反映与微处理器架构交互的性能;模 型构建单元,其用于基于所收集的微体系结构事件构建微体系结构事件和 区块链系统性能之间的关联模型;排序单元,其用于利用机器学习算法确定所述关联模型的输入微体系结构事件对于区块链系统性能的相关程度, 获得微体系结构事件的重要性排序结果。
在一个实际应用中,使用Blockbench收集了Ethereum和Hyperledger Fabric这两个区块链系统7个基准测试程序共11部分程序的数据(其中有 两个程序通过改变不同的输入数据集各收集了三部分程序),以及使用 Hyperledger Caliper收集了HyperledgerFabric和Hyperledger Sawtooth这两 个区块链系统6个基准测试程序共6部分程序的数据。因此共收集17个 程序的数据。使用本发明提供的重要性排序方法对这17个程序的微体系 结构事件进行排序,并根据排序中最重要的事件来表征不同的区块链系统。
进一步地,在获得微体系结构事件重要性排序结果之后,通过分析可 以找出区块链系统性能不佳的原因,并帮助人们针对不同的区块链系统选 择或者设计更适合的CPU来更高效的运行区块链系统。
为了验证本发明的可行性和效果,本发明实施例的机器学习算法均采 用Python来实现,实验方案主要为,通过对这17个区块链基准测试程序 的微体系结构事件的指标进行重要性排序,获取每个程序的相对重要性排 名,并通过这些排名靠前的微体系结构事件来分析不同区块链系统在微体 系结构上的特征,最后找出区块链系统性能不佳的原因,以及帮助人们选 择哪种现有的CPU微架构,或者如何设计CPU的微架构与不同的区块链 系统相匹配,从而更高效地运行不同的区块链系统。
具体地,图3(a)至图3(b)是17个区块链系统的重要性排序,由 于空间关系,只放了排名前十的事件,其中横坐标(events)是微体系结 构事件名的缩写,纵坐标(importance)是重要性排名的百分比,图3(a) 代表的是Ethereum的基准测试程序的名字,而图3(b)和图3(c)中E、F和S分别代表了该区块链基准测试程序属于Ethereum、Fabric和Sawtooth。
从图3(a)至图3(c)的实验结果可以得出以下两点:(1)与分支 相关的微体系结构事件是大多数基准测试中最重要的10个事件之一。例 如,代表错误预测的已退役宏分支指令的BMMR,对于17个测试基准测 试中的10个,位于10个最重要的事件列表中。此外,17个基准测试中 14个中最重要的10个事件包含与分支相关的事件。这表示区块链系统性 能不佳的原因可能和分支预测相关;(2)不同的区块链系统具有不同的微 体系结构事件重要性顺序。例如,Ethereum在指令长度解码器和L1数据 缓存丢失方面表现出更大的重要性;Fabric在L2缓存访问、ITLB丢失、 指令解码队列导致的DTLB丢失等方面表现出更大的重要性;Sawtooth在 Uops分发和私有offcore请求队列占用中更重要。因此,可以根据这些不同区块链系统的表现,来选取已有合适的CPU,同时硬件设计人员也可以 根据不同区块链系统的特点设计定制的CPU。
应理解的是,本发明提供的在微体系结构层面表征区块链系统的方法 不仅可以在区块链系统中使用,也可以在其他系统例如大数据系统等中使 用,同样可以分析这些系统在微体系结构层面的表现。
相对于现有技术,本发明具有以下优势:
首先,现有的区块链基准测试程序均只关注整体方面的性能指标(如 吞吐量、延迟等),这将导致无法清楚区块链系统性能不佳的原因。因此, 人们不知道应该选择哪种现有的CPU微架构,或者如何设计CPU的微架 构来更高效地运行区块链系统。而本发明通过收集区块链系统基准测试程 序在运行过程中的微体系结构事件来从微体系结构层面对区块链系统进 行表征。通过分析微体系结构事件的重要性排序结果,可以清楚地显示区 块链系统性能不佳的原因,从而帮助人们选择适合的现有的CPU微架构, 或者设计CPU的微架构与不同的区块链系统相匹配。
其次,本发明基于机器学习来对微体系结构事件进行重要性排序,获 取对不同区块链系统相对更重要的事件,通过分析这些事件就能够了解区 块链系统性能不佳的原因,而不用对所有的微体系结构事件都进行分析, 节省了分析过程的时间,降低了分析过程的开销。同时,机器学习的训练 结果拥有极低的错误率(不超过2%),因此本发明能够获得更准确的微体 系结构事件的重要性排序结果。
综上所述,本发明提出的基于机器学习对区块链微体系结构事件进行 重要性排序的方法,能够以一种准确的方式获取对不同区块链系统及该区 块链系统在运行不同的任务时,对性能影响最重要的事件。利用本发明的 方法能够找出区块链系统性能不佳的原因,进而协助人们针对不同的区块 链系统选择或者设计更适合的CPU以更高效的运行区块链系统。
需要说明的是,虽然上文按照特定顺序描述了各个步骤,但是并不意 味着必须按照上述特定顺序来执行各个步骤,实际上,这些步骤中的一些 可以并发执行,甚至改变顺序,只要能够实现所需要的功能即可。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以 包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面 的计算机可读程序指令。
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令 的有形设备。计算机可读存储介质例如可以包括但不限于电存储设备、磁 存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意 合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括: 便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、 可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、 便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、 软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、 以及上述的任意合适的组合。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽 性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范 围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更 都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原 理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术 人员能理解本文披露的各实施例。
Claims (10)
1.一种在微体系结构层面表征区块链系统的方法,包括以下步骤:
收集区块链系统运行基准测试程序时的微体系结构事件,所述微体系结构事件用于反映与微处理器架构交互的性能;
基于所收集的微体系结构事件构建微体系结构事件和区块链系统性能之间的关联模型;
利用机器学习算法确定所述关联模型的输入微体系结构事件对于区块链系统性能的相关程度,获得微体系结构事件的重要性排序结果。
2.根据权利要求1所述的方法,其特征在于,所述区块链系统性能是采用所收集的微体系结构事件来表征的节点级性能。
3.根据权利要求2所述的方法,其特征在于,所述区块链系统性能是运行基准测试程序时收集的每周期指令数。
4.根据权利要求3所述的方法,其特征在于,所述收集区块链系统运行基准测试程序时的微体系结构事件包括:
每次运行区块链系统基准测试程序时收集多个微体系结构事件,其中包括指令数instruction和周期数cycle,并将每次收集的结果表示为:
vi={IPCi,e1,e2,…,ek}
其中,IPCi是针对第i轮测试的每周期指令数,ek值表示第k个微体系结构事件。
5.根据权利要求4所述的方法,其特征在于,获得所述微体系结构事件的重要性排序包括:
将所述微体系结构事件和区块链系统性能之间的关联模型表示为:
IPC=pred(e1,e2,…en)
其中,ei是第i个微体系结构事件的值,n是输入微体系结构事件的总数,输出IPC表示每周期的指令数;
利用机器学习算法量化关联模型中每个输入微体系结构事件对于输出IPC的重要性。
6.根据权利要求1所述的方法,其特征在于,所述机器学习算法是随机梯度增强回归树、随机森林或梯度提升决策树。
7.根据权利要求1所述的方法,其特征在于,基于所获得的微体系结构事件的重要性排序结果选择或定制区块链系统所适用的CPU。
8.一种在微体系结构层面表征区块链系统的装置,其特征在于,包括:
事件收集单元:其用于收集区块链系统运行基准测试程序时的微体系结构事件,所述微体系结构事件反映与微处理器架构交互的性能;
模型构建单元:其用于基于所收集的微体系结构事件构建微体系结构事件和区块链系统性能之间的关联模型;
排序单元:其用于利用机器学习算法确定所述关联模型的输入微体系结构事件对于区块链系统性能的相关程度,获得微体系结构事件的重要性排序结果。
9.根据权利要求8所述的装置,其特征在于,所述区块链系统性能是运行基准测试程序时收集的每周期指令数。
10.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现根据权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910923005.4A CN112579555A (zh) | 2019-09-27 | 2019-09-27 | 一种在微体系结构层面表征区块链系统的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910923005.4A CN112579555A (zh) | 2019-09-27 | 2019-09-27 | 一种在微体系结构层面表征区块链系统的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112579555A true CN112579555A (zh) | 2021-03-30 |
Family
ID=75109671
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910923005.4A Pending CN112579555A (zh) | 2019-09-27 | 2019-09-27 | 一种在微体系结构层面表征区块链系统的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112579555A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114253821A (zh) * | 2022-03-01 | 2022-03-29 | 西安芯瞳半导体技术有限公司 | 一种分析gpu性能的方法、装置及计算机存储介质 |
-
2019
- 2019-09-27 CN CN201910923005.4A patent/CN112579555A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114253821A (zh) * | 2022-03-01 | 2022-03-29 | 西安芯瞳半导体技术有限公司 | 一种分析gpu性能的方法、装置及计算机存储介质 |
CN114253821B (zh) * | 2022-03-01 | 2022-05-27 | 西安芯瞳半导体技术有限公司 | 一种分析gpu性能的方法、装置及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jia et al. | Characterizing data analysis workloads in data centers | |
Duan et al. | Versatile prediction and fast estimation of architectural vulnerability factor from processor performance metrics | |
Azimi et al. | Online performance analysis by statistical sampling of microprocessor performance counters | |
Tsai et al. | Testing the scalability of SaaS applications | |
Genbrugge et al. | Chip multiprocessor design space exploration through statistical simulation | |
Annamalai et al. | An opportunistic prediction-based thread scheduling to maximize throughput/watt in AMPs | |
Bulpin et al. | Hyper-Threading Aware Process Scheduling Heuristics. | |
Jia et al. | Understanding big data analytics workloads on modern processors | |
Srinivas et al. | IBM POWER7 performance modeling, verification, and evaluation | |
Sharkawi et al. | Performance projection of hpc applications using spec cfp2006 benchmarks | |
Hassani et al. | LiveSim: Going live with microarchitecture simulation | |
Van Craeynest et al. | The multi-program performance model: debunking current practice in multi-core simulation | |
Akram et al. | Validation of the gem5 simulator for x86 architectures | |
Jongerius et al. | Analytic processor model for fast design-space exploration | |
US20150248295A1 (en) | Numerical stall analysis of cpu performance | |
CN112579555A (zh) | 一种在微体系结构层面表征区块链系统的方法和装置 | |
Hart et al. | Predicting memcached throughput using simulation and modeling. | |
Todi | Speclite: using representative samples to reduce spec cpu2000 workload | |
Duan et al. | Predicting architectural vulnerability on multithreaded processors under resource contention and sharing | |
Srinivasan et al. | Performance modeling using monte carlo simulation | |
Xiong et al. | SZTS: A novel big data transportation system benchmark suite | |
Cook et al. | A statistical performance model of the opteron processor | |
Cammarota et al. | Pruning hardware evaluation space via correlation-driven application similarity analysis | |
Samara et al. | The case for domain-specialized branch predictors for graph-processing | |
Vera et al. | A novel evaluation methodology to obtain fair measurements in multithreaded architectures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |