ZHCAEL7B July 2022 – December 2024 AM623 , AM625
STREAM 是測量數(shù)據(jù)存儲器系統(tǒng)性能的微基準(zhǔn)測試,無需重復(fù)使用任何數(shù)據(jù)。STREAM 旨在不命中高速緩存,執(zhí)行數(shù)據(jù)預(yù)取和推測性存取。STREAM 使用雙精度浮點(64 位),但在大多數(shù)現(xiàn)代處理器中,存儲器訪問是瓶頸。四個單項分?jǐn)?shù)包括 copy(復(fù)制)、scale(乘常數(shù))、add(數(shù)字相加)及 triad(乘法累加)。對于帶寬,每讀取一個字節(jié)計數(shù)為 1,每寫入一個字節(jié)計數(shù)為 1,得到的分?jǐn)?shù)是 LMBench 帶寬的兩倍。表 3-3 展示了相對于理論線速測得的帶寬和效率。使用的線速是 DDR MT/s 與寬度的乘積。為了獲得總體最大吞吐量,使用命令 stream -M 16M -P 4-N 10,這意味著兩個并行線程和 10 次迭代。
DDR4-1600MT/s-16 位帶寬 | DDR4-1600MT/s-16 位效率 | |
---|---|---|
copy | 2448MB/s | 77% |
scale | 2372MB/s | 74% |
add | 2491MB/s | 78% |
triad | 2493MB/s | 78% |