Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
28
Shadery.ZaawansowaneprogramowaniewGLSL
Tabela2.3.WydajnośćodczytudanychzposzczególnychregionówpamięciGPU4
RejestryGPR
LokalnaLDS
Stałazdostępem:
bezpośrednim
indeksowanymspójnym
indeksowanymlosowym
PodręcznaL1Cache
PodręcznaL2Cache
Globalna
Rodzajpamięci
Przepustowośćcząst-
kowa[bajt/cykl4/CU]
~0.14
~0.14
~0.4
12
8
4
4
1
dempamięciglobalnej
Wzrostprzepustowo-
ścicząstkowejwzglę-
2.8x
86x
57x
28x
28x
1x
7x
1x
mulowanadlacałego
Przepustowośćsku-
GPU[GB/s]
22733
3789
1894
474
710
264
określająprzepustowośćcząstkowądlapojedynczegomultiprocesoraorazskumu-
lowanądlacałegoGPU.Tegotypuinformacjesąspecycznedanejarchitektury
orazmodeluGPU,dlategowszystkieprzedstawionewartościmającharakterczysto
poglądowy.ZestawieniedanychdotyczytylkoukładugracznegoAMDRadeon
HD7970,zostałosporządzonenapodstawie[3].
4NajedencyklobliczeniowywarchitekturzeukładugracznegoAMDRadeonHD7970,
składająsię4taktyzegaragłównegoGPU.