Treść książki
Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
28
Shadery.ZaawansowaneprogramowaniewGLSL
Tabela2.3.WydajnośćodczytudanychzposzczególnychregionówpamięciGPU4
RejestryGPR
LokalnaLDS
Stałazdostępem:
–bezpośrednim
–indeksowanymspójnym
–indeksowanymlosowym
PodręcznaL1Cache
PodręcznaL2Cache
Globalna
Rodzajpamięci
Przepustowośćcząst-
kowa[bajt/cykl4/CU]
~0.14
~0.14
~0.4
12
8
4
4
1
dempamięciglobalnej
Wzrostprzepustowo-
ścicząstkowejwzglę-
2.8x
86x
57x
28x
28x
1x
7x
1x
mulowanadlacałego
Przepustowośćsku-
GPU[GB/s]
22733
3789
1894
474
710
264
określająprzepustowośćcząstkowądlapojedynczegomultiprocesoraorazskumu-
lowanądlacałegoGPU.Tegotypuinformacjesąspecyficznedanejarchitektury
orazmodeluGPU,dlategowszystkieprzedstawionewartościmającharakterczysto
poglądowy.ZestawieniedanychdotyczytylkoukładugraficznegoAMDRadeon
HD7970,zostałosporządzonenapodstawie[3].
4NajedencyklobliczeniowywarchitekturzeukładugraficznegoAMDRadeonHD7970,
składająsię4taktyzegaragłównegoGPU.