Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
2.ZrozumiećGPU
23
architekturyGPU.Jednymzdostępnychrozwiązańjesttymczasoweumieszczenie
wpamięciglobalnejnadmiernejczęścidanych,araziepotrzeby,ichpodmiana
zdanymiznajdującymisięaktualniewrejestrach.Odbywasiętojednakkosztem
wydajnościobliczeniowej.Innymczęstostosowanymrozwiązaniemjestograni-
czeniecałkowitejliczbyaktywnychblokówwykonawczych,wtakisposób,aby
każdyznichotrzymałwymaganąliczbęrejestrów.Takierozwiązaniezmniejsza
wydajnośćobliczeniowąGPU,oczympisaliśmyprzyokazjiprzełączaniakontek-
stów.Pamięćprywatnajestulokowananajbliżejrdzeniwykonawczych,cosprawia,
żecharakteryzujesięwysokąprzepustowościąorazbardzoniskimiopóźnieniami
wdostępiedodanych.
Pamięćlokalnawspółdzielona
PamięćlokalnajestregionempamięciGPU,indywidualnymdlakażdegomulti-
procesora.Jejzawartośćjestdostępnadlawszystkichjednostekwykonawczych,
należącychdojednegomultiprocesora.Znajdujesięonazregułybezpośrednio,
wukładziegracznym,stosunkowobliskozycznychrdzeni.Dziękitemu,jej
przepustowośćjestznaczniewiększaniżprzepustowośćpamięciglobalnej(prze-
pustowośćcząstkowadostępnadlajednegomultiprocesora),aniskieopóźnie-
niawdostępiedodanychsprawiają,żeoperacjewykonywanezjejudziałemsą
niemalnatychmiastowe.Jestonajednakniecowolniejszaodpamięciprywatnej.
Osiągnięcietakdobrejcharakterystyki,jestmożliwedziękiodpowiedniejkonstruk-
cjipamięciorazmetodziedostępudodanych,zarównodlazwykłychoperacji
(odczyt,modykacja,zapis),wykonywanychzpoziomumultiprocesora,jakialo-
kowaniadanychprzezinnemechanizmyGPU.
Pamięćwspółdzielonaskładasięzsegmentów,którychliczbajestdopasowana
doliczbyjednostekwykonawczych,dostępnychwpojedynczymmultiprocesorze.
Segmentymajądużąliczbękomórekostałymrozmiarze32bitów,copozwala
naprzechowywaniewniejsporejilościdanych.Wszystkiewątki,uruchomione
wramachblokuwykonawczego,mająswobodnydostępdodowolnejkomórki,
WątekwykonawczyO
Wątekwykonawczy1
Wątekwykonawczy2
Wątekwykonawczy3
Wątekwykonawczy1
|||
PamLęÊOokaOnawspółdzLeOona
O
1
2
3
1
1+1
1+2
1+3
1+4
21
...
...
...
...
|||
...
BankO
Bank1
Bank2
Bank3
Bank1
Rysunek2.6.Organizacjalokalnejpamięciwspółdzielonej