Treść książki

Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
2.ZrozumiećGPU
17
shadermodel)itowłaśniedziękiniemumożliwestałosięzastosowanieukładu
gracznegodoGPGPU.
Uogólnionymodelwykonawczyprocesoragracznego
Jakjużwspomnieliśmy,GPUniejestprzystosowanedoindywidualnegozarzą-
dzaniapracąpojedynczychjednostekwykonawczych,dlategowykonywaniesha-
derówodbywasięwnimwgrupach.Istniejetutajkilkapoziomówpodziału,
któreponadtomożnaskategoryzowaćnasprzętowe(zyczne)isoftwareowe.So-
ftwareowepoziomypodziałuopiszemyprzyokazjiopisushaderaobliczeniowego
wrozdziale8.Tutajskupimysięnatomiastnawarstwiesprzętowej,przedstawimy
jejorganizacjęorazwszystkieelementyodpowiedzialnezajejfunkcjonowanie.
Opiszemyblokizyczne,którezajmująsięprzetwarzaniempisanychprzeznas
shaderów,anastępnieprzejdziemyodtychbardziejogólnychdopojedynczych
elementówobliczeniowych.Zewzględunadośćdużeżnicemiędzyarchitektu-
ramiukładówGPUżnychproducentów,poniższyopisbędziejedyniepewnym
przybliżeniemfaktycznegostanu.
Najwięcejmiejscawewnątrzprocesoragracznegozajmująblokinoszącena-
zwęmultiprocesorów(Nvidiastreamingmultiprocesor,AMDcomputeunit).Ich
bardzouproszczonąwersjęprzedstawiononarysunku2.2.Sątoodseparowane
względemsiebieorazsamowystarczalnebloki,grupującewłaściwejednostkiprze-
twarzające.Samowystarczalneztegowzględu,żemożnajetraktowaćjakosobne
moduły,którenaetapieprodukcjiukładugracznegomożnazłatwościądodawać
lubusuwać.Ichliczbajestjednymzważniejszychczynnikówwydajnościowych,
wdanejseriikartgracznych(zakładająctąsamąarchitekturę)droższemodele
mająichwięcej,atańszemniej.Wewnętrzutakiegomultiprocesoraznajdująsię
właściwejednostkiobliczeniowe(inaczej:rdzenie,ang.cores,ALU,ang.thread
processors).Towłaśnienanichsąwykonywaneinstrukcjeprogramu.
ALU
ALU
CTX
CTX
6terowanLeprzepływem
JednostkLwykonawcze
Kontekstwykonawczy
PamLęÊpodręcznaL1
ALU
ALU
instrukcji
CTX
CTX
ALU
ALU
CTX
CTX
ALU
ALU
Rysunek2.2.Wysokouogólnionyschematkonstrukcjipojedynczegomultiprocesora
wchodzącegowskładGPU