Treść książki
Przejdź do opcji czytnikaPrzejdź do nawigacjiPrzejdź do informacjiPrzejdź do stopki
2.ZrozumiećGPU
17
shadermodel)itowłaśniedziękiniemumożliwestałosięzastosowanieukładu
graficznegodoGPGPU.
Uogólnionymodelwykonawczyprocesoragraficznego
Jakjużwspomnieliśmy,GPUniejestprzystosowanedoindywidualnegozarzą-
dzaniapracąpojedynczychjednostekwykonawczych,dlategowykonywaniesha-
derówodbywasięwnimwgrupach.Istniejetutajkilkapoziomówpodziału,
któreponadtomożnaskategoryzowaćnasprzętowe(fizyczne)isoftwareowe.So-
ftwareowepoziomypodziałuopiszemyprzyokazjiopisushaderaobliczeniowego
wrozdziale8.Tutajskupimysięnatomiastnawarstwiesprzętowej,przedstawimy
jejorganizacjęorazwszystkieelementyodpowiedzialnezajejfunkcjonowanie.
Opiszemyblokifizyczne,którezajmująsięprzetwarzaniempisanychprzeznas
shaderów,anastępnieprzejdziemyodtychbardziejogólnychdopojedynczych
elementówobliczeniowych.Zewzględunadośćdużeróżnicemiędzyarchitektu-
ramiukładówGPUróżnychproducentów,poniższyopisbędziejedyniepewnym
przybliżeniemfaktycznegostanu.
Najwięcejmiejscawewnątrzprocesoragraficznegozajmująblokinoszącena-
zwęmultiprocesorów(Nvidia–streamingmultiprocesor,AMD–computeunit).Ich
bardzouproszczonąwersjęprzedstawiononarysunku2.2.Sątoodseparowane
względemsiebieorazsamowystarczalnebloki,grupującewłaściwejednostkiprze-
twarzające.Samowystarczalneztegowzględu,żemożnajetraktowaćjakosobne
moduły,którenaetapieprodukcjiukładugraficznegomożnazłatwościądodawać
lubusuwać.Ichliczbajestjednymzważniejszychczynnikówwydajnościowych,
wdanejseriikartgraficznych(zakładająctąsamąarchitekturę)–droższemodele
mająichwięcej,atańszemniej.Wewnętrzutakiegomultiprocesoraznajdująsię
właściwejednostkiobliczeniowe(inaczej:rdzenie,ang.cores,ALU,ang.thread
processors).Towłaśnienanichsąwykonywaneinstrukcjeprogramu.
ALU
ALU
CTX
CTX
6terowanLeprzepływem
JednostkLwykonawcze
Kontekstwykonawczy
PamLęÊpodręcznaL1
ALU
ALU
instrukcji
CTX
CTX
ALU
ALU
CTX
CTX
ALU
ALU
Rysunek2.2.Wysokouogólnionyschematkonstrukcjipojedynczegomultiprocesora
wchodzącegowskładGPU