Inti segwa l-għajdut u injora l-hype; inti stenniet kummenti u ħares lejn il-metriċi kollha. Fl-aħħarnett, int għamilt id-dollari tiegħek u ħriġt 'il bogħod b'waħda mill-aħħar karti grafiċi minn AMD jew Nvidia. Fost dawn, proċessur tal-grafika kbir mimli bil-biljuni ta 'transistors jimxi b'veloċitajiet tal-arloġġ li kienu inkonċepibbli għaxar snin ilu.

Int tassew kuntent max-xiri tiegħek u l-logħob ma deherx u lagħab aħjar. Imma tista 'tkun mintix x'inhuma eżattament il-poteri ta' Radeon il-ġdid tiegħek. 5700 RX u kemm hu differenti f 'ċippa GeForce RTX.

Merħba għall-arkitettura u l-paragun tal-karatteristiċi ta 'AMD u Nvidia: Navi vs Turing's l-aħħar GPUs.

Anatomija Moderna tal-GPU

Qabel ma nibdew inqassmu strutturi u sistemi komuni ta 'ċippa, ejja nagħtu ħarsa lejn il-forma bażika li ssegwi l-GPUs moderni kollha. Għall-parti l-kbira, dawn il-proċessuri huma kalkolaturi ta 'punti varjabbli (FP); fi kliem ieħor, iwettqu operazzjonijiet tal-matematika fuq valuri deċimali / frazzjonali. Allura mill-inqas GPU jeħtieġ li jkollha unità loġika ddedikata għal dawn il-kompiti, u dawn normalment FP ALUs (unitajiet tal-loġika aritmetika b'punti varjabbli) jew FPUs fil-qosor. Mhux il-komputazzjonijiet kollha li jagħmlu l-GPU huma fil-valuri tad-dejta FP, u għalhekk se jkun hemm ukoll ALU għall-integer (numru sħiħ) tista 'tkun l-istess unità li tieħu ħsieb operazzjonijiet matematiċi jew iż-żewġ tipi ta' dejta.




Issa dawn l-unitajiet loġiċi se jkollhom bżonn xi ħaġa biex jorganizzawhom billi jiddekowdjaw u jorganizzawhom biex iżommuhom okkupati, u dan se jkun fil-forma ta 'mill-inqas grupp speċjali ta' unità loġika. B'differenza mill-ALUs, ma jistgħux jiġu pprogrammati mill-utent aħħari; minflok, il-bejjiegħ tal-hardware se jiżgura li dan il-proċess huwa kompletament immaniġġjat mill-GPU u s-sewwieqa tiegħu.




Għandu jkun hemm ukoll xi tip ta 'struttura tal-memorja biex tinħażen dawn l-istruzzjonijiet u d-dejta li teħtieġ tiġi pproċessata. Fil-livell l-aktar sempliċi tagħha, se jkun f'żewġ forom: cache u punt memorja lokali. L-ewwel waħda tkun inkorporata fil-GPU u MISTĦIJA. Dan it-tip ta 'memorja huwa mgħaġġel, iżda jieħu parti relattivament kbira mit-tqassim tal-proċessur. Memorja lokali DRAMAHuwa kemmxejn aktar bil-mod minn SRAM u normalment ma jitqiegħedx fuq il-GPU. Memorja lokali fuq ħafna karti grafiċi li naraw illum GDDR Moduli DRAM.

Fl-aħħarnett, jinkludi kompiti ta 'issettjar addizzjonali bħal ħolqien ta' grafika 3D, ħolqien ta 'trijangoli minn kantunieri, rasterizzazzjoni ta' qafas 3D, teħid ta 'kampjuni u taħlit ta' nisġa. Bħal unitajiet ta 'struzzjoni u kontroll, dawn ukoll Funzjoni kostanti Fin-natura. Dak li jagħmlu u kif jaħdmu huwa kompletament trasparenti għall-utenti li jipprogrammaw u jużaw il-GPU.




Ejja npoġġu dan flimkien u nagħmlu GPU:




Il-blokka oranġjo hija l-unità li tipproċessa nisġa bl-użu ta 'dak li jissejjaħ unitajiet tal-immappjar tan-nisġa (TMU'lar) - TA nisġa indirizzata volum - joħloq postijiet tal-memorja għall-cache u memorja lokali li tuża - u TF ma ġġibx nisġa jiġbor il-valuri tan-nisġa mill-memorja u jgħaqqadhom flimkien. Illum, it-TMUs huma pjuttost l-istess madwar il-bejjiegħa kollha minħabba li jistgħu jimmaniġġjaw, jieħdu kampjuni, u ħawwad valuri ta 'tessut multipli għal kull ċiklu tal-arloġġ tal-GPU.




Il-blokka hawn taħt tikteb il-valuri tal-kulur tal-pixel fil-qafas, tagħtihom kampjuni lura (PO) u taħlitiet (PB); dan il-blokk iwettaq ukoll operazzjonijiet użati meta jiġi anti-aliasing applikat. L-isem ta 'din il-blokka: tirrendi unità tal-ħruġ or toħloq backend (ROP / RB fil-qosor). Bħal TMU, issa qed isiru pjuttost standard, kull wieħed jimmaniġġja bil-kumdità ftit pixel kull ċiklu tal-arloġġ.

Madankollu, il-GPU bażiku tagħna kien ikun terribbli anke mill-istandards 13-il sena ilu. Għaliex?

Hemm biss FPU, TMU u ROP. Fl-2006, proċessuri tal-grafika bħall-GeForce 8800 GTX ta 'Nvidia kellhom 128, 32 u 24 rispettivament. Mela ejja nibdew nagħmlu xi ħaġa dwar dan ....




Bħal kull produttur tal-proċessur tajjeb, aħna aġġornajna l-GPU billi żiedu ftit aktar unitajiet. Dan ifisser li ċ-ċippa tista 'tipproċessa aktar struzzjonijiet fl-istess ħin. Biex tgħin b'dan, żidna ftit aktar kaxex, iżda din id-darba dritt ħdejn l-unitajiet tal-loġika. Iktar ma tkun qrib il-cache ma 'l-istruttura ta' kalkulatur, iktar malajr tista 'tkun inizjalizzata fit-tranżazzjonijiet assenjati lilha.

Il-problema bid-disinn il-ġdid tagħna hija li kontrollur wieħed biss għadu disponibbli biex jimmaniġġa l-ALUs żejda tagħna. Ikun aħjar jekk ikollna aktar blokok ta 'unitajiet, kollha ġestiti mill-kontrolluri separati tagħhom stess, għax dan ifisser li nistgħu nwettqu operazzjonijiet differenti ħafna fl-istess ħin.

Issa dan huwa iktar! Blokki ALU separati ppakkjati bit-TMUs u l-ROP tagħhom stess u appoġġjati minn flieli tal-cache veloċi fit-togħma. Huwa għadu biss wieħed minn kollox, iżda l-istruttura bażika mhix miljun mili mill-proċessur tal-grafika li naraw fuq il-kompjuters u l-consoles tal-lum.

Navi ve Turing: Godzilla GPU'ları

Issa li ddefinixxna t-tqassim bażiku ta 'ċippa grafika, għalkemm ftit imkabbra u pproċessata biex tenfasizza diversi strutturi, Navi vs. Nibdew il-paragun Turing tagħna.

Fuq ix-xellug hemm l-aħħar proċessur AMD. Id-disinn ġenerali taċ-ċippa jissejjaħ Navi (xi wħud jissejħu Navi 10) u l-arkitettura tal-grafika tissejjaħ RDNA. Maġenbu, fuq il-lemin, hemm il-proċessur TU102 full-size ta 'Nvidia bl-aktar arkitettura ta' Turing. Huwa importanti li wieħed jinnota li dawn l-immaġini mhumiex skalati: l-erja tan-Navi die hija 251 mm2, waqt li t-TU102 huwa 752 mm2. Il-proċessur Nvidia huwa kbir, iżda mhux 8 darbiet akbar minn dak li joffri AMD!

It-tnejn kolossali l-għadd ta 'transistors (10.3 kontra 18.6 biljun), iżda t-TU102 għandu medja ta' ~ 25 miljun transistor kull mm kwadru meta mqabbel ma '41 miljun ta' Navi kull mm kwadru.

Dan għaliex waqt li ż-żewġ ċipep huma manifatturati minn TSMC, huma prodotti f'nodi differenti tal-proċess: Nvidia's Turing hija fuq il-linja ta 'produzzjoni matura ta' 12 nm, waqt li AMD's Navi hija prodotta fl-għoqda ta '7 nm.

Ħarsa lejn l-immaġini tal-mudelli ma tgħidilna ħafna dwar l-arkitetturi, għalhekk agħti ħarsa lejn id-dijagrammi tal-blokki tal-GPU prodotti miż-żewġ kumpaniji.

Id-dijagrammi mhumiex rappreżentazzjoni 100% realistika tat-taqsimiet attwali, imma jekk iddawwarhom 90 grad, id-diversi blokki u strixxa ċentrali li jidhru fuq it-tnejn jistgħu jiġu definiti. Biex nibdew, nistgħu naraw li ż-żewġ GPUs għandhom struttura ġenerali bħal tagħna (għalkemm iktar minn kull ħaġa oħra!).

Iż-żewġ disinni jsegwu approċċ f’saffi ta ’kif kollox huwa rranġat u raggruppat - biex tibda tuża Navi, il-GPU tikkonsisti f’2 blokki li l-AMD qed tfittex. Muturi ta 'Shader (SE), kull wieħed minnhom jissejjaħ 2 blokki mhux sinkroniku Magni tal-Kompjuter (ACE). Kull wieħed minn dawn fih 5 blokki fit-titlu. Processors tal-Grupp ta ’Ħidma (WGPs), li jikkonsisti f'2 Unitajiet tal-Ipproċessar tal-Informazzjoni (Oz)

Ismijiet u numri huma differenti għad-disinn ta 'Turing, iżda l-ġerarkija hija simili ħafna: 6 Raggruppamenti tal-Ipproċessar tal-Grafika (GPC), 6 kull wieħed Raggruppamenti għall-Ipproċessar tan-Nisġa (TPC), 2 kull wieħed Stream Multiprocessor Blokki (SM).

Jekk tara proċessur tal-grafika bħala fabbrika kbira fejn dipartimenti differenti jipproduċu prodotti differenti li jużaw l-istess materja prima, din l-organizzazzjoni tibda tagħmel sens. Il-Kap Eżekuttiv tal-fabbrika jibgħat id-dettalji operattivi kollha lin-negozju u mbagħad jaqsamha f'ħafna kompiti u ammonti ta 'xogħol. Wara aktar minn wieħed, indipendenti Il-produttività tal-forza tax-xogħol żdiedet fil-fabbrika. Mhuwiex differenti għall-GPUs u hawn hi ċ-ċavetta maġika iż-żmien.

Quddiem u Ċentru, Suldat - Żmien u Dispaċċ

Kif inħarsu lejn Eżerċizzji ta 'ħolqien ta' logħob 3DSibna li l-proċessur tal-grafika mhu xejn ħlief kalkulatur super veloċi billi jwettaq serje ta 'operazzjonijiet tal-matematika fuq miljuni ta' biċċiet tad-dejta. Navi u Turing huma kklassifikati kif ġej: Data Multipla ta 'Kmand Uniku Proċessuri (SIMD), iżda spjegazzjoni aħjar One Way Multi Ħajta (Sens)

Logħba 3D moderna tipproduċi mijiet ta 'ħjut, kultant eluf, peress li n-numru ta' vertiċi u pixel li jrendi huwa enormi. Sabiex ikun żgurat li l-operazzjonijiet kollha jsiru fi ftit mikrosekondi, huwa importanti li jkun hemm numru ta ’unitajiet loġiċi possibbli mingħajr ma jitwaqqaf kollox minħabba li d-dejta meħtieġa mhix fil-post it-tajjeb jew m’hemmx biżżejjed spazju ta’ riżorsi biex taħdem ġewwa.

Meta tajna ħarsa lejn kif taħdem l-għoti tal-logħob 3D, rajna li proċessur tal-grafika mhu xejn ħlief kalkulatur tassew mgħaġġel, u wettaqna diversi operazzjonijiet tal-matematika fuq miljuni ta 'dejta. Navi u Turing huma kklassifikati bħala proċessuri ta 'dejta multipli tal-kmand uniku (SIMD), iżda spjegazzjoni aħjar tkun il-Ħjut Multiple ta' Kmand Uniku (SIMT).

Navi u Turing jaħdmu bl-istess mod u għalhekk unità ċentrali tieħu l-ħjut kollha u mbagħad tibda tipprogramma u xxandarhom. Fiċ-ċippa AMD, dan ir-rwol Proċessur tal-Kmand tal-Grafika; Nvidia'da, GigaThread Motoru. Il-ħjut huma rranġati b'tali mod li dawk bl-istess struzzjonijiet jinġabru flimkien f'kollezzjoni ta '32 grupp.

AMD din il-ġabra mewġabilli Nvidia dan kurvatura. Għal Navi, Unità tal-Kompjuter tista 'tieħu ħsieb 2 mewġ (jew mewġa ta' 64 ħjut, iżda dan il-proċess jieħu darbtejn itwal) u Stream Multiprocessor fit-Turing jimxi b'4 warps. Fiż-żewġ disinni, il-mewġ / medd huwa indipendenti, jiġifieri l-oħrajn m'għandhomx għalfejn jintemmu qabel ma jibdew.

Sa dakinhar, mhuwiex daqshekk differenti bejn Navi u Turing - it-tnejn kienu ddisinjati biex jimmaniġġjaw ħjut multipli biex joħolqu u jikkalkulaw il-piż tax-xogħol. Għandna nħarsu lejn liema proċessuri għandhom ikunu dawn biex tara fejn iż-żewġ ġganti tal-GPU jisseparaw fid-disinn.

Differenza Eżekuttiva - RDNA u CUDA

Filwaqt li ħafna mit-terminoloġija użata tidher l-istess, AMD u Nvidia jieħdu approċċ pjuttost differenti għal unitajiet ta 'shader magħquda. Unitajiet ta 'eżekuzzjoni ta' Nvidia (CUDA żrieragħ) diġitali fin-natura - dan ifisser li unità twettaq operazzjoni matematika fuq komponent tad-dejta; B'differenza mill-unitajiet AMD (Proċessuri Nixxiegħa) naħdem fuqha vettori - operazzjoni fuq bosta komponenti tad-data. Hemm unità speċifika waħda biss għal operazzjonijiet skalari.

Qabel ma tagħti ħarsa aktar mill-qrib lejn l-unitajiet ta 'eżekuzzjoni, ejja neżaminaw il-modifiki ta' AMD stess. Għal 7 snin, il-karti tal-grafika Radeon segwew arkitettura msejħa Graphics Core Next (GCN). Kull ċippa ġdida rrevediet diversi aspetti tad-disinn, iżda dawn kienu kollha bażikament l-istess.

AMD ippreżentat storja qasira tal-arkitettura tal-GPU:

GCN kienet evoluzzjoni ta 'TeraScale, disinn li jippermetti li mewġ kbir jiġi pproċessat fl-istess ħin. Il-ħaġa ewlenija ma 'TeraScale kienet li ma kienx faċli ħafna kontra programmaturi u kien hemm bżonn ta' rutini speċifiċi ħafna biex tikseb l-aħjar. GCN irranġat dan u pprovdiet pjattaforma ferm iktar aċċessibbli.

Il-CUs f'Navi ġew riveduti b'mod sinifikanti minn GCN bħala parti mill-proċess ta 'titjib tal-AMD. Kull CU fih żewġ settijiet:

  • 32 SP (ALUs tal-vettur IEE754 FP32 u INT32)
  • 1 SFU
  • Skali 1 INT32 ALU
  • 1 unità tal-iskedar u tal-kunsinna

Minbarra dawn, kull CU fih 4 unitajiet tat-tessut. Hemm unitajiet oħra biex iwettqu operazzjonijiet ta 'qari / kitba ta' data mill-cache, iżda mhux murija fl-immaġni hawn taħt:

Meta mqabbel ma 'GCN, it-twaqqif ta' RDNA CU jista 'ma jidhirx ħafna differenti, imma dak kollu importanti hawnhekk huwa organizzat u organizzat b'dan il-mod. Biex jibdew, kull sett ta '32 SP għandu l-unità ta' struzzjoni ddedikata tiegħu stess, GCN kellu programm wieħed biss għal 4 settijiet ta '16 SP.

Din hija bidla importanti li tfisser li mewġa waħda ta '32 ħjut kull ċiklu tal-arloġġ tista 'titwassal lil kull sett SP. L-arkitettura RDNA tippermetti wkoll li l-unitajiet tal-vettur jipproċessaw mewġ ta '16-il ħjut b'żewġ darbiet il-veloċità u mewġ ta' 64 ħjut f'nofs, u għalhekk il-kodiċi miktub għall-karti grafiċi Radeon preċedenti għadu sostnut.

Dawn il-bidliet se jkunu popolari ħafna għall-iżviluppaturi tal-logħob.

Għal operazzjonijiet skalari, issa hemm żewġ unitajiet li jistgħu jimmaniġġjawhom; l-uniku tnaqqis fin-numru ta 'komponenti huwa fil-forma ta' SFUs - dawn huma Funzjoni speċjali unitajietiwettaq operazzjonijiet matematiċi speċifiċi ħafna, eż. trigonometriċi (sine, tanġenti), reċiproċi (1 maqsuma f'numru) u għeruq kwadri. L-RDNA għandu inqas minn dawn meta mqabbel ma 'GCN, iżda issa jistgħu joperaw fuq settijiet ta' data tad-doppju daqs ta 'qabel.

Dawn il-bidliet se jkunu popolari ħafna għall-iżviluppaturi tal-logħob. Kien hemm ħafna prestazzjoni potenzjali fuq karti grafiċi Radeon anzjani, iżda kien diffiċli ħafna biex isir. Issa AMD ħadet pass kbir lejn it-tnaqqis tal-latenza fl-istruzzjonijiet tal-ipproċessar u ż-żamma tal-karatteristiċi biex tiżgura l-kompatibilità b'lura għall-programmi kollha ddisinjati għall-arkitettura GCN.

Xi ngħidu dwar il-grafika professjonali jew is-suq tal-kompjuters? Dawn il-bidliet huma ta 'benefiċċju wkoll għalihom?

Ir-risposta qasira hija iva (probabbilment). Il-verżjoni attwali taċ-ċippa Navi misjuba bħalha tar-Radeon RX 5700 XT għandha inqas Proċessuri Stream mid-disinn Vega preċedenti, waqt li aħna marru aħjar Il-ġenerazzjoni ta 'qabel Radeon RX Vega 56 hija pjuttost faċli:

Uħud minn dan il-qligħ tal-prestazzjoni se jiġu mill-ogħla veloċità tal-arloġġ tar-RX 5700 XT mill-RX Vega 56 (u għalhekk jista 'jikteb aktar pixel kull sekonda għall-memorja lokali), iżda jonqos daqs 15% fl-ogħla rendiment sħiħ u punt flott; madankollu sibna li ċ-ċippa Navi marret 18% aħjar mill-Vega.

Ix-xjentisti li jmexxu programmi professjonali ta ’radd u algoritmi kumplessi mhumiex jinfaqgħu bi ftit rawnds ta’ Battlefield V fix-xogħol tagħhom (i.e., tista '...) biss jekk operazzjonijiet skalari, ta 'vettur u matriċi mwettqa f'magna tal-logħob jiġu pproċessati aktar malajr vapur billi jibdlu s-suq tal-kompjuters. F'dan iż-żmien, ma nafux x'inhuma l-pjanijiet ta 'AMD għas-suq professjonali - jistgħu jmorru tajjeb mal-arkitettura Vega u jgħinu biex itejbu d-disinn, il-manifattura, iżda minħabba l-iżviluppi f'Navi, il-kumpanija se timxi kollox għall-arkitettura l-ġdida.

Id-disinn tal-GPU ta 'Nvidia għadda minn evoluzzjoni simili mill-2006, meta nedew is-serje GeForce 8, għalkemm bidliet inqas radikali minn AMD. Din il-GPU ħolqot l-ewwel arkitettura Tesla biex tuża approċċ shader fl-arkitettura ta 'eżekuzzjoni. Hawn taħt nistgħu naraw il-bidliet fil-blokki SM minn suċċessur għal Tesla (Fermi) għal predeċessur ta 'Turing (Volta):

Kif imsemmi qabel f'dan l-artikolu, il-qalba CUDA diġitali. Jistgħu jeżegwixxu galleġġjant wieħed u struzzjoni waħda sħiħa għal kull ċiklu tal-arloġġ fuq komponent tad-dejta (innota, madankollu, li l-istruzzjoni nnifisha tista 'tieħu ċikli multipli tal-arloġġ biex tiġi pproċessata), iżda l-unitajiet tal-ħin jirranġawhom fi gruppi, jistgħu jagħmlu operazzjonijiet ta' vettur għal programmatur. L-iktar bidla importanti matul is-snin tinkludi mhux biss li jkun hemm aktar unitajiet, iżda wkoll kif huma organizzati u segmentati.

Fid-disinn ta 'Kepler, iċ-ċippa sħiħa kellha 5 GPCs, kull wieħed fih tliet blokki SM; Meta tfaċċa Pascal, il-GPCs ġew maqsuma f'ħitan separati (TPC) b'żewġ SMs għal kull TPC. Bħal fil-każ tad-disinn Navi. din il-frammentazzjoni hija importanti peress li tippermetti li l-GPU ġenerali tintuża kemm jista 'jkun; Settijiet multipli ta 'struzzjonijiet indipendenti jistgħu jiġu pproċessati b'mod parallel, u jżidu l-prestazzjoni ta' dell u kompjuters tal-proċessur.

Ejja nagħtu ħarsa lejn Turing ekwivalenti għall-Unità tal-Kompjuter RDNA:

SM tinkludi 4 blokki ta 'transazzjoni, li kull fih:

  • 1 unità ta 'skedar ta' struzzjoni u dispaċċ
  • Skali IEE754 FP32 ALU
  • Skali 16 INT32 ALU
  • 2 kuluri tat-tensjoni
  • 4 SFU
  • 4 Tagħbija / Ħażna (twettaq operazzjonijiet ta 'qari / kitba tal-cache)

Hemm ukoll 2 unitajiet FP64 għal kull SM, iżda Nvidia m'għadhiex turihom fid-dijagrammi tal-blokki u kull SM għandha 4 unitajiet ta 'tessut (tinkludi tindirizza n-nisġa u sistemi ta' filtrazzjoni tan-nisġa) u 1 RT (Ray Tracing) tal-qalba.

L-ALUs FP32 u INT32 jistgħu jaħdmu simultanjament u b'mod parallel. Din hija karatteristika importanti għaliex magni tal-għoti tat-3D spiss jirrikjedu kalkoli tal-punt f'wiċċ l-ilma, iżda hemm numru raġonevoli ta 'operazzjonijiet integri sempliċi (eż. Kalkoli tal-indirizz tad-dejta) li jridu jsiru.

Il-Korijiet tat-Tensor huma ALUs speċjali li jwettqu operazzjonijiet matriċi. Il-matriċi huma matriċi ta 'data' kwadri 'u l-qlub tat-tensjoni jitmexxew fuq matriċi 4 x 4. L-FP16 hija mfassla biex tipproċessa komponenti tad-dejta INT8 jew INT4 sabiex l-operazzjoni float isseħħ għal 64 FMA (multiplu wara żid magħqud) f'ċiklu tal-arloġġ wieħed. Dan it-tip ta 'kalkolu jissejjaħ netwerks newrali u inferenza - mhux eżattament komuni fil-logħob 3D, imma użat ħafna minn Facebook jħobb fil-karozzi bl-algoritmi ta 'analiżi tal-midja soċjali jew f'sistemi ta' self-driving. Navi jista 'wkoll jagħmel kalkoli tal-matriċi, iżda jeħtieġ numru kbir ta' SPs għal dan; Fis-sistema tat-Turing, operazzjonijiet matriċi jistgħu jsiru waqt li l-qlub CUDA jagħmlu matematika oħra.

RT Core hija unità speċjali oħra unika għall-arkitettura Turing li twettaq algoritmi matematiċi speċifiċi ħafna użati għas-sistema ta ’traċċar tar-raġġi ta’ Nvidia. Analiżi kompluta ta 'dan huwa lil hinn mill-ambitu ta' dan l-artikolu, iżda RT Core huma żewġ sistemi li jaħdmu separatament għall-bqija ta 'l-SM, u filwaqt li RT Core huwa impenjat jagħmel kalkoli, jista' jaħdem fuq shaders ta 'l-ogħla jew pixel. għar-rintraċċar tar-raġġi.

Fil-livell bażiku, Navi u Turing għandhom unitajiet ta 'eżekuzzjoni li joffru sett ta' karatteristiċi pjuttost simili (rekwiżit li jirriżulta mill-konformità mar-rekwiżiti ta 'Direct3D, OpenGL, eċċ.).

Fil-livell bażiku, Navi u Turing għandhom unitajiet ta 'eżekuzzjoni li joffru sett ta' karatteristiċi pjuttost simili (rekwiżit li jiġi mill-konformità mar-rekwiżiti ta 'Direct3D, OpenGL, eċċ.), Iżda għandhom jadottaw approċċ differenti ħafna ta' kif għandhom dawk il-karatteristiċi. lest. Meta niġu għal liema disinn huwa aħjar, niġu għal kif jintużaw: FP32 programm li jipproduċi kalkoli vettorjali u numru kbir ta 'ħjut li jwettaq ftit jippreferi Navi, filwaqt li programm b'diversi numri sħaħ, varjabbli, skalari, u kalkoli ta' vettur jagħti flessibilità lil Turing. jippreferi, eċċ.

Ġerarkija tal-Memorja

GPUs moderni huma mfassla biex iwettqu serje ta 'operazzjonijiet fuq proċessuri tan-nixxiegħa, i.e. fuq kull element f'numru ta' dejta. Dan jagħmilhom inqas flessibbli minn CPU ta 'skop ġenerali u jirrikjedi wkoll li tiġi ottimizzata l-ġerarkija tal-memorja taċ-ċippa biex tirċievi data u struzzjonijiet lill-ALUs malajr kemm jista' jkun u fl-ikbar flussi possibbli. Dan ifisser li l-GPUs se jkollhom inqas cache mill-CPU, minħabba li l-biċċa l-kbira taċ-ċippa teħtieġ li tkun iddedikata għall-ammont ta 'cache, u mhux għall-aċċess tal-cache.

Kemm AMD kif ukoll Nvidia jirrikorru għall-użu ta 'cache multipli fi ħdan iċ-ċipep, għalhekk ejja nagħtu ħarsa lejn dak li Navi jippakkja l-ewwel.

Tibda fl-iktar livell baxx fil-ġerarkija, żewġ blokki ta 'Proċessuri tan-Nixxiegħa jużaw total ta' 256-lira reġistru ta 'skopijiet ġenerali (normalment fajl tal-log) Kien l-istess ammont bħal Vega iżda bejn 4 blokki SP; It-tħaddim ta 'rekords meta tipprova tipproċessa numru kbir ta' ħjut verament iweġġa 'l-prestazzjoni, u għalhekk din hija definittivament "ħaġa tajba". L-AMD żied ħafna wkoll il-fajl tar-reġistrazzjoni skalari. Meta qabel kien biss 4 kiB, issa huwa 32 kilo kull unità skalari.

Iż-żewġ Unitajiet ta 'Kompjuter imbagħad jaqsmu cache ta' 32 libbra L0 u cache ta 'dejta skalari ta' 16-il libbra, iżda kull CU tirċievi l-cache tal-vettur L0 ta '32 libbra; Il-konnessjoni ta 'din il-memorja kollha għal ALUs hija Sehem ta' Dejta Lokali ta '128 libbra.

F'Navi, żewġ Magni tal-Kompjuter joħolqu Proċessur tal-Grupp ta 'Ħidma, li ħamsa minnhom jiffurmaw il-Magna tal-Kompjuter Asinkronika (ACE). Kull ACE għandu aċċess għall-cache L1 ta '128 lira L1 stess, u l-GPU kollu huwa appoġġjat aktar minn 4 cache MiB L2 li jgħaqqdu l-caches L1 u partijiet oħra tal-proċessur.

Minħabba li s-sistema hija strettament użata biex timmaniġġja 16-il kontrollur tal-memorja GDDR6, hija forma ta 'arkitettura ta' konnettività proprja ta 'AMD Infinity Fabric. Biex timmassimizza l-wisa 'tal-banda tal-memorja, Navi juża wkoll kompressjoni tal-kulur mingħajr telf bejn L1, L2 u l-memorja indiġena GDDR6.

Għal darb'oħra, dan kollu huwa milqugħ b'mod partikolari meta mqabbel ma 'ċipep AMD preċedenti li ma kellhomx biżżejjed cache ta' livell baxx għan-numru ta 'unitajiet ta' dell li fihom. Fil-qosor, aktar cache hija ugwali għal aktar bandwid intern, struzzjonijiet inqas bil-mod (minħabba li jridu jirkupraw aktar dejta mill-memorja), eċċ. U dak huwa ugwali għal prestazzjoni aħjar.

Dwar il-ġerarkija ta ’Turing, irid jingħad li Nvidia tinsab fuq in-naħa tal-mistħija meta tiġi biex tipprovdi għarfien fil-fond f’dan il-qasam. Aktar kmieni f'dan l-artikolu, rajna kull SM jinqasam f'4 blokki ta 'tranżazzjoni - kull wieħed għandu fajl tal-log 64-lira iżgħar minn dak misjub f'Navi, iżda żomm f'moħħok li l-ALUs ta' Turing huma skalars, mhux vettori. , unitajiet.

Sussegwentement, 96 kb ta 'memorja maqsuma għal kull VM jistgħu jintużaw bħala 64 kb ta' data cache L1 u 32 kb ta 'cache ta' tessuti jew spazju ta 'rekord żejjed. Fil- "modalità tal-kalkolu", il-memorja maqsuma tista 'tinqasam f'diviżjonijiet differenti, bħal 32 kb tal-memorja maqsuma u 64 kiB tal-cache L1, imma dejjem issir bħala diviżjoni 64 + 32.

In-nuqqas ta 'dettall mogħti dwar is-sistema ta' memorja li ddawwar ġiegħelna nagħmlu iktar, u għalhekk induru lejn tim ta 'riċerka tal-GPU li qed jaħdem fiċ-Citadel Enterprise Americas. Riċentement, ippubblikaw żewġ artikli. Ħin ve Turing arkitetturi; L-immaġni ta 'hawn fuq hija l-frammentazzjoni tal-ġerarkija tal-memorja fiċ-ċippa TU104 (full TU102 sport 6144 kiB L2 cache).

It-tim ikkonferma li l-fluss tal-cache L1 kien ta ’64 bits kull ċiklu, u ddikjara li taħt l-ittestjar tal-effiċjenza tal-cache L1 ta’ Turing kien l-aħjar mill-GPUs kollha ta ’Nvidia. Għalkemm iċ-ċippa ta 'AMD għandha rata ta' qari ogħla għall-Aħżen ta 'Dejta Lokali iżda rata aktar baxxa għall-istruzzjoni / caches fissi, dan huwa daqs l-istess ma' Navi.

Iż-żewġ GPUs jużaw GDDR6 għall-memorja lokali - din hija l-aħħar verżjoni tal-Grafika DDR SDRAM - u t-tnejn jużaw konnessjonijiet ta ’32 bit għall-moduli tal-memorja, għalhekk Radeon RX 5700 XT Għandu 256 ċipep tal-memorja u jipprovdi wisa 'massimu ta' 256 GiB / s u 8 GiB ta 'spazju. waħda GeForce RTX 2080 Ti Bl-ċippa TU102, jaħdem bi 11-il modulu għal 352 GiB / s bandwidth u 11-il ħażna ta 'GiB.

Id-dokumentazzjoni ta 'AMD tista' tidher konfuża f'xi drabi: fl-ewwel dijagramma tal-blokk naraw Navi juri erba 'kontrolluri tal-memorja ta' 64 bit, filwaqt li stampa aktar tard turi 16-il kontrollur. Meta wieħed iqis Samsung joffri biss GDDR6 32-bit Jidher li t-tieni immaġni turi kemm hemm konnessjonijiet bejn is-sistema Infinity Fabric u l-kontrolluri tal-memorja. Probabbilment hemm biss 4 kontrolluri tal-memorja u kull wieħed juża żewġ moduli.

Kollox ma 'kollox, ma jidhirx li hemm differenza enormi bejn Navi u Turing meta niġu għall-caches tagħhom u l-memorja lokali. Hemm ftit iktar minn Navi li javviċina l-eżekuzzjoni tal-affarijiet bl-ikbar struzzjoni / kostanti u cache L1, imma t-tnejn huma ppakkjati għal kollox, it-tnejn jużaw kompressjoni tal-kulur fejn possibbli, u t-tnejn għandhom ħafna mudelli ta 'GPU apposta fl-aċċess għall-memorja u użata biex timmassimizza l-wisa 'tal-banda.

Triangoli, Nisġa, u Pixel

Ħmistax-il sena ilu, il-manifatturi tal-GPU għamlu ħafna dwar kemm trijangoli jistgħu jimmaniġġjaw iċ-ċipep tagħhom, in-numru ta 'elementi ta' tessut li jistgħu jiġu ffiltrati għal kull ċiklu, u l-abilità li jirrendu l-unitajiet ta 'produzzjoni (ROPs). Dawn l-aspetti għadhom importanti sal-lum, iżda l-enfasi hija ħafna iktar fuq in-naħa tal-eżekuzzjoni peress li t-teknoloġiji tal-għoti tat-3D jirrikjedu aktar prestazzjoni tal-komputazzjoni minn qatt qabel.

Madankollu, biss li wieħed jinnota li m'hemm l-ebda differenza immedjatament notevoli bejn Navi u Turing f'dawn l-oqsma, l-unitajiet ta 'konsistenza u l-ROPs għadhom ta' min jesplorawhom. Fiż-żewġ arkitetturi, l-unitajiet tan-nisġa jistgħu jimmaniġġjaw u jirkupraw 4 elementi tan-nisġa, jiffiltrawhom mhux magħrufa f'element wieħed, u jtellfuhom f'ċiklu tal-arloġġ wieħed (jinjoraw il-linji tal-arloġġ addizzjonali meħuda biex jirkupraw id-dejta mill-memorja lokali).

L-arranġament tal-ROP / RBs huwa kemmxejn differenti bejn Navi u Turing, iżda mhux wisq: ċippa AMD għandha 4 RBs għal kull ACE, u kull wieħed jista 'joħroġ 4 pixel imħallat għal kull ċiklu tal-arloġġ; Fit-Turing, kull GPC għandu żewġ RBs, kull wieħed jagħti 8 pixel fis-siegħa. In-numru ROP tal-GPU huwa tabilħaqq kejl tal-veloċità tal-ħruġ tal-pixel, u għalhekk ċippa Navi sħiħa tagħti 64 pixel fis-siegħa u TU102 96 sħiħa (imma ftakar li din hija ċippa ikbar).

Hemm inqas informazzjoni fuq in-naħa tat-trijanglu tal-affarijiet. Dak li nafu huwa li Navi għadu jagħti massimu ta '4 primittivi għal kull ċiklu ta' arloġġ (1 għal kull ACE), iżda m'għad hemm xejn dwar jekk AMD irranġatx din il-kwistjoni. Shaders Primittivi. Din kienet karatteristika tal-vultaġġ kbir ta 'Vega u ppermettiet lill-programmaturi biex ikollhom ħafna aktar kontroll fuq il-primittivi sabiex ir-rendiment primittiv jista' jiżdied b'4 fatturi. funzjonalità mneħħija mis-sewwieqa Il-prodott rieqed ftit wara t-tnedija tiegħu u minn dakinhar.

Waqt li tkun qed tistenna iktar informazzjoni dwar Navi, ma jkunx għaqli li wieħed jispekula aktar. It-tqattigħ jipproċessa wkoll 1 primittiv kull siegħa għal kull GPC (i.e. sa 6 għall-GPU TU102 sħiħa) f'Magni Raster, imma wkoll Shaders tal-maljiJoffri l-istess funzjonalità bħall-Shaders Primittivi ta 'AMD; Direct3D mhuwiex sett ta 'fatturi OpenGL jew Vulkan iżda huwa disponibbli permezz ta' estensjonijiet ta 'API.

Dan jidher li jagħti vantaġġ lil Turing fuq Navi f'termini ta 'mmaniġġjar ta' trijangoli u primittivi, iżda bħalissa m'hemmx biżżejjed informazzjoni preċiża fid-dominju pubbliku.

Mhux Kollha Dwar Unitajiet ta 'Infurzar

Navi u Turing għandhom aspetti oħra ta ’min wieħed iqabblu. Biex tibda, iż-żewġ GPUs jinkludu wirja avvanzata ħafna u magni tal-midja. L-ewwel jipproċessa l-output għall-monitor, it-tieni jikkodifika u jiddekodifika l-flussi tal-vidjo.

Kif tistenna minn disinn GPU ġdid tal-2019, il-magna tal-wirja ta 'Navi toffri riżoluzzjonijiet għoljin ħafna b'rati ta' riffriskjar għoljin u toffri appoġġ HDR. Ara l-Kompressjoni tan-Nixxiegħa (DSC) huwa algoritmu ta 'kompressjoni b'telf veloċi li jippermetti li jħobbu riżoluzzjonijiet ta' 4K + b'rati ta 'riffriskar ogħla minn 60 Hz jiġu trasmessi fuq konnessjoni DisplayPort 1.4; Fortunatament, id-deterjorament tal-kwalità tal-immaġni huwa żgħir ħafna sal-punt fejn tqis li d-DSC huwa kważi bla telf.

It-Turing jappoġġja wkoll DisplayPort b'konnessjonijiet DSC, iżda l-kombinazzjoni appoġġata ta 'riżoluzzjoni għolja u rata ta' riffriskar hija kemmxejn aħjar minn Navi: 4K HDR f'144 Hz - il-kumplament huwa l-istess.

Il-magna tal-midja Navi hija moderna daqs il-magna tal-wiri u Kodifikazzjoni tal-Vidjo Avvanzata (H.264) u Kodifikazzjoni tal-Vidjow b'Efficjenza Għolja (H.265), għal darb'oħra b'riżoluzzjonijiet għoljin u bitrates għoljin.

Il-magna tal-vidjow ta 'Turing hija bejn wieħed u ieħor l-istess bħal dik ta' Navi, iżda l-appoġġ għal kodifikazzjoni HDK 8K30 jista 'jdawwar il-bilanċ favur il-benefiċċju ta' Turing għal xi nies.

Hemm aspetti oħra biex titqabbel (pereżempju, l-interface PCI Express 4.0 ta ’Navi jew il-Link NV ta’ Turing’s), imma irrispettivament minn kemm ikunu lebsin u kkummerċjalizzati, huma tassew biċċiet ċkejkna tal-arkitettura ġenerali. Dan għaliex għall-maġġoranza l-kbira tal-utenti potenzjali dawn il-karatteristiċi uniċi mhux se jkunu importanti.

Paragun simili għall-bħal

Dan l-artikolu huwa osservazzjoni tad-disinn arkitettoniku, il-karatteristiċi, u l-funzjonalità, iżda li jkun hemm paragun dirett tal-prestazzjoni jkun mod tajjeb biex titlesta tali analiżi. Madankollu, it-tqabbil ta 'ċippa Navi fuq Radeon RX 5700 XT f'GeForce RTX 2080 Ti mal-proċessur Turing TU102 fi GeForce RTX 2080 Ti ma jkunx sewwa ġust meta wieħed jikkunsidra li dan ta' l-aħħar huwa kważi d-doppju tan-numru ta 'unitajiet ta' shader magħquda. Madankollu, hemm verżjoni taċ-ċippa Turing li tista 'tintuża għal paragun, u din hija dik misjuba fil-GeForce RTX 2070 Super.

  Radeon RX 5700 XT GeForce RTX 2070 Super
GPU | Arkitettoniku Navi 10 | rDNA TU104 | Turing
proċess TSMC ta '7 nm TSMC ta '12 nm
Żona tal-moffa (mm2) 251 545
Transisturi (biljuni) 10.3 13.6
Profil tal-blokka 2 SE | 4 ACE | 40 PB 5 GPC | 20 TPC | 40 SM
Qlub magħquda ta 'shader 2560 SP 2560 MIRACLES
TMUs 160 160
ROPS 64 64
Arloġġ bażiku 1605 MHz 1605 MHz
Arloġġ tal-logħob 1755 MHz N / A
Inħeġġu s-siegħa 1905 MHz 1770 MHz
Memorja 8 GB 256 bit GDDR6 8 GB 256 bit GDDR6
Wisa 'tal-banda tal-memorja 448 GBps 448 GBps
Qawwa tad-Disinn Termali (TDP) 225 Watt 215 W.

Ta 'min jinnota li l-RTX 2070 Super mhuwiex ċippa' sħiħa 'TU104 (wieħed mill-GPCs huwa diżattivat), u għalhekk dawn it-transistors kollha 13.6 huma inattivi, jiġifieri ċ-ċipep huma bejn wieħed u ieħor l-istess f'termini ta' għadd ta 'transistor. Fil-valur nominali, iż-żewġ GPUs jidhru simili ħafna, speċjalment jekk tikkunsidra biss unitajiet shader, TMUs, ROPs, u sistemi ewlenin tal-memorja.

Fil-proċessur Nvida, SM jista 'jipproċessa 32 warps simultanji, u ma' kull medd ta '32 ħjut, GeForce RTX 2070 Super mgħobbija għal kollox tista' taħdem fuq 40,960 ħjut madwar iċ-ċippa kollha; Għal Navi, CU SIMD32 waħda tista 'tirċievi 16-il mewġa għal kull ALU u kull mewġa għandha 32 linja. Għalhekk, ir-Radeon RX 5700 XT jista 'jkun ukoll ippakkjat sa 40,960 ħjut. Jista 'jidher li dan jagħmilhom eżattament hawn, iżda minħabba kemm huma rranġati b'mod differenti l-CU / SMs u l-vantaġġ ta' Nvidia bl-ipproċessar simultanju INT u FP, ir-riżultat jiddependi ħafna fuq il-kodiċi li jkun qed jitmexxa.

X’effett se jkollu fuq id-diversi wirjiet tal-logħob, peress li l-kodiċi ta ’magna 3D se jiffavorixxi waħda tibni fuq oħra skont liema tip ta’ struzzjonijiet jintbagħtu rutinament lill-GPU. Dan, ittestja żewġ karti grafiċi:

Il-logħob kollu użat fit-test kien ipprogrammat għall-arkitettura GCN ta 'l-AMD direttament għal kompjuters mgħammra Radeon jew permezz ta' GPU GCN misjuba fuq il-PlayStation 4 jew Xbox One. Huwa possibbli li wħud mit-tnedijiet riċenti jkunu ppreparati għall-bidliet ta 'l-RDNA, iżda d-differenzi fir-riżultati tal-punt ta' referenza huma aktar probabbli minħabba l-magni li jagħmlu u l-mod kif jiġu pproċessati l-istruzzjonijiet u d-data.

Allura xi tfisser dan kollu? Arkitettura waħda hija verament aħjar minn oħra? Turing definittivament joffri aktar kapaċità minn Navi grazzi għal Tensor u RT Cores, iżda dan tal-aħħar jikkompeti definittivament f'termini ta 'rendiment ta' rendering 3D. Id-differenzi li dehru fit-12-il eżempju tal-logħba mhumiex preċiżi biżżejjed biex tagħmel sentenza finali.

U din hija aħbar tajba għalina.

Kliem finali

Pjan Navi ta 'AMD tħabbret Huma kienu jimmiraw għat-tnedija tal-2018 fl-2016 u għalkemm ma qalux ħafna. Meta tidħol dik id-data u tmur mappa tat-triq mibdul madankollu, kien ċar li Navi kienet mibnija f'node tal-proċess 7nm u d-disinn jiffoka fuq it-titjib tal-prestazzjoni.

Dan żgur kien il-każ, u kif rajna f'dan l-artikolu, AMD għamlet tibdil arkitettoniku biex tippermetti lil Nvidia tikkompeti mal-offerti ekwivalenti tagħha. Id-disinn il-ġdid jibbenefika iktar minn sempliċement utenti tal-PC, billi nafu li Sony u Microsoft se jużaw varjant taċ-ċippa fil-perjodu li jmiss. Playstation 5 ve Sony Xbox.

Jekk terġa 'tmur lura għall-bidu ta' dan l-artikolu u terġa 'tħares lejn id-disinn strutturali ta' Shader Motors, id-daqs totali tad-die, u n-numru ta 'transistors, hemm ċara skop għal ċippa "Navi kbira" għall-quċċata. Karta grafika aktar tard; AMD kważi qablet li dan għandu jkun parti mill-pjanijiet attwali tagħha u għandu l-għan li jtejjeb l-arkitettura u l-proċess tal-manifattura matul is-sentejn li ġejjin.

Imma x'inhuma l-pjanijiet għal Nvidia, Turing u s-suċċessur tagħha? B'mod sorprendenti, ftit ġie kkonfermat mill-kumpanija. Fl-2014, Nvidia Pjan direzzjonali aġġornat għall-GPU Ippjanar tal-arkitettura ta 'Pascal għat-tnedija tal-2016 (u l-ilħuq ta' dak il-għan). Fl-2017, Tesla ħabbret il-V100Kien dan id-disinn li ħareġ Turing fl-2018, bl-użu tal-arkitettura Volta.

Minn dakinhar, l-affarijiet kienu pjuttost kwieti u kellna niddependu fuq għajdut u ġrajjiet ta 'aħbarijiet, li ħafna drabi jgħidu l-istess ħaġa: l-arkitettura li jmiss ta' Nvidia se tissejjaħ Ampere, Magħmul minn Samsung Juża l-għoqda tal-proċess 7nm u huwa ppjanat għall-2020. Minbarra dan, m'hemm xejn aktar biex tkompli. Iċ-ċippa l-ġdida x'aktarx ma tkissirx it-tradizzjoni billi tiffoka fuq unitajiet ta 'eżekuzzjoni skalari, jew x'aktarx ma twaqqax aspetti bħal Tensor Cores peress li dan jikkawża problemi ta' kompatibilità b'lura sinifikanti.

Xorta, nistgħu nagħmlu xi ideat raġonevoli dwar kif se jidher il-GPU Nvidia li jmiss. Il-kumpanija investiet ammont sinifikanti ta 'ħin u flus. Traċċar tar-raġġiu l-appoġġ tiegħu fil-logħob biss żid; Għalhekk nistgħu nistennew li naraw titjib fil-qalba tal-RT f'termini ta 'kapaċitajiet jew numru għal kull SM. Jekk wieħed 7 nm proċess node Jekk vera, Nvidia x'aktarx jimmira lejn tnaqqis tal-qawwa minflok spinta diretta tal-veloċità tal-arloġġ sabiex ikunu jistgħu jżidu n-numru ta 'GPCs. Huwa wkoll possibbli li taqbeż 7 nm u tibda Nvidia. Dritt għal 5 nm Biex tikseb vantaġġ fuq AMD.

Jidher bħal AMD u Nvidia, Karta grafika diskreta Suq minn Intel kif nafu li qed jippjanaw li jerġgħu jidħlu f'din l-industrija, Ċempel 20 sena. Dan il-prodott ġdid (bħalissa Xe's) Se tkun tista 'tikkompeti fuq l-istess livell bħal Navi u Turing.

Sadanittant, Intel baqa ’ħaj fis-suq tal-GPU għal dawk iż-żewġ deċennji billi għamel grafika integrata għas-CPUs tiegħu. L-aħħar GPU ta 'Intel Ġen 11Hija simili għall-arkitettura ta 'AMD billi tuża ALUs vector li jistgħu jimmaniġġjaw id-dejta FP32 u INT32, iżda ma nafux jekk il-karti tal-grafika l-ġodda se jkunu evoluzzjoni diretta ta' dan id-disinn.

Li hu ċert hu li l-ftit snin li ġejjin se jkunu interessanti ħafna billi tliet ġganti ta 'strutturi tas-silikon ikomplu jiġġieldu għall-kartieri tagħna. Disinni u arkitetturi GPU ġodda se jisfidaw in-numri tat-transistor, id-daqsijiet tal-cache u l-proprjetajiet tal-shader; Navi u RDNA huma l-aktar ġodda minn dawn u wrew li kull pass ‘il quddiem jista’ jagħmel differenza żgħira.

Shortcuts tax-xiri:
  • GeForce RTX 2070 Super ċar Amazon
  • GeForce RTX 2080 Super ċar Amazon
  • GeForce RTX 2080 Ti miftuħ Amazon
  • Radeon RX 5700 XT mixgħul Amazon
  • Radeon RX 5700 miftuħ Amazon
  • GeForce RTX 2060 Super ċar Amazon
  • GeForce GTX 1660 Super ċar Amazon

Dan l-artikolu ġie ppubblikat oriġinarjament fis-7 ta 'Awwissu 2019. Bħala parti mill-inizjattiva tagħna #ThrowbackThursday, irrevedejna u ġġarraf ftit.