In 2020 keert Intel terug naar de discrete grafische business en zal naar verwachting een nieuwe GPU voor gamers lanceren. We kunnen dit op een van de volgende twee manieren zien: Intel-graphics worden of worden op wonderbaarlijke wijze het mikpunt van de volgende generatie pc-grappen, en ze betreden een markt die wordt gedomineerd door slechts twee spelers sinds de millenniumwisseling.

Hier is een korte tijdlijn van hoe deze recente lancering vorm kreeg in de publieke belangstelling:

12 juni 2018: Brian Krzanich, voormalig CEO van Intel, vertelde investeerders op een speciale bijeenkomst dat Intel al jaren stilletjes bezig is met het ontwikkelen van een discrete GPU-architectuur "Arctic Sound" en zal worden uitgebracht in 2020.

8 januari 2019: Gregory Bryant, vice-president van ervaren computergebruiker tijdens CES, legt uit dat de aanstaande GPU zal worden geproduceerd in Intel's 10nm-proces.

21 maart 2019: Intel biedt twee ontwerpen op het podium voor zijn GPU's. Stilistisch lijken ze op Optane SSD's en hebben ze qua grootte een koelcapaciteit in het middensegment.




1 mei 2019: Jim Jeffers, hoofdingenieur en manager van het rendering- en visualisatieteam, kondigde de raytracing-mogelijkheden van de Xe in FMX19 aan. Bovendien bleef Intel mogelijkheden weghouden van concurrenten.




Er zijn veel lekken en gefluister over de technische ruimte tussen deze datums, en we kunnen gigantische hoeveelheden informatie verzamelen door de grondbeginselen van Intel-architectuur te bestuderen. Dit is het onderwerp van dit artikel.

ontwikkeling

Intel wilde geen risico nemen en besloot dat het hele grafische team experts zou zijn die waren gestolen van AMD en Nvidia. We hebben voor het eerst vernomen dat Intel discrete GPU's gaat maken: ze huurden AMD's grafische architectuurmanager en grafische business manager in, Raja Koduri, Senior Vice President Core and Visual Computing bij Intel in 2017.




Vervolgens kwam Jim Keller, de hoofdarchitect achter AMD's Zen-architectuur, in de rol van senior vice-president van silicon engineering. Intel maakte later Chris Hook, senior directeur wereldwijde productmarketing bij AMD, tot een aparte GPU-marketeer. Vervolgens Darren McPhee, voormalig productmarketingdirecteur van AMD; Voormalig technologiejournalist Damien Triolet werd AMD-marketeer; Tom Peterson, technisch marketingdirecteur en chiparchitect bij Nvidia; en tot slot Heather Lennon, de grafische marketing- en communicatiemanager van AMD.




Natuurlijk alleen het grotere openbare werk. Het grafische team van Intel is 4.500 man sterk. En je zou niet zoveel mensen en zulke getalenteerde mensen hebben zonder op zijn minst iets vaag interessants te doen.




Architectonisch

Kerntelling

Hoewel Xe tot de toekomst behoort, staat geen enkele technologie los van de producten die in het verleden opkwamen en de ontwikkeling die er aanleiding toe gaf - goed gedocumenteerde generaties. De eerste serie Xe-producten zal een architectuur gebruiken die is ontwikkeld op basis van de momenteel uitgebrachte "Gen11", maar nog steeds nauw verwant is en gebaseerd is op de verklaringen van Intel op CES. Zo kunnen we interessante informatie verzamelen door onderzoek te doen naar Intels. wit papier Gen11.

Zoals u zich onze herinnert Navi versus Turing-vergelijkingAlle grafische architecturen bestaan ​​uit steeds complexere onderdelen. 16 CUDA-kernen gegroepeerd voor Nvidia blokkenvier van hen een streaming multiprocessor, een paar textuur rendering set (TPC) en een van hen heeft er vier of zes grafische weergaveset (GPC). Elke GPC bevat dus 512 of 768 CUDA-kernen.




Zoals weergegeven in de onderstaande tabel, bepaalt het aantal GPC en TPC per GPC het aantal kernen voor elke matrijs. Onthoud dat sommige van deze kernen mogelijk zijn uitgeschakeld bij GPU's die te koop zijn. Een RTX 2070 Super gebruikt bijvoorbeeld een TU104-matrijs waarmee 83% van de kernen kan worden beperkt tot 2560 CUDA-kernen.

  6 grafische verwerkingsclusters 3 grafische verwerkingsclusters
768 CUDA per GPC (6 TPC per GPC) 768 x 6 = 4608 CUDA (TU102) 768 x 3 = 2304 CUDA (TU106)
512 CUDA per GPC (4 TPC per GPC) 512 x 6 = 3072 CUDA (TU104) 512 x 3 = 1536 CUDA (TU116)

Laten we hetzelfde concept toepassen op de architectuur van Intel.

Intel's cores zijn niet vergelijkbaar met Nvidia's CUDA, maar ze zijn vergelijkbaar met AMD's stream processors, dus laten we het in termen hiervan bespreken. Elke streamprocessor is een rekenkundige logische eenheid kan één drijvende-kommabewerking of geheel getal per uur uitvoeren. Intel's rekenkundige logische eenheden Laten we ze het equivalent van vier cores noemen, aangezien ze vier bewerkingen per uur kunnen uitvoeren.

Intel begint met het koppelen van de twee rekenkundige logische eenheden aan iemand uitvoerende eenheid (acht kernen) gevolgd door één onderste plak (64 kernen), dan zijn er acht voller plak (512 kleuren).

Intel's volgende generatie processors bevatten één geïntegreerde slice, maar zoals u zich kunt voorstellen, wordt de Xe discrete array opgebouwd uit meerdere segmenten. In feite betekent dit dat Intel alleen patronen kan produceren met kerntellingen in veelvouden van 512, zoals Nvidia. De kerntelling van een dobbelsteen is het aantal plakjes vermenigvuldigd met 512.

Aantal plakjes 2 3 4 5 6 7 8
Kerntelling 1024 1536 2048 2560 3072 3584 4096
Naar * iDG2HP128   iDG2HP256       iDG2HP512

Onthoud dat we ervan uitgaan dat Intel de basis-slice-configuratie van de Gen11 zal behouden, omdat ze uiteraard pas volgend jaar tijd hebben om de grafische afbeeldingen volledig opnieuw te ontwerpen. De Gen11 is natuurlijk zeer geschikt om zowel geïntegreerd als discreet te zijn met het ontwerp, maar sommige elementen zouden moeten veranderen, zoals de render-backend die, als hij ongewijzigd blijft, een multi-slice-ontwerp verstopt.

2048-Core mogelijke architectuur (vier segmenten) Xe

Bewijs

Handig is dat Intel een krachtig bewijspakket heeft geleverd om deze hypothese te ondersteunen. een bestuurder het bevatte ten onrechte de namen van verschillende niet-vrijgegeven producten die eind juli zijn uitgebracht; "IDG2HP512", "iDG2HP256" en "iDG2HP128;" we interpreteerden de codes als "Intel discrete graphics [model] twee high power" gevolgd door het aantal uitvoeringseenheden.

Elke uitvoeringseenheid bestaat uit acht kernen, dus we krijgen "512" met vier plakjes en 4096 kernen, "256" met twee plakjes en 2048 kernen en "128" met twee plakjes en 1024 kernen. Deze configuraties ondersteunen onze analyse perfect.

Intel heeft ook aangekondigd dat ze manieren onderzoeken om plakjes te combineren. Begin 2018 demonstreerde Intel een prototype van een discrete GPU met twee Gen9-plakjes gecombineerd in een enkele chip, en implementeerde het met de nieuwe geïntegreerde Iris Plus Graphics 650, waarbij twee Gen9.5-plakjes in één chip werden gecombineerd. Ze experimenteren ook met een chipletbenadering met behulp van EMIB (embedded multi-die connection bridge), die voor het eerst werd gebruikt in Kaby Lake G.

EMIB architectonisch ontwerp

EMIB combineert in wezen twee of meer fysieke matrijzen tot één virtuele matrijs voor enorme kostenbesparingen en een kleine prestatieverbinding, "waarbij meerdere heterogene patronen op een kosteneffectieve manier in één pakket worden gecombineerd". Zoals 2017 Nvidia Onderzoeksartikel omdat "zeer grote matrijzen een zeer laag rendement hebben vanwege een groot aantal onherstelbare fabricagefouten".

Door een groot aantal kleine patronen te maken en deze te combineren, verkleint Intel de kans op fouten bij het maken ervan en wordt het goedkoper om deze fouten te elimineren. Hoewel EMIB nog niet volledig is voorbereid op massadistributie, komt Intel in april goedgekeurd Ik kijk uit naar Anandtech, aangezien ze binnenkort EMIB willen gebruiken om hun GPU te ondersteunen.

Kloksnelheden

Breng de tijd in kaart. We hebben een redelijke schatting van de basiscijfers gevonden, dus laten we dit in het ergste geval bekijken om een ​​basis te creëren. Dat wil zeggen, het stemt de coretellingen af ​​op de kloksnelheden van Intels best geïntegreerde grafische kaart die beschikbaar is op 1150 MHz. Om snelheid en kerntelling te combineren, brengen we in TFLOP's in kaart, een theoretische prestatiemaatstaf op basis van deze twee variabelen. Hoewel TFLOPS een uitstekende prestatie-indicator is in een door de fabrikant geproduceerde GPU, is het vermeldenswaard dat het minder betrouwbaar is om de twee fabrikanten te vergelijken.

1,2 GHz'de TFLOPS

Hoewel Intel concurrerend is op het gebied van het aantal kernen, kunnen ze niet concurreren op 1150 MHz. Gelukkig is dit niet het geval waarin we ons bevinden. We weten tenminste dat ze de geïntegreerde snelheden kunnen overschrijden omdat ze worden beperkt door de thermische output van de CPU, wat geen probleem is als er geen CPU is. Ten tweede zullen Intel's nieuwe Xe-chips de snellere en superieure 10 nm gebruiken.

Het 10nm-proces van Intel wordt op zijn best gelijkgesteld aan 7nm TSMC, dat op 1800 MHz kan zitten bij het gamen op een goed gekoelde Radeon 5700XT. Intel heeft een lange geschiedenis in het comprimeren van zijn processen met hogere snelheden dan zijn concurrenten. Dit zijn echter Intels lange, oude eerste generatie GPU's, dus voorzichtig pessimisme biedt meer nauwkeurigheid: laten we zeggen dat Intel ten minste 1700 MHz kan beheren.

1,7 GHz'de TFLOPS

Bij deze potentieel meer realistische snelheden lijkt Intel enigszins competitief op het gebied van TFLOPS. Merk echter op dat deze snelheidsschattingen niet bedoeld zijn om betrouwbaar te zijn, vooral niet in vergelijking met berekeningen van het aantal kerntellingen.

In een notendop: Xe discrete GPU's zullen waarschijnlijk verschijnen tegen ongeveer dezelfde prijs per core als Nvidia bij 512 core-tijden en concurrerende 1,7 GHz-snelheden.

Software

GPU's zijn meer dan alleen hardware. Nvidia huurt beroemd meer software-ingenieurs in dan hardware-ingenieurs. Het ondersteunen van elke game is een kostbare en tijdrovende investering die gedeeltelijk de reden is dat nieuwkomers op de gaming-GPU-markt vrijwel zijn uitgestorven. Behalve Intel zijn ze zeker niet nieuw voor software, hoewel ze nieuw zijn voor de afzonderlijke hardwarespel. Stel je een vertaler voor tussen games en hardware naar stuurprogramma's; alleen de hardware verandert, dus het omzetten van bestaande geïntegreerde stuurprogramma's naar een discreet systeem is een eenvoudig proces.

Deze stuurprogramma's zijn niet zo goed beschermd, en dit is iets waar Intel al heel lang kritiek op heeft. De gemiddelde tijd tussen de laatste tien stuurprogramma's was vijfentwintig dagen voor Intel, achttien dagen voor Nvidia en slechts tien dagen voor AMD. Gelukkig is de kans groot dat Intel zijn sokken opdrijft voor de Xe, gezien het feit hoeveel belangrijkere stuurprogramma's zijn voor discrete GPU's voor geïntegreerde GPU's.

Maar het is niet allemaal slecht. Intel heeft vorig jaar vooruitgang geboekt en de weg geëffend voor Nvidia en AMD met zijn nieuwe Command Center dat veel betere en pijnloosere controle over GPU's en games biedt dan Nvidia's GeForce Experience. Het biedt game-optimalisatie met wat elke instelling doet en de impact ervan op de prestaties, snelle multi-screen setup met vernieuwingsfrequentie en rotatiesynchronisatie, weergavekleurnauwkeurigheid en stijlaanpassingen, en driverbediening. En een triviaal maar leuk detail, Intel ondersteunt ook asynchroon, dus alle Xe-producten ondersteunen FreeSync-monitoren en ecosystemen vanaf de deur.

Markt

Als de marktpositie van de producten onzeker is, doet er weinig toe aan de architectuur of het ecosysteem. Daar weten we heel weinig van. Zullen ze $ 100 of $ 1.000 kosten? Eén model, twee of tien? Onlangs gevraagd of Xe zich kon richten op de topmarkt Raja Koduri antwoordde:

'Niet iedereen gaat een kaart van $ 500-600 kopen, maar er zijn ook genoeg mensen om deze te kopen - het is een geweldige markt. Dus we maken ons niet echt zorgen over de strategie die we nastreven, het bereik van de prestaties, het bereik van de kosten, en zo, want uiteindelijk moet onze architectuur de mainstream bereiken vanaf ongeveer $ 100, zoals het publiek zei. Tot dure graphics van datacenterklasse met HBM-geheugens en zo.

We moeten alles raken; waar begin je net Eerste? De tweede? Derde? En de strategie die we hebben gehad in ongeveer een periode van tijd - laten we het 2-3 jaar noemen voordat de volledige stapel is. "

En hier is het: Intel zal verschillende GPU's uitbrengen. Het is niet bepaald een waardevol inzicht, maar de verwachting is dat Intel zijn kaarten dicht bij de borst wil houden. En aangezien dit het enige officiële woord over dit onderwerp is, moeten we ons nu richten op een alternatieve bron: gelekte driver.

Afbeelding: Intel concept building Cristiano Siqueira

De drie GPU's, Intel-stuurprogramma's genoemd voor de eerste stuurprogramma's, hebben 1024, 2048 en 4096 kernen. Hierdoor kunnen ze concurreren met de RTX 1650, RTX 2060 en RTX 2080 Ti voor prijzen van respectievelijk $ 150, $ 350 en $ 1000 +. Intel kan ervoor kiezen om beter te presteren dan Nvidia met hogere snelheden of lagere waarde tegen lagere prijzen, of gewoon vertrouwen op andere functies om te matchen en te differentiëren.

De driver biedt ook een perspectief op langere termijn met twee "ontwikkelaarskaarten". De groep is, samen met de andere drie, een "iDG1LPDEV" die evolueert naar een "Intel discrete graphics [model] 1 low power developer" -kaart, wat erop zou kunnen duiden dat notebook GPU's met een laag vermogen worden getest. Er is ook een aparte lijst met "iATSHPDEV" met de codenaam "Arctic Sound" voor de architectuur van Xe, maar deze kan niet worden geverifieerd als een afzonderlijke GPU.

Als er één ding is om te onthouden ... wat Intel zal posten is onbekend en speculatie impliceert geen aankoopadvies. Aan de andere kant zijn de zaken veelbelovend. Het is veelbelovend.

Shopping-snelkoppelingen: