Intel Architecture Day 2020: Willow Cove, Tiger Lake & eerste gaming videokaart

32 reacties
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Gedaan met de plussen: 10nm SuperFin
  3. 3. Tiger Lake met Willow Cove
  4. 4. Roadmap: Alder Lake en packaging
  5. 5. Xe-HPG: de basis voor gaming videokaarten
  6. 6. SSD's, 3D XPoint en Rambo Cache
  7. 32 reacties

Xe-HPG: de basis voor gaming videokaarten

Intel werkt inmiddels al enkele jaren aan de Xe-architectuur voor gpu's, waarbij het er geen geheim van maakt dat ook high-performance gpu's voor datacenters en gamers deel uitmaken van de plannen. Tot nu toe waren er al drie varianten van de overkoepelende Xe-architectuur bekend: Xe-LP voor geïntegreerde graphics, Xe-HP voor grotere gpu's en Xe-HPC voor grootzakelijke toepassingen.

Tijdens de Architecture Day 2020 ging Intel om te beginnen in op de architecturale verbeteringen in de Xe-LP-architectuur, die voor het eerst wordt toegepast voor de geïntegreerde graphics van Tiger Lake, en tevens als basis voor de andere varianten zal dienen. Daarnaast maakte Intel het bestaan van Xe-HPG bekend, de Xe-architectuur op basis waarvan de eerste losse Intel-videokaart voor high-performance gaming wordt ontwikkeld.

Xe-LP

Bij de bespreking van de geïntegreerde gpu in Tiger Lake noemden we al dat het aantal execution units met 50% was verhoogd naar 96 stuks. Ook aan de eu's zelf heeft Intel echter uitgebreid gesleuteld. Het resultaat is onder meer dat er veel hogere kloksnelheden mogelijk zijn: de f/v-curve liep tot 1100 MHz bij Gen11 en tot ruim 1800 MHz voor Xe-LP.

Een belangrijke wijziging in de front-end van de execution units is dat de thread-control tussen twee eu's wordt gedeeld, waar iedere unit bij Gen11 nog zijn eigen aansturing had. Kijken we naar de daadwerkelijke rekeneenheden, dan had de Gen11-architectuur vier alu's die overweg konden met floating-point en integer berekeningen, en vier alu's die floating-point en extended-math bewerkingen konden uitvoeren. Dat complete concept is met Xe-LP op de schop gegooid. Er zijn nu acht alu's voor floating-point en integer berekeningen aanwezig, aangevuld met twee alu's die puur voor extended math dienen.


Een blokdiagram van twee Xe-LP execution units

Aan de complete gpu zijn verder nieuwe L1-caches per subslice van 16 eu's en een gedeelde L3-cache van maximaal 16 MB toegevoegd. Ook de media- en display-engines zijn van een update voorzien. Video's encoderen en decoderen gaat tot tweemaal zo snel en bovendien is er een hardwarematige AV1-decoder toegevoegd. Deze 'open' codec gaat als opvolger van Google's VP9 waarschijnlijk een grote rol spelen in videostreaming. De display-engine kan nu vier monitoren aansturen (dat waren er drie bij Gen11), waaronder via displayport 1.4, hdmi 2.0, thunderbolt 4 en usb 4. Resoluties tot 8K, HDR10 en Dolby Vision, 12-bit kleur, 360Hz-refreshrate en natuurlijk VESA Adaptive-Sync worden ondersteund.


De complete gpu gebaseerd op Xe-LP

Software en drivers

De meeste pc-gamers zullen (helaas) wel uit ervaring weten dat goede gaminghardware niets is zonder goed werkende software. De software- en driverteams zijn daarom hard aan de slag voor de nieuwe Xe-gpu's, die gebruikmaken van een hybride software/hardware-oplossing voor scheduling.

Het grootste nieuws is dat Intel from scratch een volledig nieuwe DirectX 11-driver heeft gebouwd. In tegenstelling tot DirectX 12 en Vulkan is DirectX 11 nog sterk afhankelijk van een goede software-implementatie om de overhead te beperken. De nieuwe DX11-driver heeft volgens Intel lagere latencies en minder last van 'gpu pipeline stalls'.

Verder heeft Intel een techniek in zijn drivers gebouwd die shaders on-the-fly kan hercompileren afhankelijk van hoe die in een game worden uitgevoerd, gaat het gamespecifieke optimalisaties pushen losstaand van volledige driver-updates en komen er diverse filters voor verscherping beschikbaar via het Intel Graphics Command Center.

Xe-HP

Xe-HP is de 'scaled out' versie van Xe-LP, die bestaat uit een 'tile' waarvan er maximaal vier kunnen worden gecombineerd, als een soort multi-core gpu. Veel games zullen daar (nog) niet mee overweg kunnen, maar voor compute-toepassingen vormt dat een minder grote uitdaging. De eerste chip op basis van Xe-HP heeft inmiddels succesvol zijn eerste 'power-on' gehad.

Intel toonde tijdens zijn presentatie een demo waarbij een Xe-HP gpu bestaande uit één tile tien 4K60-streams tegelijkertijd converteerde. Grote klanten hebben reeds een testversie van Xe-HP ontvangen, maar de officiële beschikbaarheid volgt pas volgend jaar.

Xe-HPG: met raytracing, maar extern geproduceerd

Xe-HPG wordt de variant van Xe waarop Intel zijn echte gaming videokaarten zal baseren. Volgens de chipontwerper bevat Xe-HPG elementen van alle drie de overige architecturen, omdat gamers 'de lastigste doelgroep zijn om tevreden te stellen'. De Xe-videokaarten zullen gebruikmaken van gddr6-geheugen om een aantrekkelijk prijspunt te kunnen bereiken - met pijn in het hart, zo zei Raja Koduri, die bij AMD jarenlang groot voorstander van hbm-geheugen voor gamingtoepassingen was. Bovendien zal Xe-HPG zijn voorzien van hardwarematige versnelling voor real-time raytracing.

Het is een publiek geheim dat de Xe-videokaarten gebruik hadden moeten gaan maken van Intels eigen 7nm-procedé, maar met het op de lange baan schuiven daarvan heeft de fabrikant andere keuzes moeten maken. Intel bevestigt nu da de Xe HPG-gebaseerde videokaarten voor gamers bij een externe partij gefabriceerd zullen worden, maar wil daarover nog geen details geven. TSMC ligt veruit het meeste voor de hand - volgens geruchten wil Intel wafers op een doorontwikkeld 7nm-proces inkopen, dat TSMC om marketingredenen 6nm noemt.

Voor de andere varianten van Xe gebruikt Intel wel grotendeels eigen processen. Xe-LP en Tiger Lake worden zoals gezegd geproduceerd op 10nm SuperFin. Xe-HP zal gebruikmaken van de opvolger daarvan, 10nm Enhanced Superfin. De high-end Ponte Vecchio-kaart op basis van Xe-HPC wordt een mengelmoes: de base tile is 10nm SuperFin, de cache is 10nm Enhanced SuperFin, de compute tile wordt een combinatie van 'Intel Next Gen' (7nm) en externe productie, en de i/o-tile voor Xe-Link komt volledig van externe partijen.

De eerste losse videokaart op basis van Xe wordt de DG1, feitelijk een externe versie van de Tiger Lake-igpu, met eveneens 96 eu's en vermoedelijk 3 GB vram. Leden van het early access-programma van Intels DevCloud kunnen daar nu al mee aan de slag, later dit jaar zal de videokaart voor iedereen te koop zijn.

0
*