La serie Killer GeForce RTX 4090 e 4080 di NVIDIA riguarda il miglioramento dei giochi per PC ad alta fedeltà

2022-10-22 20:13:45 By : Ms. Shelly Xie

Il CEO di NVIDIA Jensen Huang possiede una GeForce RTX 4090 basata sull'architettura GPU Ada LovelaceTra tutte le fanfara e lo sfrigolio alla Virtual GPU Technology Conference (GTC) di NVIDIA questa settimana, la centrale elettrica della piattaforma di gioco e intelligenza artificiale della California ha finalmente annunciato le sue schede grafiche per PC Gaming di nuova generazione basate sulla sua architettura GPU Ada Lovelace.Prende il nome da un matematico inglese e pioniere dei computer, Lovelace di NVIDIA è davvero una lastra di silicio bestiale con un approccio progettuale più di tutto, costruito su un processo di fabbricazione del chip TSMC 4N all'avanguardia.Tuttavia, la sua architettura del chip di base è stata progettata anche con nuove innovazioni nei suoi vari motori al silicio, nel tentativo di scalare le prestazioni oltre i limiti della legge di Moore, in cui la densità dei transistor sta raggiungendo un punto di rendimenti sempre più decrescenti con ogni nuovo fab node sembra.Caratteristiche di NVIDIA GeForce RTX serie 40 Ada LovelaceIn effetti non c'è dubbio che la GPU Lovelace di NVIDIA sia molto più robusta della sua architettura Ampere di precedente generazione, e infatti la nuova GeForce RTX 4090 ha 16.384 core CUDA e 24 GB di memoria GDDR6X, contro 10.752 core CUDA (stessa memoria) in un RTX 3090. Anche se , la nuova GeForce RTX 4080 da 12 GB ha 7.680 core CUDA, contro una RTX 3080 a 8960, mentre una scheda RTX 4080 da 16 GB ha 9.728 core, meno di una RTX 3080 Ti a 10.240 core CUDA.Queste specifiche della serie RTX 4080 e il marchio del modello potrebbero essere un punto critico per alcuni che stanno solo contando i core, ma il ridimensionamento delle prestazioni qui semplicemente non è lineare, soprattutto se si considera che queste nuove schede GeForce RTX serie 40 hanno clock boost a nord di 2,5 GHz, mentre la generazione precedente ha raggiunto il massimo a 1,75 GHz.Specifiche NVIDIA Ada Lovelace e GeForce RTX 4080/4090 rispetto alla precedente generazione RTX 3090Oltre a questi conteggi core, velocità e feed, ci sono diversi nuovi miglioramenti e innovazioni a cui NVIDIA punta per i miglioramenti delle prestazioni di Ada Lovelace e, in definitiva, ciò che introdurrà nuovi livelli di fedeltà dell'immagine e immersione per i giocatori, tra cui il nuovo core Ray Tracing innovazioni, così come i core Tensor di quarta generazione che ora sono dichiarati spingono oltre il doppio del throughput TFLOP.Inoltre, Lovelace supporterà anche la codifica/decodifica video AV1 nell'hardware, proprio come la serie Arc di Intel, che dovrebbe essere un vantaggio per le prestazioni di streaming di giochi con un sovraccarico molto più basso ad un certo punto in futuro.Ray Tracing (RT) è una tecnica di rendering grafico per effetti di luce e riflessione con una fedeltà visiva molto più elevata e accurata rispetto alla rasterizzazione tradizionale, sebbene abbia anche un sovraccarico computazionale molto più elevato.Prima dell'avvento del ray tracing, la rasterizzazione tradizionale era un processo molto ordinato e deterministico.RT non consente questa coerenza naturale e parti di una scena renderizzata 3D non possono quindi essere renderizzate contemporaneamente, causando stalli nella pipeline.Riordino dell'esecuzione di NVIDIA Ada Lovelace Shader per il ray-tracingQuesto problema limita notevolmente gli effetti ray traced nei moderni motori di gioco.Tuttavia, l'arco GPU Ada Lovelace di NVIDIA supporta una nuova tecnica, chiamata Shader Execution Reordering (SER), che aggiunge una fase nella pipeline RT in cui batch e riordini funzionano in modo che i raggi che eseguono lo stesso programma possano essere eseguiti insieme in modo più efficiente (vedi illustrazione sopra ).Cyberpunk 2077 Modalità Overdrive con Ray Tracing avanzatoNVIDIA afferma che SER può offrire un miglioramento fino al 2X percento delle prestazioni di rendering RT e in particolare ha evidenziato una nuova versione del gioco Cyberpunk 2077 con nuovi livelli più elevati di effetti RT, inclusa una modalità Overdrive che consente 635 operazioni RT per pixel (sopra) per una grafica eccezionale.Infine, va notato che gli sviluppatori di giochi devono coordinarsi con NVIDIA sull'ottimizzazione del carico di lavoro RT e sulle migliori pratiche di ordinamento, quindi NVIDIA ha un'API disponibile per gli sviluppatori per aiutare a ottimizzare i loro motori di gioco e le tecniche di rendering con questa funzionalità.La tecnologia DLSS o Deep Learning Super-Sampling di NVIDIA è una tecnica di recupero delle prestazioni che ha fornito buoni guadagni di prestazioni per i giocatori che desiderano aumentare la fedeltà visiva con il ray tracing o aumentare gli FPS (Frames Per Second) per un gameplay a risoluzione più elevata su schede GeForce.La tecnologia utilizza l'apprendimento automatico per eseguire il rendering di frame a risoluzione più elevata dedotti da modelli pre-addestrati nei data center di NVIDIA, consentendo al resto della pipeline grafica di funzionare a una risoluzione inferiore per prestazioni più elevate e una latenza inferiore, ma con una qualità dell'immagine simile a quella nativa superiore immagine di risoluzione.Sebbene anche AMD e Intel abbiano tecniche di upscaling competitive (FSR e XeSS), DLSS è ora alla sua terza iterazione ed è stato ben accolto e distribuito dagli sviluppatori di giochi, con 200 titoli di giochi e app che attualmente utilizzano la tecnologia.NVIDIA DLSS 3 con accelerazione del flusso ottico e generazione multi-frameLaddove il nuovo DLSS 3 di NVIDIA (supportato solo sulle schede della serie RTX 40) differisce dal suo DLSS 2 di generazione precedente, è che l'architettura è diventata così veloce con la nuova architettura di NVIDIA che la GPU ora può generare interi frame in tempo reale per molto prestazioni più elevate, pur mantenendo un'eccellente qualità dell'immagine.Con DLSS 3, NVIDIA ha fornito esempi dell'intelligenza artificiale che esegue il rendering di metà dei fotogrammi in una sequenza e 7 pixel su 8, con l'upscaling coinvolto e la generazione di fotogrammi combinati.Senza entrare troppo in profondità nelle erbacce, le schede GeForce RTX 40 ottengono questo in parte grazie a un acceleratore di flusso ottico molto più veloce che calcola il movimento dei pixel in una scena.Questo acceleratore ha una comprensione di come l'illuminazione e le ombre dovrebbero essere visualizzate correttamente mentre un oggetto si muove, quindi alimenta tutte queste informazioni nei motori di intelligenza artificiale del Tensor sul chip (sopra il diagramma), per prendere una decisione sul modo migliore per generare il fotogramma.La tecnologia può anche aiutare a migliorare le prestazioni nei motori di gioco che in genere sono anche più legati alla CPU, tramite questa tecnica di generazione multi-frame.NVIDIA ha mostrato le demo di Cyberpunk e Microsoft Flight Simulator con la tecnologia, per un impressionante aumento delle prestazioni 2X con una grande fedeltà visiva.NVIDIA avrà anche un plug-in AI DLSS 3 semplificato per una più semplice integrazione degli sviluppatori di giochi e anche i motori di gioco Unity e Unreal supporteranno nativamente la tecnologia.Inoltre, la società ha notato che, oltre a Cyberpunk e MS Flight Sim, al lancio ci saranno 35 titoli di gioco che supporteranno DLSS 3, con altri in arrivo, in quello che NVIDIA afferma essere l'adozione più veloce mai vista della sua tecnologia.Perdona il grafico qui sotto, che è un po' un grafico a occhio qui nel motore di Forbes.Indipendentemente da ciò, NVIDIA è stata abbastanza diretta sulle aspettative di prestazioni per la nuova serie GeForce RTX 40, mostrando una GeForce RTX 4080 da $ 899 o talvolta battendo facilmente la GeForce RTX 3090 Ti di precedente generazione, che aveva un prezzo consigliato di $ 1999 al lancio.L'azienda ha anche mostrato prestazioni in giochi di nuova generazione come Cyberpunk 2077, che supportano DLSS 3, con livelli di prestazioni molto più elevati.Previsti guadagni di prestazioni della serie GeForce RTX 4090/4080 rispetto a GeForce RTX 3090 TiNel complesso, come si può debolmente vedere nel grafico sopra, le schede GeForce RTX 4090 e 4080 possono funzionare fino a 2 - 4 volte più velocemente (RTX 4090) rispetto alla potente GeForce RTX 3090 Ti.Tuttavia, il grafico sopra mostra tutti i confronti delle prestazioni DLSS (sinistra, fino a 2X) e DLSS 3 (destra, fino a 4X).Sarà molto interessante vedere come le prestazioni scompaiono con il DLSS disattivato nel gioco tradizionale, anche se si potrebbe obiettare perché preoccuparsi di disattivarlo, purché un gioco supporti la tecnologia.La GPU NVIDIA Ada Lovelace muore e scatta il pacchettoFamiglia e prezzi della serie NVIDIA GeForce RTX 4090 e RTX 4080La nuova famiglia di schede GeForce RTX 40 iniziali di NVIDIA è elencata sopra con i rispettivi prezzi.Velocità, feed e configurazioni a parte, l'azienda ha lanciato qui un'offerta di prodotti estremamente potente, che afferma di portare un grande aumento delle prestazioni per dollaro di 3X in media per le sue schede RTX 4080 e 4X per le sue schede RTX 4090, rispetto alle sue generazione precedente.È importante notare che queste affermazioni sulle prestazioni sono fatte con la sua nuova tecnologia DLSS 3 in gioco, quindi sarà ancora interessante vedere come le prestazioni si scuotono su tutta la linea, con DLSS attivato e disattivato, nonché abilitato per il ray tracing giochi e tradizionali carichi di lavoro di rasterizzazione.Il CEO di NVIDIA Jensen Huang riceve il premio Robert N. NoyceUltimo ma certamente non meno importante, ho avuto la possibilità di incontrare il CEO di NVIDIA Jensen Huang in una conferenza questa settimana e gli ho chiesto quanto fosse vantaggioso il passaggio dal processo di fabbricazione del chip 8N di Samsung a TSMC 4N per questa generazione.Jensen ha notato che il suo team di progettazione ha realizzato un aumento di "circa il 15%" rispetto al solo processo, mentre il resto dei miglioramenti delle prestazioni di RTX 40 deriva dall'innovazione del silicio come SER (Shader Execution Re-Ordering) e DLSS.Huang ha osservato che, mentre il processo 4N di TSMC è molto più avanzato, "purtroppo il costo aumenta di oltre il 15%" e che il solo ridimensionamento della densità dei transistor non è sufficiente e non fa più il lavoro, perché "la legge di Moore è morta .”Inoltre, ha osservato Jensen, “e non è perché TSMC stia cercando di ottenere maggiori profitti.Non è vero.Il loro costo è aumentato.Puoi dire che il loro tempo di ciclo è aumentato perché il numero di fasi del processo è aumentato".Huang ha continuato spiegando che “il modo in cui l'abbiamo risolto, Dave, con Ada è l'architettura.Il vantaggio combinato di diverse architetture diverse e la grande leva, la leva gigante era l'intelligenza artificiale e i core tensor.Questa è la leva gigante... E quindi penso che dobbiamo superare la debolezza che siamo alla fine della legge di Moore, non rinunciando, ma inventando tecniche molto più intelligenti, e grazie al cielo è arrivata l'intelligenza artificiale appena in tempo."Devi ammirare la passione di Jensen per l'azienda, i suoi prodotti e il fiorente campo dell'IA.Non c'è dubbio che l'intelligenza artificiale sia una "grande leva", come osserva Huang.L'intelligenza artificiale sta diventando pervasiva ora in così tante aree della tecnologia e la creazione di immagini ad alta fedeltà per i giochi per PC è sicuramente un'evoluzione naturale.