Nvidia Ampere aka RTX 3000 im Detail und mit Blick auf Virtual Reality

Hinter Nvidias neuer Grafikkartenreihe verstecken sich viele kleine Neuerungen, die wir hier mit Focus auf VR-Nutzen erklären wollen.

Am 02. September hat Nvidia endlich die neue Grafikkarten-Generation mit dem Namen Ampere vorgestellt. Konkret die drei Modelle RTX 3070, RTX 3080 und RTX 3090. Den technischen Daten und von Nvidia bereitgestellten Benchmarks zufolge gibt es damit einen massiven Leistungssprung gegenüber der 2000er-Serie. Sogar das kleinste bislang vorgestellte Modell, die RTX 3070 soll flotter rechnen als eine RTX 2080 Ti. Zum Preisvergleich: Die 3070 kostet als Founders Edition direkt bei Nvidia und inklusive Watch Dogs: Legion nur 499 Euro, die 2080 Ti wird noch immer für stattliche 1100 Euro aufwärts angeboten. Aber wohl nicht mehr lange, denn solch ein Preis wird sich, sollten die vollmundigen Versprechungen stimmen, nur kurz rechtfertigen lassen.

Dafür braucht es noch nicht einmal die im Oktober erschienende 3070. Auch die RTX 3080 kostet mit 699 Euro weniger als die 2080 Ti und schlägt diese noch etwas deutlicher. Die 3080 verfügt zudem über rasend schnellen GDDR6X-Speicher, was den für Nvidia-Verhältnisse fast schon niedrigen Preis interessant macht. Allerdings sind nur 10 Gigabyte Speicher vorhanden, es gibt aber starke Hinweise auf ein später nachgeschobenes Modell mit 20 Gigabyte.

Die RTX 3090 hingegen sieht Nvidia offiziell gar nicht so sehr bei Gamern sondern eher im Profibereich. Dafür spricht die gigantische Menge Videospeicher von 24 Gigabyte aber auch der Preis von 1499 Euro. Trotzdem dürften gerade VR-Enthusiasten mit dem Kauf liebäugeln wird es doch wohl so schnell keine flottere Grafikkarte zu kaufen geben.

Cyberpunk 2077 kommt mit Raytracing, allerdings erscheint das Spiel leider nur Flat und nicht in VR.

Raytracing und KI-Zeugs

Doch auch ungeachtet der reinen Leistungswerte gibt es Neuerungen zu vermelden. Flatgamer bekommen schnelleres Raytracing dank fast verdoppelter Raytracing-Leistung – VR-Games mit Raytracing dürften indes noch etwas auf sich warten lassen. Nicht mehr nur Flat-Domäne ist nun aber DLSS, eine per KI optimierte Supersamplingmethode, mit der bei geringeren Auflösungen die optische Qualität höherer Pixelmengen erreicht wird. Das spart Leistung, was gerade hochauflösende VR-Brillen gut gebrauchen können um hohe Frameraten zu erziehlen.

Zudem beherrschen die neuen RTX-Karten eine Funktion, RTX-IO genannt, mit der sich ohne den Umweg über die CPU große Datenmengen direkt von einer (möglichst schnellen) M.2-SSD in den Grafikspeicher laden lassen. Damit zieht Nvidia mit Konsolen wie der Playstation 5 gleich, die SSD wird sozusagen ein 2^nd Level Cache für die Grafikkarte.

Schauen wir uns die Karten einmal genauer an, beginnend bei der bislang günstigsten Lösung, der

RTX 3070 (ab 499 Euro)

CUDA-Cores: 5.888
Raytracing-Cores: 46 , 2nd Gen.
Tensor-Cores: 184, 3rd Gen.
Speicher: 8 GByte GDDR6 256 Bit
Taktrate GPU: bis zu 1,73 GHz
TDP: 220 Watt (1x PCIe 8 Pin)
Erscheinungsdatum: Oktober 2020 für die FE

RTX 3080 (ab 699 Euro)

CUDA-Cores: 8.704
Raytracing-Cores: 68, 2nd Gen.
Tensor-Cores: 272, 3rd Gen.
Speicher: 10 GByte GDDR6X, 320 Bit
Taktrate GPU: bis zu 1,71 GHz
TDP: 320 Watt (2x PCIe 8 Pin)
Erscheinungsdatum: 17. September für die FE

RTX 3090 (ab 1.499 Euro)

CUDA-Cores: 10.496
Raytracing-Cores: 82, 2nd Gen.
Tensor-Cores:328, 3rd Gen.
Speicher: 24 GByte GDDR6X, 384 Bit
Taktrate GPU: bis zu 1,70 GHz
TDP: 350 Watt (2x PCIe 8 Pin)
Erscheinungsdatum: 24. September für die FE

Auffällig ist die gigantische Menge an Shadereinheiten, mit denen Nvidia wirbt. Gegenüber der Vorgängergeneration verdoppelt selbst die 3070 die Shadermenge – und das im Vergleich zur RTX 2080 Ti. Da klingt es nur nachvollziehbar, wenn Nvidia davon spricht, dass selbst die 3070 eine gut 600 Euro teurere 2080 Ti schlagen kann.

Ich würde trotzdem noch auf Benchmarks warten, vor allem auf welche ohne Raytracing-Beteiligung, da Raytracing mittelfristig in VR kaum genutzt werden dürfte. Denn Nvidia hat die Aufteilung der Shadercluster gegenüber der Vorgänger verändert.

Neuer Aufbau der Shader bei Nvidia Ampere

Vor dem Start der Ampere-Karten war sich die Gerüchteküche sehr sicher, deutlich geringere Shadermengen zu sehen. Das liegt daran, dass vorab die Menge an Streaming-Multiprozessoren von 82 für die 3090 geleakt wurden. Bei bisher 64 Shader-Einheiten pro Streaming-Multiprozessor hätte das die kolportierten 5248 Shader ergeben. Nun verbaut Nvidia aber etwas überraschend 128 statt 64 Einheiten.

Für Grafikberechnungen enthalten diese Streaming-Multiprozessoren neben Cache-Speicher sogenannte FP32 und INT32-Einheiten. FP32 berechnet Gleitkommaberechnungen, INT32 Ganzzahlenberechnungen mit je 32 Bit Genauigkeit.

Nvidia verbaut nun 64 FP32-Einheiten pro Shadercluster sowie 64 Einheiten, die FP32 und INT32 beherrschen statt wie bisher 64 dieser Kombieinheiten. Da FP32 vor allem bei Spielen wichtiger ist, ergibt sich so ein spürbares Leistungsplus.

Muss eine Anwendung aber auch INT32-Berechnungen durchführen, kann eine Kombieinheit das nicht gleichzeitig mit FP32-Berechnungen. Im Grunde erinnert das ein wenig an AMDs Modul-Bauweise in den glücklosen FX-Prozessoren – dort fehlte es aber an Gleitkommaleistung, die bei Nvidias Ampere definitiv ausreichend vorhanden sein dürfte.

Der Chip der RTX-3000-Grafikkarten wird bei Samsung in einem 8nm-Verfahren hergestellt.

Die doppelte Menge an Shadereinheiten bedeutet aber in der Realität nicht auch eine verdoppelte Performance. Je nach Anwendung, dürften, grob geschätzt und auch den etwas höheren Takt gegenüber RTX 2000 einberechnet, etwa 75-80% Mehrleistung statt 100% ankommen – immer noch beachtlich aber vielleicht hilft es beim Einschätzen.

Unterstützt wird diese Beobachtung durch Benchmarks von Digital Foundry. Hier zeigt sich: eine RTX 3080 ist im Schnitt um die 70% schneller als eine RTX 2080. Die pure Menge Shadereinheiten und der schnellere Speicher würden eine größere Steigerung nahelegen.

Interessant ist auch die gegenüber der Vorgängerkarten eher gesunkenen Menge an Raytracing- und vor allem Tensor-Cores. Die 68 Gen1-Raytracingkerne einer RTX 2080 Ti erreicht die 3090 zwar auch – aber eben auch nur diese, die kleineren Karten bleiben darunter. Bei Tensor ist es noch auffälliger: Die RTX 2080 Ti kam auf 544 Gen2-Kerne, selbst die 3090 verfügt aber über nur 328, dafür in Gen3. Allerdings: die dritte Generation soll laut Nvidia viermal so schnell KI-Berechnungen vornehmen können, was die geringere Kernzahl problemlos ausgleichen dürfte. Die Raytracing-Einheiten sollen immerhin fast doppelt so schnell arbeiten so dass sich auch hier eine effektive Verbesserung statt eines Downgrades ergibt und selbst die RTX 3070 Raytracing schneller berechnen dürfte als die 2080 Ti.

SSD-Direktzugriff mit RTX-IO

Ein besonders spannendes Feature abseits der reinen Shaderleistung ist RTX-IO. Bereits bei der Vorstellung der Playstation 5 war eine Funktion besonders interessant: Direkter und dank eines zusätzlichen Controllers sehr schneller Zugriff von der NVMe-SSD. So kann die SSD Daten mit mehreren Gigabyte pro Sekunde direkt mit dem GPU-Speicher austauschen, was das Nachladen hochauflösender Texturen und von Geometriedaten beschleunigt. Auch Ampere bietet jetzt eine solche Funktion, die dafür nötige Controllerlogik steckt direkt in der GPU.

Bislang müssen Daten von Festplatte oder SSD von der CPU dekodiert werden, was Rechenleistung kostet und die maximale Datenrate senkt. Die bis zu 7 Gigabyte pro Sekunde einer NVMe-SSD belasten dabei auch einen modernen Achtkernprozessor extrem – so sehr, dass sich diese Datenmengen als Stream beim Spielen (schließlich will das Spiel auch noch CPU-Zeit für sich haben) ausschließen. In Zeiten von Festplatten mit ihren geringen Datenraten oder auch SATA-SSDs mit bis zu 550 Mbyte/s war das kaum problematisch, NVMe beschleunigt dank direkter Anbindung an die PCIe-Lanes aber auf eben bis zu 7 Gigabyte pro Sekunde.

Die Samsung 980 Pro SSD arbeitet dank PCIe 4.0 rasend schnell.

Da hochauflösende VR wie beispielsweise mit der HP Reverb G2 oder Pimax 8KX auch hochauflösende Texturen fordert um wirklich beeindruckende Grafik zu zeigen (vergleicht einmal Asgard’s Wrath mit einigen Indie-Spielen und achtet auf die Texturqualität – dann wisst ihr auch, warum das Oculus-Spiel über 100 Gigabyte auf dem Laufwerk frisst). Selbst 8 oder 10 Gigabyte Grafikspeicher füllen sich da in hohen Auflösungen oder mit Supersampling sehr schnell. Große Open-World-Spiele können daher nicht immer alle Daten vorrätig halten, es muss, möglichst unauffällig, beim Spielen nachgeladen werden.

Hier setzt RTX-IO ein und überlässt der GPU die nötigen Übertragungsberechnungen, was bei sehr hohen Datenraten nicht mehr einen Zehnkern-Prozessor auslastet sondern nur noch einen halben Core in Anspruch nimmt. Noch ist diese Funktion zwar bei keinem Spiel im Einsatz- wie auch, die Hardware erscheint ja erst – aber in Zukunft dürften gerade Multi-Plattform-Entwicklungen davon profitieren. Wir tippen: In gar nicht so ferner Zukunft wird dieser SSD-Direktzugriff sogar Standard sein. Solltet ihr aber die 3000er-Reihe überspringen: Bis zur 4000er wird das mit Standard wohl noch nicht geschehen..

KI-Upscaling auch für VR: DLSS 2.1

Noch interessanter ist das KI-Upscaling per DLSS: Hier wird das Spiel in einer geringeren Auflösung als das Display nativ bietet berechnet und dann per künstlicher Intelligenz hochskaliert. Um die Funktion nutzen zu können, müssen Entwickler allerdings nicht nur ihr Spiel anpassen, sie müssen auch Bildsequenzen in unterschiedlicher Qualität auf einem Nvidia-Server für das Upscaling vorberechnen lassen – die KI muss trainiert werden, damit die Grafikkarte ein gutes Ergebnis erzielen kann, so ein Server ist dann doch etwas flotter für dieses Training.

Nvidias Werbescreenshots und -Videos sind beeindruckend – selbst ein WQHD-Bild, hochskaliert auf 4K, sieht darin schärfer und detailreicher aus als ein natives 4K-Bild. Und das mit höheren Frameraten.

Interessant ist, dass DLSS in Version 2.1 nicht mehr nur Flatgames sondern auch VR unterstützt. Allerdings wird diese Funktion wohl vorerst eher selten in VR-Games zu sehen sein und wenn dann eher in denen größerer Studios – die Rechenzeit auf dem Nvidia-Server dürfte nicht kostenlos angeboten werden. Wird DLSS aber genutzt, könnte eine HP Reverb G2 statt mit 2x 2.160×2.160 auch im performancesparenden Modus mit 1.440×1.440 Pixeln genutzt werden können ohne ein sichtbar schlechteres Bild zu erzielen. Das ist natürlich auch im Hinblick auf kommende und vielleicht noch höher auflösende VR-Brillen nicht uninteressant.

Speichersituation – wie viel ist zuwenig?

Während die RTX 3070 mit 8 Gigabyte GDDR6 recht konservativ daherkommt, setzt 3080 und 3090 auf den brandneuen GDDR6X-Speicher mit deutlich gesteigerter Performance. Spannend wird es daher sein, in ersten realen Benchmarks zu beobachten, wie sich Speichermenge- und Geschwindigkeit auswirken.

Während AMD einige Zeit auf den teuren, nicht allzu großen und dazu noch energiehungrigen HDR-Speicher gesetzt hat, erreicht jetzt auch GDDR6X fast diese Geschwindigkeiten. Ebenfalls spannend: Reichen mittelfristig die 10 Gigabyte der RTX 3080? Wer primär in geringen Auflösungen spielt, wird wohl keine Probleme bekommen. Hochauflösende Texturen füllen Videospeicher aber sehr schnell und effektiv. Und unsere VR-Brillen streben ebenfalls immer in Richtung höherer Auflösungen.. Lenovo zeigte bereits Hinweise auf eine RTX 3070 mit 16 Gigabyte und auch eine RTX 3080 mit 20 Gigabyte ist wohl sicher. Die sündhaft teure Titan-Nachfolgekarte RTX 3090 hingegen ist mit 24 Gigabyte durchaus zukunftssicher ausgestattet. Wir würden uns aber nicht wundern, wenn im kommenden Jahr noch eine 1000 Euro teure RTX 3080 Ti mit 20 Gigabyte nachrücken würde.

Bislang gibt es im VR-Bereich kaum Titel, die nach 24 Gigabyte rufen, auch die 8 Gigabyte einer RTX 2080 reichen aktuell noch recht gut und die 11 Gigabyte einer RTX 2080 Ti erst recht. Mit einer 10 Gigabyte RTX 3080 solltet ihr also vorerst keine Probleme haben, bei den 8 Gigabyte der 3070 kommt allerdings neben der geringeren Speichermenge auch die niedrigere Geschwindigkeit hinzu – wir sind gespannt.

Die Zukunft von Ampere – und AMD RDNA2

Bis Oktober startet Nvidia die ersten drei Karten den Ampere-Generation. Doch es wird noch mehr geben, das ist recht sicher. Da zu Beginn der Fertigung, vor allem der einer brandneuen Architektur in einem ebenfalls neuen Fertigungsprozess (hier: Samsung 8nm „Nvidia Custom“) noch keine Unmengen an Chips produziert werden können, folgen die kleineren, bezahlbareren, Modelle meist später. So können auch Chips eingesetzt werden, die sich für die großen Highend-GPUs nicht eignen, beispielsweise weil einzelne Shader-Komplexe defekt sind. Diese werden deaktiviert und der Chip eine Leistungsstufe kleiner verkauft.

Wie gut sich AMDs RDNA2 gegenüber Ampere schlägt, werden wir wohl erst später im Jahre erfahren.

So erwarten wir entweder Ende 2020 oder Anfang 2021 eine RTX 3060, ebenfalls auf Basis des 102er-Chips der RTX 3070. Es bleibt zu hoffen, dass Nvidia hier gleich auf 8 Gigabyte Speicher setzt statt wie in der Vorgängergeneration erst nur auf 6 Gigabyte. Ansonsten erwarten wir von einer 3060 eine Leistung auf dem Niveau einer RTX 2070 Super – was bereits zum Betrieb einer HP Reverb G2 ausreicht. Mit einer RTX 3070 bei 499 Euro wird eine potentielle 3060 wohl im Preisbereich 350-400 Euro liegen, eventuell sogar darunter – je nachdem, wie sich AMD positioniert.

Deren RDNA2-Architektur ist ebenfalls nagelneu und wird in den neuen Konsolen von Sony und Microsoft eingesetzt. In Playstation 5 und Xbox Series X sorgt die GPU für Raytracing-Funktionen und, zumindest den nackten Teraflopzahlen zufolge, auch viel Leistung.

Im PC erwarten wir allerdings keine Leistung auf dem Niveau einer RTX 3090 sondern eher im Bereich von maximal einer RTX 3080. Beim obligatorischen Raytracing hat Nvidia bereits eine Generation mehr Erfahrung, daher dürfte Team Green hier wohl vorerst die Oberhand behalten. Allerdings gibt es bereits vermehrt Gerüchte (und es passt auch zur bisherigen Strategie), dass die AMD-Karten mit „Big Navi“ eine großzügige Speicherbestückung von 16 Gigabyte tragen werden. Wie gut sich AMD positionieren kann, wird aber nicht zuletzt auch vom Verkaufspreis der neuen Karten abhängen. Und hier hat Nvidia ungewohnt niedrig vorgelegt – zumindest bei den beiden offiziell für Gamer gedachten Karten.

Fazit: Was bringt Nvidia Ampere für VR

Die Antwort auf diese Frage ist einfach: Mehr Leistung und potentiell sinkende Preise. Hier sehen wir vor allem die noch nicht angekündigten Mittelklassekarten sehr positiv, zumal die RTX 3070 den Preis vorgibt – über 500 Euro wird die Mittelklasse wohl eher nicht kosten können. Die Zukunft mit noch höher auflösenden VR-Brillen sieht dank DLSS 2.1 und der puren Power einer RTX 3080 und vor allem 3090 aber ebenfalls gut aus, gleiches gilt für hohe Frameraten sollten sich mehr Hersteller für 144 Hz entscheiden wie Valve.

Wer jetzt zuschlagen möchte, macht mit einer RTX 3080 wohl nur wenig falsch – sollte diese außerhalb der finanziellen Möglichkeiten liegen, wird aber auch eine 3070 voraussichtlich eine sehr gute Leistung bringen, für die lange mindestens 750 Euro (2080 Super) fällig wurden.

Eine RTX 3090 klingt natürlich außerordentlich verlockend, allerdings würde ich dringend auf Benchmarkergebnisse warten und dort gerade auch auf die Unterschiede zur RTX 3080 achten. Sollte der Performancevorteil unter 25% liegen, lohnt es sich kaum, gleich das Doppelte für die nächstbessere Karte auszugeben. Da wäre es vielleicht sinnvoller, noch etwas zu warten, vielleicht erscheint ja noch eine 3080 Ti..

Einige der Links in diesem Artikel sind (unter Umständen) sogenannte Affiliate-Links. Mit einem Kauf über einen dieser Links bekommen wir eine kleine Provision, für euch ändert sich nichts.

VR-Legion

We don't play flat!