Blog (275)
Komentarze (260)
Recenzje (0)
@SirckZabawy z DLSS 3 - wrażenia i przemyślenia

Zabawy z DLSS 3 - wrażenia i przemyślenia

30.09.2023 15:23, aktualizacja: 30.09.2023 15:57

Same parametry to nie wszystko, co oferują nam współczesne karty graficzne. Nvidia, AMD oraz Intel inwestują w nowe rozwiązania mające przykuć uwagę graczy i profesjonalistów. Czasami próby te wywołują sporo zamieszania, czego przykładem będzie ożywiona dyskusja wokół DLSS 3.

2417039

Zacznijmy od początku. DLSS 3 w dniu swojej premiery wzbudził niemałe kontrowersje. Głównie, dlatego ponieważ pozostał dodatkiem ekskluzywnym dla obecnej generacji Ada Lovelace. „Generator klatek” finalnie nie zdołał przekonać do siebie większej ilości graczy. Można wyczuć wszechobecne uprzedzenie do eksperymentów Nvidii z AI kosztem czystej mocy obliczeniowej układu graficznego. Nietrudno też odnieść wrażenie, że zabawa w pecetowy gaming zrobiła się bardzo drogim hobby. W efekcie zainteresowanie nim sukcesywnie maleje, ale to temat na inny raz.

W skrócie, co to jest DLSS 3?

Kilka słów wyjaśnienia dla laików. Ogarnięci w temacie niech od razu przejdą do następnego akapitu. DLSS, czyli Deep Learning Super Sampling, to algorytm oparty na uczeniu maszynowym, który został sprawdzony wraz z premierą układów serii RTX 2000 w 2018 roku. Słowem jest z nami pięć lat. Natomiast DLSS 3 to jego kolejna wersja rozwojowa.

DLSS w wielkim skrócie to metoda upscalingu – karta graficzna generuje obraz w niższej rozdzielczości a resztę ogarnia algorytm, pracujący na dedykowanych rdzeniach Tensor. Pożądanym efektem było więcej klatek na sekundę w docelowej (wyższej) rozdzielczości. Oczywiście pierwsze wersje DLSS miały swoje problemy w postaci artefaktów graficznych, czy nieostrego obrazu. Wersja 2.0 sukcesywnie naprawiała te niedogodności.

DLSS 3 to trochę inny zawodnik wprowadzający Optical Flow Accelerator. Jego główny moduł stanowi Frame Generation – generator klatek. Jest to funkcja dostępna wyłącznie dla serii RTX 4000. Będąc dokładnym Nvidia wyjaśnia, że seria 3000 po prostu nie ma możliwości technicznych, aby podołać zadaniu. Algorytmy analizuje postępujące po sobie obrazy pozwalając tak interpolować klatki animacji.

2417071

Mówiąc dokładnie, AI generuje dodatkową klatkę obrazu między dwiema wygenerowanymi przez GPU. Dla gracza skutkuje to większą liczbą fps‑ów. Pamiętajmy jednak, że frame generation jest łakomy na pamięć VRAM. Do tego, ponieważ generujemy dodatkową klatkę, skutkuje opóźnieniami sygnału (latency). Na to jednak Nvidia znalazła stosowne rozwiązanie.

Frame Generation musi być uruchomiony z drugim modułem DLSS 3 w postaci Nvidia Reflex. Jego zadaniem jest minimalizować wszelkie opóźnienia (tzw. input lag) powodowane przez generator klatek. Jednocześnie możemy, ale też nie musimy, uruchomić DLSS 2.0, czyli metodę upscalingu obrazu. Jeśli idzie o high-end (4080, 4090), tak można go pominąć. W przypadku low‑end (rodzina 4060) Frame Generation musi iść w parze z DLSS 2.0.

DLSS 3 jest sukcesywnie wdrażany do różnych gier. Mają go Cyberpunk 2077, Wiedźmin 3, Returnal, Atomic Heart, Hogwarts Legacy, Marvel's Spider-Man, Dying Light 2, Diablo 4. Oczywiście liczba gier z dostępnym DLSS 3 to kropla w morzu pecetowych tytułów. Mimo tego wartość rozwiązania powinniśmy docenić właśnie w nowościach dla pojedynczego gracza, które cechuje spore zapotrzebowanie na VRAM i moc przerobową GPU.

Wisienka na torcie, czyli Frame Generation i RTX 4080

RTX 4080 w Diablo 4, przy rozdzielczości 4K i ustawieniach graficznych Ultra, daje nam 70 klatek. RTX 4070 Ti w identycznych ustawieniach 55 fps. Po uruchomieniu DLSS 3 mamy odpowiednio dla mocniejszej karty 180 i 140 dla modelu z dopiskiem Ti. Brzmi to aż nazbyt dobrze, dlatego postanowiłem pogrzebać bardziej przy temacie. Wykonałem kilka benchmarków na miarę moich możliwości technicznych, ale przede wszystkim chciałbym skupić się na wrażeniach subiektywnych - jak się właściwie gra z włączonym DLSS 3?

Temat udało mi się ogarnąć dzięki uprzejmości firmy Inno3D, która podrzuciła do tych celów dwie karty. Do mojej platformy testowej pierw powędrował RTX 4080. Użyty procesor to Core i7‑13700K i towarzyszy mu pamięć 32GB DDR4 z zegarem 3600MHz. Gry i system Windows 10 lądują na dysku NVMe. Słowem nie brakuje mocy obliczeniowej. Skupiłem się na standardzie rozdzielczości 2560 x 1440 px. Uprzednio wgrałem najnowszą wersję sterowników 537.42.

Na pierwszy ogień poszedł A Plague Tale: Requiem w maksymalnych ustawieniach graficznych. Nasza karta spokojnie wykręca 110 fps (wykorzystanie pamięci 4590 MB, alokacja 5500 MB). Jeśli sięgnąć po DLSS 2 uzyskamy dodatkowych 47 klatek, przy jednoczesnej redukcji zapotrzebowania na VRAM o jakieś 300 MB (alokacji i faktycznego użycia). Generator klatek pozwolił dodać średnio 60 fps, ale zapotrzebowanie na VRAM wzrosło o 1GB. Dla 4080 to nie problem. Razem – DLSS 2 i generator klatek – dały 230 fps‑ów.

Włączony DLSS Frame Generation bez DLSS 2.0.
Włączony DLSS Frame Generation bez DLSS 2.0.

Wszystko działało płynnie. Niezależnie od wybranego trybu gra pozostawała responsywna i nie przeszkadzały żadne artefakty. Tutaj na korzyść gry działa brak HUD‑a. Podobnie zachowywał się Cyberpunk 2077 w najnowszej wersji. Natywnie 80 fsp, z DLSS 2 103 klatki, z generatorem 130 a razem oba rozwiązania dały (uwaga!) 175 klatek. Ciekawostką jest, że gra studia CD Projekt RED przy zaznaczeniu funkcji Frame Gen uruchamia też DLSS 2 w trybie auto.

RTX 4080 generalnie ma na tyle własnych sił, że w rozdzielczości 2560 x 1440 px ogarnia gry bez żadnych wspomagaczy. Natomiast dodatek DLSS 3 pozwala dociągnąć klatki do odświeżania szybkiego monitora lub przeskoczyć potencjalne wąskie gardło po stronie procesora. Wszystko jasne. No dobrze, a jak to wygląda po całkowicie opozycyjnej stronie – z kartami budżetowymi?

RTX 4060 kartą do 1440p? Sprawdźmy

Nvidia kartę 4060 pozycjonuje w roli układu do zabawy w 1080p. Czy możemy przeskoczyć to ograniczenie? Poniżej przygotowałem dwa wykresy – ponownie A Plague Tale i Cyberpunk w rozdzielczości 2560 x 1440 px. Mamy kolejno od góry renderowanie bez wspomagaczy, DLSS 2, generator klatek oraz DLSS + generator.

2417078

RTX 4060 sam z siebie wyciśnie 40 klatek, co trudno nazwać w pełni komfortowym doświadczeniem. DLSS 2 pozwala wykręcić upragnione sześćdziesiąt klatek i wszystko działa należycie. Natomiast sam generator to 65 fps. Z tym jednak, że wtedy alokacja pamięci wynosi 7900 MB a użycie 7300 MB, czyli wykorzystujemy niemal cały VRAM. Może to czasami skutkować doczytywaniem tekstur w locie. Udało się tego uniknąć, choć problem ten o wiele bardziej doskwiera np. w Forspoken. Do tego czułem, że gra łapała opóźnienia. Sprawę dopiero rozwiązało dodatkowe uruchomienie DLSS 2, dając prawie 100 klatek. Gra wtedy należycie odpowiadała na nasze komendy wystukiwane na klawiaturze, plus VRAM dostał lekkiego oddechu.

2417079

Cyberpunk w najnowszej wersji podniósł wymagania. Widać i czuć pod palcami zmiany naniesione przez twórców. W maks detalach i pełnym śledzeniem promieni nasz RTX 4060 ciągnie ledwo 30 klatek. Alokacja VRAM wynosi 7,9 GB a jej faktyczne zużycie 7,4 GB. Doczytywanie tekstur czy geometrii zdarzało się ciut częściej niż bym tego chciał. Ogółem nie da się grać. Wyłącznie RT da nam co najwyżej 48 fps. DLSS 2 ratuje sytuację. Z włączonym RT pozwala na płynne 60 klatek, obniżając zapotrzebowanie na VRAM o jakieś 800MB.

Włączony samodzielnie generator klatek zawiódł, bo pozwolił karcie na wygenerowanie ledwo 48 fps, przy niemal całkowitej alokacji pamięci. Podczas grania nasza postać dosłownie pływała. Ponownie na ratunek przyszedł DLSS 2, pozwalając na osiągnięcie 80 klatek na sekundę, zastawiając przy okazji trochę wolnego miejsca w pamięci karty. Dopiero wtedy dało się grać. Pewne glitche graficzne potrafiły pojawić się tu i tam, ale nic co mogłoby przeszkadzać w zabawie.

Moje przemyślenia o DLSS 3 - hit, czy kit?

Według założeń Nvidii to głównie z powodu DLSS 3 konsumenci mają sięgać po serię 4000. Tyle w teorii a co mówi praktyka? Przede wszystkim ustalmy, że generator klatek sam w sobie nie jest przyspieszeniem karty. Określmy go raczej wygładzaczem animacji. Z tego powodu DLSS 3 raczej nie zawita do trybu wieloosobowego szybkich gier pierwszoosobowych, gdzie o zwycięstwie decydują nierzadko setne sekundy. Tutaj sztuczne klatki mogłyby działać na niekorzyść.

DLSS 3 (FG + DLSS2) w grze Cyberpunk 2077. Detale ultra, ray tracing i 1440p.
DLSS 3 (FG + DLSS2) w grze Cyberpunk 2077. Detale ultra, ray tracing i 1440p.

Frame Generation w segmencie high-end (4080, 4090) to wartościowy dodatek, pozwalający ominąć bottleneck procesora, co dziś wcale nie jest rzadkim zjawiskiem. Jest to także sposób na spożytkowanie potencjału monitorów z wyższym parametrem odświeżania. W sumie ma to także sens w przypadku układów klasy 70. Jeśli idzie o dolną półkę (seria 4060) wrażenia mogą być mieszane. Przede wszystkim w mojej ocenie dla właściwego odbioru DLSS 3 karta musi utrzymywać stabilne 50‑60 fpsów, najlepiej bez żadnego wspomagania. Dla właściwego działania koniecznym jest też DLSS 2. Oczekując pełnego komfortu zalecam również pobawić się ustawieniami graficznymi.

Sposób wdrożenia DLSS 3 różni się w każdej grze, co powoduje, że doświadczenia potrafią być czasami skrajnie odmienne. Mimo tego to ciekawy kawałek technologii. Czy przesądza o wyborze karty Nvidii? Pozostawiam to już do indywidualnej oceny. Natomiast jeśli macie już kartę serii 4000 żal nie spróbować. Efekt może zaskoczyć bardziej niż pozytywnie.

Wybrane dla Ciebie
Komentarze (2)