Blog (270)
Komentarze (260)
Recenzje (0)
@SirckZabawy z DLSS 3 ciąg dalszy

Zabawy z DLSS 3 ciąg dalszy

27.10.2023 13:16, aktualizacja: 29.10.2023 11:51

Po moich ostatnich zmaganiach z kartami graficznymi i generatorem klatek naszło mnie proste pytanie: lepiej wybrać RTX 4060 czy RTX 3060 do rozbudowy leciwego lub budżetowego PC? Czy DLSS 3 z Frame Generation w przypadku komputerów dnia wczorajszego będzie wartością dodaną?

2419405

We wrześniu bawiłem się kartami Nvidii serii 4000 i ich funkcją generatora klatek. Na warsztat wziąłem RTX 4080 i RTX 4060. Z pierwszą nie było żadnych niespodzianek. Obawy miałem o tańszego RTX‑a. Ostatecznie karta wybroniła się. Niemniej, pracowała w sprzyjających warunkach, czyli nowym i bardzo mocnym PC. Jest to oczywiście zgodne z metodyką testową kart graficznych. Czy ma pokrycie w faktycznym scenariuszu użytkowym budżetowego GPU? Już nie bardzo.

Słowem wstępu o technologiach Nvidii

DLSS, czyli Deep Learning Super Sampling, to algorytm wykorzystujący uczenie maszynowe, który zadebiutował z serią kart graficznych RTX 2000 w roku 2018. Minęło już pięć lat od tamtej premiery i po drodze dostaliśmy dwie nowe wersje z oznaczeniami 3 oraz 3.5.

DLSS to technika upscalingu, działająca na dedykowanych rdzeniach Tensor. GPU renderuje obraz w niższej rozdzielczości w celu zwiększenia wydajności, a potem AI odpowiada za jego przekształcenie w wyższą rozdzielczość, zachowując przy tym poziom szczegółów, jakby obraz początkowo był renderowany w docelowej (wyższej) rozdzielczości. Brzmi to pokrętnie, ale w skrócie pozwala to na osiągnięcie większej liczby klatek na sekundę bez konieczności redukcji poziomu detali.

DLSS 3 to trochę inny zwierzę. W przeciwieństwie do bazowego DLSS (2.0), dostępny jest wyłącznie na kartach serii 4000. Nowa generacja wprowadziła Optical Flow Accelerator, przekładający się na Frame Generation – generator klatek. W skrócie, AI generuje dodatkową klatkę obrazu między dwiema wygenerowanymi przez GPU. Dla gracza skutkuje to większą liczbą fps‑ów i płynniejszym obrazem. Generator zwiększa zapotrzebowanie na VRAM karty, plus skutkuje opóźnieniem sygnału (latency). Tą drugą niedogodność rekompensuje nam Nvidia Reflex - zmniejsza opóźnienia w grach.

Natomiast DLSS 3.5, w przeciwieństwie do wcześniejszych wersji DLSS, skupia się nie na poprawie wydajności, ale na zwiększeniu ogólnych walorów wizualnych ray tracingu dla wszystkich kart RTX. W ramach tej aktualizacji wprowadzono nową technikę znaną jako ray reconstruction (rekonstrukcja promieni). W rezultacie, technologia ta podnosi jakość efektów opartych na ray tracingu poprzez odszumianie obrazu siecią neuronową. Na powyższym filmiku możecie zobaczyć, jak to działa w praktyce.

Powrót do przeszłości - platforma testowa

Karty Nvidii klasy 60 oraz 70 w dniu swojej premiery są najczęstszym wyborem przy okazji modernizacji istniejących zestawów PC. Dlatego moją platformą testową będzie procesor Intel Core i7‑9700K z 2019 roku. Jest to osiem rdzeni i osiem wątków, które powędrowały na płytę główną z chipsetem Z370, gdzie czekał dysk NVMe 1TB i 16GB RAM 3200MHz. To wciąż całkiem żwawy CPU, bok którego lądują inne perełki warte polecania: i7‑8700K, i5‑10600K, i5‑10400, i5‑11400, Ryzen 5 3600, Ryzen 5 5500. Słowem procesory, które częściej znajdziemy w pecetach przeciętnych Kowalskich.

2419410

Ze starszymi płytami jest tak, że nie zawsze dostają stosowną aktualizację UEFI do wsparcia ReBAR lub zabezpieczeń TPM wymaganych przez Windows 11. Do tego wybrana płyta ma wyłącznie standard PCIe 3.0. Jak widać taka platforma potrafi być dość kłopotliwa, bo przykładowo brak ReBAR skreśla możliwość nabycia kart Intel ARC (tzn. można, ale nie ma to sensu). Natomiast starszy standard PCIe teoretycznie kładzie przysłowiowe kłody układom ze złączem PCIe 4.0 x8 - np. RTX 4060.

Metodyka i założenia testu

Na warsztat biorę RTX 3060 i RTX 4060. Interesują mnie dwie rozdzielczości: 1080p i 1440p. Pierwsza dlatego, bo Nvidia sama pozycjonuje oba układy do zabawy w tym standardzie. Natomiast panele 1440p sukcesywnie zyskują na popularności. Gramy na Windows 10. Sterowniki graficzne 537.42 zainstalowałem z pomocą NVCleanstall. Nie gram na „Ultra”. Skupimy się na detalach wysokich. Następnie na to wszystko, o ile gra ma wsparcie, kolejno włączałem śledzenie promieni, DLSS w trybie jakości oraz generator klatek w przypadku 4060.

192649
192650

Swoje pomiary zawęziłem do czterech gier. Na początek Cyberpunk 2077 i Wiedźmin 3. Potem Horizon Zero Dawn oraz Counter Strike 2. Prócz klatek na sekundę interesuje mnie, jak gry zachowują się na wybranym PC: obciążenie CPU i GPU, czy występują jakieś problemy z obrazem i jego jakością itd.

Cyberpunk 2077

Zacznijmy od rodzimego akcentu. Jak widać na załączonych poniżej wykresach w rasteryzacji obie karty dostarczają satysfakcjonujący rezultat. Różnica między nimi to 9%. Dorzucając do tego DLSS Quality ponownie dają zbliżony wynik.

2419413

Jeśli włączymy sam ray tracing obie karty klękają. Konieczna jest pomoc DLSS, aby wrócić do poziomu ~60 fps.

2419414

Dla RTX 4060 nie ma sensu włączać śledzenia promieni i generatora klatek bez pomocy DLSS. Niby jest sześćdziesiąt klatek, ale gra „pływa” reagując na komendy klawiszy z opóźnieniem. DLSS ratuje dzień, dobijając do 88 klatek. Jeśli wyłączymy śledzenie promieni możemy liczyć na prawie 150 fps. Warto podkreślić, że we wszystkich tych pomiarach obciążenie procesora było większe z 4060, średnio o 15%.

2419415

Rozdzielczość 1440p stanowi spore wyzwanie dla RTX 3060. Tutaj zalecam całkowitą rezygnację ze śledzenia promieni. Dla podbicia klatek koniecznym jest DLSS 2.

2419416

Z RTX 4060 ta sama historia. Chcąc zapewnić najlepsze wrażenia, szczególnie na polu responsywności, nie włączajcie śledzenia promieni. Będzie to optymalny wybór także w przypadku generatora klatek. Sam generator w połączeniu z DLSS robi dobrą robotę na polu płynności rozgrywki.

1920 x 1080 px, ray tracing, DLSS + generator klatek.
1920 x 1080 px, ray tracing, DLSS + generator klatek.

Cyberpunk ma dobrze zaimplementowany DLSS. W 1080p wybierając tryb jakości trudno go odróżnić od natywnej rozdzielczości. Dopiero wybranie opcji zbalansowanej niesie ze sobą pewne subtelne różnice. Natomiast w przypadku samego generatora klatek artefakty i inne błędy graficzne byłby trudne do wychwycenia. Zasadniczo pojawiały się rzadko. Ciekawie wychodzi również ray reconstruction (DLSS 3.5)

Wiedźmin 3: Dziki Gon – Remaster

Dalsze pomiary postaram się zawęzić. RTX 3060 w 1080p radzi sobie popisowo z Wiedźminem, o ile zostaniemy przy rasteryzacji. DLSS Quality daje łady boost. Natomiast śledzenie promieni dobija tego RTX‑a. W teorii DLSS naprawia ten problem, ale nie jest idealnie. Możemy oczywiście skorzystać z DLSS balance albo performance, acz w 1080p jakość obrazu jest dla mnie niesatysfakcjonująca.

2419418

Biorąc na warsztat RTX 4060 mamy zasadniczo identyczną sprawność w tej grze w porównaniu do 3060. Niemniej tutaj ray tracing zalecam wyłącznie z włączonym DLSS i generatorem klatek. Ogółem zdarzały się drobne glitche graficzne, acz nic, co mogłoby odrzucać od gry.

2419419

Podnosząc rozdzielczość do 2560 x 1440 px, chcąc zostać przy detalach wysokich, dla RTX 3060 trzeba stosować DLSS. Całkowicie odradzam ray tracing. Granie z nim to katusze dla oka.

2419420

Zaskakujące, jak kropka w kropkę 4060 wykręca podobne wyniki do 3060. Dopiero generator klatek pozwala jej bardziej odskoczyć. Niestety frame gen. nie ratuje układu Ada Lovelace w przypadku śledzenia promieni, nawet po uruchomieniu DLSS. Całkiem możliwe, że procesor stanowił ograniczenie, mimo że nie był w pełni obciążony pracą.

2419421

Wiedźmin wzorem Cyberpunk obsługuje DLSS i generator klatek. Wydaje mi się, że w 1080p różnice między każdym trybem wyświetlania są bardziej dostrzegalne. Nie mniej gra wciąż prezentuje się bardzo dobrze. W 1440p do DLSS w trybie jakości nie mam żadnych zastrzeżeń. Jeśli idzie o generator klatek bardziej uważni zobaczą tu i tam pojedynczy glitch graficzny, ale zasadniczo nic, co by wybijało z rytmu rozgrywki.

Po lewej: 1440p natywna rozdzielczość; Po prawej: DLSS + generator klatek. Grafika bez śledzenia promieni. Detale na bliskim i dalszym planie są tak samo wyraźne.
Po lewej: 1440p natywna rozdzielczość; Po prawej: DLSS + generator klatek. Grafika bez śledzenia promieni. Detale na bliskim i dalszym planie są tak samo wyraźne.

Horizon Zero Dawn

Horizon wybrałem z dwóch powodów. Mimo, że bazuje wyłącznie na rasteryzacji to wspiera DLSS. Do tego cechuje ją apetyt na VRAM, nawet z detalami wysokimi. Będzie to ciekawy sprawdzian dla 4060.

2419424

Jeśli wybierzemy renderowanie grafiki bez upscalera obie karty prezentują niemal identyczną sprawność. Jeśli wspomożemy się DLSS to wyniki są także podobne. Tylko 8 klatek przewagi dla RTX 4060, mimo generacyjnych poprawek rdzeni Tensor, pozostawia niedosyt.

2419425

W rozdzielczości 2560 x 1440 px identyczna historia. Obie karty dostarczyły podobne rezultaty. Warto nadmienić, że użycie pamięci (nie mylić z alokacją) dla RTX 3060 dochodziło do 8,5GB. Dla RTX 4060 wynosiło ok. 6500 MB. Mimo tego karta nie sprawiała żadnych problemów z tego powodu.

Po lewej: 1440p natywna rozdzielczość; Po prawej: 1440p + DLSS Quality.
Po lewej: 1440p natywna rozdzielczość; Po prawej: 1440p + DLSS Quality.

Horizon ma już trochę lat na karku, ale zaimplementowanie DLSS w tym tytule oceniam na piątkę. Ustawiony na Quality trudno odróżnić od rozdzielczości natywnej.

Counter-Strike 2

Nowy Counter-Strike, nowy silnik graficzny. Przy zestawieniu z CS:GO gra ta różni się pod każdym możliwym sposobem w porównaniu do poprzednika – także wymaganiami. Gram w dwóch ustawieniach graficznych. Pierw wszystko na high. Potem schodzę na medium, bez pomocy FSR, celem wyciągnięcia jeszcze wyższej ilości klatek.

2419428

Nastąpiła dość ciekawa sytuacja. Z detalami high wartość 1% low jest niemal taka sama, ale średnia ilość klatek przemawia na korzyść RTX 4060. Natomiast schodząc na medium to RTX 3060 wychodzi na czoło sporą różnicą. Test powtarzałem kilka razy i wzór ten występował regularnie.

2419429

Wchodząc na rozdzielczość 2560 x 1440 px w obu ustawieniach graficznych nie miałem już takich anomalii. Karty lądowały obok siebie, dając regularne wyniki. W przypadku obu kart obciążenia procesora wyglądało bardzo podobnie. CS2 nie idzie w graficzne wodotryski. Natomiast, może pochwalić się obecnością Nvidia Reflex, obsługiwanego przez każdą kartę RTX i wybrane modele GTX.

Pojedynek najniższego szczebla a DLSS 3

Jeśli zakładaliście, że z powodu PCIe 4.0 x8 młodsza karta RTX 4060 będzie mieć spore kłopoty to w praktyce nie było tak źle. Gry działały prawidłowo. Tym parametrem teoretycznie można przejmować się najmniej. Również szyna 128 bit nie stanowi problemu. 8GB VRAM też nie jest tak kłopotliwe, jak niektórzy twierdzą. Trzeba po prostu realnie dostosować poziom detali i opcjonalnie sięgać po DLSS 2, jeśli gra go wspiera.

2419433

W optymalnych warunkach, bezpośrednia różnica wydajności między RTX 3060 a 4060 powinna wynosić 15‑20% na korzyść tej drugiej. Na mojej platformie testowej uległa ona skurczeniu do wyniku jednocyfrowego. W przypadku starszych platform trzeba pamiętać o ograniczeniu po stronie procesora. Widać to szczególnie, gdy włączymy ray tracing.

Nvidia ma jeszcze Path Tracing (wyższą formę śledzenia promieni), obecny w Cyberpunk i nadchodzącym Alan Wake 2. Ta wizualna przyjemność zarezerwowana jest dla kart graficznych i procesorów z górnej półki. Jego wymagania są ponad siły i7‑9700K i RTX‑ów z numerem 60. Natomiast miłą niespodzianką było połączenie rasteryzacji z generatorem klatek. Opóźnienia były jak najbardziej w porządku, a glitche graficzne trudne do wychwycenia. Jednak dla zachowania właściwych wrażeń wizualnych DLSS musi być w trybie jakości (Quality). Ogółem obie karty nie sprawiają problemów w komputerze ze starszym ośmio lub sześciordzeniowym CPU.

Podsumowanie - mieszanka nowego i starego

Inno3D GeForce RTX 4060 TWIN X2 OC na tę chwilę kosztuje 1549 zł. Inno3D GeForce RTX 3060 iChill X3 RED niestety nie jest dostępny w sprzedaży. Identyczną wydajnością będzie charakteryzować model RTX 3060 TWIN X2 w cenie 1449 zł. Mamy, zatem różnicę 100 zł. [Ceny X‑Kom na dzień 25 października] Którą kartę wybrać?

Gier wykorzystujących ray tracing i podstawowy DLSS na przestrzeni ostatnich lat przybyło całkiem sporo. Z kompletną listą możecie zapoznać się pod tym adresem. RTX 3060 nie ma też problemu z DLSS 3.5. Natomiast asem w rękawie RTX 4060 ma być dodatek w postaci DLSS 3, uwzględniającego generator klatek. Ponieważ jest to nowinka tytułów wykorzystujących tę technologię nie ma jeszcze zbyt wiele. Do tego, ze względu na swoją naturę, generator nie trafi do gier sieciowych - szczególnie dynamicznych strzelanek. Mimo tego, na powyżej platformie testowej sprawdził się dobrze a sto złotych dopłaty do DLSS 3 nie wydaje się horrendalnym podatkiem od nowości. Ma on też sens w przypadku nabycia nowego monitora. A po którą kartę wy sięgnęlibyście w przypadku modernizacji PC?

Wybrane dla Ciebie
Komentarze (9)