Architektura Maxwell jednak nie tak dobra? GTX 970 ma problemy z pamięcią Strona główna Aktualności26.01.2015 21:44 Udostępnij: Polub: O autorze Łukasz Tkacz Od jesiennej premiery nowych kart graficznych firmy NVIDIA korzystających z energooszczędnej architektury Maxwell minęło już nieco czasu. Klienci najpierw natrafili na problemy z dostawami, a później na piszczące cewki w przypadku licznych kart. Później wszystko było teoretycznie dobrze. Teoretycznie, bo przy wymagających grach okazało się, że tańszy model GTX 970 nie domaga i nie wykorzystuje odpowiednio całej dostępnej pamięci, a jedynie jej część. Wyjaśnienie problemu tajemniczej granicy 3,5 GB, po której zapełnieniu wydajność karty spada, zawdzięczamy Jonahowi Albenowi, Seniora VP of GPU Engineering w firmie NVIDIA. Co prawda układ GTX 970 jest zbudowany na tym samym rdzeniu GM204 co mocniejszy i znacznie droższy GTX 980, ale posiada 13 zamiast 16 włączonych bloków SMM (Streaming Multiprocessor Maxwell). Jak się okazuje, doszło do pewnych nieporozumień między zespołem inżynierskim i działem PR, w efekcie czego do mediów trafiła nieprawdziwa specyfikacja modelu GTX 970… W rzeczywistości ma on nie 64, a 56 jednostek ROP, a także pamięć L2 o wielkości 1792 KB zamiast wcześniej przyjętego 2048 KB. Wyłączone bloki SMM z rdzeniami CUDA same w sobie nie stanowią jednak problemu i to nie one doprowadzają do spadków wydajności, na jakie można natrafić w wymagających grach przy wysokiej rozdzielczości. Wyłączenie wspomnianych elementów doprowadziło do tego, że jedna z 512 MB sekcji pamięci nie mogła zostać wpięta bezpośrednio do stosowanych w Maxwellach magistrali Crossbar. NVIDIA postanowiła wykorzystać 7 pełnoprawnych sekcji, które działają jako jedna pula pamięci w sytuacji, gdy dana gra wymaga jej maksymalnie 3,5 GB. Jeżeli trzeba więcej, sytuacja się komplikuje, bo szybkość transferu do pozostałych 512 MB tworzących zupełnie odrębną pulę pamięci to zaledwie 1/7 normalnego transferu. Nawet to nie byłoby jeszcze aż tak poważnym problemem, gdyby nie sam mechanizm przydzielania pamięci – system operacyjny przydziela ją grom i aplikacjom na różny sposób, nie zawsze tak samo, bo w oparciu o analizę heurystyczną i próby dostosowania do jak największej wydajności. To właśnie tutaj coś zawodzi, bo do wolnego obszar pamięci trafia nie to co trzeba, a czasami jest on w ogóle całkowicie pomijany. W niektórych sytuacjach dane trafiają np. do pliku wymiany znajdującego się na dysku twardym komputera. Co prawda GTX 970 posiada 3,5 GB pełnoprawnej pamięci i 0,5 GB pamięci znacznie wolniejszej, ale nawet ten drugi obszar jest przynajmniej czterokrotnie szybszy niż pamięć RAM, nie mówiąc już zupełnie o dysku komputera, nawet SSD. Stworzony przez NVIDIĘ podział, jaki umożliwiła architektura Maxwell spowodował, że teraz system i sterowniki mają nieco trudniejsze zadanie, bo dostępna jest jeszcze jedna pula, którą trzeba rozpatrywać osobno. W wielu przypadkach ten proces zawodzi, co doprowadza do spadków wydajności – do wolniejszej sekcji trafiają bowiem dane, które są często, a nie rzadko wykorzystywane. NVIDIA mówi tutaj o spadkach o około 4-6%, ale praktyczne testy wykazują znacznie większe różnice. Gdyby mechanizm działał prawidłowo, to w ich przypadku wysoka przepustowość nie byłaby wcale aż tak potrzebna i nie wpływałaby na wydajność całego układu w sytuacjach, gdy dana gra wymaga ponad 3,5 GB pamięci. Trudno odnieść się do tej sytuacji – pewnym jest, że GTX 970 to układ szybki i nad wyraz energooszczędny, co wykazały także przeprowadzone w naszym labie testy wydajnościowe. Rzecz w tym, że karta w zasadzie mogłaby być nazywana modelem z 3,5 GB pamięci, oraz dodatkowym, znacznie wolniejszym „buforem” 512 MB. Oczywiście z marketingowego punktu widzenia jest to kompletnie nie do przyjęcia. Architektura Maxwell umożliwia tego typu zabiegi, więc w przyszłości teoretycznie możemy spodziewać się podobnych sytuacji w okrojonych modelach innych układów. To, czy zdecydujemy się na zakup zależy już od osobistych preferencji. Warto mieć na uwadze, że być może nieco uda się poprawić w kolejnych wersjach sterowników. Sprzęt Udostępnij: Polub: © dobreprogramy Zgłoś błąd w publikacji Zobacz także Jak oglądacie telewizję za granicą? Ankieta i nasze podpowiedzi 21 sty Mateusz Budzeń Internet 71 NVIDIA: pamięć w GeForce GTX 970 to wyczyn, a nie błąd techniczny 25 lut 2015 Łukasz Tkacz Sprzęt 83 NVIDIA blokuje podkręcanie mobilnych Maxwelli, „ze względów bezpieczeństwa” 12 lut 2015 Łukasz Tkacz Sprzęt 35 AMD obniża ceny Radeona R9 290X i naśmiewa się z problemów Nvidii 2 lut 2015 Łukasz Tkacz Sprzęt 101 zobacz więcej
Udostępnij: Polub: O autorze Łukasz Tkacz Od jesiennej premiery nowych kart graficznych firmy NVIDIA korzystających z energooszczędnej architektury Maxwell minęło już nieco czasu. Klienci najpierw natrafili na problemy z dostawami, a później na piszczące cewki w przypadku licznych kart. Później wszystko było teoretycznie dobrze. Teoretycznie, bo przy wymagających grach okazało się, że tańszy model GTX 970 nie domaga i nie wykorzystuje odpowiednio całej dostępnej pamięci, a jedynie jej część. Wyjaśnienie problemu tajemniczej granicy 3,5 GB, po której zapełnieniu wydajność karty spada, zawdzięczamy Jonahowi Albenowi, Seniora VP of GPU Engineering w firmie NVIDIA. Co prawda układ GTX 970 jest zbudowany na tym samym rdzeniu GM204 co mocniejszy i znacznie droższy GTX 980, ale posiada 13 zamiast 16 włączonych bloków SMM (Streaming Multiprocessor Maxwell). Jak się okazuje, doszło do pewnych nieporozumień między zespołem inżynierskim i działem PR, w efekcie czego do mediów trafiła nieprawdziwa specyfikacja modelu GTX 970… W rzeczywistości ma on nie 64, a 56 jednostek ROP, a także pamięć L2 o wielkości 1792 KB zamiast wcześniej przyjętego 2048 KB. Wyłączone bloki SMM z rdzeniami CUDA same w sobie nie stanowią jednak problemu i to nie one doprowadzają do spadków wydajności, na jakie można natrafić w wymagających grach przy wysokiej rozdzielczości. Wyłączenie wspomnianych elementów doprowadziło do tego, że jedna z 512 MB sekcji pamięci nie mogła zostać wpięta bezpośrednio do stosowanych w Maxwellach magistrali Crossbar. NVIDIA postanowiła wykorzystać 7 pełnoprawnych sekcji, które działają jako jedna pula pamięci w sytuacji, gdy dana gra wymaga jej maksymalnie 3,5 GB. Jeżeli trzeba więcej, sytuacja się komplikuje, bo szybkość transferu do pozostałych 512 MB tworzących zupełnie odrębną pulę pamięci to zaledwie 1/7 normalnego transferu. Nawet to nie byłoby jeszcze aż tak poważnym problemem, gdyby nie sam mechanizm przydzielania pamięci – system operacyjny przydziela ją grom i aplikacjom na różny sposób, nie zawsze tak samo, bo w oparciu o analizę heurystyczną i próby dostosowania do jak największej wydajności. To właśnie tutaj coś zawodzi, bo do wolnego obszar pamięci trafia nie to co trzeba, a czasami jest on w ogóle całkowicie pomijany. W niektórych sytuacjach dane trafiają np. do pliku wymiany znajdującego się na dysku twardym komputera. Co prawda GTX 970 posiada 3,5 GB pełnoprawnej pamięci i 0,5 GB pamięci znacznie wolniejszej, ale nawet ten drugi obszar jest przynajmniej czterokrotnie szybszy niż pamięć RAM, nie mówiąc już zupełnie o dysku komputera, nawet SSD. Stworzony przez NVIDIĘ podział, jaki umożliwiła architektura Maxwell spowodował, że teraz system i sterowniki mają nieco trudniejsze zadanie, bo dostępna jest jeszcze jedna pula, którą trzeba rozpatrywać osobno. W wielu przypadkach ten proces zawodzi, co doprowadza do spadków wydajności – do wolniejszej sekcji trafiają bowiem dane, które są często, a nie rzadko wykorzystywane. NVIDIA mówi tutaj o spadkach o około 4-6%, ale praktyczne testy wykazują znacznie większe różnice. Gdyby mechanizm działał prawidłowo, to w ich przypadku wysoka przepustowość nie byłaby wcale aż tak potrzebna i nie wpływałaby na wydajność całego układu w sytuacjach, gdy dana gra wymaga ponad 3,5 GB pamięci. Trudno odnieść się do tej sytuacji – pewnym jest, że GTX 970 to układ szybki i nad wyraz energooszczędny, co wykazały także przeprowadzone w naszym labie testy wydajnościowe. Rzecz w tym, że karta w zasadzie mogłaby być nazywana modelem z 3,5 GB pamięci, oraz dodatkowym, znacznie wolniejszym „buforem” 512 MB. Oczywiście z marketingowego punktu widzenia jest to kompletnie nie do przyjęcia. Architektura Maxwell umożliwia tego typu zabiegi, więc w przyszłości teoretycznie możemy spodziewać się podobnych sytuacji w okrojonych modelach innych układów. To, czy zdecydujemy się na zakup zależy już od osobistych preferencji. Warto mieć na uwadze, że być może nieco uda się poprawić w kolejnych wersjach sterowników. Sprzęt Udostępnij: Polub: © dobreprogramy Zgłoś błąd w publikacji