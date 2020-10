Udostępnij:

Czy 96 może znaczyć więcej niż np. 512? Jak najbardziej — wszystko zależy od przyjętej nomenklatury, a w tym wypadku Intel jest swoistym rodzynkiem.

Zadam inne pytanie: czy zastanawialiście się kiedyś, dlaczego układy graficzne Intela mają tak mało jednostek wykonawczych na tle konkurencji? Ot, choćby przykład z czasów teraźniejszych, gdy wyposażony w 96 jednostek Iris Xe skutecznie rywalizuje z Radeonem RX Vega 8, legitymującym się 512 jednostkami.

Oczywiście można odpowiedzieć krótko, że wynika to z różnic w architekturze i przyjętym nazewnictwie. I zgoda. Tylko, jaki marketingowiec wyraził w takim razie zgodę, aby tak znacząco odstawać od bezpośredniej konkurencji? Zapytałem o to samego Intela.

– Generalnie korzystamy z innego języka niż konkurencja, ponieważ głównym elementem naszego układu jest EU, czyli jednostka wykonawcza – mówi Kamil Guzik, specjalista ds. technicznych w Intel Client Computing Group. Ale tego akurat mogliśmy się domyśleć sami. Diabeł tkwi w szczegółach, a w tym konkretnym przypadku chodzi o architektoniczne rozumienie jednostki – wyjaśnia przedstawiciel niebieskich i przedstawia niuanse.

To, co nazywamy umownie procesorem strumieniowym—lub w przypadku kart Nvidii procesorem CUDA—mówiąc obrazowo, można rozumieć jako zdolność układu do wykonania jednej operacji arytmetyczno-logicznej w cyklu zegara. Nie jest to też jednoznaczne z fizyczną liczbą ALU, bo te mogą być wieloliniowe lub wielowątkowe, ale działa na wyobraźnię.

Myk polega na tym, że zasoby obliczeniowe można grupować na szereg różnych sposobów, a podejście Intela jest tu diametralnie odmienne od tego, co proponuje konkurencja.

Na przykład w GeForce'ach RTX 30 podstawową jednostką strukturalną jest tzw. multiprocesor strumieniujący (Streaming Multiprocessor – SM), który ma de facto cztery relatywnie duże podbloki ALU, zdolne prowadzić operacje na 32 liniach każda. Do tego na każdą ALU przypada 32-wątkowy dyspozytor. To efektywnie pozwala mówić o 128 procesorach CUDA w każdym SM. A koncepcja AMD w samym zamyśle jest bardzo podobna.

Intel tymczasem idzie własną, zupełnie inną ścieżką. – Nasze jednostki wykonawcze są mniejsze i zawierają fizycznie tylko jedną ALU z ośmioma liniami – ujawnia Guzik. – Stąd wiadomo, że chcąc przeliczyć 96 EU w Iris Xe na format bliższy konkurencji, należy wykonać działanie 96 EU x 1 ALU x 8 FP32 = 768 – dodaje.

Jak również udało się dowiedzieć, Intel uważa reprezentowanie swych grafik poprzez fizyczną liczbę jednostek wektorowych za bardziej konkretne. I zmiany tego schematu nie planuje, przynajmniej w kontekście iGPU. – Rozważymy alternatywy, gdy pojawią się nasze karty dedykowane, ale to też nic wiążącego – ucina temat producent.