r   e   k   l   a   m   a
r   e   k   l   a   m   a

Cortex-A75 i A55: ARM odświeża rdzenie, myśląc o sztucznej inteligencji

Strona główna AktualnościSPRZĘT

Coraz trudniej producentom autorskich rdzeni mikroprocesorowych nadążyć za tym, co przedstawia ARM. Kolejne wersje rdzeni CPU Cortex i zintegrowanych grafik Mali zbliżają się w wydajności do tego, co kiedyś było dostępne tylko dla Qualcomma czy Samsunga, a są przy tym zauważalnie tańsze. Widać to po najnowszych premierach – pokazane właśnie rdzenie Cortex A-75 (następca A-73) i Cortex A-55 (następca A-53) podnoszą poprzeczkę wydajności dla środkowej półki smartfonów, a nowa architektura DynamIQ błyszczy tam, gdzie ma to dzisiaj największe znaczenie – w maszynowym uczeniu i sztucznej inteligencji.

Następcy najpopularniejszych

Nowy „duży” rdzeń konsorcjum ARM, Cortex-A75, to przede wszystkim wzrosty wydajności w jednowątkowym przetwarzaniu: nawet 22% więcej mocy obliczeniowej niż Cortex-A73, a w niektórych benchmarkach wyniki jeszcze lepsze: Octane z wynikiem lepszym o 48%, Geekbench o 34%. To efekt wykorzystania dostępnej pojemności cieplnej poprzednika i podkręcenia zegara: wykonany w procesie 10 nm rdzeń może pracować z częstotliwością 3 GHz (zużywając przy tym więcej energii).

Oczywiście praktycznie nie ma mobilnych obciążeń, w których trzeba byłoby użyć jednocześnie czterech takich rdzeni na pełnym obciążeniu, ale to nie jest tylko rdzeń do smartfonów. ARM spodziewa się jego zastosowania także w sprzęcie mającym lepszy budżet energetyczny, np. chromebookach czy sprzęcie samochodowym. Poważnie – w przeciwieństwie do poprzednika, A75 ma wszystko to, co potrzebne jest do wykorzystania w serwerach, sprzęcie sieciowym czy przemysłowym – wsparcie dla różnych wykorzystywanych tam magistrali, sprzętową korekcję błędów czy ochronę przed zatruciem danych.

r   e   k   l   a   m   a

Cortex-A55 jest podobnie jak poprzednik optymalizowany pod kątem efektywności energetycznej. Wydajności samych rdzeni w stosunku do A53 nie było już jak ulepszać modyfikacjami architektury, więc ARM skupił się przede wszystkim na podsystemie pamięci, uzyskując niemal dwukrotnie większą przepustowość. To możliwe dzięki nowemu mechanizmowi pobierania danych z wyprzedzeniem, zintegrowanego z rdzeniem cache L2 o dwukrotnie mniejszych opóźnieniach i dodatkowej zewnętrznej warstwie cache L3, którą będą mogli zastosować w swoich konstrukcjach partnerzy ARM.

Te wszystkie zmiany przyniosły w efekcie wzrost wydajności na poziomie 14% (Octane) – 20% (Geekbench). Ceną jest pewien wzrost zużycia energii, ale i tak ogólna wydajność na wat wzrosła o 15%. Podobnie jak w wypadku A75, także i tutaj mamy do czynienia ze sprzętową korekcją błędów i obsługą magistrali wykorzystywanych w urządzeniach przemysłowych. Ciekawostka – mamy też wsparcie dla tych nowych instrukcji Int8, wykorzystywanych do przechowywania liczb zmiennoprzecinkowych w pamięci jako tablice 8-bitowych liczb stałoprzecinkowych – to pomysł Nvidii, bardzo opłacalny w zastosowaniach związanych z sieciami neuronowymi.

wielki.MAŁY na więcej sposobów

Może nawet ważniejsza od nowych rdzeni jest nowa wersja architektury big.LITTLE, dzięki której w smartfonach łączy się dziś powszechnie klastry wydajnych oraz energooszczędnych rdzeni. DynamIQ to wynik prowadzonych od kilku lat prac, które pozwalają uzyskać większą elastyczność i skalowalność, przy zachowaniu założeń big.LITTLE.

Podstawową różnicą jest to, że teraz możemy w jednym klastrze mieszać typy rdzeni – A75 z A55. Otwiera to drogę do wielu specjalistycznych konfiguracji, tym bardziej, że teraz taki klaster może zawierać już nie cztery a osiem rdzeni. Teoretycznie ARM-owy procesor może zawierać do 32 takich klastrów (a więc do 256 rdzeni), a jeśli wykorzystać interfejs struktury CCIX, to w grę wchodzą nawet tysiące takich wielordzeniowych procesorów. To oczywiście zastosowania serwerowe, na smarfonach za to będziemy mogli zobaczyć układy w rodzaju jeden A75 i siedem A55, dziś w big.LITTLE niemożliwe.

Umożliwia to wszystko nowa podstawowa jednostka: DynamIQ Shared Unit (DSU), która oprócz wybranej liczby rdzeni, mogących mieć nawet do ośmiu oddzielnych domen energetycznych, oferuje takiemu blokowi rdzeni wspólny zestaw interfejsów, zaawansowane zarządzanie energii i wspólną pamięć cache L3. Interesujące jest to, że każdy z rdzeni w DSU może być oddzielnie taktowany różnymi częstotliwościami, przy zachowaniu jednoczesnego dostępu do tych wszystkich dodatków. Możliwe jest to poprzez wykorzystanie asynchronicznych mostków komunikacyjnych.

DynamIQ oferuje też bardzo przydatną funkcję zarządzania operacjami na pamięci cache L3 przez zewnętrzne jednostki (np. agenty sieciowe czy układy graficzne) – może to pomóc np. w szybkim przetwarzaniu pakietów TCP/IP, czy wykorzystaniu danych z sieci neuronowych uruchamianych na GPU.

Procesory z nowymi rdzeniami ARM zobaczymy pewnie już tej jesieni. Trochę więcej czasu zajmie pojawienie się czipów w pełni wykorzystujących możliwości DynamIQ. Szkoda, bo taki sobie ośmiordzeniowy chromebook w konfiguracji 6×A75 + 2×A55 mógłby czynić cuda w kwestii wydajności i długości pracy na akumulatorze.

© dobreprogramy
r   e   k   l   a   m   a
r   e   k   l   a   m   a

Komentarze

r   e   k   l   a   m   a
r   e   k   l   a   m   a
Czy wiesz, że używamy cookies (ciasteczek)? Dowiedz się więcej o celu ich używania i zmianach ustawień.
Korzystając ze strony i asystenta pobierania wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.