Cortex-A75 i A55: ARM odświeża rdzenie, myśląc o sztucznej inteligencji

Cortex-A75 i A55: ARM odświeża rdzenie, myśląc o sztucznej inteligencji

Cortex-A75 i A55: ARM odświeża rdzenie, myśląc o sztucznej inteligencji
29.05.2017 23:16

Coraz trudniej producentom autorskich rdzeni mikroprocesorowychnadążyć za tym, co przedstawia ARM. Kolejne wersje rdzeni CPUCortex i zintegrowanych grafik Mali zbliżają się w wydajności dotego, co kiedyś było dostępne tylko dla Qualcomma czy Samsunga, asą przy tym zauważalnie tańsze. Widać to po najnowszychpremierach – pokazane właśnie rdzenie Cortex A-75 (następcaA-73) i Cortex A-55 (następca A-53) podnoszą poprzeczkę wydajnościdla środkowej półki smartfonów, a nowa architektura DynamIQbłyszczy tam, gdzie ma to dzisiaj największe znaczenie – wmaszynowym uczeniu i sztucznej inteligencji.

Następcy najpopularniejszych

Obraz

Nowy „duży” rdzeń konsorcjum ARM, Cortex-A75, to przedewszystkim wzrosty wydajności w jednowątkowym przetwarzaniu: nawet22% więcej mocy obliczeniowej niż Cortex-A73, a w niektórychbenchmarkach wyniki jeszcze lepsze: Octane z wynikiem lepszym o 48%,Geekbench o 34%. To efekt wykorzystania dostępnej pojemnościcieplnej poprzednika i podkręcenia zegara: wykonany w procesie 10 nmrdzeń może pracować z częstotliwością 3 GHz (zużywając przytym więcej energii).

Obraz

Oczywiście praktycznie nie ma mobilnych obciążeń, w którychtrzeba byłoby użyć jednocześnie czterech takich rdzeni na pełnymobciążeniu, ale to nie jest tylko rdzeń do smartfonów. ARMspodziewa się jego zastosowania także w sprzęcie mającym lepszybudżet energetyczny, np. chromebookach czy sprzęcie samochodowym.Poważnie – w przeciwieństwie do poprzednika, A75 ma wszystko to,co potrzebne jest do wykorzystania w serwerach, sprzęcie sieciowymczy przemysłowym – wsparcie dla różnych wykorzystywanych tammagistrali, sprzętową korekcję błędów czy ochronę przedzatruciem danych.

Obraz

Cortex-A55 jest podobnie jak poprzednik optymalizowany pod kątemefektywności energetycznej. Wydajności samych rdzeni w stosunku doA53 nie było już jak ulepszać modyfikacjami architektury, więcARM skupił się przede wszystkim na podsystemie pamięci, uzyskującniemal dwukrotnie większą przepustowość. To możliwe dziękinowemu mechanizmowi pobierania danych z wyprzedzeniem, zintegrowanegoz rdzeniem cache L2 o dwukrotnie mniejszych opóźnieniach idodatkowej zewnętrznej warstwie cache L3, którą będą moglizastosować w swoich konstrukcjach partnerzy ARM.

Te wszystkie zmiany przyniosły w efekcie wzrost wydajności napoziomie 14% (Octane) – 20% (Geekbench). Ceną jest pewien wzrostzużycia energii, ale i tak ogólna wydajność na wat wzrosła o15%. Podobnie jak w wypadku A75, także i tutaj mamy do czynienia zesprzętową korekcją błędów i obsługą magistraliwykorzystywanych w urządzeniach przemysłowych. Ciekawostka – mamyteż wsparcie dla tych nowych instrukcji Int8, wykorzystywanych doprzechowywania liczb zmiennoprzecinkowych w pamięci jako tablice8-bitowych liczb stałoprzecinkowych – to pomysł Nvidii, bardzoopłacalny w zastosowaniach związanych z sieciami neuronowymi.

wielki.MAŁY na więcej sposobów

Obraz

Może nawet ważniejsza od nowych rdzeni jest nowa wersjaarchitektury big.LITTLE, dzięki której w smartfonach łączy siędziś powszechnie klastry wydajnych oraz energooszczędnych rdzeni.DynamIQ to wynik prowadzonych od kilku lat prac, które pozwalająuzyskać większą elastyczność i skalowalność, przy zachowaniuzałożeń big.LITTLE.

Podstawową różnicą jest to, że teraz możemy w jednymklastrze mieszać typy rdzeni – A75 z A55. Otwiera to drogę dowielu specjalistycznych konfiguracji, tym bardziej, że teraz takiklaster może zawierać już nie cztery a osiem rdzeni. TeoretycznieARM-owy procesor może zawierać do 32 takich klastrów (a więc do256 rdzeni), a jeśli wykorzystać interfejs struktury CCIX, to w gręwchodzą nawet tysiące takich wielordzeniowych procesorów. Tooczywiście zastosowania serwerowe, na smarfonach za to będziemymogli zobaczyć układy w rodzaju jeden A75 i siedem A55, dziś wbig.LITTLE niemożliwe.

Obraz

Umożliwia to wszystko nowa podstawowa jednostka: DynamIQ SharedUnit (DSU), która oprócz wybranej liczby rdzeni, mogących miećnawet do ośmiu oddzielnych domen energetycznych, oferuje takiemublokowi rdzeni wspólny zestaw interfejsów, zaawansowane zarządzanieenergii i wspólną pamięć cache L3. Interesujące jest to, żekażdy z rdzeni w DSU może być oddzielnie taktowany różnymiczęstotliwościami, przy zachowaniu jednoczesnego dostępu do tychwszystkich dodatków. Możliwe jest to poprzez wykorzystanieasynchronicznych mostków komunikacyjnych.

DynamIQ oferuje też bardzo przydatną funkcję zarządzaniaoperacjami na pamięci cache L3 przez zewnętrzne jednostki (np.agenty sieciowe czy układy graficzne) – może to pomóc np. wszybkim przetwarzaniu pakietów TCP/IP, czy wykorzystaniu danych zsieci neuronowych uruchamianych na GPU.

Procesory z nowymi rdzeniami ARM zobaczymy pewnie już tejjesieni. Trochę więcej czasu zajmie pojawienie się czipów w pełniwykorzystujących możliwości DynamIQ. Szkoda, bo taki sobieośmiordzeniowy chromebook w konfiguracji 6×A75 + 2×A55 mógłbyczynić cuda w kwestii wydajności i długości pracy naakumulatorze.

Programy

Zobacz więcej
Źródło artykułu:www.dobreprogramy.pl
Oceń jakość naszego artykułuTwoja opinia pozwala nam tworzyć lepsze treści.
Wybrane dla Ciebie
Komentarze (28)