^
TSMC procesor CPU chip krzem

Najszybszy superkomputer świata jest na ARM

Jaromir Kopp

10 marca 2021

Właśnie wczoraj świat obiegła informacja, że najwydajniejszy obecnie superkomputer świata, wyszedł z fazy prototypowej i został przed czasem oddany do użytku. Ma pomagać m.in. podczas prac badawczych związanych z pandemią i wirusem powodującym COVID-19.

Fugaku z procesorami Fujitsu A64FX na bazie ARM

Już w czerwcu zeszłego rogu, jako niedokończony prototyp, Fugaku zdobył palmę pierwszeństwa na liście  TOP500 pokonując poprzednika wydajnością aż trzykrotnie (442 PFLOPS). Ten wynik został osiągnięty bez wsparcia w postaci dodatkowych koprocesorów „graficznych”, jak to się często dzieje w kolejnych na liście TOP500 superkomputerach.

Superkomputer Fugaku jest zbudowany na bazie procesorów Fujitsu A64FX. Te są oparta na architekturze ARMv8.2-A z dodatkami opracowanymi przez Fujitsu. Każdy z procesorów posiada aż 48 rdzeni obliczeniowych. Są one połączone po 12 sztuk w jednostkach nadrzędnych zwanych  NUMA. Jak wynika z matematyki jeden procesor ma 4 NUMA, a każda z nich ma dodatkową pamięć cache L2 i dodatkowe rdzenie pomocnicze nieużywane w obliczeniach.

W superkomputerze Fugaku w czerwcu 2020 takich procesorów było 158 976. Teraz prawdopodobnie jest ich więcej.

Na liście TOP500 miejsca od 1 do 4 zajmują komputery z procesorami bazującymi na architekturach innych niż wywodzące się z intelowskiego x86-64. Dwa miejsca za Fugaku z ARM okupują POWER9 IBM wsparte koprocesorami graficznymi Tesla V100 od Nvidii.

Częste użycie ARM w superkomputerach i osiągane przez nie wyniki świadczą o elastyczności tej architektury. Również na liście superkomputerów osiągających najwyższą wydajność z wata, te na ARM zajmują czołowe miejsca.

Ciekawe co by się stało gdyby zbudować superkomputer na bazie procesorów Apple? Podejrzewam, że bez wbudowania w nie specjalnej magistrali pozwalającej na superszybką komunikację między jednostkami się nie obejdzie.  Fugaku i A64FX mają zaimplementowany własny system magistral zwany Tofu interconnect D.

Ambicje Apple chyba nie idą w tę stronę, ale kto wie, co się zrodzi w tajnych laboratoriach Apple. Na superkomputerach też można zarobić.

Jaromir Kopp

Użytkownik komputerów Apple od 1991 roku. Dziennikarz technologiczny, programista i deweloper HomeKit. Propagator przyjaznej i dostępnej technologii. Lubi programować w Swift i czystym C. Tworzy rozwiązania FileMaker. Prowadzi zajęcia z IT i programowania dla dzieci oraz młodzieży, szkoli też seniorów. Współautor serii książek o macOS wydanych przez ProstePoradniki.pl. Projektuje, programuje oraz samodzielnie wykonuje prototypy urządzeń Smart Home. Jeździ rowerem.
Komentarze (13)
L

13 komentarzy

    • Jaromir Kopp

      Czyli architektura POWER, a w zasadzie PowerPC od IBM i AIM

      • Ola

        W zasadzie Power było tam najsłabszym elementem. Za samą wydajność miały odpowiadać dodatkowe małe jednostki wykonawcze, ale się nie przyjęły. Programiści są przyzwyczajeni do programowania normalnych procesorów i te małe były dla nich kłopotem.

    • Dawid

      W sensie nie, że najlepszy, tylko tani do zbudowania superkomputer (= biznes).

      • Jaromir Kopp

        No bo Sony trochę dopłacało do konsol, licząc na zyski z gier

    • Jaromir Kopp

      A czekaj… PS3 już chyba były na jakimś badziewiu.

      • Dawid

        Co masz na myśli?

        • Jaromir Kopp

          Nie jestem pewien na jakich prockach PC3 robili, czy czasem nie już na jakiś x86-64 Intel/AMD

  1. Arm

    Hehe tak to już jest z tym monopolem na architekturę „x86” , ciągną te nadmiarowe tranzystory o dekadę za długo. Apple bardzo mnie zaskoczyło z wydajnością M1, chyba jeszcze we mnie płynie „hejterska krew”. Bo zrobili coś co intel mial w nosie od 10lat, i te sprzętowe dziury łatane systemowo.

    • Iro

      Czyżby nowa baza do produkcji hackintoshy?

      • Jaromir Kopp

        No takim na A64FX chyba i ja bym nie pogardził

    • Ola

      Te nadmiarowe tranzystory stanowią mniej niż 1% procesora. X86 jest dalej bardzo wydajne, tyle że nie jest energooszczędne i nie skaluje się zbyt dobrze w dół. Zobaczymy co się stanie kiedy w końcu dotrą do wymiaru 5 nm.

  2. Ola

    Zapomniałeś wspomnieć, że te procesory mają unikalne, 1024 bitowe jednostki wektorowe, które odwalają całą robotę jeśli chodzi o wydajność. ARM został wybrany pewnie dlatego, że wtedy Japońska firma była jego właścicielem, ma stosunkowo małe wymiary przy jednocześnie oferowanych możliwościach. W sieci dostępna jest dość duża dokumentacja procesorów zastosowanych w tym komputerze.