czwartek, 24 maj 2012
NEXT / Artykuły / NEXT 3/2007 / Artykuły z NEXT 3/2007 / Niegraficzne rozwiązania

NEXT 3/2007 - Niegraficzne rozwiązania

Niegraficzne rozwiązania - ikonka porównanie układów Avebury i Azul Vega

Data: 16 listopad 2007
Identyfikator: 070302

Oprócz superwydajnych konstrukcji wywodzących się z grafiki można znaleźć również inne rozwiązania. Przyjrzyjmy się kartom ClearSpeed Advance X620 z procesorem Avebury i 48-rdzeniowemu układowi Azul Vega.


Słownik

ALU (Arithmetic Logical Unit) jednostka arytmetyczno-logiczna. To główna część procesora, prowadząca proste operacje arytmetyczne na liczbach całkowitych, a także operacje logiczne, skoków oraz związane z adresowaniem.

FP64 (FloatingPoint 64-bit) oznaczenie określające sposób przeprowadzania obliczeń zmiennoprzecinkowych, tj. na liczbach niecałkowitych. W tym wypadku obliczenia wykonywane są przy wykorzystaniu 64 bitów. Zapewnia to znacznie większą precyzję, niż przy obliczeniach przeprowadzanych na 32 bitach. Zamiast nazwy FP64 używa się też określenia obliczenia podwójnej precyzji - wynika to z dwukrotnie dłuższego słowa (niż w FP32), na którym przeprowadzane są działania.

GPGPU (General Purposes GPU) zyskujący coraz większą popularność termin określający zastosowanie specjalizowanych jednostek potokowego przetwarzania danych graficznych do przeprowadzania obliczeń ogólnego zastosowania. Dzięki znacznie prostszej konstrukcji układu GPGPU mogą wykonywać określone zadania znacznie szybciej niż istniejące układy ogólnego przeznaczenia, pobierając przy tym porównywalną ilość energii. GPGPU wymagają jednak pisania od podstaw wszelkich aplikacji i bibliotek, które umożliwią wykorzystanie ich potencjału.

GPU (Graphics Processing Unit) układ graficzny, który jest główną jednostką obliczeniową znajdującą się w nowych kartach graficznych. Dzięki dużo większej szybkości obliczeń strumieniowych pozwala na znaczne przyspieszenie tworzenia scen trójwymiarowych. Wykorzystanie GPU bardzo odciąża procesor główny komputera, który może w tym samym czasie wykonywać inne zadania.

NAP (Network Attached Processing) klasa urządzeń, które dołączane są do systemów komputerowych poprzez interfejs sieciowy, najczęściej typu Gigabit Ethernet. Są samodzielnymi urządzeniami i udostępniają narzędzia do zarządzania, najczęściej za pośrednictwem interfejsu WWW.

SPECjbb2005 nazwa jednego z wielu testów opracowanych i udostępnianych za opłatą przez organizację SPEC (Standard Performance Evaluation Corporation). Test ten sprawdza wydajność przetwarzania aplikacji napisanych w języku Java, a jego wynik określa liczbę operacji przeprowadzanych w jednostce czasu.

TOP500.org organizacja zajmująca się od 14 lat prezentowaniem listy 500 najwydajniejszych superkomputerów na świecie. Ogłoszenie kolejnej prestiżowej listy następuje co pół roku i jest wielce oczekiwanym wydarzeniem w branży. Lista dostępna jest bez żadnych opłat i zawiera szczegółowe informacje o konfiguracji danego superkomputera, co pozwala przewidzieć możliwości kolejnych generacji bezpośrednio po zapowiedzi ich opracowania.

Avebury, czyli CSX600, to procesor wyposażony w 96 jąder obliczeniowych, z których każde zawiera zmiennoprzecinkowe jednostki dodawania i mnożenia oraz jednostkę ALU, operujące na 128-bajtowym pliku rejestrów, zarówno w trybie 64- lub 32- -bitowym. Ponadto każde z jąder wyposażone jest w 6-kilobajtową pamięć statyczną, pełniącą rolę podręcznej pamięci operacyjnej. Bez trudu można zauważyć ogromne podobieństwo między jednostkami obliczeniowymi GPU a tymi, które są stosowane w CSX600. Podobieństwo to kończy się jednak na poziomie architektury macierzy jednostek obliczeniowych. Podstawowym trybem pracy CSX600 jest bowiem FP64, czyli z 64-bitową precyzją, a zaledwie dodatkowym – FP32 (precyzja obliczeń 32-bitowa). Nie ma więc problemów ze spadkiem wydajności, które w GPU występują w przypadku obliczeń typu FP64. Przypomnijmy, że GPU pracuje z 32-bitową precyzją obliczeń, natomiast tryb FP64 jest w nich mniej wydajny o około 50 proc.

Mało czy dużo?

Układ CSX600 ma teoretyczną moc obliczeniową zaledwie 33 GFLOPS, czyli znikomą w porównaniu z teoretycznymi mocami 8 GPGPU. Ale uwaga! Ta teoretyczna moc potwierdzona jest przez wyniki testów przy użyciu benchmarku Linpack. Ściślej mówiąc, moc pojedynczego procesora nie została zmierzona bezpośrednio, a oszacowana na podstawie testów klastra czterech serwerów z dwoma procesorami Intel Xeon 5160 (jądro Woodcrest pracujące z częstotliwością 3 GHz) w każdym z węzłów. Klaster taki uzyskał wynik 136 GFLOPS, zaś po wyposażeniu każdego z węzłów w dwie karty Advance X620, z których każda ma na pokładzie dwa układy CSX600 (w takiej formie firma ClearSpeed sprzedaje swój koprocesor), uzyskiwany wynik w Linpacku wyniósł aż 364 GFLOPS. Skok o bez mała 200 GFLOPS (co daje około 25 GFLOPS na kartę) to bardzo dużo, zwłaszcza jeśli weźmiemy pod uwagę fakt, że ten 2,7-krotnie wyższy rezultat uzyskano kosztem zwiększenia poboru mocy przez cały klaster o zaledwie 200 W. A to tylko nieco więcej niż 10 proc. całkowitego poboru tegoż – jedna karta Advance X620 pobiera moc zaledwie 25 watów. Hasłem reklamowym firmy ClearSpeed stało się więc określenie „GigaFLOPS na wat”, a jej głównymi klientami... użytkownicy superkomputerów, którzy znaleźli relatywnie tanią drogę do znacznego zwiększenia mocy obliczeniowej swoich maszyn, nawet tych najpotężniejszych, wymienianych w rankingu z listy TOP500.org.

Nie do obliczeń

Prezentowane dotychczas rozwiązania przeznaczone były głównie do masowych obliczeń zmiennoprzecinkowych, jednak istnieją również inne linie zastosowań. Kolejnym superkomputerem, przeznaczonym do umieszczenia w serwerze o architekturze zgodnej z dobrze nam znanym x86, jest układ o nazwie Azul Vega 2, produkowany przez firmę Azul Systems. W przypadku tego układu należałoby jednak zamiast superkomputer używać określenia superserwer – zawiera on bowiem 48 jąder optymalizowanych do wykonywania kodu języka Java. Niestety, Azul Systems nie ujawnia detali konstrukcji układu Vega 2. Najbardziej istotny dla użytkowników szczegół jest jednak znany – wszystkie 48 procesorów Javy widoczne są programowo jako architektura SMP (Symmetric Multiprocessing). Na tym jednak nie koniec – przy połączeniu kilku procesorów razem, czyli umieszczeniu w jednym serwerze kilku kart z takimi procesorami, całość programowo nadal pozostaje architekturą SMP.

Firma Azul Systems początkowo sprzedawała same karty z procesorami Vega 1 (aktualnie są to już procesory Vega 2), obecnie jednak przestawiła się wyłącznie na bardziej dochodową działalność, jaką jest dostarczanie serwerów stworzonej przez siebie klasy NAP (Network Attached Processing). Serwery takie służą odciążeniu podstawowych maszyn od przetwarzania liczących ogromne ilości wątków aplikacji Javy. Natomiast koncentracja całego potencjału wielowątkowości w jednej maszynie jest rozwiązaniem tańszym i wygodniejszym od stosowania w poszczególnych serwerach dodatkowych kart obsługujących 24 czy 48 wątków Javy.

Jakiej wydajności możemy się spodziewać po 768-wątkowym monstrum, którego wymiary tylko trochę przekraczają wymiary zwykłego peceta? Wyposażony w 16 układów Vega 2 NAP, czyli Network Area Processor, osiągnął w ogólnie uznawanym teście wydajności 8 SPEC- jbb2005 wynik blisko 873 tys. SPECjbb2005 bops, współpracując z serwerem produkcji Penguin Computing Inc. Nic nam to nie mówi, poszukajmy więc w bazach wyników SPEC rezultatów uzyskiwanych przez mniej oryginalne i lepiej znane nam maszyny. I tak serwer Fab- ric 7, z ośmioma procesorami AMD Opteron 885 (16 rdzeni, 2,6 GHz każdy), uzyskał maksymalny wynik nieco ponad 180 tys. SPEC-jbb2005 bops, a więc nieco ponad 4,8 razy niższy. Z kolei do zdecydowanego pokonania Vega 2 NAP konieczny był komputer Fujitsu PrimePOWER 2500, wyposażony w 128 procesorów SPARC64 V z zegarem 2080 MHz, który uzyskał wynik 1 251 tys. SPECjbb2005 bops.

Warto jednak zauważyć, że podobny PrimePower 2500 zajmuje 414. pozycję na prestiżowej liście TOP500. Jest też przynajmniej kilka razy większy od serwera NAP i zużywa od niego 6 do 40 razy mniej energii.

Bez korzeni?

Wcześniej napisaliśmy, że nie będziemy zajmować się tematem rozwiązań wywodzących się z grafiki 3D na rzecz konstrukcji dostosowanych do konkretnych zadań. Rzeczywiście Azul Vega i Vega 2 nie mają żadnych technicznych korzeni w grafice, natomiast firma jako taka – owszem. Scott Sellers, założyciel Azul Systems, był kilkanaście lat temu współzałożycielem firmy 3dfx i współtwórcą kultowych akceleratorów grafiki 3D Voodoo...


Tagi: karty graficzne  
Ocena: +++++    (aby ocenić, musisz się zalogować w serwisie)

Podobne artykuły:

Komentarze:

Redakcja nie ponosi odpowiedzialności za treść komentarzy.
Nikt jeszcze nie skomentował.
Niezalogowany

Aby mieć dostęp do niektórych części serwisu NEXT (np. forum dyskusyjnego, oceny numeru, newslettera), musisz posiadać konto w naszym serwisie. Zachęcamy do darmowej rejestracji!

Jeżeli posiadasz już konto w serwisie, to zaloguj się.