Kasulikke näpunäiteid

Superarvutite võrgud

Pin
Send
Share
Send
Send


Hajutatud andmetöötlus on üks võimalus panustada mõnele huvitavale projektile. Kui teie arvuti on jõude, jagage seda oma võimuga maaväliste tsivilisatsioonide otsimise projektiga SETI. Sel juhul analüüsib arvuti satelliitide andmeid ja teleskoopidest saadud teavet.

See artikkel aitab teil liituda hajutatud andmetöötlusega seotud projektidega (näiteks SETI). Artiklis tutvustatakse teile ka hajutatud arvutitarkvara BOINC.

Teil on vaja arvutit. Kui teil see juba olemas on, minge jaotisse Allikad ja lingid ning installige BOINC tarkvara. Kui teid SETI-projekt ei huvita, leiate allpool teiste projektide loendi.

Kui palju raha

Eraldi märgime Intel Xeon LGA1567 pistikupesas olevat äärmiselt kallist, kuid produktiivset protsessorite rida.
Selle seeria tippprotsessor on E7-8870, millel on kümme 2,4 GHz südamikku. Selle hind on 4616 dollarit. Selliste protsessorite jaoks vabastavad HP ja Supermicro! kaheksa protsessor! serveri šassii. Kaheksa 10-tuumast Xeon E7-8870 2,4 GHz protsessorit koos HyperThreadinguga toetavad 8 * 10 * 2 = 160 lõime, mis kuvatakse Windows Task Manager'is sada kuuskümmend graafikut protsessori laadimisest, maatriks 10x16.

Selleks, et kaheksa protsessorit mahuks korpusesse, ei paigutata neid kohe emaplaadile, vaid eraldi tahvlitele, mis kleepuvad emaplaadile. Fotol on neli emaplaati koos emaplaadile installitud protsessoritega (mõlemal kaks). See on Supermicro lahendus. HP lahenduses on igal protsessoril oma tahvel. HP lahenduse maksumus on kaks kuni kolm miljonit, sõltuvalt protsessorite arvust, mälust ja muust. Supermicro veermik maksab 10 000 dollarit, mis on atraktiivsem. Lisaks saab Supermicro panna PCI-Express x16 portidesse neli ühistöötleja laienduskaarti (muide, Infinibandi adapteril on endiselt ruumi nende klastri kokkupanekuks), kuid HP-s ainult kaks. Seega on superarvuti loomiseks atraktiivsem kaheksa protsessori platvorm firmalt Supermicro. Järgneval fotol näitusest on näha kogu GPU-tahvlitega superarvuti.

See on aga väga kallis.

Sidevõrgud

Superarvuti efektiivsus paljudes rakendustes on suures osas mälu ja võrguga töötamise profiiliga määratud. Mäluga töötamise profiili kirjeldatakse tavaliselt kõnede ruumilise-ajaliku lokaliseerimisega - kõnede suuruse ja nende aadresside hajuvuse järgi ning võrguga töötamise profiili kirjeldatakse nende sõlmede jaotusega, millega sõnumeid vahetatakse, vahetuskursi ja sõnumite suuruse järgi.

Superarvuti jõudlus sõlmede vahelise intensiivse andmevahetusega ülesannete korral (modelleerimisprobleemid, probleemid graafikutel ja ebakorrapärastel võrkudel, arvutused hõredate maatriksite abil) on peamiselt määratud võrgu jõudlusega, seega on tavapäraste kommertslahenduste (näiteks Gigabit Ethernet) kasutamine äärmiselt ebaefektiivne. Päris võrk on aga alati kompromisslahendus, mille väljatöötamisel seatakse prioriteedid hinna, jõudluse, energiatarbimise ja muude suures osas vastuoluliste nõuete vahel: ühe omaduse parandamise katsed võivad teise halvendada.

Sidevõrk koosneb sõlmedest, millest igaühel on võrguadapter ühendatud ühe või mitme ruuteriga, mis on omavahel ühendatud kiirete sidekanalite (linkide) abil.

Joon. 1. 4 topoloogia topoloogia (3x3x3x3)

Võrgu struktuur, mis määrab, kuidas süsteemi sõlmed täpselt omavahel ühendatud on, määratakse võrgutopoloogia (tavaliselt võre, tooruse või paksu puu) ja struktuuriparameetrite komplektiga: mõõtmiste arv, puude arv, toruse külgede mõõtmed, lülituste arv puude tasemel, võrgusõlmede arv. sadamad ruuteritel jne. Joonis 1 näitab neljamõõtmelise tooriumi 3x3x3x3 topoloogia näidet.

Ruuteri arhitektuur määrab võrgusõlmede vahel andmete edastamise eest vastutavate plokkide struktuuri ja funktsionaalsuse, samuti kanali, võrgu ja transpordikihtide protokollide vajalikud omadused, sealhulgas marsruutimise, arbitreerimise ja andmevoo juhtimise algoritmid. Võrguadapteri arhitektuur määrab protsessori, mälu ja võrgu vahelise interaktsiooni eest vastutavate plokkide struktuuri ja funktsionaalsuse, eriti toetatakse sellel tasemel MPI toiminguid, RDMA (Remote Direct Memory Access - otsene juurdepääs teise sõlme mälule ilma selle protsessori osaluseta), paketi teise sõlme vastuvõtmise kinnitused, erandolukordade käsitlemine, pakettide liitmine.

Sidevõrgu toimivuse hindamiseks kasutatakse enamasti kolme omadust: ribalaius (edastatud andmete hulk ajaühiku kohta), side viivitus (andmeedastuse aeg võrgu kaudu), sõnumi tempo (tavaliselt arvestavad nad ruuteri sisemiste üksuste vahel pakettide saatmisel, vastuvõtmisel ja edastamisel eraldi kohaletoimetamise määra).

Täielikkuse huvides mõõdetakse neid karakteristikuid erinevat tüüpi liikluses, näiteks kui üks sõlm saadab andmeid kõigile teistele või vastupidi, kõik sõlmed saadavad andmeid ühele või kui kõik sõlmed saadavad andmeid juhuslikesse sihtkohtadesse. Kaasaegsetele võrkudele kehtestatakse funktsionaalsusnõuded:

  • Shmem-raamatukogu tõhus rakendamine ühe suuna kommunikatsioonimudeli toetamise võimalusena ja paljude PGAS-keelte rakendamise aluseks olev GASNet;
  • MPI tõhus rakendamine (tavaliselt nõuab see helipuhvrite ja vastuvõetud pakettide kinnituste mehhanismi tõhusat toetamist),
  • kollektiivsete toimingute tõhus toetamine: leviedastamine (samade andmete samaaegne saatmine paljudele sõlmedele), vähendamine (binaarse toimingu rakendamine, näiteks erinevatele sõlmedele vastuvõetud väärtuste komplektile), massiivi elementide jaotamine sõlmede komplektile (hajumine), elementide massiivi kokkupanek, asuvad erinevates sõlmedes (kogunevad),
  • sõlmedevahelise sünkroonimistoimingute efektiivne tugi (vähemalt tõkete sünkroniseerimine), efektiivne interaktsioon sõlme suure hulga protsesside võrguga ja paketi usaldusväärse edastamise tagamine.

Samuti on oluline adapteri töö efektiivne toetamine hostinimese mäluga ilma protsessori kaasamiseta.

Välismaa kiirvõrgud

Kõik kommunikatsioonivõrgud võib jagada kahte klassi: kommerts- ja kohandatud, arvutisüsteemide osana välja töötatud ja saadaval ainult koos nendega. Kommertsvõrkude hulgas jaguneb turg InfiniBandi ja Etherneti vahel - Top500 nimekirjas (juuni 2011) kasutab InfiniBandit 42% süsteemidest ja 45% Gigabiti Etherneti. Samal ajal, kui InfiniBand on keskendunud suure jõudlusega süsteemide segmendile, mis on loodud keerukate arvutusülesannete jaoks suure hulga kommunikatsioonidega, siis Ethernet hõivab traditsiooniliselt niši, kus andmevahetus sõlmede vahel on kriitiline. Superarvutites kasutatakse Etherneti võrku oma madala hinna ja käideldavuse tõttu sageli abiteenuste võrguna, et vähendada juhtimisliikluse ja toiminguliikluse häireid.

Inifinibandi võrk keskendus algselt konfiguratsioonidele koos rasvapuu topoloogiaga, kuid lülitite ja ruuterite uusimad versioonid (peamiselt QLogici toodetud) toetavad mitmemõõtmelist toruse topoloogiat (kasutades Torus-2QoS Routing Engine), aga ka hübriidset topoloogiat 3D torust. ja rasvapuu. 2010. aasta alguses kokku pandud ja nüüd Top500-s 16. kohal paiknev superarvuti Sandia RedSky on üks esimesi suuremahulisi projekte, kus on InfiniBandi võrk ja topoloogia 3D torus (6x6x8). Samuti on nüüd palju tähelepanu pööratud RDMA toimingute ja Shmem-teegi (eriti Qlogic Shmem) tõhusale toetamisele.

InfiniBandi populaarsus on tingitud selle suhteliselt odavatest kuludest, tarkvara ökosüsteemist ja MPI tõhusast toest. InfiniBandil on aga oma puudused: madal sõnumite edastamise kiirus (Mellanoxi uusimates lahendustes 40 miljonit sõnumit sekundis), lühikeste pakettide madal edastamise efektiivsus, suhteliselt suur viivitus (rohkem kui 1,5 μs edastustesõlmede vahel ja lisaks 0,1 0,5 μs transiidisõlme kohta), toroidaalse topoloogia nõrk tugi. Üldiselt võib väita, et InfiniBand on toode tavakasutajale ning selle väljatöötamise ajal tehti kompromiss tõhususe ja mitmekülgsuse vahel.

Samuti võime märkida võrgustiku Extoll, mida valmistatakse turule turule toomiseks - Heidelbergi ülikooli arendamist professor Ulrich Brueningi juhtimisel. Selle võrgu arendamisel on põhirõhk viivituste minimeerimine ja ühesuunalise suhtluse edastamise kiiruse suurendamine. Plaanitakse, et Extollil on 3D-toruse topoloogia ja see kasutab optilisi linke ribalaiusega 10 Gb / s ühe raja kohta (jadaandmeedastuskanal lingi sees) ja laiusega 12 rada ühe lingi kohta. Nüüd on FPGA-l Extoll-võrgu prototüübid: R1 - põhineb Virtex4-l, R2 Ventoux - kahesõlmeline paigutus, mis põhineb Virtex6-l. Ühesuunaline ribalaius lingi kohta on 600 MB / s (R1 jaoks). Toetatakse ka kahte protsessoriga liidest (HyperTransport 3.0 ja PCI Express gen3), mis võimaldab selle võrgu integreerida Inteli ja AMD platvormidesse. Extoll toetab mitut võimalust ühesuunaliste kirjete korraldamiseks, enda MMU-d (mäluhaldusüksus, virtuaalaadresside tõlkimise blokk füüsilisteks aadressideks) ja aatomatoiminguid.

Erinevalt kommertsvõrkudest hõivavad kohandatud võrgud palju väiksema turuosa, kuid neid kasutatakse Cray, IBMi, SGI, Fujitsu, NEC ja Bulli võimsamates superarvutites. Kohandatud võrkude kavandamisel on arendajatel rohkem vabadust ja nad püüavad kasutada progressiivsemaid lähenemisviise, kuna lõpptoote turu atraktiivsus on vähem tähtis, lahendades eeskätt konkreetse ülesande klassi maksimaalse jõudluse saavutamise probleemi.

K Computeri superarvuti kasutab patenteeritud Tofu (TOrus FUsion) kommunikatsioonivõrku, mis on skaleeritav 3D torus, mille sõlmed sisaldavad 12 sõlme rühmi (sõlmede rühmad on ühendatud 12 võrguga 3D torusega ja igal selle grupi sõlmel on oma väljund) 3D torus võrk). Igas rühmas olevad sõlmed on omavahel ühendatud 3D-torusega, mille küljed on 2x3x4 ilma dubleerivate linkideta, mis võrdub 2D-torusega, mille küljed on 3x4 (seega saame 5D toruse, millel on fikseeritud kaks mõõdet). Seega on Tofu võrgusõlmel 10 lüli ühesuunalise läbilaskevõimega 40 Gb / s. Riistvara toetab sõlmede tõkete sünkroniseerimist ja vähendamist (täisarv ja ujukoma).

Tianhe-1A superarvuti väljatöötamisel olid peamised eesmärgid kõrge energiatõhususe saavutamine, oma protsessori ja võrgu arendamine, mis oleks parem kui InfiniBand QDR. Superarvuti koosneb 7168 arvutisõlmest, mis on ühendatud paksu puu topoloogiaga Archi võrguga, mis on kujundatud oma kujundusega. Võrk on ehitatud 16-pordilistest ruuteritest, ühesuunalise lingi ribalaius - 8 GB / s, viivitus - 1,57 μs. Toetatud on RDMA operatsioonid ja optimeeritud kollektiivoperatsioonid.

Süsteemsete klasside esindajad, kes kasutavad arvutuslike sõlmede ühendamiseks toroidset topoloogiat, on IBM Blue Gene seeria süsteemid, mille kahes esimeses põlvkonnas - Blue Gene / L (2004) ja Blue Gene / P (2007) - kasutati 3D toruse topoloogiat. Blue Gene / P võrgul on suhteliselt nõrgad lingid ühepoolse ribalaiusega 0,425 GB / s, mis on suurusjärku võrra madalam kui selle tänapäevase InfiniBand QDR lingi ribalaius, kuid riistvarapõhine tugi tõkete sünkroniseerimiseks ja kollektiivseteks toiminguteks (eraldi puusarnastes võrkudes) võimaldab head skaleeritavust tõelised rakendused. Lisaks on kõik liidesed ja marsruutimisüksused integreeritud BPC mikroprotsessorisse (Blue Gene / P Chip), mis vähendab märkimisväärselt sõnumi edastamise viivitusi. Järgmise põlvkonna sidevõrgul Blue Gene / Q on 5D-toriline topoloogia ja erinevalt eelkäijatest puuduvad sellel eraldi võrgud tõkete sünkroniseerimiseks ja kollektiivseteks toiminguteks. Blue Gene / Q kiibist sai esmakordselt mitme südamiku-mitme keermega - neli riistvara lõime tuuma kohta koos 16 südamikuga, mis võimaldab nõrgendada võrgunõudeid ja tagada viivitustaluvuse. Lingi läbilaskevõimet on suurendatud 2 GB-ni / s, kuid võrreldes Cray Gemini või Extolliga on see endiselt väike. Nendes süsteemides madalat läbilaskevõimet tasandatakse toruse suure mõõtmega (suur arv linke) ja selle tulemusel võrgu väikese läbimõõduga (oluliselt väiksem kui võrkude puhul, millel on sama torude arvuga 3D toruse topoloogia). Kättesaadavad allikad teatavad kahe Blue Gene / Q transpetaflopi superarvuti loomisest: Sequoia jõudlusega 20 PFLOPS ja Mira - 10 PFLOPS. Võib järeldada, et Blue Gene / Q on keskendunud ülesannetele, mis kasutavad kümneid ja sadu tuhandeid arvutisõlmi, mille võrguliiklus on "kõik kõigile".

Teine toroidaalse topoloogiaga võrkude loomise lähenemisviisi järgija on Cray, mis jätkab 3D tor-topoloogia kasutamist, suurendades samal ajal läbilaskevõimet ja naabruses asuvaid sõlme ühendavate linkide arvu. Cray toroidaalse võrgu praegune põlvkond on Cray Gemini võrk. Üks Gemini ruuter vastab kahele eelmise SeaStar2 + põlvkonna ruuterile, see tähendab tegelikult kahele võrgusõlmele, seetõttu kasutatakse Geminites naabruses olevate sõlmedega ühenduse loomiseks 6 lingi asemel 10 (2 teenivad kahe adapteri ühendamiseks üksteisega).

Erinevalt protsessoritest on superarvuti võrgu komponendid (võrguadapterid, lülitid, ruuterid) sageli kallimad ja nendele juurdepääs on piiratum. Näiteks nüüd toodavad InfiniBandi võrgu kommutaatoreid, mis on superarvutite peamine kommertsvõrk, ainult kaks ettevõtet, mõlemat kontrollib USA. See tähendab, et kiirete võrkude valdkonnas omaenda arengu puudumisel saab hõlpsasti kontrollida kaasaegsete superarvutite loomist ükskõik millises riigis, välja arvatud USA, Hiina või Jaapan.

Kodused võrgud

Superarvutites kasutatavate kommunikatsioonivõrkude arendamist viivad läbi mitmed kodumaised organisatsioonid: RFNC VNIIEF (avatud allikates on nende arengute kohta väga vähe teavet), Venemaa Teaduste Akadeemia tarkvarasüsteemide instituut ja RSK SKIF, IPM RAS ning teadusinstituut Kvant (MVS-Expressi võrk) ").

Vene-Itaalia superarvuti SKIF-Aurora 3D tor-sidevõrk on täielikult üles ehitatud kasutades Altera Stratix IV FPGA, mis selgitab üsna väikest ribalaiust lingi kohta - 1,25 GB / s (FPGA ressursid on väga piiratud).

MVS-Expressi võrgus kasutatakse arvutisõlmede integreerimiseks PCI Express 2.0 ja need on ühendatud 24-pordiliste lülitite kaudu. Võrgul on rasvapuu lähedal topoloogia. Arvutussõlme võrguadapteril on üks sadam laiusega 4 rada, mille tulemusel on ühe suuna maksimaalne läbilaskevõime lüli kohta 20 Gbit / s, võtmata arvesse kodeerimise üldkulusid. PCI Expressi kasutamise eeliseks MVS-Expressis on jagatud mälu tõhus toetamine ühesuunalise suhtluse võimalusega. Selle tulemusel on võrk Shmem teegi ja PGAS-keelte (UPC, CAF) rakendamiseks mugav.

Vene Föderatsiooni tööstus- ja kaubandusministeeriumi toetusel töötab NICEVT OJSC Angara kommunikatsioonivõrgu väljaarendamisel 4D-tor topoloogiaga, millest võib saada superarvutite arendamiseks kodumaiste tehnoloogiate loomise alus.

Võrgustik "Angara"

Angara võrgu arendamise peamised eesmärgid:

  • efektiivne tugi ühesuunalise (panna / saada) ja PGAS-keelte (kui paralleelprogrammeerimise peamine vahend) jaoks,
  • Tõhus MPI tugi
  • oma kristallide vabastamine (kõrge andmeedastuskiiruse ja väikeste viivituste saavutamiseks),
  • adaptiivne tõrkekindel pakettide edastamine,
  • tõhus töö kaasaegsete protsessorite ja kiibikomplektidega.

Selle võrgu esimeses arenguetapis (2006) simuleeriti erinevaid võrgu võimalusi ja tehti peamised otsused topoloogia, ruuteri arhitektuuri, marsruutimisalgoritmide ja arbitraaži kohta. Lisaks toroidaalsele topoloogiale kaaluti Cayley võrke ja “paksu puud”. Neljamõõtmeline torus valiti väiksema tori omaga võrreldes lihtsama marsruudi, hea mastaapsuse ja suure ühenduvuse tõttu. Võrgu modelleerimine võimaldas üksikasjalikult uurida võrguarhitektuuri erinevate parameetrite mõju peamistele jõudluse karakteristikutele, mõista intensiivse ebaregulaarse mäluga tööülesannete liikluse mustreid. Selle tulemusel valiti optimaalsed puhvrite suurused, virtuaalsete kanalite arv ja analüüsiti võimalikke kitsaskohti.

2008. aastal ilmus FPGA ruuteri esimene prototüüp - Virtx4 võrgus 2x3 torusega ühendatud kuue sõlme võrguskeem, millel siluti ruuteri põhifunktsioonid, töötati välja tõrketaluvusega andmeedastus, kirjutati draiver ja madala taseme teek ning siluti, Shmem teegid teisaldati ja MPI Nüüd tõi turule kolmanda põlvkonna paigutuse, mis koosneb üheksast sõlmest, mis on ühendatud kahemõõtmelise torusega 3x3. Собран стенд с двумя узлами для тестирования новых разъемов и каналов передачи данных, предполагаемых к использованию с будущими кристаллами маршрутизатора ВКС. При разработке принципов работы сети ряд деталей был позаимствован из работ и , а также в том или ином виде из архитектур IBM Blue Gene и Cray SeaStar.

Сеть «Ангара» имеет топологию 4D-тор. Поддерживается детерминированная маршрутизация, сохраняющая порядок передачи пакетов и предотвращающая появление дедлоков (взаимных блокировок), а также адаптивная маршрутизация, позволяющая одновременно использовать множество путей между узлами и обходить перегруженные и вышедшие из строя участки сети. Erilist tähelepanu pöörati kollektiivsete toimingute toetamisele (levitamine ja vähendamine), mida rakendati virtuaalse alamvõrgu abil, mille puu topoloogia oli asetatud mitmemõõtmelisele torusele. Riistvara tasemel olev võrk toetab kahte tüüpi kaugkirjutamist, lugemist ja aatomitoiminguid (liit- ja eksklusiivne VÕI). Kauglugemise täitmisskeem (päringu saatmine ja vastuse saamine) on näidatud joonisel fig. 2 (kaug salvestamine ja aatomi toimingud viiakse läbi sarnaselt). Eraldi plokis rakendatakse loogikat võrgust vastuvõetud sõnumite liitmiseks, et suurendada kasulike andmete osakaalu tehingu kohta, kui edastatakse liidese kaudu hostiga (host on protsessori-mälu-silla sild).

Joon. 2. Kauglugemise skeem Angara võrgus

Andmesidekihis toetatakse tõrkekindlat pakettide edastamist. Samuti on olemas mehhanism ebaõnnestunud sidekanalite ja sõlmede ümbersõitmiseks marsruutimistabelite ümberehitamise teel. Erinevate teenusetoimingute tegemiseks (eriti marsruutimistabelite konfigureerimiseks / ümberehitamiseks) ja mõnede arvutuste tegemiseks kasutatakse teenusprotsessorit. Hostiliides kasutab PCI Expressi.

Joon. 3. Võrgusadapteri / ruuteri "Angara" arvutisõlme struktuur

Ruuteri peamised plokid:

  • liides hostisüsteemiga, mis vastutab hostiliidesel pakettide vastuvõtmise ja saatmise eest,
  • süstimis- ja väljundüksus, mis moodustab võrku saadetavad paketid ja parsib võrgust saabuvate pakettide päised,
  • päringute töötlemisüksus, mis töötleb pakette, mis vajavad vastuvõtvasüsteemi mälust teavet (näiteks lugemist või aatomitoiminguid),
  • kollektiivsete operatsioonide võrguüksus, mis töötleb kollektiivsete toimingutega seotud pakette, eriti vähendamise toiminguid, genereerides edastustaotluste pakette,
  • teenindusoperatsioonide üksus, mis töötleb pakette, mis lähevad teenusetöötlejale ja sealt edasi,
  • lüliti, mis ühendab sisendeid erinevatest virtuaalsetest kanalitest ja sisendeid injektoritest koos väljunditega erinevatesse suundadesse ja väljunditesse,
  • sidekanalid andmete edastamiseks ja vastuvõtmiseks kindlas suunas,
  • andmeedastusüksus pakettide saatmiseks antud suunas ning vastuvõtmis- ja marsruutimisüksus pakettide vastuvõtmiseks ja nende edasise saatuse üle otsustamiseks.

Masina interaktsioon (keskprotsessoril täidetav kood) ruuteriga viiakse läbi, kirjutades mäluaadressidele, mis on kaardistatud ruuteri ressursipiirkondade aadressidega (mäluga kaardistatud sisend / väljund). See võimaldab rakendusel ruuteriga suhelda ilma kerneli osaluseta, mis vähendab pakettide saatmise üldkulusid, kuna kerneli konteksti ja tagasi lülitumine võtab rohkem kui sada taktsüklit. Pakettide saatmiseks kasutatakse ühte mälupiirkonda, mida peetakse ringpuhvriks. Samuti on eraldi piirkond toimingute tegemiseks ilma mälumahtu kopeerimata (andmeid loetakse mälust ja kirjutatakse kommunikatsioonivõrgu adapteri kaudu DMA toimingute kaudu) ja piirkond koos juhtregistritega. Juurdepääsu ruuteri teatud ressurssidele kontrollib tuumamoodul.

Suurema efektiivsuse saavutamiseks otsustati, et ühel sõlmel tuleb teostada ainult üks arvutuslik ülesanne, see kõrvaldas virtuaalse mälu kasutamisega seotud üldkulud, vältis ülesande sekkumist, lihtsustas ruuteri arhitektuuri täieliku MMU puudumise tõttu ja vältis kõiki tema töö suhtlemisel viibib, aga ka lihtsustab võrguturbe mudelit, välistades sellega ühe sõlme erinevate toimingute protsesside turvalisuse. See lahendus ei mõjutanud võrgu funktsionaalsust, mis oli mõeldud peamiselt suuremahulisteks ülesanneteks (erinevalt InfiniBandist, mis on universaalne võrk erineva suurusega ülesanneteks). Sarnane otsus tehti ka ettevõttes IBM Blue Gene, kus lõigule kehtestati ülesande ainulaadsuse piirang.

Riistvara tasemel toetatakse ühe ülesande paljude lõimede / protsesside samaaegset tööd ruuteriga - see on rakendatud mitme süstimiskanali kujul, mida protsessid saavad kasutada pakettide salvestamiseks mitme ringpuhvri kaudu. Nende puhvrite arv ja suurus võivad dünaamiliselt muutuda.

Angara võrgu peamine programmeerimisrežiim on MPI, OpenMP ja Shmem, samuti GASNet ja UPC ühine kasutamine.

Pärast võrgu verifitseerimise ja prototüüpimise lõpuleviimist on kavas vabastada VLSI kiip. VLSI-partii prototüüp kavandatakse põhiliste tehnoloogiliste lahenduste silumiseks, tehnoloogiliseks protsessiks ja simulatsiooni tulemuste eksperimentaalseks kontrollimiseks. Prototüüp sisaldab kõiki põhifunktsioone, töötab PCI Express gen2 x16 liidesega ja lingid läbilaskevõimega 75 Gb / s.

Angara võrku on kavas reklaamida kahes versioonis: eraldi kommertsvõrguna PCI Express-kaartide kujul klastrisüsteemide jaoks, millel on tavalised protsessorid ja kiibistikud, ning osana NICEVT-is väljatöötatavast AMD-protsessoritel põhinevast nelja pistikupesaga labasüsteemist.

Pin
Send
Share
Send
Send