SARA


gepubliceerd op woensdag 6 oktober 2004

Nieuw Nationaal Rekencluster gearriveerd in Almere

Na een lang en grondig selectieproces is het zover: het nieuwe Nationale Rekencluster wordt een feit. De installatie in SARA's datacenter in Almere is kortgeleden begonnen. Hoe dat in zijn werk ging kunt u zien op de foto's.

Het nieuwe cluster gaat het Beowulf-cluster vervangen dat SARA voor de Universiteit van Amsterdam beheert en ondersteunt. Daarnaast gaat de stichting Netherlands Bioinformatics Center (NBIC) diensten en applicaties aanbieden via het nieuwe cluster.

En, last but not least: het cluster zal ook beschikbaar worden gesteld aan de wetenschappelijke gemeenschap in Nederland door de stichting Nationale Computer Faciliteiten (NCF), die het cluster in het kader van het flankerend beleid mede financiert. Ook neemt NWO in het Nationale Rekencluster deel via het NWO-programma 'Computational Life Sciences'.

Configuratie
Via een Europese aanbestedingsprocedure is de firma Dell B.V. geselecteerd als de leverancier van het nieuwe cluster dat de volgende configuratie zal krijgen:
· 272 nodes met gloednieuwe dual Intel® Xeon(TM) op 3.4 GHz (dus 544 processors) voor batchgebruik met 2 GByte aan geheugen en een 800 MHz front-side bus.
· 3 masternodes eveneens met 3.4 GHz Xeon-processors, maar nu met 4 GB aan geheugen.
· De processors zijn uitgerust met 1 MB aan Level-2 cache en hebben de nieuwe Intel Extended 64 Technology (EM64T). Hiermee kunnen de processors nieuw geschreven 64-bit code verwerken en grotere hoeveelheden geheugen adresseren.
· In totaal heeft het cluster een top-performance van ruim 1,8 Tflop/s. Met gebruikmaking van de speciale instructieset kan zelfs ruim 3 Tflop/s worden gehaald. Dit is een welkome aanvulling op de al beschikbare nationale supercomputercapaciteit.
· de batchnodes worden verbonden via een high bandwidth (800 Mbyte/s), low latency (6 microsec) InfiniBand-netwerk voor intern verkeer (zoals MPI-messages) en via Gigabit Ethernet. De masternodes worden uitgerust met optic Fiberchannel en Gigabit Ethernet.
· Het besturingssysteem wordt, net als op het huidige Beowulf-cluster, Linux (de Debian-distributie).
· Voor de dataopslag is speciaal voor dit cluster een disk-array van SGI met 10 Terabyte aan disks aangeschaft. De toegenomen groei in de rekencapaciteit betekent dat de druk op de dataopslag voor de lange termijn zal toenemen. SARA heeft daarom besloten binnen enkele maanden een tweede taperobot in Almere te plaatsen.

Inrichting
De capaciteit van het cluster zal niet - zoals nu op het Beowulf-cluster het geval is - over de partners worden verdeeld door het cluster onder te verdelen in subclusters, maar door middel van het batchsysteem. Op het cluster zal het van het Beowulf-cluster al bekende batchsysteem TORQUE gaan draaien. Dit batchsysteem kent back-filling en fair-share scheduling, waardoor zowel grote als kleine jobs aan bod kunnen komen en niet op elkaar hoeven te wachten.

Een van de voordelen van een clusteroplossing is dat hij flexibel en uitbreidbaar is. Mochten in een later stadium nog andere partijen belangstelling tonen, dan kunnen die alsnog aan het cluster gaan deelnemen.

Start productie
Het Nationale Rekencluster wordt op dit moment geïnstalleerd in SARA's datacenter in Almere. Als deze werkzaamheden zijn afgerond, hebben de SARA-medewerkers nog enige tijd nodig om de SARA-specifieke omgeving (filesystemen, user-administratie, batch queues e.d.) in te richten. Naar verwachting zal het cluster eind oktober in productie gaan.