Felhasználói eszközök

Eszközök a webhelyen


eltehpchistory

Az ELTE IIG HPC rendszereiről

Korábbi rendszerek

A caesar cluster részeként 1996-ban létezett egy IBM SP alapú rendszer. 2 rack. Rendszergazdái: FCO Nagy János és Szalay Tamás. Elavultság és pénzhiány miatt a szolgáltatás megszűnt.

A lágymányosi épületbe költözés után (2000) sokáig nem volt HPC szolgáltatása az Informatikai Igazgatóságnak.

A HP Magyarország közbenjárásával egy amerikai meteorológiai hivatal leselejtezett Alpha4100 clusterének fele (4 node) került hozzánk. A cluster másik fele (a másik 4 node) a műegyetemre. Ennek a neve volt az aladar.elte.hu. A Mézga-család. Sorozatos hardverhibák és supportnélküliség útján egyre alacsonyabb színvonalú szolgáltatást nyújtva kimult.

Az NIIF által korábban használt SUN Enterprise 10000 számítógép-pár egyik fele (selejtezés útján) került ide, amit igen hosszú küszködéssel végre sikerült életre lehelni. (Holitska András) Ez egy valódi szupergép, 'baby-Cray'. Valószínű, hogy az üzemeltetéshez szükséges erősáramú/klímatechnikai és rendszergazdai erőforrások meghaladták a gép számítási teljesítményének piaci értékét. Ennek a neve a szelgep.elte.hu, utalva a hűtéstechnikai megoldására. Lásd a bekapcsolásakor készített kis videót: szelgep-poweron.3gp A gép később elkerült a szegedi Informatika Történeti Múzeumba

Az Atlasz

2005-ös pályázattal 2006 decemberben érkezett volna, de papírproblémák (értsd, pénz) miatt egy évet a szállító raktárában hevert. Végül 2007 februárban lett hardveresen összerakva egy 14 node-os IBM blade rendszer, akkor már nem-túl-újnak számító 64 bites kétmagos AMD Opteron processzorokkal. Érkezett hozzá még egy önálló fejgép is, valamint egy FC storage (IBM DS4800). Ez rettenetesen sokáig szolgáltatás nélkül hevert. Az FC storage a caesar alá adta a stabil tárterületet, a 14 node-os cluster felkonfigurálása meghaladta a rendelkezésre álló rendszergazdai erőforrásokat.

2008-ban az IBM blade rendszer atlasz.elte.hu névvel elindult. Ezt az erőforrás 2019 -ben lett leállítva, ez volt a hpc2005 partíció. Ugyanebben az évben indult egy pályázat, aminek részeként 25M Ft (bruttó) szerepelt HPC építésére.

Sokáig tartó előzetes igényfelmérés, pályáztatás és versenyeztetés után 2009 őszén lett kiválasztva a hpc2009 partíciót és a fejgépet adó erőforrás. Ezt a rendszert jelentős késéssel, 2010. április 19-én szállították le. A rendszer 2010. június 21-én indult éles üzemben. A tesztelés, telepítés, konfigurálás 9 hétig tartott. (Maulis Ádám, FCO Nagy János) Ez a rendszer akkor a régi (kicsi és gyors) IBM DS4800 storage rendszerrel ment.

2011.03.03-án beszerelésre került egy lassú, ámde legalább nagy storage rendszer. Ekkor a régi IBM DS4800 rendszer kivezetésre került.

2011.10.10-én a fejgép funkcionalitását kettébontva bekerült a rendszerbe a régi atlasz régi fejgépe management node-nak. Ezáltal a rendelkezésre állás lényegesen megnőtt.

2011 őszén indult egy pályázat, a Biológiai Fizika tanszék kérésére, az általuk megadott igények alapján. E pályázat keretében lett lehetőség a flocking partíció beszerzésére, aminek éles üzembe állítása 2012.03.08-án történt. Ezzel kapcsolódóan nyílt lehetőség a storage szerver lecserélésére.

2012.05.10-én az egyik felhasználónk kérésére egy elavult nagyszámítógépet (SGI ALTIX 350, 16 Itanium processzor, 40GiB memória) beüzemeltünk az atlasz részeként. Ez mintegy 2 évig ment.

2016-08-10-án elromlott az akkor 9 éves management node. Beraktunk egy asztali gépet ideiglenesen. A tárterület inség miatt hozzácsatoltuk a régi, már leállított DS4800 storage egyik diszkpolcát. Nagyjából ez volt a mélypontja az atlasz-üzemnek.

2017.07.31 üzembe állt az új management node. Ez az első, ami direkt erre lett tervezve/konfigurálva/beszerezve. Lényeges teljesítménynövekedést értünk el.

2018.6.13-án megérkezett az st03 storage. Ekkor az st01 és az st02 még valamire jó részeiből újabb st02 készült. Örültünk, hogy idáig nem volt adatvesztés.

2019 -ben kiírásra, beszerzésre, majd 2020.03 -ban szállításra került az atlasz következő hardvere. A beüzemelést fél évvel eltolta a covid19-átállás.

2020.9.30 SEK telephelyen fizikailag beszerelésre került az új hardver. (Győri Endre Attila, Maulis Ádám, Szánthó Lénárd Lajos)

2021.1.22 Innentől a SEK telephely szolgáltat, a régi hardverek leállításra kerültek. A régi hardvereből továbbüzemeltetni tervezzük st03, flocking gépek, management node.

2021.4.16 SEK telephelyen fizikailag beszerelésre került 5 újabb node, valamint a produktív (felhasználói forgalmat bonyolító) switch. Ezek a bővítések még a tavalyi etaphoz tartoztak. Az st03, flocking gépek és a régi management node is most került beszerelésre.

eltehpchistory.txt · Utolsó módosítás: 2021/10/13 16:29 szerkesztette: maulis