Prvním je úložiště PROJECT, které významně ulehčuje práci výzkumníkům, kteří na ostravských superpočítačích počítají své projekty. Ve druhém případě se jedná o úložiště sdružení CESNET, které patří k těm vůbec největším v České republice.
Datové úložiště PROJECT
Hned pět rozváděčových skříní (tzv. racků) zabírá datové úložiště PROJECT, které je uživatelům superpočítačového centra IT4Innovations plně k dispozici od března 2021. Jak již jeho název napovídá, slouží pro uchování a zálohování dat, která jsou zpracovávána nebo generována na ostravských superpočítačích.
Kromě toho, že úložiště PROJECT staví na nejmodernějších technologiích, konkrétně na řešení Spectrum Scale od společnosti IBM, je také mnohem vstřícnější k uživatelům, kteří na superpočítačích staví své vědecké bádání. Moderní řešení slibuje dostatek kapacity, spolehlivý a rychlý provoz, a navíc funguje jako centrální, tedy na superpočítačích, nezávislý systém.
„To znamená, že po nahrání projektových dat do úložiště k nim mohou uživatelé přistupovat z jakéhokoliv superpočítače, na kterém zrovna své výpočty provádějí. Na rozdíl od předešlé praxe, která předpokládala mít jejich kopie na každém superpočítači, tento systém přináší uživatelům ostravské výpočetní infrastruktury značnou úsporu času,“ uvádí Radovan Pasek, vedoucí provozu a správy HPC v IT4Innovations.
Další výhodou úložiště PROJECT je to, že obslouží nejen specifické datové potřeby stávajících superpočítačů Karolina, Barbora a NVIDIA DGX-2, ale díky své živostnosti, která se pohybuje mezi 8 až 10 lety, nabídne své kapacity i jejich nástupcům. Navíc disponuje dostatečným úložným prostorem pro projekty s dlouhým životním cyklem, obvykle delším než jednoročním, což představuje další z motivů jeho pořízení.
Jedním z nejdůležitějších parametrů úložiště PROJECT je jeho kapacita. Ta činí 15 petabajtů. Jak si toto číslo lépe představit? „Porovnejme si úložiště PROJECT k externímu disku o kapacitě 1TB, který běžný PC uživatel používá pro zálohu svých dat. Pokud by se chtěl tento uživatel vyrovnat našemu velkokapacitnímu úložišti, musel by si takových externích disků nakoupit přesně 15 000 kusů,“ vypočítává Roman Slíva, senior HPC architekt v IT4Innovations.
K dalším parametrům úložiště PROJECT patří:
- Úložiště je tvořeno kombinací rychlejších disků SSD a pomalejších NL-SATA, které jsou společně s dalšími infrastrukturními prvky uspořádány do tří nezávislých bloků s ohledem na vysokou dostupnost a možnost jednoduché replikace dat.
- Celková propustnost systému dosahuje hodnoty 39 GB/s a zvládá až 57 000 I/O operací za sekundu.
- Ačkoliv je kapacita momentálně dostačující, již nyní je jasné, že vzhledem k neustále rostoucímu množství dat, se kterými výzkumné projekty operují, ji bude v budoucnu nutné navýšit. Díky modulárnímu návrhu řešení však bude možné úložiště v případě potřeby dále rozšířit.
Dodavatelem úložiště PROJECT je společnost DATERA, která se specializuje na návrh a implementaci datových úložišť. Nákup byl financován v rámci projektu IT4Innovations národní superpočítačové centrum – Cesta k exascale.
Datové úložiště sdružení CESNET
S kapacitou neuvěřitelných 33,673 petabajtů se jedná o jedno z největších datových úložišť v tuzemsku. Kromě kapacity stojí za zmínku také hmotnost úložiště – 3,3 tuny nebo to, že zabírá celkem 6 racků. Řešení obsahuje 1776 rotačních disků Seagate Exos X18 s kapacitou 18 terabajtů. Pro ukládání dat slouží 74 serverů Lenovo ThinkSystem SR635, dále je k dispozici 12 serverů pro monitoring celého systému.
Za tímto velkoobjemovým datovým úložištěm stojí sdružení CESNET a projekt e-INFRA CZ, jehož součástí je kromě CESNET i IT4Innovations a CERIT-SC. Úložiště bude sloužit vzdělávacím institucím v Česku pro přenos, ukládání, archivaci a zpracování vědeckých dat.
Dodavatelem řešení, které stálo 39,9 milionů korun, je česká společnost M Computers se zkušenostmi s HPC instalacemi. Více informací na webu M Computers.