Cluster Apuana
O Cluster Apuana é uma infraestrutura de processamento com alto desempenho baseado em GPU (Graphics Processing Unit) que o CIn-UFPE desenvolveu para execução de pesquisas voltadas para a área de Inteligência Artificial (Deep Learning). O nome “Apuana” é de origem indígena, que significa ligeiro, rápido e veloz.
Atualmente o cluster conta com 10 nodes de processamento, integrando um total de 11 GPUs RTX3090 e 5 GPUs A100, contando ainda com 5TB de memória RAM, 464 núcleos e 928 threads de processamento.
O acesso ao cluster Apuana é solicitado via preenchimento do formulário (https://forms.gle/rU2te4TfvnjAdiqS8).
Para mais informações acesse a página https://apuana.cin.ufpe.br ou envie um e-mail para cluster.apuana-l@cin.ufpe.br para esclarecer dúvidas e reportar problemas.
slurm-client[1-2]
Clientes acessam para executar os jobsslurm-manager
Gerenciador do Slurm para alocar os jobs a serem executados nos nodescluster-node[1-10]
Nodes que executam os jobsStorage (/home)
Armazenamento do /home compartilhado, garantindo que os arquivos dos clientes esteja disponível em todas as máquinas do cluster
Especificação dos nodes
cluster-node[1-5]
Fabricante: Asus
Modelo: Pro WS WRX80E-SAGE SE WIFI
SO: Ubuntu Server 22.04 LTS
Disco: 1 x 1TB NVMe
Memória RAM: 4 X 32GB DDR4 3200 MT/s Kingston (4/8 slots utilizados)
CPU: 1 x AMD Ryzen Threadripper PRO 3975WX 3.5GHz 32-Cores 64-Threads
GPU: 2 x GeForce RTX 3090 24GB GDDR6X 1.40GHz - 1.70GHz (2/4 slots utilizados)
* cluster-node2: 3 x GeForce RTX 3090 24GB GDDR6X 1.40GHz - 1.70GHz (3/4 slots utilizados)
cluster-node[6-10]
Fabricante: Asus
Modelo: ESC4000-E10
SO: Ubuntu Server 22.04 LTS
Disco:
1 x 1TB NVMe
1 x 256GB SSD
Memória RAM: 16 X 32GB DDR4 3200 MT/s (16/16 slots utilizados)
CPU: 2 x Intel Xeon Gold 5318Y 2.10GHz 24-Cores 48-Threads (Socket FCLGA4189)
GPU: 1 x NVIDIA A100 80GB HBM2e 1.06 GHz - 1.41GHz
* 7 instâncias MIG (GPU Multi-Instância pode particionar a GPU em até sete instâncias, cada uma totalmente isolada com sua própria memória de alta largura de banda, cache e núcleos de computação)
Especificação dos gerenciadores
slurm-client[1-2]
Fabricante: Dell
Modelo: PowerEdge R710
SO: Ubuntu Server 22.04 LTS
Disco: 1 x 160GB
Memória RAM: 4 X 2GB DDR3 1333 MHz (4/18 slots utilizados)
CPU: 1 x Intel Xeon X5667 3.07GHz
slurm-manager1
Fabricante: Itautec
Modelo: MX221
SO: Ubuntu Server 22.04 LTS
Disco: 1 x 1TB
Memória RAM: 4 X 4GB DDR2 667 MHz (4/16 slots utilizados)
CPU: 2 x Intel Xeon E5310 1.60GHz
Storage (/home)
Servidor de armazenamento Truenas que compartilha o /home dos usuários em todas as máquinas do cluster usando NFS.