• Lobo Carneiro

    SGI ICE X
    260 nós de processamento
    6240 cores
    16.6 Tbytes RAM

    Slide 1
  • Fenix

    SUN Blade 6048
    144 nós
    1152 cores
    3.45 TBytes RAM

    Slide 2
  • 1
  • 2
  • 3

Novidades

  • COMUNICADO

    "Comunicado aos Usuários
    Informamos que a indisponibilidade do sistema Lobocarneiro foi ocasionada por uma falha de hardware que afetou diretamente o funcionamento do sistema de arquivos paralelo Lustre.
    Como é de conhecimento geral, o sistema Lobocarneiro foi originalmente fornecido pela Silicon Graphics International (SGI), empresa que encerrou suas atividades no final de 2016. Em decorrência disso, qualquer processo de reposição de componentes de hardware torna-se altamente complexo, especialmente em situações de disaster recovery.
    Destacamos que um equipamento equivalente já foi adquirido para substituição, contudo sua entrega ainda não foi realizada.
    Tão logo haja qualquer atualização relevante, esta será comunicada de forma oficial por meio do portal institucional."

  • Parada programada

    Prezados usuários,
    Informamos que foi identificada uma falha no sistema Lustre. Para realizar o reparo necessário, será preciso que o Lobocarneiro fique temporariamente offline.
    Como se trata de um sistema de grande porte e com alto volume de dados, ainda não é possível estimar com precisão o tempo de inatividade.
    O desligamento está programado para o dia 23, às 18h.
    Lamentamos pelos transtornos causados e agradecemos pela compreensão.

  • Lobocarneiro online

    Prezados usuários,
    O cluster Lobo Carneiro está operacional novamente após sucessivos problemas no fornecimento de energia elétrica pela concessionária. Esses eventos afetaram tanto o sistema de refrigeração quanto o sistema de arquivos Lustre. A equipe técnica aplicou um workaround com o objetivo de reduzir o tempo de indisponibilidade da infraestrutura, infelizmente podem ocorrer instabilidades principalmente no lustre.

    Como é de conhecimento de todos os usuarios a responsabilidade pela realização de backup dos dados é exclusivamente dos usuários, uma vez que não há política de contingência de armazenamento para backup nem procedimentos de recuperação de dados no ambiente Lobo Carneiro.

  • Lobocarneiro fora do ar

    Falha do sistema de refrigeração, tão logo tenhamos posicionamento das equipes tecnicas noticiaremos aqui no portal.

  • Falha no lobocarneiro

    Às 04h00 da manhã, foi registrada uma interrupção no fornecimento de energia elétrica por parte da concessionária Light. Essa indisponibilidade acionou automaticamente o protocolo de proteção térmica do cluster Lobo Carneiro, resultando na queda de todos os nós de processamento.
    Durante o restabelecimento da energia, ocorreu um pico de tensão fora dos parâmetros operacionais, o que ocasionou falhas no sistema de arquivos distribuído Lustre. Diante da impossibilidade de realizar o reparo completo sem comprometer a disponibilidade do ambiente por vários dias, a equipe técnica implementou um procedimento workaround na falha para manter a infraestrutura operacional. Lamentamos os transtornos e o acesso foi normalizado

Monitoramento dos Sistemas

Nome Jobs Uso


Lobo Carneiro
Down


Rodando:
Fila:


0
0

Nossos Parceiros

Client Name
Client Name
Client Name
Client Name
Client Name