• Lobo Carneiro

    SGI ICE X
    260 nós de processamento
    6240 cores
    16.6 Tbytes RAM

    Slide 1
  • Fenix

    SUN Blade 6048
    144 nós
    1152 cores
    3.45 TBytes RAM

    Slide 2
  • 1
  • 2
  • 3

Novidades

  • Parada programada

    Prezados usuários,
    Informamos que foi identificada uma falha no sistema Lustre. Para realizar o reparo necessário, será preciso que o Lobocarneiro fique temporariamente offline.
    Como se trata de um sistema de grande porte e com alto volume de dados, ainda não é possível estimar com precisão o tempo de inatividade.
    O desligamento está programado para o dia 23, às 18h.
    Lamentamos pelos transtornos causados e agradecemos pela compreensão.

  • Lobocarneiro online

    Prezados usuários,
    O cluster Lobo Carneiro está operacional novamente após sucessivos problemas no fornecimento de energia elétrica pela concessionária. Esses eventos afetaram tanto o sistema de refrigeração quanto o sistema de arquivos Lustre. A equipe técnica aplicou um workaround com o objetivo de reduzir o tempo de indisponibilidade da infraestrutura, infelizmente podem ocorrer instabilidades principalmente no lustre.

    Como é de conhecimento de todos os usuarios a responsabilidade pela realização de backup dos dados é exclusivamente dos usuários, uma vez que não há política de contingência de armazenamento para backup nem procedimentos de recuperação de dados no ambiente Lobo Carneiro.

  • Lobocarneiro fora do ar

    Falha do sistema de refrigeração, tão logo tenhamos posicionamento das equipes tecnicas noticiaremos aqui no portal.

  • Falha no lobocarneiro

    Às 04h00 da manhã, foi registrada uma interrupção no fornecimento de energia elétrica por parte da concessionária Light. Essa indisponibilidade acionou automaticamente o protocolo de proteção térmica do cluster Lobo Carneiro, resultando na queda de todos os nós de processamento.
    Durante o restabelecimento da energia, ocorreu um pico de tensão fora dos parâmetros operacionais, o que ocasionou falhas no sistema de arquivos distribuído Lustre. Diante da impossibilidade de realizar o reparo completo sem comprometer a disponibilidade do ambiente por vários dias, a equipe técnica implementou um procedimento workaround na falha para manter a infraestrutura operacional. Lamentamos os transtornos e o acesso foi normalizado

  • Lobocarneiro de volta ao ar

    Prezados usuários,
    Informamos que a equipe técnica conseguiu mitigar a falha que estava afetando o sistema Lustre. Nos próximos dias, serão realizadas verificações adicionais e procedimentos de validação para garantir a estabilidade e o desempenho do ambiente.
    Durante esse período, é possível que ocorram breves interrupções ou instabilidades no acesso ao sistema. Contamos com a compreensão e colaboração de todos para que possamos concluir esse processo com o mínimo de impacto.
    Atenciosamente,
    Equipe de Suporte.

Monitoramento dos Sistemas

Nome Jobs Uso


Lobo Carneiro
Down


Rodando:
Fila:


0
0

Nossos Parceiros

Client Name
Client Name
Client Name
Client Name
Client Name