Postado por Alex Ferreira | 9 - março - 2009 | 13 Comentários

Certamente você já ouviu o ditado “Duas cabeças pensam melhor do que uma”, certo?

Na informática não é diferente.Agora imagine 1 milhão e 600 mil cabeças pensando ao mesmo tempo. O IBM Sequoia
possui 1 milhão e 600 mil núcleos funcionando como 1 só.

Ele possui uma placa mãe que cabe tudo isso? Não. Ele usa o recurso de clusterização. Quer saber o que é isso? Continue lendo.

Para construir um supercomputador que possui milhares de pentes de memória, milhares de HDs e milhares de processadores, os profissionais usam a clusterização que consiste em “fundir” todo esse hardware para que ele trabalhe em conjunto.

Não seria ótimo se comprássemos dois computadores cada um com um HD 1TB, Intel Core i7, 8 GB de memória e 2 placas de vídeo em CrossFire e colocássemos eles para trabalharem clusterizados? Suas conversões de vídeo, suas partidas de Crysis em HighDefinition…

É amigo… alegria de pobre dura pouco. A montagem e configuração de um sistema clusterizado não é tão simples assim.

Os custos pra se fazer um cluster (não confundir com conjunto de setores em um HD), mesmo que doméstico, é muito alto. Para se ter uma idéia, somente a licença do Windows HPC Server 2008 (que suporta clusters) custa $475 dólares por processador. No IBM Sequóia temos em cada processador 4 núcleos, dividindo o número de núcleos por 4, teremos o total de processadores que são 400.000. Multiplicando o número de processadores por $475, teremos um total, só com a licença, 100 milhões e 900 mil dólares ou 400 milhões e 370 mil reais em licenças .
Além do $$, é necessário conhecimento técnico bastante avançado pra se montar um sistema do tipo. O que não é qualquer um que sabe fazer.

Falando em sistemas… Pra fazer com que seja possível tal coisa, é necessário um sistema operacional que o suporte. Por exemplo, temos o Windows HPC Server 2008 da Microsoft e o Grid Engine da Sun Microsystems. Empresas que usam essa prática (Yahoo!, Google, Microsoft, NASA…) geralmente usam uma distribuição específica baseada no Linux.

Mas afinal, pra que tanto poder de processamento? Já pensou em prever o clima no seu Sempron? Tanto poder é utilizado para pesquisas cientificas (genética, dinâmica de fluidos, astrofísica, etc.) e militares (simulação de armas nucleares, etc.). Um dos dois maiores supercomputadores do mundo pertence ao governo americano destinado a testes de armamento nuclear.

Cada nó (cada computador) que faz parte do supercomputador, é montado em um blade (um fino computador), que por sua vez é colocado em um rack, como você pode ver ao lado. Cada pequena luz dessa é um computador e o lugar onde elas estão, do tamanho de uma geladeira, é o rack.

Aqui no Brasil temos um supercomputador na Petrobras que calcula possíveis terrenos onde é provável ter petróleo, ele possui 1024 núcleos rodando sobre uma distribuição Linux. Na foto ao lado podemos ver o Columbia, supercomputador da NASA, que usa Linux e tem apenas 10.240 processadores Intel Itanium 2 com 28.672GB de memória RAM. Universidades (inclusive USP e UFRJ) que possuem supercomputadores desse porte geralmente disponibilizam aos pesquisadores para fazer cálculos super precisos que seriam bastante demorados em uma máquina convencional.

Um cluster também não serve apenas pra melhorar o desempenho. Imagine que no nosso cluster de duas máquinas, uma das máquinas em uso deixasse de funcionar! Dependendo do modo que o sistema foi configurado eu posso fazer com que a outra assuma as operações da máquina defeituosa no momento da interrupção. Essa pratica, denominada de High Availability, é muito usada por servidores de alta disponibilidade (como os que são responsável pelos banco de dados dos aeroportos) onde é necessário operar sem interrupção.

Pena que não há uma aplicação caseira pra esse tipo de tecnologia… Não é a toa que não vemos um cluster em cada esquina!

Esperamos que tenha ficado claro o modo como essas grandes e potentes máquinas funcionam. E você, ficou com alguma dúvida ou tem algo a acrescentar ? Comente ;)

Quer ficar por dentro o que fazem os 4 maiores supercomputadores brasileiros ?
Fontes:
NASA, Wikipédia, Tek, O Globo, InfoWester

No related posts.

Related posts brought to you by Yet Another Related Posts Plugin.

13 comentários até agora...

  1. FranChico - Hora de Relaxar disse:

    Esse roda Crisis!

  2. Danilo Augusto disse:

    Hehehehehe… Se não rodasse né – Paciênca :P

    Vou comprar um desses pra colocar aqui em casa.

  3. Anonymous disse:

    Belo artigo!

    Só consertando: “um fino computador” é uma gaveta, ou, se traduzirmos ao pé da letra, uma lâmina (do inglês “blade”). Também chamamos de módulo.

    Vários módulos são montados em um rack, e não “hack”, como vc escreveu. Racks são “gabinetes ou armários de metal, geralmente de tamanho padronizado, utilizados pelos data centers para acomodar servidores e outros equipamentos” (fonte: http://www.microbyte.com.br/Default.aspx).

    O brasileiro Marcos Pitanga escreveu o livro “Construindo Supercomputadores com Linux”, muito bom.

    E os clusters não trazem melhorias a games como Crysis, já esse game (e, que eu saiba, todos os outros…) não tem instruções para processamento em cluster.

  4. Anonymous disse:

    Pequena correção:
    Os gabinetes ou armários onde se coloca o hardware (cpu´s) se chamam Rack e não Hack.

  5. Danilo Augusto disse:

    Valeu mesmo pelas correções, vou ajeitar aqui no artigo.

    Apenas um objeção, quando nós dissessemos que seria ótimo para jogar Crysis, estávamos bricando. Porque não é qualquer computador que roda Crysis em high quality, então será que um desses rodaria ?

    Foi mais ou menos isso que a gente tentou brincar e não puxar pro lado técnico.

    Mas de qualquer maneira, obrigado pelo puxão de orelha.

    Ah ! Vou consertar o “hack” também :D

  6. Anonymous disse:

    Se não tiver placa de video,não roda não!!ahsusahuashsuahusahu
    Só uma coisa,clusterização funciona mais ou menos como um SLI?Ou o aumento de desempenho é de 100% a cada computador adicionado?

  7. Magrão disse:

    Quanto voçê levou pra dizer”querida e amada Microsoft?”
    RARARARÁ

  8. Marcos disse:

    A microsoft tem que ser querida mesmo, só isso justifica pagar por algo que é gratuito e ainda por cima melhor NO linux.

  9. [...] de computador corporativo (para fins de pesquisa) com um excepcional poder de processamento é o IBM Sequoia, que conta com nada menos de 400 mil processadores e 1,6 PB de memória RAM.Apesar de existirem [...]

  10. eni343 disse:

    Nao é só pagando essas licenças absurdas que podemos montar um cluster, existem softwares que ajudam a efetivar seus processadores em clustering sem engordar o Bill

  11. [...] vai ficar a um passo de se tornar uma “dor de cabeça” para a IBM e as outras concorrentes no mundo dos supercomputadores, devido à vasta tradição que eles têm com as aplicações que agora serão aliados aos [...]