Os desenvolvedores do Apache Hadoop liberaram o segundo alfa do Apache Hadoop 2.0, que tem o número de versão 2.0.2. As novidades do framework incluem melhorias significativas na variante de alta disponibilidade do HDFS e uma versão mais estável do YARN, que já foi testado em cluster com 2000 nós. As notas de lançamento detalham todas as mudanças realizadas.
De acordo com os desenvolvedores da Hortonworks, eles estão a caminho de terminar o Hadoop-2.x no início do próximo ano. Os desenvolvedores do Hadoop agora estão trabalhando na última das funcionalidades de trabalho, como HDFS HA, sem a necessidade de armazenamento compartilhado (que já está comitado), disponibilidade do YARN ResourceManager, e melhorias de programação. A implementação do YARN do alfa 2.0.2 já está rodando no Yahoo em clusters de 2.000 e 3.600 nós, mas eles já executam o Hadoop 0.23.4, que é “essencialmente o alfa 2.0.2 sem a alta disponibilidade do HDFS”.
O YARN é uma próxima geração da implementação de MapReduce; ele divide a funcionalidade JobTracker do Hadoop em dois daemons: um como gerenciador global de recursos (RM) e um para agendamento de trabalho por aplicação, o ApplicationMaster (AM). O ResourceManager então gerencia os recursos do cluster enquanto o ApplicationMaster negocia com ele os recursos que ele precisa rodar em sua aplicação.
O Apache Hadoop 2.0.2 alfa está disponível para download a partir de vários mirrors do Apache como um release de desenvolvimento, não sendo apropriado para uso em produção.
Com informações de The H