in

HBase Training – o que é tudo sobre

 

Sobre o HBase

O HBase é um produto do Apache escrito em Java. Ele é modelado após Big table, que é um produto do Google. É um software livre e um banco de dados distribuído não relacional. Foi desenvolvido como parte do projeto Apache Hadoop. Adoptado pelo Facebook para o seu sistema de mensagens, este produto possui funcionalidades como compressão, operação na memória e aplicação de filtros de bloom por coluna.

O HBase é recomendado quando você deseja acesso em tempo real e aleatório ao seu grande volume de dados. Você pode hospedar tabelas muito grandes com milhões de linhas e colunas que devem ser distribuídas em um cluster de computadores. Não pode substituir bancos de dados SQL tradicionais. O desempenho do HBase está melhorando e equalizando.

Treinamento em HBase

Para aprender o HBase, pode-se aprendê-lo junto com o Apache Hadoop. Você precisaria conhecer a programação da API Java. Um bom conhecimento de programação orientada a objetos e proficiência na linguagem de programação Java seria necessário para trabalhar no HBase.

Noções básicas

Uma introdução ao HBase seria a primeira coisa para começar. Depois disso, você pode passar para a modelagem de esquema. A modelagem de esquema envolve o entendimento de tabelas, famílias de linhas e colunas, escolha de atributos de coluna e localidade e padrões de acesso.

Shell HBase

Depois disso, pode-se continuar a treinar no trabalho com o shell do HBase. O shell é uma interface de linha de comando que pode ser usada para criar e manipular dados. Isso pode ser bom quando você é do tipo que trabalha com comandos em vez de uma interface gráfica com o usuário.

Arquitetura

Seguindo em frente, aprende-se sobre a arquitetura do HBase. O HMaster, RegionServers e Zookeeper são alguns conceitos que você aprenderá. Junto com isso, você também será treinado em tolerância a falhas, armazenamento em cache no HBase e compactações. Embora sejam operações comuns de banco de dados, elas são ensinadas na perspectiva de grande quantidade de dados de maneira distribuída.

APIs JAVA

As APIs Java do HBase estão próximas na lista de módulos. Você pode aprender o MapReduce, um produto do Google a partir do qual o Hadoop evoluiu e outras APIs Java para acessar dados.

Desdobramento, desenvolvimento

Aqui é possível aprender topologia de nó, gerenciamento de zookeeper, controle de versão no HBase, monitoramento e ajuste de instalações do HBase.

Advanced Features

O uso de bloqueio e filtros e recursos avançados da API são abordados. Pode-se também obter uma visão de como se pode acessar os dados de aplicativos não-java.

O treinamento pode ser predominantemente baseado nos papéis a serem desempenhados. Um poderia ser um desenvolvedor do HBase ou um administrador. As habilidades necessárias para gerenciar estas diferem na maneira como são empregadas. Enquanto o administrador cuida dos trabalhos e tarefas gerais, o desenvolvedor se preocupa em fazer a parte individual corretamente.

 

Leave a Reply

Your email address will not be published. Required fields are marked *

R Treinamento Online – Treine para Trabalhar Programaticamente com Estatísticas

Treinamento on-line do Qlikview – Aprendendo a nova plataforma de descoberta de negócios on-line