Categoria: Big Data

Direito aos Dados …

Com todas as evoluções tecnológicas, o processamento de dados potenciou novos negócios e mercados, no entanto também vieram alguns problemas. Principalmente relacionados a privacidade e propriedade dos dados. As empresas possuem um manancial de dados, e nós somos os principais produtores, como um estudo anual da DOMO demonstra o crescimento da volumetria nas diversas fontes de

Continue lendo

Replicação para Apache Kafka via OGG

Apache Kafka é um serviço de mensagens de grande throughput e baixa latência para publicar mensagens em tempo real. Softwares que foram utilizados: Oracle Database 12c Oracle Goldengate 12c para Base de Dados Oracle Oracle Goldengate 12c para Big Data (Big Data Adapters) Apache Kafka 2.11 Configurações do processo de replicação: 1) Processo de extração (extract): Configuração

Continue lendo

Oracle to Hive – Part II

Para replicar (CDC) dados para o Hive via Goldengate, neste exemplo irei utilizar os processos de extract e pump. Como exemplo vou replicar (CDC) de uma tabela XPTO. Estou a mencionar o CDC (Change Data Capture), pois para o carregamento inicial, irei exemplificar com outra ferramenta que é o Sqoop. Para a configuração do pump, será necessário

Continue lendo

Oracle to Hive – Part I

Com a crescente realidade das tecnologias escaláveis de baixo custo e grande desempenho, o Big Data vem se afirmando cada dia mais como um conceito indispensável para as empresas, que precisam melhorar e acelerar as capacidades de decisão e com uma excelente adequação a realidade de crise financeira em escala mundial. O mergulho neste oceano

Continue lendo

“DBLink” de Greenplum para Oracle

No post anterior, temos uma configuração de um Database Link onde a partir de uma BD Oracle consultamos dados em Greenplum, e ao contrário, há solução? Sim, pelo menos já conheço duas. A primeira é através de um driver JDBC. Para esta utilização serão utilizados os seguintes recursos: 1) Drive JDBC: O drive JDBC deve

Continue lendo
um comentário

DBLink do Oracle para o Greenplum – Heterogeneous Service

A configuração de uma ligação via Database Link de Oracle para Greenplum é feita atráves do Heterogeneous Service (HS). Partindo do principio que temos uma BD de Greenplum e outra de Oracle, a configuração é feita através de um driver ODBC, portanto antes de configurar o HS temos que preparar o ambiente: 1) Instalação do

Continue lendo

2013 chegou!

Bem, Passado as festas, agora temos um novo ano de desafios e de evolução. E por falar em evolução, com a afirmação das tecnologias Big Data, do surgimento de novos conceitos como Database Virtualization e com a própria evolução das Bases de Dados, acredito que teremos um ano cheio de novidades na consolidação de tecnologias

Continue lendo