Apache NiFi

O Apache NiFi é um projeto de software da Apache Software Foundation, que permite a automação do fluxo de dados entre sistemas. Pode ser comparado como uma mistura do Oracle  Goldengate e ODI, ambas ferramentas da Oracle. O projeto é escrito usando programação baseada em fluxo e fornece uma interface de usuário baseada na web... Continue lendo →

MariaDB e RAMFS

  O ramfs, permite criar uma estrutura de filesystem em memória, e como óbvio, é uma estrutura volátil, portanto, todo cuidado é pouco para não se perder os dados. Mas para alguns caso é interessante para acelerar o processamento. Para "migrar" os dados do MariaDB para uma ramfs, é necessário seguir os seguintes passos: 1) Criar... Continue lendo →

Systemtap

O systemtap é uma ferramenta útil, que permite extrair métricas e informação de performance do Linux. A vantagem, é que permite "programar" o que queremos extrair e correlacionar. Para funcionar, é preciso obter o Systemtap, a partir de: https://sourceware.org/systemtap/ftp/releases/ Antes de compilar e instalar o Systemtap, é preciso garantir que o kernel-devel, elfutils-devel e elfutils-libelf estejam instalados... Continue lendo →

Replicação para Apache Kafka via OGG

Apache Kafka é um serviço de mensagens de grande throughput e baixa latência para publicar mensagens em tempo real. Softwares que foram utilizados: Oracle Database 12c Oracle Goldengate 12c para Base de Dados Oracle Oracle Goldengate 12c para Big Data (Big Data Adapters) Apache Kafka 2.11 Configurações do processo de replicação: 1) Processo de extração (extract): Configuração... Continue lendo →

Oracle to Hive – Part II

Para replicar (CDC) dados para o Hive via Goldengate, neste exemplo irei utilizar os processos de extract e pump. Como exemplo vou replicar (CDC) de uma tabela XPTO. Estou a mencionar o CDC (Change Data Capture), pois para o carregamento inicial, irei exemplificar com outra ferramenta que é o Sqoop. Para a configuração do pump, será necessário... Continue lendo →

Oracle to Hive – Part I

Com a crescente realidade das tecnologias escaláveis de baixo custo e grande desempenho, o Big Data vem se afirmando cada dia mais como um conceito indispensável para as empresas, que precisam melhorar e acelerar as capacidades de decisão e com uma excelente adequação a realidade de crise financeira em escala mundial. O mergulho neste oceano... Continue lendo →

MariaDB: Replicação Master-Slave

  Em tempos, fiz um post sobre o Galera cluster, que é um mecanismo mais sofisticado e que se tem apostado mais. No entanto uma simples replicação de dados entre um MASTER e SLAVE pede uma configuração simples. Este SLAVE pode servir ter um servidor dedicado para leitura e queries de suporte a decisão, retirando... Continue lendo →

Old School: Block Editor (BBED) – Parte 1

O Block Editor, é um utilitário utilizado pelo Suporte Oracle para Troubleshooting e que também permite escrever nos blocos de dados. É uma ferramenta interessante para se estudar a estrutura interna dos blocos e o funcionamento da armazenagem. Atenção: Este utiliário permite escrever nos blocos, muita atenção, pois pode corromper os dados de uma BD,... Continue lendo →

Site no WordPress.com.

Acima ↑