Change data capture solutions for apache cassandra.

Schmidt, Felipe Mathias

dc.contributor.advisor	Schaeffer Filho, Alberto Egon	pt_BR
dc.contributor.author	Schmidt, Felipe Mathias	pt_BR
dc.date.accessioned	2014-08-14T02:10:23Z	pt_BR
dc.date.issued	2014	pt_BR
dc.identifier.uri	http://hdl.handle.net/10183/100287	pt_BR
dc.description.abstract	Apache Cassandra is a powerful NoSQL database. Its implementation provides a high performance database, also aiming high scalability. In the same manner, the Hadoop MapReduce framework provides a highly scalable API for parallel and distributed computation. All in a transparent way to the programmer. Change Data Capture (CDC) solutions are capable of speeding up services that track modifications in a source database, passing the changes to a target database. In this context, we discuss in this thesis several techniques for extracting data that has changed in a source database; later on, making the changes available for use at a target database. The techniques use MapReduce to implement their logics and also to interact with the source database Apache Cassandra. The same API stores the results in Hadoop Distributed File System (HDFS). All technologies are for distributed and/or parallel environments, e.g., clusters. The proposed techniques are designed to work in this scenario, with the best possible performance.	en
dc.description.abstract	O Apache Cassandra é um banco de dados NoSQL poderoso. Sua implementação provê um banco de dados de alta performance, visando também alta escalabilidade. Da mesma forma, o framework Hadoop MapReduce fornece uma API altamente escalável para computação paralela e distribuída. Tudo de uma forma transparente para o programador. Soluções de Change Data Capture (CDC) são capazes de acelerar serviços que monitoram modificações em um banco de dados fonte, passando as mudanças para um banco de dados destino. Neste contexto, nesta tese discutimos diferentes técnicas para extrair dados que foram alterados em um banco de dados fonte, posteriormente disponibilizando as mudanças para uso em um banco de dados destino. As técnicas usam MapReduce para implementar suas lógicas e interagir com o banco de dados fonte Apache Cassandra. A mesma API armazena os resultados no Sistema de Arquivos Distribuídos do Hadoop (HDFS). Todas tecnologias são para ambientes distribuídos e/ou paralelos, e.g., clusters. As técnicas propostas são projetadas para atuar neste cenário, com a melhor performance possível.	pt_BR
dc.format.mimetype	application/pdf	pt_BR
dc.language.iso	eng	pt_BR
dc.rights	Open Access	en
dc.subject	Comunicacao : Dados	pt_BR
dc.subject	Change data capture	en
dc.subject	Apache (Programa de computador)	pt_BR
dc.subject	Apache Cassandra	en
dc.subject	Hadoop MapReduce	en
dc.subject	HDFS	en
dc.subject	Big data	en
dc.title	Change data capture solutions for apache cassandra.	pt_BR
dc.title.alternative	Soluções de change data capture para apache Cassandra	pt
dc.type	Trabalho de conclusão de graduação	pt_BR
dc.contributor.advisor-co	Hu, Yong	pt_BR
dc.identifier.nrb	000931701	pt_BR
dc.degree.grantor	Universidade Federal do Rio Grande do Sul	pt_BR
dc.degree.department	Instituto de Informática	pt_BR
dc.degree.local	Porto Alegre, BR-RS	pt_BR
dc.degree.date	2014	pt_BR
dc.degree.graduation	Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado	pt_BR
dc.degree.level	graduação	pt_BR

Nome:: 000931701.pdf
Tamanho:: 817.1Kb
Formato:: PDF
Descrição:: Texto completo (inglês)

Visualizar/abrir

Este item está licenciado na Creative Commons License

Trabalhos de Conclusão de Curso de Graduação (35860)

TCC Ciência da Computação (992)

Mostrar registro simples