Linkagem de Dados Utilizando os Programas Link King e SAS® 9.2
Visualizar/abrir
Data
2010Autor
Orientador
Nível acadêmico
Graduação
Resumo
Em muitas investigações, principalmente na área da saúde, é necessário reunir informações sobre indivíduos armazenadas em bases de bancos diferentes, muitas vezes registradas por instituições diferentes. Um aspecto peculiar é que a chave de identificação dos registros nos arquivos de dados, quando existe, não permite fazer uma correspondência entre eles. Para superar estas dificuldades foram desenvolvidas técnicas especiais de relacionamento de registros utilizando campos como nome do indivíduo ...
Em muitas investigações, principalmente na área da saúde, é necessário reunir informações sobre indivíduos armazenadas em bases de bancos diferentes, muitas vezes registradas por instituições diferentes. Um aspecto peculiar é que a chave de identificação dos registros nos arquivos de dados, quando existe, não permite fazer uma correspondência entre eles. Para superar estas dificuldades foram desenvolvidas técnicas especiais de relacionamento de registros utilizando campos como nome do indivíduo, nome da mãe, data de nascimento, endereço, etc., para identificar os pares correspondentes. Este método é usualmente chamado de linkagem de registros, podendo utilizar algoritmos determinísticos ou probabilísticos. O objetivo deste trabalho é apresentar os conceitos fundamentais e aplicação da linkagem de registros. Rotinas computacionais em linguagem SAS® foram desenvolvidas para a padronização dos campos e criação de um banco final, usado nas análises. A linkagem foi realizada utilizando o programa Link King. Dois conjuntos de dados hipotéticos foram usados para ilustrar passo a passo os procedimentos de padronização e linkagem. De um total de 4995 registros em cada banco de dados, foram criados corretamente 4746 (95%) pares. ...
Abstract
In many investigations, especially in health, it is necessary to join individual’s information stored in different databases, often recorded by distinct institutions. A peculiar aspect is that the key to identifying the records in the data files, if any, do not allow a match between them. To overcome these difficulties some special techniques have been developed to identify the corresponding pairs using fields such as individual's name, mother's name, birth date or address. This method is usual ...
In many investigations, especially in health, it is necessary to join individual’s information stored in different databases, often recorded by distinct institutions. A peculiar aspect is that the key to identifying the records in the data files, if any, do not allow a match between them. To overcome these difficulties some special techniques have been developed to identify the corresponding pairs using fields such as individual's name, mother's name, birth date or address. This method is usually called record linkage and may use deterministic or probabilistic algorithms. The aim of this work is to present the fundamental concepts of record linkage and of its application. SAS® routines were developed to standardize the fields and also to create the final database used in the analysis. The record linkage was performed using the program Link King. Two hypothetical datasets were used to illustrate step by step procedures of standardization and linkage. From a total of 4995 records in each database, 4746 (95%) of the pairs were correctly created. The main objective of this work is to present the concepts and application of record linkage method. This method can be deterministic or probabilistic, once in the first there is a univocal identifier field which is inexistent on the second. It has been developed computational routines in SAS® language for the fields’ standardization and creation of a final database that can be adapted to any other database. In the application phase, the software used was the Link King together with the developed routines. From a total of 4995 records in each database used in the linkage 4746 (95%) pairs were created correctly. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Matemática. Departamento de Estatística. Curso de Estatística: Bacharelado.
Coleções
-
TCC Estatística (295)
Este item está licenciado na Creative Commons License