Mostrar registro simples

dc.contributor.advisorVanz, Samile Andrea de Souzapt_BR
dc.contributor.authorFerreira, Manuela Klanoviczpt_BR
dc.date.accessioned2024-06-18T06:50:49Zpt_BR
dc.date.issued2024pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/275864pt_BR
dc.description.abstractEste trabalho analisa a contribuição das ferramentas que compõem a infraestrutura de suporte à pesquisa, particularmente as fornecidas pelo Laboratório Insterinstitucional de e-Astronomia (LIneA), para a reprodutibilidade das pesquisas o reúso dos dados ao longo do tempo. O LIneA foi escolhido por se tratar de uma instituição brasileira que oferece aos seus pesquisadores uma infraestrutura computacional com ferramentas necessárias para a manipulação da grande quantidade de dados em Astronomia, característica comum à e-Science. Este estudo adotou como procedimentos metodológicos a revisão bibliográfica para identificação das ferramentas de suporte à pesquisa que promovem a reprodutibilidade e reúso dos dados na ciência em geral; a pesquisa documental para identificar o funcionamento destas ferramentas; entrevistas semiestruturadas com membros do LIneA e de suas colaborações que desempenham diferentes papéis a fim de identificar como as pesquisas aproveitam a infraestrutura oferecida pelo LIneA e qual a contribuição desta para a reprodutibilidade das pesquisa e o reúso dos dados; além do experimento de reprodução de pesquisas descritas em três artigos publicados por pesquisadores membros das colaborações apoiadas pelo LIneA. Durante este processo, foi identificada a utilização, no LIneA, de ferramentas dentre as quais destaca-se o versionamento de códigofonte de programas de análises através do Git Hub, a descrição interativa de fluxos de análises de dados utilizando Jupyter Hub e o encapsulamento do ambiente computacional por meio de containers Docker. Nas entrevistas, observou-se que os pesquisadores do LIneA utilizam a infraestrutura oferecida, por vezes solicitando auxílio de membros da equipe de TI, seja no uso do Git Hub ou Docker, para a disponibilização de artefatos de pesquisa ou na transformação de dados de terceiros para o reúso do pesquisador. Entretanto os pesquisadores relataram não ter conhecimento da reutilização dos artefatos produzidos por suas pesquisas, apesar de eles mesmo reusarem artefatos de terceiros. O experimento de avaliação de reprodutibilidade partiu da leitura dos três artigos selecionados e posterior coleta dos artefatos de pesquisa neles descritos. Os respectivos artefatos foram parcialmente recuperados, devido à falta de referência para o recorte dos dados de entrada utilizados nos artigos, ou de referência para a correta versão do código-fonte dos experimentos ou, também, pela falta de disponibilidade das dependências de software necessários para o ambiente computacional. Considera-se que o LIneA vem adotando sistematicamente práticas e ferramentas de suporte ao desenvolvimento e à documentação das pesquisas, as quais precisam alcançar um uso padronizado e combinado para atingir a reprodutilidade das pesquisas. Para este fim, com base nos trabalhos relacionados, sugere-se a criação de uma política de curadoria de dados, com o estabelecimento de um padrão de compartilhamento de artefatos para as pesquisas desenvolvidas pelos membros do LIneA, assim como a contratação de equipe responsável pela gestão dos dados de pesquisa para auxiliar tanto na elaboração desta política como na sua adoção pelos pesquisadores e membros do LIneA. Esta pesquisa evidencia a importância da curadoria digital se estender para além dos dados, abrangendo os programas e ambiente computacional utilizados, além de enumerar diversar ferramentas que podem ser empregadas com este propósito e investigar o seu uso pelo LineA.pt_BR
dc.description.abstractThis work analyzes the contribution of the tools that constitute the research support infrastructure, particularly those provided by the Interinstitutional Laboratory of e-Astronomy (LIneA), to the reproducibility of research and the reuse of data over time.. LIneA was chosen because it is a Brazilian institution that offers its researchers the necessary computational infrastructure with tools to handle the large amount of data in Astronomy, a common characteristic of e-Science. This study adopted methodological procedures including a literature review to identify research support tools that promote reproducibility and data reuse in science in general; documentary research to identify the functioning of these tools; semi-structured interviews with LIneA members and their collaborators who play different roles to identify how research benefits from the infrastructure offered by LIneA and how it contributes to the reproducibility of research and data reuse; as well as the experiment of reproducing research described in three articles published by researchers from collaborations supported by LIneA. During this process, the use of tools at LIneA was identified, with particular emphasis on versioning analysis program source code via GitHub, interactively describing data analysis workflows using JupyterHub, and encapsulating the computational environment with Docker containers. In the interviews, it was observed that LIneA researchers use the offered infrastructure, sometimes requesting assistance from IT team members, either in the use of GitHub or Docker for making research artifacts available or transforming third-party data for researcher’s reuse. However, researchers reported not being aware of the reuse of artifacts produced by their research, despite themselves reusing third-party artifacts. The reproducibility evaluation experiment started with reading the three selected articles and subsequently collecting the research artifacts described in them. The respective artifacts were partially recovered due to a lack of reference for the entry data used in the articles, or reference for the correct version of the experiment source code, or also due to the unavailability of the necessary software dependencies for the computational environment. It is considered that LIneA has been systematically adopting practices and tools to support the development and documentation of research, which need to achieve standardized and combined use to attain research reproducibility. To this end, based on related works, it is suggested to create a data curation policy, establishing a standard for sharing artifacts for research developed by LIneA members, as well as hiring a team responsible for research data management to assist both in the creation of this policy and in its adoption by researchers and LIneA members.This research highlights the importance of digital curation extending beyond data to include the programs and computational environment used. It also lists various tools that can be employed for this purpose and investigates their use by LIneA.en
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectReprodutibilidade de pesquisaspt_BR
dc.subjectResearch reproducibilityen
dc.subjectCiência abertapt_BR
dc.subjectOpen research dataen
dc.subjectGestão de dados de pesquisapt_BR
dc.subjectResearch data managementen
dc.subjectData reuseen
dc.titleDados de pesquisa contribuição da infraestrutura para a promoção da reprodutibilidade e do reúsopt_BR
dc.typeTesept_BR
dc.identifier.nrb001205628pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentFaculdade de Biblioteconomia e Comunicaçãopt_BR
dc.degree.programPrograma de Pós-Graduação em Comunicaçãopt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2024pt_BR
dc.degree.leveldoutoradopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples