Análise da diluição de citações entre preprints do medRxiv publicados em periódicos da área da saúde
Visualizar/abrir
Data
2025Orientador
Nível acadêmico
Mestrado
Tipo
Outro título
Relationship between preprints and published articles: a study on the dilution of citations in the area of health
Assunto
Resumo
A diluição de citações é o fenômeno que ocorre quando um preprint continua sendo citado no lugar do artigo correspondente já publicado. Como cada documento recebe um DOI distinto, formam-se dois conjuntos separados de citações: um para o preprint e outro para o artigo. Desse modo, a diluição de citações representa uma questão importante para as revistas que publicam artigos originados de preprints, uma vez que as citações direcionadas aos preprints não são contabilizadas em favor delas. Consequ ...
A diluição de citações é o fenômeno que ocorre quando um preprint continua sendo citado no lugar do artigo correspondente já publicado. Como cada documento recebe um DOI distinto, formam-se dois conjuntos separados de citações: um para o preprint e outro para o artigo. Desse modo, a diluição de citações representa uma questão importante para as revistas que publicam artigos originados de preprints, uma vez que as citações direcionadas aos preprints não são contabilizadas em favor delas. Consequentemente, isso representa um potencial perda de citações, o que pode impactar métricas importantes das revistas. Diante disso, este estudo teve como objetivo geral analisar o fenômeno da diluição de citações em artigos da área da saúde originados de preprints disponibilizados no medRxiv entre 2019 e 2021. Os objetivos específicos incluíram quantificar e classificar citações a preprints, analisar as citações diluídas considerando o intervalo de publicação, investigar a duração da diluição e avaliar seu impacto potencial nas revistas, por meio do Aumento Potencial de Citações (APCit) – taxa que estima, em porcentagem, o aumento potencial no número de citações que um artigo ou revista poderia ter alcançado caso não houvesse a diluição. Quanto à metodologia, adotou-se uma abordagem quantitativa, de caráter descritivo-exploratório. Os dados foram coletados das plataformas medRxiv, OpenAlex e Crossref, por meio de suas respectivas interfaces de programação de aplicações (APIs). Nos resultados, identificou-se 18.596 pares de preprints e artigos publicados em 3.200 revistas. 5.064 preprints não receberam nenhuma citação. Dos 13.532 preprints que foram citados, 9.412 receberam uma ou mais citações após a publicação do artigo correspondente. Foram contabilizadas 58.737 citações diluídas, distribuídas entre os 9.412 preprints, uma média de 6,24 por preprint. A análise temporal revelou que a maioria das citações diluídas (70%) ocorreu nos primeiros 12 meses após a publicação do artigo correspondente. No entanto, identificou-se casos de preprints citados até 51 meses após a publicação do artigo. A duração média da diluição foi de 8,29 meses. O impacto da publicação do artigo sobre as citações direcionadas ao preprint foi significativo: observou-se uma redução média de 43% nas citações a preprints após a publicação dos artigos correspondentes. Em relação ao impacto sobre as revistas, a análise indicou que metade delas teria acréscimo de até 10% nas citações recebidas pelos artigos originados de preprints. Considerando o volume de citações de todos os artigos publicados pelas revistas, 98% apresentariam um aumento potencial de até 4,9%. Verificou-se também que revistas com menor índice h sofreram um impacto proporcionalmente maior da diluição. Por fim, as citações duplicadas – casos em que preprint e artigo foram citados no mesmo trabalho – ocorreram em 1.076 pares (5,79% do corpus), totalizando 1.899 citações. Conclui-se que as revistas que publicam artigos originados de preprints podem ter parte de suas citações diluídas em favor dos preprints. Algumas medidas sugeridas para mitigar a diluição de citações incluem: orientar autores a atualizar referências; garantir a vinculação adequada entre preprint e artigo; registrar metadados completos na Crossref; evitar a citação de preprints, e, quando indispensável, realizá-la apenas como comunicação pessoal. ...
Abstract
Citation dilution is the phenomenon that occurs when a preprint continues to be cited instead of the corresponding article that has already been published. As each document receives a distinct DOI, two separate sets of citations are formed: one for the preprint and another for the article. Thus, citation dilution is an important issue for journals that publish articles originating from preprints, since citations directed to preprints are not counted in their favour. Consequently, this represent ...
Citation dilution is the phenomenon that occurs when a preprint continues to be cited instead of the corresponding article that has already been published. As each document receives a distinct DOI, two separate sets of citations are formed: one for the preprint and another for the article. Thus, citation dilution is an important issue for journals that publish articles originating from preprints, since citations directed to preprints are not counted in their favour. Consequently, this represents a potential loss of citations, which can impact important journal metrics. Given this, the overall objective of this study was to analyse the phenomenon of citation dilution in health articles originating from preprints made available on medRxiv between 2019 and 2021. Specific objectives included quantifying and classifying citations to preprints, analysing diluted citations considering the publication interval, investigate the duration of dilution, and assess its potential impact on journals through the Potential Citation Increase (PCI) – a rate that estimates, as a percentage, the theoretical potential increase in the number of citations that an article or journal could have achieved if there had been no dilution. Regarding the methodology, a quantitative, descriptive-exploratory approach was adopted. Data were collected from the medRxiv, OpenAlex, and Crossref platforms through their respective application programming interfaces (APIs). The results identified 18,596 pairs of preprints and articles published in 3,200 journals. 5,064 preprints received no citations. Of the 13,532 preprints that were cited, 9,412 received one or more citations after the publication of the corresponding article. A total of 58,737 diluted citations were counted, distributed among the 9,412 preprints, an average of 6.24 per preprint. Temporal analysis revealed that most diluted citations (70%) occurred in the first 12 months after the publication of the corresponding article. A total of 58,737 diluted citations were counted, distributed among the 9,412 preprints, an average of 6.24 per preprint. Temporal analysis revealed that most diluted citations (70%) occurred in the first 12 months after the publication of the corresponding article. However, cases of preprints cited up to 51 months after the publication of the article were identified. The average duration of dilution was 8.29 months. The impact of article publication on citations directed to the preprint was significant: an average reduction of 43% in citations to preprints was observed after article publication. Regarding the impact on journals, the analysis indicated that half of them would have an increase of up to 10% in total citations to articles originating from preprints. Considering the volume of citations of all articles published by the journals, 98% would show a potential increase of up to 4.9%. It was also found that journals with a lower h-index suffered a proportionally greater impact from dilution. Finally, duplicate citations – cases in which the preprint and article were cited in the same work – occurred in 1,076 pairs (5.79% of the corpus), totalling 1,899 citations. It is concluded that journals that publish articles originating from preprints may have part of the citations to articles diluted in favour of preprints. Some suggested measures to mitigate citation dilution include: instructing authors to update references; ensuring proper linking between preprints and articles; registering complete metadata in Crossref; avoiding citing preprints, and, when indispensable, doing so only as personal communication. ...
Instituição
Universidade Federal do Rio Grande do Sul. Faculdade de Biblioteconomia e Comunicação. Programa de Pós-Graduação em Ciência da Informação.
Coleções
-
Ciências Sociais Aplicadas (6511)
Este item está licenciado na Creative Commons License


