Mostrar registro simples

dc.contributor.advisorRecamonde-Mendoza, Marianapt_BR
dc.contributor.authorDambros, Henrique Vargaspt_BR
dc.date.accessioned2020-08-14T03:40:20Zpt_BR
dc.date.issued2019pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/212889pt_BR
dc.description.abstractOs microRNAs (miRNAs) são uma classe de RNAs não codificantes, de aproximadamente 22 nucleotídeos, que atuam como silenciadores pós-transcricionais da expressão gênica, inibindo a tradução ou degradando RNA mensageiros (mRNA) alvos. Encontrar pares de miRNAs e mRNAs alvos funcionais é um problema complexo, pois a quantidade de combinações possíveis está na casa dos milhões de pares, dado o elevado número de miRNAs e mRNAs em um organismo, tornando-se inviável avaliar experimentalmente todos os pares existentes. Abordagens utilizando aprendizado de máquina, principalmente no escopo de aprendizado supervisionado, têm sido utilizadas com relativo sucesso na busca por pares de miRNA-mRNA alvo mais prováveis de apresentarem uma interação funcional, possibilitando filtrar os pares a serem testados experimentalmente e auxiliando a descoberta de novos alvos funcionais de miRNAs. No entanto, características dos dados inerentes ao problema, como o grande número de exemplos positivos em contraste aos exemplos negativos, e o amplo volume de interações com fracas evidências experimentais (i.e., com baixa confiança), apresentam desafios ao treinamento de modelos de classificação. A proposta deste trabalho é testar o desempenho de algoritmos de PU Learning utilizando pares de miRNA-mRNA com fraca evidência experimental como dados não-rotulados, e de classificação a partir de uma única classe (OCC), especificamente da classe positiva, para o problema de predição de alvos de miRNAs, comparando os resultados com algoritmos supervisionados comumente adotados na literatura relacionada. Os resultados dos experimentos realizados com os dados do Tarbase demonstram que para o dataset criado (incluindo nossa definição de dados não-rotulados) e as features utilizadas, não há nenhum ganho significativo no desempenho de classificação em se usar métodos de PU Learning em relação aos algoritmos supervisionados. No entanto, se não houver dados negativos disponíveis, PU Learning se mostra uma opção vantajosa visto que os métodos OCC são muito inferiores em relação aos demais para o problema abordado. Não é possível concluir que os métodos de PU Learning não possam ter desempenho melhor que os algoritmos supervisionados na predição de alvos de miRNAs. Diferentes escolhas quanto às features, ao conjunto de dados não-rotulados, ou até mesmo do dataset utilizado para treinamento dos modelos, podem gerar melhores resultados para estes métodos.pt_BR
dc.description.abstractMicrosRNAs (miRNAs) are a family of non-coding RNAs of approximately 22 nucleotides that act as post-transcriptional silencers of gene expression by inhibiting translation or degrading target messenger RNA (mRNA). Finding functional miRNA and target mRNAs pairs is a complex problem, as the number of possible combinations is in the millions of pairs given the high number of miRNAs and mRNAs in an organism, making it impossible to experimentally evaluate all existing pairs. Approaches using machine learning, especially within the scope of supervised learning, have been used with relative success in finding target miRNA-mRNA pairs most likely to have functional interaction, enabling filtering of pairs to be tested experimentally and aiding the discovery of new functional miRNA targets. However, characteristics of the data inherent to the problem, such as the large number of positive as opposed to negative examples, and the large volume of interactions with poor experimental (i.e., low confidence) evidence present challenges to the training of classification models. The purpose of this work is to test the performance of PU Learning algorithms using miRNA-mRNA pairs with poor experimental evidence as unlabelled data, and one-class classification (OCC), specifically of the positive class, for the miRNA target prediction problem, comparing the results with supervised algorithms commonly adopted in the related literature. The results of experiments performed with data from Tarbase demonstrate that for the created dataset (including our definition of unlabelled data) and the features used, there is no significant classification performance gain in using methods of PU Learning in relation to supervised algorithms. However, if no negative data is available, PU Learning proves to be an advantageous option as OCC methods are much worse than others for the problem addressed. It cannot be concluded that PU Learning methods cannot perform better than supervised algorithms in predicting miRNA targets. Different choices of features, unlabeled data, or even datasets used for model training can yield better results for these methods.en
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectMachine Learningen
dc.subjectInformáticapt_BR
dc.subjectPU Learningen
dc.subjectOne-Class Classificationen
dc.subjectMicroRNAen
dc.subjectTarget Predictionen
dc.titlePredição de alvos de microRNAs utilizando aprendizado semi-supervisionado e classificação baseada em uma única classept_BR
dc.title.alternativeMicroRNA target prediction based on semi-supervised learning and one-class classification en
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.identifier.nrb001116927pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Informáticapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.graduationCiência da Computação: Ênfase em Ciência da Computação: Bachareladopt_BR
dc.degree.levelgraduaçãopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples