Mostrar registro simples

dc.contributor.advisorBeck Filho, Antonio Carlos Schneiderpt_BR
dc.contributor.authorMoori, Marcelo Kojipt_BR
dc.date.accessioned2025-08-06T06:56:20Zpt_BR
dc.date.issued2025pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/294677pt_BR
dc.description.abstractAsymmetric multicore processors (AMPs), which integrate high-performance cores with energy-efficient ones, are gaining popularity in desktop and server systems (e.g., Intel’s Core Ultra and Apple’s M4) due to their significant energy savings. However, to fully utilize their resources most efficiently, thread count, thread mapping, and CPU frequency levels (i.e., a given configuration) must be appropriately tuned in much more complex scenarios than their homogeneous counterparts. Inspired by analogous work in homogeneous systems, this study evaluates four of our own AMP-aware optimization tools, each with progressively more sophistication, spanning static vs. dynamic policies and offline vs. online search. First, HyTuning, an offline, static heuristic that performs an exponential search over the number of threads (NT). Then, Mímir, an OpenMP runtime extension that adjusts NT online and dynamically based on the application’s behavior. Next, LOKI, an offline, dynamic Genetic Algorithm (GA)–based optimizer that tunes both NT and DVFS frequency levels (FL) to minimize the energy–delay product (EDP). Finally, GAAMP, an offline, static, GA-driven framework that simultaneously tunes NT, FL, and thread-to-core affinity (TA) using evolutionary search to push EDP even lower.en
dc.description.abstractProcessadores assimétricos multicore (AMPs), que integram núcleos de alto desempenho com núcleos energeticamente eficientes, estão ganhando popularidade em sistemas de desktop e servidores (por exemplo, o Intel Core Ultra e o Apple M4) devido às suas significativas economias de energia. Entretanto, para aproveitar seus recursos da forma mais eficiente, o número de threads, o mapeamento de threads e os níveis de frequência da CPU (i.e., uma dada configuração) devem ser ajustados adequadamente em cenários muito mais complexos do que em seus equivalentes homogêneos. Inspirado por trabalhos análogos em sistemas homogêneos, este estudo avalia quatro ferramentas de nossa autoria de otimização específicas para AMPs, cada uma com um maior nível de sofisticação, abrangendo políticas estáticas vs. dinâmicas e buscas offline vs. online. Primeiramente, HyTuning, uma heurística estática e offline que realiza uma busca exponencial pelo nú- mero de threads (NT). Em seguida, Mímir, uma extensão do OpenMP que ajusta NT online e dinamicamente com base no comportamento da aplicação, em tempo de execu- ção. Depois, LOKI, um otimizador dinâmico e offline baseado em Algoritmo Genético (GA) que ajusta tanto NT quanto os níveis de frequência de DVFS (FL) para minimizar o produto energia–atraso (EDP). Finalmente, GAAMP, um framework estático, offline e movido a GA que ajusta simultaneamente NT, FL e afinidade thread-to-core (TA) usando busca evolutiva para reduzir ainda mais o EDP.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoengpt_BR
dc.rightsOpen Accessen
dc.subjectProcessadores multicore assimétricospt_BR
dc.subjectThread throttlingen
dc.subjectEnergy-delay producten
dc.subjectEficiência energéticapt_BR
dc.subjectOtimizaçãopt_BR
dc.subjectParallel regionsen
dc.subjectArquiteturas multicorept_BR
dc.subjectProcessamento paralelopt_BR
dc.titleOptimization of parallel applications for asymmetric multicorespt_BR
dc.title.alternativeOtimização de aplicações paralelas para arquiteturas assimétricas multicore pt
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.contributor.advisor-coRocha, Hiago Mayk Gomes de Araújopt_BR
dc.identifier.nrb001289932pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Informáticapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2025pt_BR
dc.degree.graduationCiência da Computação: Ênfase em Engenharia da Computação: Bachareladopt_BR
dc.degree.levelgraduaçãopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples