Analysis of openMP scheduling policies in hybrid architectures
Visualizar/abrir
Data
2025Autor
Orientador
Nível acadêmico
Graduação
Outro título
Análise de políticas de escalonamento do openMP em arquiteturas híbridas
Abstract
Modern hybrid CPU architectures, which combinehigh-performance(P-cores) and energy efficient (E-cores) processors, present new challenges for parallel programming, as asymmetric core performance complicates parallel task scheduling and load balancing. Scheduling policies bring strategies to guide workloads to the appropriate cores and can be used in this architectures to mitigate the effects of the heterogeneous cores. This work analyzes the efficacy of standard OpenMP scheduling policies (stat ...
Modern hybrid CPU architectures, which combinehigh-performance(P-cores) and energy efficient (E-cores) processors, present new challenges for parallel programming, as asymmetric core performance complicates parallel task scheduling and load balancing. Scheduling policies bring strategies to guide workloads to the appropriate cores and can be used in this architectures to mitigate the effects of the heterogeneous cores. This work analyzes the efficacy of standard OpenMP scheduling policies (static, dynamic, and guided) on an Intel Core i9-14900KF hybrid processor. Using the NAS Parallel Benchmarks, we evaluate performance and energy consumption across homogeneous (P-core or E-core only) and heterogeneous, full hybrid, configurations. Our findings indicate that no single policy is universally optimal; the best choice is highly application-dependent. Adaptive policies like dynamic and guided excel at managing load imbalance on asymmetric hardware, bringing up to 50% increase in speedup when using the hybrid layout, but can degrade performance for locality-bound workloads, achieving worse the single-threaded performance, where static scheduling proves superior. Furthermore, leveraging the full hybrid configuration does not guarantee a performance benefit with standard schedulers and can be detrimental for certain applications, where it leads to 25% slowdown in the best case. A distinct trade-off emerges between achieving maximum performance, typically on Pcore-inclusive setups, and maximizing energy efficiency, often found on E-core-only conf igurations. These results underscore the limitations of hardware-agnostic schedulers and highlight the need for more sophisticated strategies to effectively harness the potential of hybrid systems. ...
Resumo
Arquiteturas de CPU híbridas modernas, que combinam processadores de alto desempenho (P-cores) e eficientes em energia (E-cores), apresentam novos desafios para a programação paralela, uma vez que o desempenho assimétrico dos núcleos complica o escalonamento de tarefas paralelas e o balanceamento de carga. Políticas de escalonamento oferecem estratégias para guiar as cargas de trabalho aos núcleos apropriados e podem ser usadas nessas arquiteturas para mitigar os efeitos dos núcleos heterogêneo ...
Arquiteturas de CPU híbridas modernas, que combinam processadores de alto desempenho (P-cores) e eficientes em energia (E-cores), apresentam novos desafios para a programação paralela, uma vez que o desempenho assimétrico dos núcleos complica o escalonamento de tarefas paralelas e o balanceamento de carga. Políticas de escalonamento oferecem estratégias para guiar as cargas de trabalho aos núcleos apropriados e podem ser usadas nessas arquiteturas para mitigar os efeitos dos núcleos heterogêneos. Este trabalho analisa a eficácia das políticas de escalonamento padrão do OpenMP (static, dynamic e guided) em um processador híbrido Intel Core i9-14900KF. Utilizando o NAS Parallel Benchmarks, avaliamos o desempenho e o consumo de energia em configurações homogêneas (apenas P-core ou E-core) e heterogêneas (híbrida completa). Nossos resultados indicam que nenhuma política é universalmente ótima; a melhor escolha é altamente dependente da aplicação. Políticas adaptativas como dynamic e guided se destacam no gerenciamento de desequilíbrio de trabalho em hardware assimétrico, proporcionando um aumento de até 50% na performance ao usar a configuração híbrida, mas podem degradar o desempenho para cargas de trabalho ligadas à localidade de dados, alcançando um desempenho inferior ao de thread única. Além disso, o uso da configuração híbrida completa não garante um benefício de desempenho com escalonadores padrão e pode ser prejudicial para certas aplicações, onde leva a um slowdown de 25% no melhor dos casos. Surge um dilema entre atingir o desempenho máximo, geralmente em configurações que incluem P-cores, e maximizar a eficiência energética, frequentemente encontrada em configurações apenas com E-cores. Estes resultados ressaltam as limitações dos escalonadores agnósticos ao hardware e destacam a necessidade de estratégias mais sofisticadas para aproveitar efetivamente o potencial dos sistemas híbridos. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado.
Coleções
-
TCC Ciência da Computação (1128)
Este item está licenciado na Creative Commons License


