Mostrar registro simples

dc.contributor.advisorBalen, Tiago Robertopt_BR
dc.contributor.authorAguilera, Carlos Julio Gonzálezpt_BR
dc.date.accessioned2025-10-01T07:55:40Zpt_BR
dc.date.issued2024pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/297677pt_BR
dc.description.abstractEstratégias de tolerância a falhas, como a Redundância Modular Tripla (TMR, Triple Modular Redundancy) e a diversidade de projeto — utilização de diferentes abordagens de projeto para mitigar falhas de modo comum — têm sido amplamente estudadas para aumentar a confiabilidade de System-on-Chip (SoCs) multipropósito, visando mitigar os efeitos da radiação ionizante. Este trabalho apresenta o desenvolvimento, implementação e avaliação experimental de uma técnica de TMR com diversidade aplicada a conversores analógico-digitais (ADCs) operando sob radiação ionizante. A técnica de tolerância a falhas foi implementada em um Programmable System-on-Chip (PSoC), identificando pontos críticos de falha após experimentos de radiação, validando algoritmos de votação por software e propondo configurações otimizadas para diversos ambientes de radiação. Foram realizadas quatro campanhas experimentais; duas envolvendo irradiação com íons pesados, para validar a suscetibilidade a efeitos de evento único (SEEs, Single Event Effects) e avaliar estratégias de votação; uma campanha abordou a Interferência Eletromagnética (EMI), para analisar simultaneamente o comportamento dos votadores. Por fim, realizou-se um experimento com raios-X para confirmar os mecanismos de degradação associados a dose total ionizante (TID, Total Ionizing Dose). Nos experimentos com íons pesados, diferentes arquiteturas de conversores apresentaram diferentes níveis de suscetibilidade quando aplicada a diversidade entre módulos irradiados. Foram observadas 98 ocorrências de erros do tipo Silent Data Corruption, das quais cerca de 22% ocorreram no esquema de votação bit a bit implementado. Esses resultados evidenciam vulnerabilidades específicas em determinadas estratégias de votação e ressaltam a importância de considerar o tempo de execução e a complexidade do algoritmo. O votador de palavra mostrou-se mais robusto, sendo aproximadamente 77% mais resistente a falhas induzidas por radiação, destacando diferenças significativas nas seções de choque obtidas quando comparado com um votador do tipo bit-a-bit. Nos experimentos de radiação acumulativa (TID), a utilização da redundância com diversidade de projeto e temporal, demostrouse eficaz na extensão da vida útil do sistema. O sistema atingindo uma dose total de 242 krad(Si) para 60Co (Cobalto-60) e até 30,6 krad(Si) sob exposição a raios-X antes de apresentar falha total do sistema. No experimento com 60Co, apenas um dos três módulos do TMR diversificado apresentou degradação crítica, enquanto, no experimento com raio-X, os módulos falharam em diferentes doses acumuladas, evidenciando variabilidade associada à diversidade implementada. Posteriormente, foram realizados estudos de simulação elétrica para investigar o mecanismo principal de falha nos conversores SAR (Successive Approximation Register) testados sob TID. As simulações indicaram que a principal vulnerabilidade era associada à degradação de uma chave do tipo bootstrap, responsável pela conexão da tensão de referência à matriz capacitiva do SAR. De modo geral, os resultados experimentais confirmam que a aplicação de TMR combinada com diversidade de projeto e temporal proporciona um aumento significativo na robustez do sistema frente aos efeitos da radiação ionizante e da interferência eletromagnética, utilizando de forma eficiente os recursos internos do SoC, sem introduzir overhead significativo de área ou consumo.pt_BR
dc.description.abstractFault tolerance strategies, such as Triple Modular Redundancy (TMR) and design diversity — employing different design approaches to mitigate common-mode failures — have been extensively studied to enhance the reliability of multipurpose System-on-Chips (SoCs), aiming to mitigate the effects of ionizing radiation. This work presents the development, implementation, and experimental evaluation of a TMR technique with diversity applied to analog-to-digital converters (ADCs) operating under ionizing radiation. The fault tolerance technique was implemented on a Programmable System-on-Chip (PSoC), with critical failure points identified through radiation experiments, validation of software-based voting algorithms, and proposals of optimized configurations for various radiation environments. Four experimental campaigns were conducted: two involving heavy-ion irradiation to validate susceptibility to Single Event Effects (SEEs) and to evaluate voting strategies; one campaign addressing Electromagnetic Interference (EMI) to simultaneously analyze voter behavior; and a final campaign involving X-ray irradiation to confirm degradation mechanisms associated with Total Ionizing Dose (TID). In the heavyion experiments, different ADC architectures demonstrated varying levels of susceptibility when diversity was applied among irradiated modules. A total of 98 Silent Data Corruption (SDC) events were observed, of which approximately 22% occurred within the bit-by-bit voting scheme. These results highlight specific vulnerabilities in certain voting strategies and emphasize the importance of considering execution time and algorithmic complexity. The word-level voter demonstrated greater robustness, being approximately 77% more resistant to radiation-induced failures, and showing significant differences in the measured cross-sections compared to the bit-by-bit voter. In the cumulative radiation experiments (TID), the use of redundancy combined with design and temporal diversity proved effective in extending the system’s operational lifetime. The system reached a total dose of 242 krad(Si) under Cobalt-60 (60Co) irradiation and up to 30.6 krad(Si) under X-ray exposure before exhibiting total system failure. In the Cobalt-60 experiment, only one of the three diversified TMR modules showed critical degradation, while in the Xray experiment, module failures occurred at different accumulated doses, highlighting the variability associated with the implemented diversity. Subsequently, electrical simulation studies were performed to investigate the main failure mechanism in the SAR (Successive Approximation Register) converters tested under TID conditions. Simulations indicated that the primary vulnerability was associated with the degradation of a bootstrap switch, responsible for connecting the reference voltage to the SAR capacitive array. Overall, the experimental results confirm that the application of TMR combined with design and temporal diversity significantly enhances system robustness against ionizing radiation and electromagnetic interference, while efficiently utilizing internal SoC resources without introducing significant area or power overhead.en
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectProgrammable System-On-Chipen
dc.subjectDiversidadept_BR
dc.subjectTolerância a falhaspt_BR
dc.subjectEfeitos da radiaçãopt_BR
dc.subjectRedundância modular triplapt_BR
dc.titleEstudo da confiabilidade de interfaces de sinal misto em dispositivos programáveis para aplicações críticaspt_BR
dc.typeTesept_BR
dc.identifier.nrb001294405pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Informáticapt_BR
dc.degree.programPrograma de Pós-Graduação em Microeletrônicapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2024pt_BR
dc.degree.leveldoutoradopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples