Artificial intelligence in cephalometric analysis: Comparison of angular measurements between WebCephTM and NemoCeph Systematic Review and Retrospective Diagnostic Study
Résumé
Introdução: Com os avanços da Inteligência Artificial (IA) torna-se essencial avaliar a precisão de software automatizados como o WebCeph™. Apesar dos benefícios, discrepâncias na identificação de pontos de referência podem comprometer a precisão cefalométrica e a fiabilidade clínica.
Objetivo: Avaliar a precisão da IA na análise cefalométrica, comparando medidas angulares obtidas no WebCeph™ e no NemoCeph.
Material e Métodos: Foi realizado um estudo retrospetivo e diagnóstico com cefalometrias de 50 pacientes com idade igual ou superior a 18 anos, dentição permanente e sem tratamento ortodôntico prévio. Foi também realizada uma revisão sistemática para contextualizar os dados com a literatura existente. As medições foram obtidas no WebCeph™ e NemoCeph, sendo os dados analisados estatisticamente com o IBM SPSS®.
Resultados: O nosso estudo identificou diferenças estatisticamente significativas entre os softwares nas análises de Jarabak, Steiner e Ricketts. A análise de Tweed não apresentou diferenças relevantes. A maioria das medições teve discrepâncias superiores a 2 graus. Encontrou-se diferenças significativas na determinação do biótipo facial.
Discussão: Os resultados evidenciam incongruências na literatura. Enquanto algumas medidas variaram minimamente, outras mostraram diferenças substanciais, sobretudo no biótipo facial. Estes achados reforçam a importância de uma avaliação crítica dos software de IA, pois inconsistências entre métodos podem influenciar o diagnóstico e o plano de tratamento.
Conclusões: O WebCeph™ revelou discrepâncias na maioria das medições, com exceção da análise de Tweed. Tais inconsistências destacam a necessidade de validar ferramentas baseadas em IA. Introduction: With advances in Artificial Intelligence (AI), it has become essential to assess the accuracy of automated software such as WebCeph™. Despite the benefits, discrepancies in the identification of reference points can compromise cephalometric accuracy and clinical reliability.
Aim: To assess the accuracy of AI in cephalometric analysis by comparing angular measurements obtained on WebCeph™ and NemoCeph.
Material and Methods: A retrospective and diagnostic study was carried out with cephalometrics from 50 patients aged 18 or over, with permanent dentition and no previous orthodontic treatment. A systematic review was also carried out to contextualise the data with existing literature. The measurements were obtained from WebCeph™ and NemoCeph, and the data was statistically analysed using IBM SPSS®.
Results: Our study identified statistically significant differences between the software in the Jarabak, Steiner and Ricketts analyses. The Tweed analysis showed no relevant differences. Most measurements had discrepancies of more than 2 degrees. Significant differences were found in determining the facial biotype.
Discussion: The results show inconsistencies in the literature. While some measurements varied minimally, others showed substantial differences, especially in facial biotype. These findings reinforce the importance of a critical evaluation of AI software, as inconsistencies between methods can influence the diagnosis and treatment plan.
Conclusions: WebCeph™ revealed discrepancies in most measurements, except for the Tweed analysis. These inconsistencies highlight the need to validate AI-based tools.