Objetivo: Desenvolver e validar um pipeline totalmente automatizado de Deep learning para identificação de níveis vertebrais e controle de qualidade (QC) da região cervical superior da medula espinhal em imagens de ressonância magnética (RM) cerebral ponderadas em T1 3D.
Materiais e Métodos: Este estudo retrospectivo e multicêntrico incluiu 1.877 exames de RM obtidos por consórcios internacionais de ataxia, abrangendo 32 centros entre 2012 e 2023. Os dados foram divididos em dois conjuntos: vertebral labeling (n = 924) e QC automatizado (n = 1.396). Foram avaliadas diferentes arquiteturas de redes neurais profundas: nnU-Net, U-Net com deep supervision e SwinUNETR para a tarefa de labeling, e VGG, ResNet e EfficientNet para o QC automatizado. O desempenho foi medido por coeficiente de similaridade de Dice (DSC), interseção sobre união (IoU), distância de Hausdorff (HD), acurácia e sensibilidade. Métricas automatizadas de QC incluíram razão sinal-ruído (SNR), razão contraste-ruído (CNR), coeficiente de variação conjunta (CJV) e critério de foco por entropia (EFC). A fase de teste foi conduzida em 698 casos previamente rotulados de forma incorreta. A validação externa utilizou 2.788 exames de indivíduos saudáveis provenientes de repositórios públicos (C-MIND, IXI, HCP-D, NIH) e de casos de esclerose múltipla.
Resultados: O modelo nnU-Net apresentou o melhor desempenho em rotulagem, com médias de DSC de 0,85 (C1), 0,89 (C2) e 0,89 (C3), corrigindo 95,8 das falhas prévias de rotulagem. Para o QC, o modelo baseado em VGG alcançou 97,9 de acurácia e sensibilidade de 0,987 na detecção de erros. A validação externa confirmou a robustez e generalização do pipeline, com acurácias superiores a 92 em quatro dos cinco conjuntos de dados avaliados. Além disso, o pipeline mostrou sensibilidade para detectar atrofia longitudinal da medula espinhal em pacientes com esclerose múltipla.
Conclusão: O pipeline de aprendizado profundo proposto demonstrou alta acurácia e confiabilidade tanto na identificação automática dos níveis vertebrais quanto na avaliação de qualidade de imagens da medula cervical em RM cerebral. A abordagem supera ferramentas convencionais, é escalável para grandes bases multicêntricas e oferece suporte relevante ao desenvolvimento de biomarcadores em ensaios clínicos voltados para doenças neurodegenerativas.