Qual é a nossa posição em IA para análise de imagens endoscópicas?  Decifrando lacunas e direções futuras

blog

LarLar / blog / Qual é a nossa posição em IA para análise de imagens endoscópicas? Decifrando lacunas e direções futuras

Feb 25, 2024

Qual é a nossa posição em IA para análise de imagens endoscópicas? Decifrando lacunas e direções futuras

npj Digital Medicine volume 5, Artigo número: 184 (2022) Citar este artigo 5830 Acessos 3 Citações 15 Detalhes de métricas altmétricas Desenvolvimentos recentes em aprendizagem profunda permitiram

npj Digital Medicine volume 5, número do artigo: 184 (2022) Citar este artigo

5830 Acessos

3 citações

15 Altmétrico

Detalhes das métricas

Desenvolvimentos recentes em aprendizagem profunda permitiram algoritmos baseados em dados que podem atingir desempenho de nível humano e muito mais. O desenvolvimento e implantação de métodos de análise de imagens médicas apresentam vários desafios, incluindo a heterogeneidade dos dados devido à diversidade populacional e aos diferentes fabricantes de dispositivos. Além disso, são necessárias mais contribuições de especialistas para um processo confiável de desenvolvimento de métodos. Embora o crescimento exponencial dos dados de imagens clínicas tenha permitido o florescimento da aprendizagem profunda, a heterogeneidade dos dados, a multimodalidade e os casos de doenças raras ou imperceptíveis ainda precisam ser explorados. Sendo a endoscopia altamente dependente do operador, com resultados clínicos sombrios em alguns casos de doenças, a orientação confiável e precisa do sistema automatizado pode melhorar o atendimento ao paciente. A maioria dos métodos concebidos deve ser mais generalizável para dados-alvo invisíveis, variabilidade da população de pacientes e aparecimentos variáveis ​​de doenças. O artigo analisa trabalhos recentes sobre análise de imagens endoscópicas com inteligência artificial (IA) e enfatiza as atuais necessidades incomparáveis ​​neste campo. Finalmente, descreve as direções futuras para soluções complexas de IA clinicamente relevantes para melhorar os resultados dos pacientes.

A endoscopia é um procedimento padrão ouro para muitos órgãos ocos. É usado principalmente para vigilância de doenças, monitoramento de inflamação, detecção precoce de câncer, caracterização de tumores e procedimentos de ressecção, intervenções de tratamento minimamente invasivas e monitoramento de resposta terapêutica. A análise de imagens endoscópicas começou a ganhar mais atenção nos últimos anos com um número excedente de métodos baseados em imagens endoscópicas sendo publicados em detecção auxiliada por computador (CADe)1,2,3,4,5, diagnóstico auxiliado por computador (CADx)6 ,7,8,9,10,11 e cirurgia assistida por computador (CAS)12,13,14,15,16. Ao contrário de outros dados radiológicos (por exemplo, raios X, tomografia computadorizada, ressonância magnética), a imagem endoscópica e sua análise é um tópico altamente especializado e desafiador. A imagem endoscópica tem dependências multifatoriais, incluindo grande dependência do operador (por exemplo, experiência e treinamento), questões relacionadas ao escopo (por exemplo, variabilidade na qualidade da imagem) e sublinhando a dinâmica da cena (por exemplo, corrupção iminente de quadros com artefatos graves, movimento de grandes órgãos e desvios superficiais17). Os padrões de qualidade em intervenções endoscópicas gastrointestinais são discutidos em vários estudos de diretrizes notáveis18,19. Alguns trabalhos recentes exploraram áreas de aprendizagem profunda para automatizar métricas para avaliar a qualidade da endoscopia. Estes são especialmente críticos na quantificação dos pontos cegos20,21. Embora a reconstrução 3D baseada em SLAM tenha sido usada para gerar mapas colônicos18, o comprimento e a área do precursor do câncer gastrointestinal superior (GI), o esôfago de Barrett, foram quantificados usando a técnica de estimativa de profundidade baseada em aprendizado profundo22. Da mesma forma, a tarefa mais crucial para procedimentos cirúrgicos minimamente invasivos (por exemplo, laparoscopia) é compreender e interpretar a cena subjacente.

Embora uma reconstrução 3D de órgãos ocos seja vital, é difícil de conseguir por vários motivos, incluindo deformação de órgãos altamente não linear, desordem de cena (por exemplo, fluido escorrendo, sangue) e oclusão (por exemplo, gordura ao redor da cirurgia do fígado). Assim, a maioria das pesquisas está focada na avaliação de cenas locais utilizando métodos de classificação, detecção e segmentação. A detecção e caracterização da lesão, juntamente com seu delineamento, é o foco principal da endoscopia gastrointestinal1,2,3,4,5,6,7,8,9,10,11. Da mesma forma, a segmentação do cálculo direcionado e sua caracterização são o foco principal na ureteroscopia23 e a detecção de tumor24 tem sido explorada na cistoscopia. Para intervenções laparoscópicas minimamente invasivas, classificação de ferramentas cirúrgicas12, detecção e segmentação13, reconhecimento de fase12,14, segmentação de pontos de referência associados15 e sobreposição de volume 3D pré-operatório em laparoscopia 2D interoperatória16 tem sido uma área de foco. Um resumo representativo dos principais objetivos e várias tarefas de análise de imagens endoscópicas para diferentes intervenções endoscópicas é apresentado na Fig.