uff

arXiv · 29 de maio de 2023

Plataforma de Hardware e Software para Localização de Objetos Aéreos — Projeto Galileu

Pesquisadores do Projeto Galileu, vinculado ao Centro de Astrofísica Harvard & Smithsonian, descrevem um sistema integrado de câmeras e algoritmos projetado para medir posição, velocidade e aceleração de objetos aéreos, incluindo UAP (Fenômenos Aéreos Não Identificados), em três dimensões. O artigo foi publicado em março de 2023 no Journal of Astronomical Instrumentation.

Visão Geral

O artigo A Hardware and Software Platform for Aerial Object Localization, de Szenher et al. (2023), descreve uma plataforma dual — hardware e software — desenvolvida pelo Projeto Galileu para coletar dados cinéticos confiáveis sobre objetos aéreos, incluindo UAP (Fenômenos Aéreos Não Identificados — Unidentified Aerial Phenomena). Os autores observam que, até a data de publicação, havia escassez de dados confiáveis sobre posição, velocidade e aceleração de UAP [§ p.1].

O sistema foi projetado para distinguir objetos fabricados pelo ser humano, fenômenos naturais e fenômenos que não se enquadram em nenhuma dessas categorias [§ p.1].


1. Introdução e Motivação

Uma única câmera fornece apenas a posição angular de um objeto em relação à sua pose (localização e orientação), como azimute e elevação, mas não fornece a distância (alcance). Para determinar a localização 3D de um objeto aéreo, são necessárias pelo menos duas câmeras calibradas, separadas por uma distância conhecida e apontando em direções conhecidas, que capturem o objeto simultaneamente [§ p.1].

A escolha de câmeras ópticas, infravermelhas (IR) e próximas ao infravermelho (NIR) se justifica porque:

O artigo apresenta três contribuições originais [§ p.2]:

  1. Descrição de um conjunto exclusivo de câmeras para estudo científico de UAP.
  2. Novo algoritmo de calibração extrínseca de câmeras usando dados de aeronaves equipadas com ADS-B (Vigilância Dependente Automática por Difusão — Automatic Dependent Surveillance-Broadcast).
  3. Algoritmo orientado a eventos para coleta de dados de câmeras remotas com fins de localização de objetos.

2. Embasamento Técnico

2.1 Definição do Problema de Localização com Múltiplas Câmeras

Os autores definem três sistemas de coordenadas interdependentes: sistema de coordenadas de imagem, sistema de coordenadas de câmera e sistema de coordenadas do mundo. Uma câmera calibrada é definida como aquela cujos parâmetros intrínsecos e extrínsecos são conhecidos [§ p.2–3].

Parâmetros intrínsecos incluem [§ p.2]:

Parâmetros extrínsecos codificam a rotação e a translação entre o sistema de coordenadas da câmera e o sistema de coordenadas do mundo [§ p.3].

A relação entre um ponto 3D nas coordenadas da câmera e um ponto de imagem não distorcido é dada pela matriz de parâmetros intrínsecos K. A matriz de projeção P mapeia um ponto 3D nas coordenadas do mundo para um ponto 2D nas coordenadas de imagem: xᵢ = PX [§ p.3].

Para estimar a localização do centroide de um objeto no sistema de coordenadas do mundo, o objeto deve ser imageado quase simultaneamente por pelo menos duas câmeras calibradas. Os vetores de linha de visão ("look-at vectors") de cada câmera ao centroide do objeto, quando não há erros, se intersectam perfeitamente no ponto 3D do objeto [§ p.3].

O algoritmo de detecção de objetos utilizado é baseado no framework YOLO (You Only Look Once). O algoritmo DeepSORT (Deep Simple Online and Realtime Tracking) é usado para vincular detecções entre múltiplos quadros de imagem [§ p.3–4].

2.2 Análise Geral de Erro de Triangulação

Os autores derivam uma análise de erro generalizada para um sistema de duas câmeras (estéreo). O erro de medição na distância do objeto Z, devido à incerteza angular, depende do quadrado da distância Z² e é inversamente proporcional à distância de base b entre as câmeras [§ p.4]:

"o erro de medição na distância do objeto, Z, devido à incerteza angular, depende do quadrado da distância, Z², e é inversamente proporcional à distância de base, b" [§ p.4]

O artigo também analisa erros devidos à falta de sincronização temporal entre câmeras. Quando a distância percorrida pelo objeto (v·Δt) se aproxima do tamanho da base, surgem erros grandes na estimativa de distância [§ p.4].


3. Implementação de Hardware

3.1 O Array de Câmeras Infravermelhas e NIR "Dalek"

O conjunto primário de câmeras monitora o céu inteiro nas faixas IR, NIR e óptica. O sistema inclui [§ p.5]:

O Dalek é um arranjo hemisférico de oito câmeras IR e uma câmera NIR zeniteal. As câmeras são instaladas em um invólucro de fibra de vidro com janelas de Germânio seladas. Sete câmeras FLIR Boson 640 de infravermelho de ondas longas (LWIR, 7,5 µm a 13,5 µm) são dispostas radialmente para fornecer visão de 360°, cada uma com FOV (Campo de Visão — Field of View) de 50° e apontadas nominalmente a 30° acima do horizonte [§ p.5].

As câmeras Boson LWIR detectam luz IR na janela de alta transmitância atmosférica entre 8 µm e 14 µm [§ p.5].

Capacidade de detecção estimada [§ p.5–6]:

Especificações FLIR Boson 640 [§ p.5, Tabela 1]:

Duas câmeras no Dalek apontam para o zênite: uma FLIR Boson 640 com FOV de 95° e uma ZWO ASI462MC CMOS colorida com resolução 1936×1096 e FOV de 150° [§ p.6].

3.1.1 Controle Ambiental do Domo

A estrutura do Dalek isola as câmeras de forças externas como vento, chuva, animais e objetos. Uma análise de elementos finitos demonstrou deformação máxima do domo inferior a 1 mm de deformações radiais sob vento de 200 mph (um furacão categoria 5 produz ventos de até 157 mph) [§ p.6].

O Dalek conta com [§ p.6]:

3.2 Câmera Óptica de Céu Inteiro Alcor

A câmera Alcor OMEA 9C oferece campo de visão de 180°×180° no espectro visível (350–750 nm). É projetada para uso externo em condições climáticas extremas, com temperatura de operação de –35°C a +45°C. Equipada com sensores de temperatura e umidade, pode desembaciar automaticamente o domo acrílico [§ p.6].

Especificações Alcor [§ p.7, Tabela 3]:

3.3 Câmera Óptica NPACKMAN

O instrumento NPACKMAN (New PArticle Counter k-index Magnetic ANomaly) é um dispositivo desenvolvido especificamente para o Projeto Galileu para fornecer dados sobre condições ambientais e clima espacial próximos ao local de implantação. É baseado no predecessor de código aberto PACKMAN [§ p.7].

Especificações da câmera NPACKMAN [§ p.7, Tabela 4]:

3.4 Transmissão de Dados

Cada câmera é fisicamente conectada a um computador Nvidia Jetson (computador de borda — "Edge computer"). O Jetson executa detecção inicial de objetos em cada imagem. Quando um objeto é detectado, o Jetson compõe uma mensagem contendo: centroide da detecção em coordenadas de imagem; ID da câmera; timestamp da imagem; e um identificador único universal (UUID) marcando o objeto detectado. A mensagem é enviada via canal seguro 0MQ ao processador central [§ p.7].

O Jetson hospeda um pipeline Gstreamer que empacota feeds de imagem em segmentos de 30 segundos e os transporta ao processador central para armazenamento e análise assíncrona. Na fase inicial do projeto, todos os dados de imagem são transmitidos ao servidor central independentemente de ter ocorrido uma detecção [§ p.7].


4. Calibração de Câmeras e Localização de Objetos por Software

4.1 Calibração Intrínseca de Câmeras Visual, NIR e IR

A calibração intrínseca de câmeras visuais utiliza o método de tabuleiro de xadrez fornecido pela biblioteca de software OpenCV. Cada câmera é calibrada independentemente. Os parâmetros intrínsecos resultantes são armazenados em repositório central para acesso em tempo de execução. Para câmeras com lentes olho-de-peixe (como a câmera Alcor, com FOV de ~180°), usa-se a função de calibração específica para lentes olho-de-peixe do OpenCV [§ p.7–8].

Caso seja difícil posicionar manualmente um tabuleiro de xadrez próximo à câmera no campo, os autores planejam fixar o padrão a um drone e voar próximo à câmera [§ p.8].

4.2 Calibração Extrínseca de Câmeras Visual, NIR e IR

A calibração extrínseca é o processo de inferir a matriz de rotação e o vetor de translação que transforma o sistema de referência da câmera para coordenadas do mundo. O GPS é utilizado para calcular o vetor de translação de cada câmera, expresso no sistema WGS 84 (World Geodetic System 1984). Receptores GPS em smartphones têm precisão típica de cerca de 5 m [§ p.8].

Os autores demonstram que uma imprecisão relativamente pequena na estimativa de orientação de uma câmera pode gerar grande erro de localização, o que cria a necessidade de opções de baixo custo para verificar e ajustar continuamente as matrizes de calibração extrínseca [§ p.8].

4.2.1 Calibração Extrínseca com Aeronaves Equipadas com ADS-B

A FAA (Federal Aviation Administration) dos EUA exige que a maioria das aeronaves no espaço aéreo americano seja equipada com sistemas ADS-B, que transmitem posições derivadas de GPS (latitude, longitude e altitude) em tempo quase real [§ p.8].

Usando dados de um receptor ADS-B, os autores computam os parâmetros extrínsecos de uma câmera a partir das posições conhecidas de aeronaves imageadas. O processo forma dois arrays de vetores de linha de visão unitários [§ p.8]:

O problema de determinar a matriz de rotação R a partir de observações de vetores é conhecido como problema de Wahba (Wahba, 1965). A solução utiliza decomposição em valores singulares (SVD) [§ p.9].

Essa técnica de calibração extrínseca baseada em ADS-B é apresentada pelos autores como uma contribuição original [§ p.9].

4.2.2 Calibração Extrínseca com VANTs (Drones) Equipados com GPS

Um VANTs (Veículo Aéreo Não Tripulado — UAV) equipado com receptor GPS é voado manualmente dentro do campo de visão da câmera a ser calibrada, aplicando o mesmo procedimento descrito na Seção 4.2.1, substituindo aeronave por drone [§ p.9].

4.2.3 Calibração Extrínseca com Marcadores Celestes

Utiliza uma única imagem do céu noturno capturada pela câmera. Centróides de estrelas brilhantes são isolados, identificados com software como AstroMB, e suas localizações na esfera celeste são consultadas em catálogos estelares públicos. As posições estelares são tipicamente expressas no Sistema de Coordenadas Equatoriais (ECS — Equatorial Coordinate System). Uma vez estabelecidas as correspondências entre posições 3D estelares e posições 2D de centróides na imagem, computa-se a matriz de rotação R [§ p.9].

Essa técnica é totalmente automatizável e será executada a cada noite para cada câmera relevante (salvo cobertura de nuvens) [§ p.9].

4.2.4 Combinação de Estimativas de Calibração Extrínseca

As três técnicas são combinadas. Os procedimentos baseados em ADS-B e drone empregam o sistema WGS 84; a calibração baseada em estrelas usa o sistema equatorial. A tradução entre os dois sistemas é feita com o programa ogr2ogr. Toda vez que uma nova matriz de rotação é gerada, ela é combinada com as duas matrizes mais recentes dos outros dois métodos, usando o método de "média" de matrizes de rotação descrito em Bhardwaj et al. (2018) [§ p.9].

4.3 Calibração Específica para Câmeras Infravermelhas

As câmeras FLIR Boson requerem etapas adicionais de calibração para remover não-uniformidades de imagem (INU — Image Non-Uniformities), definidas como pixels que tendem a variar levemente de sua vizinhança local sob certas condições de imageamento [§ p.10].

Dois métodos são utilizados [§ p.10]:

4.4 Sincronização de Dados de Imagem

O Protocolo de Tempo de Rede (NTP — Network Time Protocol) é usado para sincronizar os relógios de todos os computadores aos quais as câmeras estão conectadas. Mills (1989) relata que o NTP tipicamente produz precisão na ordem de dezenas de milissegundos em relação à fonte de referência de tempo [§ p.10].

Para sincronização de câmeras da mesma marca em locais distintos, o método adotado na fase inicial é pragmático: reiniciar os programas de captura de imagem até que as câmeras difiram em tempo de captura por não mais do que uma diferença de tempo configurável d_time (em segundos) [§ p.10].

4.5 Localização de Objetos com Múltiplas Imagens Sincronizadas

Um "conjunto de câmeras" é definido como um conjunto de câmeras Dalek, Alcor e NPACKMAN próximas. Para localização e rastreamento, pelo menos dois conjuntos de câmeras são implantados a alguma distância um do outro [§ p.10].

Cada câmera usa o algoritmo YOLO independentemente para detectar objetos de interesse. Para cada detecção, uma mensagem 0MQ é enviada ao processador central com: centroide em coordenadas de imagem; ID da câmera; timestamp; e UUID do objeto detectado [§ p.11].

O processador central coleta mensagens de detecções ocorridas quase simultaneamente para formar um "conjunto de eventos de detecção". São dois os problemas a resolver [§ p.11]:

  1. Problema de correspondência: decidir quais detecções 2D em diferentes imagens se referem ao mesmo objeto 3D.
  2. Problema de triangulação/localização: inferir a localização 3D do objeto a partir do conjunto de detecções.

4.5.1 Triangulação de Objetos

Quando há mais de duas detecções do mesmo objeto (mais de duas câmeras), os autores utilizam o Método de Triangulação Linear Homogênea (LTM-H — Linear Triangulation Method, Homogeneous), recomendado por Hartley & Zisserman (2004). O método resolve o sistema linear AX = 0 via decomposição em valores singulares de A; a solução X é a quarta coluna de V [§ p.11–12].

O erro de reprojeção é introduzido como métrica de qualidade: para cada câmera usada na solução, calcula-se PX = x̂ (reprojeção de X) e mede-se a distância euclidiana entre x̂ e o ponto de imagem observado. O erro total de reprojeção é a média sobre todas as imagens [§ p.12].

4.5.2 Correspondência de Objetos em Múltiplas Imagens

Os autores utilizam o framework de Problema de Otimização de Satisfação de Restrições (CSOP — Constraint Satisfaction Optimization Problem) para determinar as correspondências ótimas de imagem para um conjunto de eventos de detecção [§ p.12].

As restrições relevantes do CSOP são [§ p.12]:

  1. Um objeto Ok pode ser atribuído no máximo uma vez por imagem de câmera Cᵢ.
  2. Um objeto Ok só pode ser atribuído a um par de detecções se a interseção mais próxima dos vetores de linha de visão estiver dentro do alcance de visão de cada câmera, assumindo tamanho mínimo de objeto de 30 m, e não estiver atrás de nenhuma câmera.
  3. Pelo menos um objeto em qualquer solução válida deve ser imageado por 2 ou mais câmeras.
  4. Qualquer objeto deve ser imageado por câmeras de pelo menos dois conjuntos de câmeras distintos.

A solução aceita é aquela com o maior número de localizações de objetos válidas; em caso de empate, aceita-se a solução com menor erro médio de reprojeção [§ p.12–13].

4.6 Cálculo de Velocidade e Aceleração

Dadas duas localizações 3D sucessivas X₁ e X₂ do mesmo objeto em tempos t₁ e t₂, o vetor de velocidade média V é calculado como [§ p.13]:

V = (X₂ – X₁) / (t₂ – t₁)

O tempo para o qual X₁ (ou X₂) foi calculado é tomado como a média dos timestamps das imagens usadas em seu cálculo. A identidade do objeto ao longo do tempo é rastreada por sobreposição de UUIDs de detecção [§ p.13]. Uma vez disponíveis três cálculos de velocidade para um dado objeto, calcula-se a aceleração média.


5. Experimentos, Resultados e Discussão

5.1 Experimentos de Localização

Os autores descrevem experimentos de simulação para determinar o erro de localização esperado. A questão básica é: quão afastados devem estar dois conjuntos de câmeras para atingir uma precisão de localização alvo? [§ p.13]

A equação de referência utilizada (de Gallup et al., 2008) é:

εz ≈ (z²/bf) · εd

onde z é a distância do objeto à base, εz é o erro nessa distância, b é a distância de base entre câmeras, f é a distância focal e εd é o erro de correspondência em pixels [§ p.13].

A distância máxima z_max é fixada em 15 km, compatível com a capacidade de detecção das câmeras FLIR Boson. São explorados valores de εd de 0,1, 1 e 10 pixels, e valores de εz de 1, 10 e 100 m [§ p.14].

Exemplo [§ p.14]: Para erro de distância desejado de 10 m e disparidade de correspondência assumida de 0,1 pixels, um par de câmeras Alcor deve ser separado por cerca de 300 m.

Para os experimentos de simulação, usa-se uma distância de base de câmeras de 1.500 m. A simulação Monte Carlo considera as seguintes variáveis aleatórias de entrada [§ p.14]:

Resultados das simulações [§ p.16–18]:

  1. Apenas erro do algoritmo de localização: erro muito baixo (≪ 1 m) para ambos os tipos de câmera.
  2. Apenas erro de posição da câmera (C): distribuições unimodais com moda próxima de zero; erros maiores ocorrem com objetos no campo próximo.
  3. Apenas erro de orientação da câmera (R): distribuições com modas muito grandes (~10⁴ m). A incerteza de orientação da câmera é, de longe, a maior fonte de erro de localização.
  4. Apenas erro de dessincronização temporal: distribuições unimodais com moda próxima de zero; a câmera Alcor tem distribuição de erros muito mais ampla do que a ZWO, devido à sua taxa máxima de quadros aproximadamente 100 vezes menor. Para atingir precisão de localização de 10 m, os tempos de captura de imagem devem diferir por não mais que ~10⁻³ s [§ p.18].
  5. Apenas erro do algoritmo YOLO: distribuições unimodais com moda próxima de zero; a câmera Alcor é menos sensível a erros de detecção devido ao seu sensor de imagem de maior resolução.
  6. Todas as fontes de erro combinadas: distribuições qualitativamente similares ao caso de erro de orientação isolado, confirmando que erros de orientação da câmera são a principal fonte de erro de localização [§ p.18].

5.2 Experimentos de Correspondência

Nos experimentos de correspondência com dois objetos em cena, as correspondências imagem-objeto ocorreram com 100% de precisão [§ p.18].

Quando a orientação calibrada da terceira câmera foi perturbada em 1° em torno de seu eixo óptico, as detecções dessa câmera foram descartadas como errôneas com sucesso em todos os 100 casos simulados [§ p.18–19].

Na simulação em que uma câmera imageia um objeto próximo pequeno (como um inseto) invisível às demais câmeras, o inseto nunca foi reportado como localizado em nenhuma das 100 simulações; o objeto de controle foi localizado com precisão comparável ao caso sem erros [§ p.19].


6. Trabalhos Relacionados

O hardware e software descritos guardam similaridade com sistemas usados para rastrear meteoros na atmosfera terrestre. Redes de rastreamento de meteoros relevantes incluem [§ p.19–20]:

Métodos de inferência de trajetória usados por essas redes incluem: método dos planos que se intersectam (Ceplecha, 1987); mínimos quadrados em linha reta / Método de Linha de Visão (Borovicka, 1990); e o método de ajuste multi-parâmetro (MPF) (Gural, 2012) [§ p.20].

Os autores observam uma diferença importante: o rastreamento de meteoros tipicamente assume perfis de velocidade simples (velocidade constante, desaceleração quadrática). No trabalho do Projeto Galileu, não se pode assumir que os objetos rastreados (aviões, helicópteros, drones, pássaros, insetos) exibam perfis de velocidade meteóricos [§ p.20].

Trabalhos anteriores sobre calibração de câmeras para rastreamento de meteoros incluem os métodos astrométricos de Borovicka (1992) e Borovicka et al. (1995), o método SCAMP de Jeanne et al. (2019) para a rede FRIPON, e o software Python de Peña-Asensio et al. (2021c) para rastreamento automatizado de meteoros [§ p.20–21].


7. Conclusões e Trabalho Futuro

O artigo descreve um conjunto de imageamento robusto e original que captura dados em comprimentos de onda óptico, IR e NIR para estudo científico de UAP. Os algoritmos de calibração e localização foram descritos e avaliados em experimentos simulados. Os principais resultados confirmam que [§ p.21]:

Direções futuras [§ p.22] incluem:


Apêndice A: Análise do Sistema de Resfriamento do Dalek

Para verificar se o ventilador é suficiente para resfriar o hardware do Dalek, os autores calculam o balanço térmico [§ p.22]:

Resultado: Q(sol) + Q(câmeras) + Q(ventilador) – Q(ar) = 168 + 5 + 1,6 – 277 = –102 W (negativo = sistema pode ser resfriado adequadamente). A análise negligenou a convecção externa de ar para simular o pior cenário [§ p.22].


Informações de Publicação

Glossário

UAP
Fenômeno Aéreo Não Identificado (Unidentified Aerial Phenomena) — termo oficial adotado pelo governo dos EUA para objetos aéreos não identificados.
ADS-B
Vigilância Dependente Automática por Difusão (Automatic Dependent Surveillance-Broadcast) — sistema obrigatório em aeronaves nos EUA que transmite posição GPS em tempo quase real.
FOV
Campo de Visão (Field of View) — ângulo sólido visível por uma câmera.
LWIR
Infravermelho de Ondas Longas (Long-Wave Infrared) — faixa espectral de 7,5 µm a 13,5 µm usada pelas câmeras FLIR Boson 640.
NIR
Próximo ao Infravermelho (Near Infrared) — faixa espectral adjacente ao visível, de aproximadamente 700 nm a 1000 nm.
LTM-H
Método de Triangulação Linear Homogênea (Homogeneous Linear Triangulation Method) — algoritmo para estimar a posição 3D de um objeto a partir de múltiplas projeções 2D em câmeras calibradas.
CSOP
Problema de Otimização de Satisfação de Restrições (Constraint Satisfaction Optimization Problem) — framework utilizado para resolver o problema de correspondência entre detecções em múltiplas câmeras.
WGS 84
Sistema Geodésico Mundial 1984 (World Geodetic System 1984) — sistema de coordenadas de referência global utilizado pelo GPS.
NTP
Protocolo de Tempo de Rede (Network Time Protocol) — protocolo usado para sincronizar relógios de computadores; precisão típica de dezenas de milissegundos.
INU
Não-Uniformidade de Imagem (Image Non-Uniformity) — grupo de pixels que tendem a variar levemente de sua vizinhança local em câmeras infravermelhas sob certas condições de imageamento.
SFFC
Correção Suplementar de Campo Plano (Supplemental Flat-Field Correction) — procedimento de calibração para câmeras IR que compensa o calor gerado internamente pela câmera.
UUID
Identificador Único Universal (Universally Unique Identifier) — etiqueta digital atribuída a cada objeto detectado para rastreamento consistente entre câmeras e ao longo do tempo.
YOLO
You Only Look Once — framework de detecção de objetos em imagens baseado em rede neural profunda, utilizado para identificar objetos de interesse nos frames capturados pelas câmeras.
DeepSORT
Deep Simple Online and Realtime Tracking — algoritmo que vincula detecções de objetos entre múltiplos quadros de imagem sequenciais, habilitando rastreamento e estimativa de cinemática.

Perguntas frequentes

Por que são necessárias pelo menos duas câmeras para localizar um UAP em 3D?
Uma única câmera fornece apenas a posição angular do objeto (azimute e elevação), mas não o alcance (distância). São necessárias pelo menos duas câmeras calibradas, separadas por distância conhecida, capturando o objeto quase simultaneamente, para triangular sua posição em três dimensões [§ p.1].
Qual é a maior fonte de erro de localização identificada nos experimentos de simulação?
A incerteza na orientação da câmera (parâmetros extrínsecos rotacionais) é, de longe, a maior fonte de erro de localização, com modas de erro na ordem de 10⁴ metros nas simulações [§ p.17–18].
Como o sistema calibra a orientação das câmeras sem intervenção humana constante?
Três métodos são usados: (1) dados de aeronaves com ADS-B; (2) drones equipados com GPS voados manualmente; (3) identificação automática de estrelas em imagens do céu noturno. O terceiro método é totalmente automatizável e executado a cada noite [§ p.8–9].
O sistema é capaz de detectar objetos a mais de 10 km de distância?
Sim. Testes preliminares indicam que aviões de grande porte (~60 m) são facilmente detectáveis a 20 km e mal detectáveis a 35 km pelas câmeras FLIR Boson 640. Objetos de ~20 m são mal detectáveis a 23 km [§ p.5–6].
Qual é a diferença máxima aceitável no tempo de captura entre câmeras para localização precisa?
Para atingir precisão de localização de 10 m (assumindo que a dessincronização seja a única fonte de erro), os tempos de captura de imagem devem diferir por não mais que cerca de 10⁻³ segundos [§ p.18].
O artigo confirma a natureza de UAP como fenômenos não humanos?
Não. O artigo descreve um sistema de medição para coletar dados cinéticos (posição, velocidade, aceleração) que poderiam potencialmente distinguir objetos anômalos de objetos comuns. O documento não formula conclusões sobre a natureza dos UAP [§ p.1–2].
Qual algoritmo de detecção de objetos é usado no sistema?
O sistema usa o framework YOLO (You Only Look Once) para detecção de objetos nas imagens e o algoritmo DeepSORT para vincular detecções entre múltiplos quadros, permitindo rastreamento e estimativa de velocidade e aceleração [§ p.3–4].

Entidades citadas

Documentos relacionados