A Apple manteve sua pesquisa autônoma em segredo por anos, mas agora a empresa publicou algumas de suas técnicas de software autônomo de direção que melhoram a detecção de obstáculos.
Publicado em 17 de novembro no repositório científico moderado de pré-impressão arXiv pelos especialistas em inteligência artificial e aprendizado de máquina da Apple, Yin Zhou e Oncel Tuzel, o documento descreve a detecção de pequenos obstáculos usando o método de detecção de Detecção e Variação da Luz (LiDAR).
Em vez de confiar em representações de recursos artesanais (por exemplo, uma projeção de vista aérea), os cientistas da Apple propõem uma nova arquitetura profunda treinável de ponta a ponta para detecção 3D baseada em nuvem de pontos. Chamado VoxelNet, ele pode operar diretamente em pontos 3D esparsos e capturar informações de forma 3D efetivamente.
As primeiras experiências com a tecnologia VoxelNet mostraram que ela supera os métodos avançados de detecção 3D baseados em LiDAR por uma grande margem. Em tarefas mais desafiadoras, como a detecção 3D de pedestres e ciclistas, a abordagem VoxelNet demonstrou resultados encorajadores, mostrando que fornece uma melhor representação e detecção 3D.
Caixas 3D verdes indicam possíveis obstáculos detectados usando o LiDAR
A capacidade de detectar com precisão objetos em nuvens de pontos 3D é crucial para evitar obstáculos.
Do artigo:
O VoxelNet divide uma nuvem de pontos em voxels 3D igualmente espaçados e transforma um grupo de pontos dentro de cada voxel em uma representação de recurso unificada através da camada de codificação de recurso de voxel (VFE) recém-introduzida. Dessa forma, a nuvem de pontos é codificada como uma representação volumétrica descritiva, que é então conectada a um RPN para gerar detecções.
Experimentos no benchmark de detecção de carros KITTI mostram que o VoxelNet supera os métodos de detecção 3D baseados em LiDAR de ponta em uma grande margem. Além disso, nossa rede aprende uma representação discriminativa eficaz de objetos com várias geometrias, levando a resultados encorajadores na detecção 3D de pedestres e ciclistas, com base apenas no LiDAR.
A arquitetura VoxelNet, ilustrada na parte superior da postagem, apresenta uma rede de aprendizado que usa uma nuvem de pontos brutos como entrada e, em seguida, particiona o espaço em voxels e transforma pontos dentro de cada voxel em uma representação vetorial que caracteriza as informações de forma..
É ótimo que a Apple esteja começando a se abrir quando se trata de sua pesquisa de direção autônoma, que se destina ao mercado de carona e ao serviço de transporte interno da empresa.
O fabricante do iPhone aparentemente fez um grande investimento em direção autônoma e tem "um grande projeto em andamento" naquele espaço, segundo o CEO Tim Cook.