A Apple publicou na quinta-feira uma nova entrada em seu blog do Machine Learning Journal, que é altamente técnico sobre a capacidade da Siri de reconhecer pontos de interesse com nomes obscuros em um mapa, como restaurantes, empresas e outros locais.
“A precisão dos sistemas de reconhecimento automático de fala melhorou fenomenalmente nos últimos anos devido à ampla adoção de técnicas de aprendizado profundo”, observa o post.
“Melhorias no desempenho, no entanto, foram feitas principalmente no reconhecimento do discurso geral; considerando que o reconhecimento preciso de entidades nomeadas, como pequenas empresas locais, permaneceu um gargalo de desempenho ".
A Apple superou esse desafio ao incorporar o conhecimento da localização do usuário em seu sistema de reconhecimento de fala e nos chamados modelos de linguagem baseados em geolocalização (Geo-LMs).
Como resultado da combinação, a Siri pode estimar melhor a sequência de palavras pretendida pelo usuário.
Isso reduziu a taxa de erro da Siri entre 41,9-48,4% em Boston, Chicago, Los Angeles, Minneapolis, Nova York, Filadélfia, Seattle e São Francisco, excluindo mega-cadeias.
Nos Estados Unidos, a Apple possui um Geo-LM para cada uma das 169 áreas estatísticas combinadas que cobrem cerca de 80% da população. Há também um Geo-LM global que abrange todas as áreas que não são definidas pelas Áreas Estatísticas Combinadas ao redor do mundo.
A combinação de localização e Geo-LMs permite que o sistema forneça resultados personalizados em termos de nomes de pontos de interesse ou retorne ao Geo-LM global se a localização não estiver disponível.
Tudo o que você precisa saber: Os modelos de idioma regionalmente específicos da Siri para reconhecimento de fala tornam fácil encontrar destinos locais. O método é independente do idioma, o que significa que a expansão do suporte do Geo-LM para outros locais além do inglês dos EUA é bastante direta.
Visite o Machine Learning Journal da Apple para obter mais detalhes.