Alguns funcionários da Amazon que ouvem as solicitações de Alexa têm acesso aos endereços residenciais dos usuários

A Bloomberg informou recentemente que a Amazon tem um projeto com alguns de seus funcionários ouvindo algumas das gravações de áudio feitas pelos alto-falantes Alexa quando os usuários interagem com eles, mas agora parece que essas pessoas também têm acesso aos endereços residenciais dos clientes..

Um novo relatório da Bloomberg desta manhã cita cinco funcionários anônimos da equipe Alexa Data Services da Amazon, confirmando que eles podem encontrar facilmente o endereço residencial de um cliente digitando suas informações de latitude e longitude em software de mapeamento como o Google Maps.

Embora não haja indicação de que os funcionários da Amazon com acesso aos dados tenham tentado rastrear usuários individuais, dois membros da equipe Alexa expressaram preocupação com a Bloomberg que a Amazon estava concedendo acesso desnecessariamente amplo aos dados dos clientes, o que facilitaria a identificação do proprietário de um dispositivo..

Bem, isso certamente não parece promissor.

Alguns dos funcionários encarregados de analisar as gravações dos clientes Alexa usam uma ferramenta da Amazon que exibe clipes de áudio juntamente com dados sobre o dispositivo que capturou a gravação. Muitas das informações armazenadas pelo software, incluindo um ID do dispositivo e um número de identificação do cliente, não podem ser facilmente vinculadas ao usuário..

É assim que deve ser.

No entanto, a Amazon também coleta dados de localização para que o Alexa possa responder com mais precisão às solicitações, por exemplo, sugerindo um restaurante local ou informando o clima nas proximidades de Ashland, Oregon, em vez de distante Ashland, Michigan.

Não havia nada de errado em Alexa coletar dados de localização de usuários para melhorar seu serviço, não fosse pelo fato de que alguns de seus funcionários pudessem vê-lo em primeiro lugar.

Em uma demonstração vista pela Bloomberg, um membro da equipe da Amazon colou as coordenadas de um usuário, armazenadas no sistema como latitude e longitude, no Google Maps. Em menos de um minuto, o funcionário passou de uma gravação do comando Alexa de uma pessoa para o que parecia ser uma imagem de sua casa e o endereço correspondente.

Bem, isso certamente é perturbador, mas qualquer pessoa pode procurar a localização de uma pessoa no Google Maps, desde que possua latitude e longitude, não há nada de especial nisso. O que é preocupante é o fato de que as coordenadas do usuário estão disponíveis para alguns funcionários da Amazon.

Outra ferramenta interna que eles estão usando armazena mais dados pessoais.

Depois de digitar um número de identificação do cliente, esses trabalhadores - chamados anotadores e verificadores - podem ver os endereços residencial e comercial e os números de telefone que os clientes inseriram no aplicativo Alexa quando configuraram o dispositivo, disse o funcionário. Se um usuário optar por compartilhar seus contatos com o Alexa, seus nomes, números e endereços de email também aparecerão no painel.

Sim, mas por que mostrar todas essas informações no painel?

Esses dados estão no sistema para que, se um cliente disser 'Enviar uma mensagem para Laura', os revisores humanos possam garantir que os transcritores tenham escrito o nome corretamente, para que o software aprenda a emparelhar essa solicitação com a Laura na lista de contatos..

Não está claro no relatório quantos funcionários e contratados podem ter acesso a esses recursos. Dois funcionários da Amazon disseram acreditar que a grande maioria dos funcionários do grupo Alexa Data Services conseguiu usar esse software cerca de um ano atrás.

Outro funcionário disse que, "até recentemente", o sistema exibia números de telefone completos com alguns dígitos ocultos. "Até recentemente", ou seja, depois que a Bloomberg relatou isso, certo?

A Amazon limitou ainda mais o acesso aos dados após o relatório da Bloomberg em 10 de abril, disseram dois funcionários. Alguns associados de dados, que transcrevem, anotam e verificam gravações de áudio, chegaram ao trabalho para descobrir que não tinham mais acesso às ferramentas de software que usavam anteriormente em seus trabalhos, disseram essas pessoas..

Até o momento, seu acesso não havia sido restaurado.

Preocupantemente, o relatório original incluía uma declaração atribuída a um porta-voz da Amazon negando que as pessoas que ouviam as gravações do Alexa tivessem acesso a outras informações..

Os funcionários não têm acesso direto às informações que podem identificar a pessoa ou a conta como parte desse fluxo de trabalho. Todas as informações são tratadas com alta confidencialidade e usamos autenticação multifator para restringir o acesso, criptografia de serviço e auditorias do nosso ambiente de controle para protegê-lo.

Em uma nova declaração respondendo à história, no entanto, a Amazon mudou de posição e agora está chamando o acesso a ferramentas internas de "altamente controlado":

O acesso às ferramentas internas é altamente controlado e é concedido apenas a um número limitado de funcionários que exigem que essas ferramentas treinem e melhorem o serviço processando uma amostra extremamente pequena de interações.

Nossas políticas proíbem estritamente o acesso de funcionários ou o uso de dados de clientes por qualquer outro motivo e temos uma política de tolerância zero por abuso de nossos sistemas. Auditamos regularmente o acesso dos funcionários a ferramentas internas e limitamos o acesso sempre que possível.

Antes de chegarmos a conclusões prematuras, é preciso repetir que esse não é um projeto secreto - a Amazon não esconde o fato de que vale a pena que as pessoas ouçam as conversas com os clientes. Como a Apple e outras empresas de tecnologia, a Amazon mantém trechos anônimos de gravações de áudio em seus servidores por um período de tempo para ajudar a melhorar o reconhecimento de voz e a IA.

"Usamos suas solicitações ao Alexa para treinar nossos sistemas de reconhecimento de fala e compreensão de linguagem natural", diz a empresa em uma lista de perguntas frequentes.


É fato da vida no mundo da tecnologia que os sistemas de inteligência artificial que ajudam as máquinas a entender o significado das palavras faladas devem ser treinados regularmente usando gravações reais, que é a única maneira confiável de melhorar sua precisão..

Como o porta-voz da Amazon explicou à Bloomberg:

Apenas anotamos uma amostra extremamente pequena de gravações de voz Alexa, a fim de melhorar a experiência do cliente. Essas informações nos ajudam a treinar nossos sistemas de reconhecimento de fala e compreensão de linguagem natural para que o Alexa possa entender melhor suas solicitações e garantir que o serviço funcione bem para todos.

A Apple faz exatamente a mesma coisa: a Siri tem ajudantes humanos que ouvem alguns clipes, vinculados a um identificador aleatório e armazenados em servidores por seis meses.

Depois disso, o identificador aleatório é completamente removido, mas os dados são retidos por períodos mais longos para melhorar o reconhecimento de voz da Siri. Sim, o Google também tem revisores encarregados de ouvir alguns trechos do assistente para ajudar a treinar e melhorar o serviço. As gravações do Google são removidas de qualquer informação pessoal identificável e o áudio em si é distorcido.

Como Florian Schaub, professor da Universidade de Michigan, que pesquisou questões de privacidade relacionadas a alto-falantes inteligentes, disse:

Você não pensa necessariamente em outro humano ouvindo o que está dizendo ao seu orador inteligente na intimidade de sua casa. Acho que fomos condicionados à suposição de que essas máquinas estão apenas aprendendo máquinas mágicas.

Mas o fato é que ainda há processamento manual envolvido.

Se isso é uma preocupação com a privacidade ou não, depende de quão cautelosa a Amazon e outras empresas são quanto ao tipo de informação que anotaram manualmente e como apresentam essas informações a alguém..

Para o contexto, aqui está um trecho da história original:

Alguns revisores do Alexa têm a tarefa de transcrever os comandos dos usuários, comparar as gravações com a transcrição automática do Alexa, digamos, ou anotar a interação entre usuário e máquina. O que a pessoa perguntou? Alexa forneceu uma resposta eficaz?

Outros observam tudo o que o orador capta, incluindo conversas em segundo plano, mesmo quando as crianças estão falando. Às vezes, os ouvintes ouvem os usuários discutindo detalhes particulares, como nomes ou dados bancários; nesses casos, eles devem marcar uma caixa de diálogo indicando os dados críticos. Eles então passam para o próximo arquivo de áudio.

Segundo o site da Amazon, nenhum áudio é armazenado, a menos que o Echo detecte a palavra de ativação ou seja ativado pressionando um botão. Mas, às vezes, o Alexa parece começar a gravar sem nenhum aviso e os arquivos de áudio começam com uma televisão estridente ou um ruído ininteligível. Independentemente de a ativação estar errada, os revisores devem transcrevê-la. Uma das pessoas disse que os auditores transcrevem até 100 gravações por dia quando Alexa não recebe nenhum comando de ativação ou é acionado por acidente.

Os relatórios originais da Bloomberg alegavam que “os milhares de funcionários” que trabalham neste projeto às vezes também precisam revisar clipes que podem ser bastante angustiantes - e até alguns que são potencialmente criminosos. Em um caso relatado, dois funcionários da Amazon ouviram o que acham que era agressão sexual, mas foram instruídos pelo empregador a não relatar o incidente porque "não era tarefa da Amazon interferir".

Em casos tão extremos, é muito trabalho da Amazon interferir.

Por que a empresa não permite que os funcionários que ouvem as gravações do Alexa denunciem esses incidentes à polícia e potencialmente salvem vidas? Se alguém invadir minha casa e me segurar à mão armada, quero que quem estiver ouvindo possa ver meu endereço residencial e até alertar a polícia, se necessário.

Pensamentos?