Bloomberg milhares de funcionários da Amazon estão ouvindo gravações de voz Echo

A Amazon tem milhares de funcionários ouvindo clipes de áudio da Echo como parte da melhoria do aprendizado de máquina do Alexa, para que o assistente pessoal possa responder melhor aos comandos de voz.

Essas pessoas estão ouvindo o que alguns proprietários do Alexa dizem ao assistente, revisando, transcrevendo e anotando gravações de áudio para ajudar a treinar o modelo de aprendizado de máquina do Alexa.

A Bloomberg tem a história:

O trabalho é principalmente mundano. Um trabalhador em Boston disse que extraiu dados de voz acumulados para declarações específicas como 'Taylor Swift' e os anotou para indicar que o pesquisador era o artista musical.

Até aí tudo bem, mas ...

Ocasionalmente, os ouvintes pegam coisas que os donos de eco provavelmente preferem ficar em privado: uma mulher cantando mal na tecla do chuveiro, digamos, ou uma criança gritando por socorro. As equipes usam salas de bate-papo internas para compartilhar arquivos quando precisam de ajuda para analisar uma palavra confusa - ou encontrar uma gravação divertida.

Consigo compartilhar a gravação de áudio de um cliente com um colega de trabalho com o objetivo de concluir o trabalho. Mas compartilhar um clipe de áudio com um colega só porque o usuário pode ter dito algo engraçado ou estúpido parece totalmente errado e pouco profissional para mim.

Às vezes, ouvem gravações que consideram perturbadoras ou possivelmente criminosas. Dois dos trabalhadores disseram ter recebido o que acreditam ser um abuso sexual. Quando algo assim acontece, eles podem compartilhar a experiência na sala de bate-papo interna como uma maneira de aliviar o estresse..

Embora a Amazon tenha um processo em andamento para que seus funcionários sigam sempre que ouvirem algo angustiante, alguns funcionários foram rejeitados em termos inequívocos com a explicação de que não era tarefa da Amazon interferir.

Para aqueles preocupados com a privacidade, o relatório afirma que as pessoas desta equipe estão ouvindo apenas algumas das gravações de voz que foram capturadas nas casas e escritórios dos proprietários da Echo..

Um porta-voz da Amazon comentou:

Levamos a sério a segurança e a privacidade das informações pessoais de nossos clientes. Apenas anotamos uma amostra extremamente pequena de gravações de voz Alexa, a fim de melhorar a experiência do cliente.

Por exemplo, essas informações nos ajudam a treinar nossos sistemas de reconhecimento de fala e entendimento de linguagem natural, para que o Alexa entenda melhor suas solicitações e garanta que o serviço funcione bem para todos.

Os arquivos Sudio são despojados de informações identificáveis, como o nome e o endereço completo do usuário. Dito isto, a Amazon poderia ter sido mais transparente com sua coleta de dados:

O processo de revisão de voz Alexa, descrito por sete pessoas que trabalharam no programa, destaca o papel humano muitas vezes esquecido no treinamento de algoritmos de software. Em materiais de marketing, a Amazon diz que Alexa 'vive na nuvem e está sempre ficando mais inteligente'. Mas, como muitas ferramentas de software criadas para aprender com a experiência, os humanos estão fazendo parte do ensino.

Os usuários podem ajustar as configurações para impedir que a Amazon use suas gravações de voz para melhorar o Alexa.

A gigante do varejo on-line reconhece que as solicitações do Alexa estão sendo usadas "para treinar nossos sistemas de reconhecimento de fala e compreensão de linguagem natural", mas isso está oculto em uma lista de perguntas freqüentes em seu site. Não importa como você o veja, o reconhecimento de voz contextual é um osso duro de roer, mas o aprendizado de máquina promete ser a solução certa. O problema é que os modelos de aprendizado de máquina devem ser treinados.

A Amazon tem equipes de pessoas que rotulam e categorizam as consultas de voz do Alexa

Por exemplo, a Apple treinou o Face ID com mais de um bilhão de fotografias dos rostos das pessoas. Quanto ao reconhecimento de fala, alcançar alta precisão requer grandes quantidades de dados rotulados.

É por isso que o lançamento do Siri em um novo idioma não é possível sem dados suficientes para treinar os modelos acústicos, e esses dados devem ser provenientes de pessoas reais realizando consultas de voz reais. A única diferença entre Amazon e Apple é que o primeiro tem seres humanos ouvindo algumas dessas gravações, enquanto o último, presumível, não.

Agora que você sabe que a Amazon tem uma equipe global ouvindo clipes de áudio Alexa, é mais ou menos provável que você continue usando os produtos Echo?

Deixe-nos saber, deixando um comentário abaixo.