Em vez de uma pessoa, uma gravação. Nos últimos anos, tornou-se cada vez mais comum a interação com sistemas munidos de respostas automáticas de voz, seja ao entrar em contato com empresas por telefone, ao entrar em um estacionamento de shopping ou ao usar o GPS do carro. Quem acompanhou a evolução desse tipo de tecnologia pode atestar o quanto ela soa, a cada dia, mais natural. O som emitido pelo programa de tradução do Google, por exemplo, já foi usado para encomendar pizza pelo telefone sem que o atendente desconfiasse de que falava com uma máquina. Outros exemplos que costumam impressionar os usuários são as assistentes pessoais de smartphones Siri, da Apple, ou Iris, para o Android. Mas até que ponto as características dessas vozes podem influenciar o comportamento dos usuários? Há um tom mais adequado para que os comandos se tornem mais fáceis de ser aprendidos?
Pesquisadores da Sociedade de Fatores Humanos e Ergonômicos, nos Estados Unidos, resolveram investigar o assunto. Rochelle Edwards e Philip Kortum partiram da hipótese de que a personalidade e o gênero das vozes automatizadas exercem um efeito inconsciente na percepção da tecnologia. Para isso, eles analisaram, com a ajuda de voluntários, a facilidade de utilização de um serviço como aqueles empregados por empresas de cartão de crédito, bancos e GPS. No estudo, foi usado um sistema de voz para coletar informações sobre a saúde do usuário. Quase 300 participantes responderam o questionário sendo orientados por diferentes tipos de voz ; que podiam ser de um homem ou de uma mulher e variar de entonação ; e depois avaliaram a usabilidade do sistema (veja infografia).
Os autores descobriram que as chamadas unidades de resposta audível (URAs) com vozes masculinas tendem a ser percebidas como mais usáveis do que aquelas com vozes femininas, mesmo que as duas tenham sido consideradas igualmente confiáveis. ;A voz é o principal elemento em uma interface URA, como elementos gráficos são para uma página da web. E o estudo foi uma primeira tentativa de compreender seu impacto sobre a usabilidade percebida de tais sistemas;, argumenta Kortum. Os pesquisadores mostraram que algumas modificações simples no desenho desses sistemas pode ter um impacto sobre a capacidade de utilização de interfaces de voz . ;Qualquer um que usa uma URA sabe como elas podem ser frustrantes. Grande parte disso se deve ao fato de elas serem mal projetadas;, conclui.
O pesquisador admite que o resultado surpreendeu, uma vez que, principalmente no começo, a maioria dos sistemas utilizava vozes de mulheres. Para o professor de engenharia de computação João Carlos Lopes Fernandes, do Instituto Mauá de Tecnologia, isso ocorria porque os serviços eram vistos como uma espécie de secretária, profissão tida como essencialmente feminina. No entanto, o especialista observa que o uso de locutores homens tem se tornado cada vez mais comum e cita como exemplo o serviço de atendimento da Microsoft Brasil, que antes utilizava uma voz feminina, substituída depois por uma masculina. Na opinião da locutora Regina Bittar, dona da voz utilizada no Google Tradutor no Brasil, o mercado ainda não se pauta tanto pelo gênero, mas pela capacidade de o profissional tornar a experiência mais pessoal para o usuário. Além disso, segundo ela, o mercado ainda busca muito as voz feminina ;por ser associada à receptividade e à simpatia; (leia Três perguntas para).
Reconhecimento
O coordenador da iniciação científica do Instituto Nacional de Telecomunicações, Carlos Alberto Ynoguti, acrescenta um dado curioso: para as máquinas, a voz masculina também é mais ;agradável;. Em uma experiência, ele constatou que os programas de reconhecimento de fala (usados, por exemplo, para ligar para uma pessoa apenas dizendo o nome dela próximo ao aparelho) são mais sensíveis à voz masculina. Ele gravou 20 homens e 20 mulheres para testar o sistema de reconhecimento de fala que desenvolveu em sua tese de doutorado, em 2000. No fim, ele percebeu que a taxa de acertos do programa ao receber um comando de voz masculina era maior.
;O sistema dessas interfaces tem o lado do reconhecimento e o feedback. O desempenho também fica comprometido quando o sistema não entende a resposta, o que é muito comum;, conta. Ele lembra que, no Brasil, as formas de fala são muito diferentes, o que dificulta o desenvolvimento de um sistema padrão. Além disso, se for aplicado em um dispositivo móvel, o serviço fica sujeito aos mais diferentes ruídos. Em produtos como a Siri e a Iris, os softwares sofrem uma atualização contínua, o que permite a melhora no reconhecimento de voz.
Três perguntas para
Regina Bittar, locutora e ;a voz; do Google Tradutor no Brasil
Os resultados encontrados na pesquisa correspondem ao observado pela senhora no mercado brasileiro?
Mais do que uma questão de vozes femininas ou masculinas, como apresenta a pesquisa, eu acredito que o mercado está tendendo para que a voz sintetizada de atendimentos como URA, GPS, esperas telefônicas ou outros sistemas se aproxime ao máximo possível de um atendimento pessoal. Atualmente, no mercado brasileiro, a voz feminina é mais procurada para esse tipo de locução, por ser associada à receptividade e à simpatia, enfim, características mais ligadas ao estereótipo feminino.
Como a senhora percebe o impacto da voz automatizada no usuário de sistemas como o GPS e o Google?
Acredito que a curiosidade sobre quem está por trás de uma voz quando não temos uma imagem vem desde os tempos do rádio. Hoje, soma-se a isso a dependência que criamos de nossos aparelhos, e quase todos eles possuem uma voz. E essa voz cria uma identidade, uma personalidade que, no fundo, representa a marca e cria uma empatia com o usuário.
A senhora acredita que o gênero, a formalidade, o tom e outros aspectos influenciam o comportamento do usuário?
Claro que sim. Por isso é muito importante o cliente direcionar que tipo de locução ele quer no seu atendimento telefônico ou produto. Cada caso requer um tipo de locução, que vai ter identidade com determinado tipo de público. Percebo isso em cada trabalho que realizo.