Celina Aquino
postado em 07/03/2014 16:00
Belo Horizonte ; A cada segundo, milhões de pessoas em todo o mundo expressam o que pensam nas redes sociais. Como a internet virou um espaço democrático para divulgar opiniões sobre os mais variados temas, por que não aproveitar as informações para descobrir qual é a percepção de um conjunto de usuários da rede sobre fatos, produtos, marcas, pessoas ou empresas? Com o apoio de cinco alunos de iniciação científica, o professor do Departamento de Ciência da Computação da Universidade Federal de São João del-Rei (UFSJ) Leonardo Chaves Dutra da Rocha desenvolveu uma ferramenta capaz de interpretar automaticamente textos postados na web, em tempo real. A invenção pode ser útil neste ano eleitoral, para avaliar, por exemplo, o desempenho dos candidatos nos debates televisivos.
Considerando o dinamismo da internet, o volume de dados e o tamanho dos textos (geralmente curtos), o pesquisador resolveu criar há dois anos um novo algoritmo (conjunto de instruções repassadas ao computador). ;Quando se fala em web, tudo muda. Os outros algoritmos não dão conta da quantidade de dados e da mudança rápida de sentimento. A rede é muito dinâmica;, justifica Rocha. Batizada de Análise de Sentimento por Inspeção Coletiva (em inglês, Sentiment Analysis by Collective Inspection, ou Saci, sigla em homenagem ao escritor Monteiro Lobato), a ferramenta está disponível, por enquanto, para análises no Twitter. No mês que vem, devem entrar no ar as versões para Facebook, Google%2b e Instagram.
Sem precisar ler qualquer comentário, Rocha consegue avaliar qual é a percepção geral dos internautas em relação a determinado assunto. Definido o alvo da análise, o pesquisador cria um ranking com as palavras que mais aparecem e o repassa para o computador, que faz a coleta automática dos posts nas redes sociais. Em seguida, classificam-se os termos como positivos, negativos ou neutros, de acordo com o contexto. ;Divertido é um comentário positivo para uma série de televisão, mas, no cenário de eleições, pode ter conotação negativa;, lembra o pesquisador. Os sinônimos seguem a mesma lógica, e os antônimos se encaixam na lista do sentimento inverso. Gráficos gerados automaticamente permitem avaliação rápida e eficiente.
Equipe responsável pelo desenvolvimento: análise de até 10 mil tuítes por segundo |
Idioma
A nova ferramenta de análise está em teste há oito meses na língua inglesa. No dia em que a televisão veiculou o último capítulo da série norte-americana Dexter, o Saci conseguiu captar automaticamente e em tempo real a opinião dos espectadores a partir dos comentários no Twitter. O professor da UFSJ conta que visitou vários sites especializados e confirmou, por meio de comentários e enquetes, que a maioria dos fãs do programa não havia gostado do fim, como apontou o algoritmo.
A final da liga de futebol americano dos Estados Unidos, chamada de Super Bowl, deu a prova de que a ferramenta era mesmo eficiente. Para se ter uma ideia, durante o evento esportivo mais assistido pelos norte-americanos, o número de tuítes sobre o evento chegava a 3 mil por minuto. ;Percebemos que os torcedores de ambos os times estavam bem confiantes antes da partida, porque o sentimento negativo era muito baixo. Estava com o computador do lado e, com dois segundos de jogo, teve uma roubada de bola. De repente, começaram a subir os comentários negativos do time que estava perdendo;, relata. Rocha ressalta que a identificação feita pelo Saci do sentimento das torcidas era coerente com o que ocorria na partida, em tempo real.
A ferramenta consegue avaliar até 10 mil posts por segundo. O desafio, agora, é adaptar o Saci para a língua portuguesa, muito mais complexa que o inglês. Em fase de teste, a ferramenta em português está interpretando o sentimento dos internautas em relação a um reality show, o que representa bem a dinâmica da web, pois as opiniões mudam a todo instante. Rocha adianta que uma versão em espanhol também será produzida.
Rocha defende que o Saci terá bastante utilidade para o Brasil em 2014. Nas eleições presidenciais, por exemplo, será possível ter noção do sentimento das pessoas em relação a cada candidato na diferentes fases da campanha. ;Como faz análise em tempo real, o algoritmo pode apontar quem ganhou um debate;, exemplifica o professor. A ferramenta pode medir ainda a impressão geral sobre os aeroportos e os estádios de futebol durante a Copa do Mundo.