SIGA O
Correio Braziliense

publicidade

Os humores da rede

Pesquisadores brasileiros criam algoritmo capaz de interpretar, instantaneamente, a percepção de um grupo de internautas sobre temas variados. O sistema pode ser útil, por exemplo, para medir a reação das pessoas na web durante campanhas eleitorais

INFORMAÇÕES PESSOAIS:

RECOMENDAR PARA:

- AMIGO + AMIGOS
Preencha todos os campos.

postado em 07/03/2014 16:00

Celina Aquino

 

Belo Horizonte — A cada segundo, milhões de pessoas em todo o mundo expressam o que pensam nas redes sociais. Como a internet virou um espaço democrático para divulgar opiniões sobre os mais variados temas, por que não aproveitar as informações para descobrir qual é a percepção de um conjunto de usuários da rede sobre fatos, produtos, marcas, pessoas ou empresas? Com o apoio de cinco alunos de iniciação científica, o professor do Departamento de Ciência da Computação da Universidade Federal de São João del-Rei (UFSJ) Leonardo Chaves Dutra da Rocha desenvolveu uma ferramenta capaz de interpretar automaticamente textos postados na web, em tempo real. A invenção pode ser útil neste ano eleitoral, para avaliar, por exemplo, o desempenho dos candidatos nos debates televisivos.

Considerando o dinamismo da internet, o volume de dados e o tamanho dos textos (geralmente curtos), o pesquisador resolveu criar há dois anos um novo algoritmo (conjunto de instruções repassadas ao computador). “Quando se fala em web, tudo muda. Os outros algoritmos não dão conta da quantidade de dados e da mudança rápida de sentimento. A rede é muito dinâmica”, justifica Rocha. Batizada de Análise de Sentimento por Inspeção Coletiva (em inglês, Sentiment Analysis by Collective Inspection, ou Saci, sigla em homenagem ao escritor Monteiro Lobato), a ferramenta está disponível, por enquanto, para análises no Twitter. No mês que vem, devem entrar no ar as versões para Facebook, Google+ e Instagram.

Sem precisar ler qualquer comentário, Rocha consegue avaliar qual é a percepção geral dos internautas em relação a determinado assunto. Definido o alvo da análise, o pesquisador cria um ranking com as palavras que mais aparecem e o repassa para o computador, que faz a coleta automática dos posts nas redes sociais. Em seguida, classificam-se os termos como positivos, negativos ou neutros, de acordo com o contexto. “Divertido é um comentário positivo para uma série de televisão, mas, no cenário de eleições, pode ter conotação negativa”, lembra o pesquisador. Os sinônimos seguem a mesma lógica, e os antônimos se encaixam na lista do sentimento inverso. Gráficos gerados automaticamente permitem avaliação rápida e eficiente.

 

Equipe responsável pelo desenvolvimento: análise de até 10 mil tuítes por segundo 
Equipe responsável pelo desenvolvimento: análise de até 10 mil tuítes por segundo
 
Idioma
A nova ferramenta de análise está em teste há oito meses na língua inglesa. No dia em que a televisão veiculou o último capítulo da série norte-americana Dexter, o Saci conseguiu captar automaticamente e em tempo real a opinião dos espectadores a partir dos comentários no Twitter. O professor da UFSJ conta que visitou vários sites especializados e confirmou, por meio de comentários e enquetes, que a maioria dos fãs do programa não havia gostado do fim, como apontou o algoritmo.

A final da liga de futebol americano dos Estados Unidos, chamada de Super Bowl, deu a prova de que a ferramenta era mesmo eficiente. Para se ter uma ideia, durante o evento esportivo mais assistido pelos norte-americanos, o número de tuítes sobre o evento chegava a 3 mil por minuto. “Percebemos que os torcedores de ambos os times estavam bem confiantes antes da partida, porque o sentimento negativo era muito baixo. Estava com o computador do lado e, com dois segundos de jogo, teve uma roubada de bola. De repente, começaram a subir os comentários negativos do time que estava perdendo”, relata. Rocha ressalta que a identificação feita pelo Saci do sentimento das torcidas era coerente com o que ocorria na partida, em tempo real.

A ferramenta consegue avaliar até 10 mil posts por segundo. O desafio, agora, é adaptar o Saci para a língua portuguesa, muito mais complexa que o inglês. Em fase de teste, a ferramenta em português está interpretando o sentimento dos internautas em relação a um reality show, o que representa bem a dinâmica da web, pois as opiniões mudam a todo instante. Rocha adianta que uma versão em espanhol também será produzida.

Rocha defende que o Saci terá bastante utilidade para o Brasil em 2014. Nas eleições presidenciais, por exemplo, será possível ter noção do sentimento das pessoas em relação a cada candidato na diferentes fases da campanha. “Como faz análise em tempo real, o algoritmo pode apontar quem ganhou um debate”, exemplifica o professor. A ferramenta pode medir ainda a impressão geral sobre os aeroportos e os estádios de futebol durante a Copa do Mundo.
Tags:

publicidade

publicidade