TECNOLOGIA

Trabalho coletivo (e inconsciente)

Professor da Universidade Carnegie Mellon, nos Estados Unidos, cria ferramentas que transformam internautas em tradutores e digitalizadores de textos. E boa parte dos colaboradores, muito provavelmente, nem sabe que está ajudando na tarefa

INFORMAÇÕES PESSOAIS:

RECOMENDAR PARA:

- AMIGO + AMIGOS
Preencha todos os campos.

postado em 09/09/2013 16:00 / atualizado em 09/09/2013 11:15

Roberta Machado

Como você gasta seu tempo na internet? Talvez você não saiba, mas, mesmo quando navega à toa, você pode trabalhar na digitalização ou na tradução de textos. Isso graças à mente criativa do guatemalteco chamado Luis von Ahn, que viu no tempo ocioso do internauta uma oportunidade. A proposta é simples: usar os 2 milhões de usuários da rede para cumprir tarefas trabalhosas demais para uma só pessoa.

O mais recente fruto da teoria colaborativa de Von Ahn é o site Duolingo, que ensina francês, português, italiano e alemão sem cobrar nada pelo serviço nem recorrer a anúncios: todos os custos são pagos por serviços prestados pelos próprios alunos. A grande jogada é que, enquanto aprendem uma nova língua, os usuários traduzem textos que, depois, são comercializados pelo site.

A iniciativa já conta com 9 milhões de estudantes e atrai 50 mil novos membros por dia. “Acho que o sucesso vem da combinação de ser gratuito e agradável. As pessoas sentem que estão aprendendo”, resume o criador da ferramenta em entrevista por telefone ao Correio. As lições são apresentadas ao internauta num modelo de jogo em que as perguntas valem moedas e a pessoa têm direito a um número limitado de corações: quando perde todas as vidas, o aluno precisa recomeçar a lição.

O sistema não forma especialistas na gramática ou na literatura estrangeiras, apenas apresenta uma série de perguntas rápidas para treinar a capacidade de tradução do aluno. A cada palavra nova, o internauta recebe diversas combinações de frases para converter em outro idioma, às vezes por perguntas de múltipla escolha, outras escrevendo a sentença ou ainda selecionando os verbetes corretos. Há ainda a opção de usar o microfone do computador para testar a pronúncia. Por enquanto, a única língua disponível para os que só falam português é a inglesa. Mas, em breve, a plataforma promete disponibilizar outros idiomas para os brasileiros, além de ensinar outras, como a árabe, chinesa e japonesa.

Quem usa o sistema costuma fazer os exercícios várias vezes por dia pelo smartphone ou se dedicar a sessões mais longas pelo computador. Mas Von Ahn garante que os resultados devem ser os mesmos das duas formas. Um estudo feito pela Universidade de Nova York estima que 34 horas de exercícios no site ou no aplicativo para celular são equivalentes a um semestre de aulas de línguas na instituição. Com 300 horas, seria possível aprender o novo idioma.

Depois de algumas lições, o site passa a recomendar traduções de textos para os alunos. Os usuários não são obrigados a cumprir a tarefa para continuar com as aulas, mas mesmo assim muitos escolhem fazê-lo para testar seus conhecimentos. O guatemalteco diz que os usuários dão conta do recado. “A qualidade é boa, porque não é só uma pessoa fazendo. São várias, e elas corrigem uma a outra. É bem parecido com a Wikipédia”, explica. Ele admite, no entanto, que a tradução nem sempre é perfeita. “Não é boa para algumas coisas, como textos jurídicos. Mas para coisas como artigos de notícias e páginas da internet, é muito boa”, compara. O Duolingo já fornece traduções à Wikipédia e a algumas empresas de notícia, mantidas em segredo por Von Ahn, que também é professor da universidade Carnegie Mellon, nos Estados Unidos.

Código
A força-tarefa de bilíngues criada por Luis von Ahn tenta compensar a dificuldade que os computadores têm em fazer alguns tipos de tarefas. Mesmo com avançadas ferramentas de tradução existentes, não é raro que os robôs tropecem nos verbetes mais subjetivos ou vacilem em formar frases lógicas com expressões coloquiais. O mesmo acontece na hora de digitalizar livros. Os sistemas ópticos de reconhecimento de caracteres (OCR, em inglês) nem sempre são capazes de ler um texto com a destreza humana. Em livros escritos há mais de 50 anos, por exemplo, as máquinas não reconhecem 30% das palavras impressas.

Esse problema tem sido resolvido nos últimos anos com outra invenção do guatemalteco. Mesmo sem perceber, você já deve ter colaborado para a digitalização de livros com o sistema reCaptcha, que usa aquelas irritantes palavras distorcidas como protocolo para o envio de informações pela rede. “O captcha é um desafio, que procura saber se  do outro lado é um computador ou um humano. A ideia é que, se você distorcer bastante as letras, o humano ainda consegue reconhecê-las, mas a máquina, não”, explica André Luiz Moura dos Santos, professor do Centro de Ciências e Tecnologia da Universidade Estadual do Ceará (UECE). A ferramenta de segurança procura barrar a ação de spammers, programas que inundam a internet com e-mails e acessos por meio de ações automáticas.

O reCaptcha oferece duas palavras ao internauta: enquanto uma procura provar a humanidade do visitante, a outra é, na verdade, um pedaço de um livro ou artigo que está sendo digitalizado. Se várias pessoas decifram os caracteres da mesma forma, o reCaptcha confirma o significado da imagem e a combina com todas as outras que passaram pelo mesmo processo. No ritmo de 100 milhões de captchas enviados por dia, a ferramenta é capaz de digitalizar 2,5 milhões de livros por ano. Até hoje, 30 anos de edições do jornal diário The New York Times foram convertidas para formato digital.

O modelo foi comprado em 2009 pelo gigante Google, e foi adotado por sites como Twitter e Facebook. O uso de duas palavras-chave em vez de uma provou aumentar a segurança do padrão captcha original. A proteção extra é necessária contra o desenvolvimento de bots que se tornam cada dia mais capazes de ler as letras. “O campo de inteligência artificial tem evoluído constantemente. O que é difícil para um computador reconhecer hoje não será mais no futuro”, aponta Santos, que também é diretor do Information Security Research Team (INSRT) da UECE.  A chance de que um robô acerte as duas palavras distorcidas, de acordo com o site que oferece o serviço, é menor que uma em 10 milhões.

O criador do reCaptcha e do Duolingo já pensa em outras formas de usar o crowdsourcing para unir educação e produção de conteúdo. Ele revela que  trabalha na possibilidade de ensinar programação pela internet de uma forma tão simples quanto o site de idiomas. “A ideia é ajudar as pessoas a programarem computadores. Mas, ao faze-rem isso, elas estarão encontrando erros em programas ou ajudando a fazer novos”, adianta Von Ahn.

Estranhos significados

A falta de tato da tecnologia com o significado das palavras rende piadas interessantes sobre o reCaptcha. Internautas já criaram um Tumblr chamado captchart, dedicado a criar ilustrações e montagens fotográficas das combinações absurdas dos termos apresentados pela ferramenta, como “bolo de flatulência” ou “bombeiro piromaníaco”.
Tags: