Plataforma permite ensinar tarefas básicas a robôs por meio de celular

Gabriel Bandeira*

postado em 19/11/2018 06:00

Ilustração mostra homem mexendo em celular e robô respondendo aos comandos

Imagine que você tenha acabado de chegar do trabalho, e o cansaço o impede de preparar um bom jantar. Um robô inteligente e ágil poderia cumprir a tarefa e ainda lavar a louça. A máquina dos sonhos é objetivo também de pesquisadores do Laboratório de Inteligência Artificial da Universidade de Stanford, nos Estados Unidos, que criaram plataformas que permitem a participação de pessoas comuns no desafio de criá-la. Por meio do celular ou do computador, um indivíduo, de qualquer canto do mundo, consegue ensinar um braço robô a desempenhar atividades humanas básicas, como encaixar peças correspondentes e sobrepor objetos. A intenção é que o mesmo mecanismo permita, no futuro, treinar androides para cuidar de casa ou desempenhar atividades mais complexas.

As invenções ; RoboTurk e Surreal ; foram apresentadas, mês passado, na Conferência em Aprendizado de Robô em Zurique, na Suíça, e facilitam o recolhimento de dados para o processo de aprendizado de máquinas. Os interessados também poderão adaptar o sistema a qualquer tarefa que queira se ensinar a autômatos. ;É uma tecnologia muito animadora, pois permitirá que as pessoas sejam mais produtivas e independentes em todas as esferas da atividade humana. Elas não precisarão mais perder tempo com questões básicas, que serão realizadas por máquinas, e poderão se dedicar a tarefas mais complexas;, prevê Ajay Mandlekar, estudante de pós-doutorado em engenharia elétrica da Universidade de Stanford e participante do estudo.

A aprendizagem de máquina é um ramo da inteligência artificial desde a década de 1950. A partir de aplicações estatísticas, ela busca descobrir métodos para ensinar tarefas e tecnologias. Dentro disso, duas metodologias principais são observadas: as supervisionadas e as não supervisionadas. Enquanto a primeira é baseada no fornecimento prévio de dados e experiências para robôs, a segunda permite que a máquina aprenda na base dos erros e acertos.

As plataformas criadas pela equipe da Universidade de Stanford enquadram-se no primeiro grupo. Pessoas de qualquer parte do mundo podem ensinar duas atividades básicas ao RoboTurk: separar objetos em diferentes caixas e encaixar peças correspondentes. Basta abrir o aplicativo no celular e, quando conectado a um servidor externo, começar a mover o aparelho de um lado para o outro. Um robô criado em realidade virtual reproduzirá os movimentos da pessoa do outro lado da tela até finalizar a tarefa escolhida.

;A criação é significativa porque sistematiza um problema constante da robótica, que é o acesso a dados confiáveis e reprodutíveis;, opina Dante Barone, coordenador do Laboratório de Robótica Inteligente da Universidade Federal do Rio Grande do Sul (UFRGS). Isso acontece porque, como uma criança, robôs precisam aprender uma mesma tarefa a partir de múltiplas demonstrações. Assim, o perfeito desempenho de uma atividade por uma máquina está diretamente ligado ao número de exemplos que ela recebe. ;No entanto, não há mecanismos simples para coletar milhões de dados desse tipo. Trabalhar com robôs normalmente requer estar na mesma sala, o que pode consumir muito tempo;, observa Ajay Mandlekar.

Risco do viés

Para facilitar a coleta de dados, Mandlekar e seu time apostaram na técnica de crowdsourcing, em que inúmeras pessoas se tornam agentes computacionais para gerar experiências necessárias ao aprendizado do robô. O professor do Departamento de Ciência da Computação da Universidade Federal de Minas Gerais (UFMG) Douglas Macharet encara a metodologia com otimismo. ;Com essas múltiplas participações externas, evitamos viés na máquina, isto é, que ela só conheça uma única forma de desempenhar uma atividade. Contar com a participação voluntária das pessoas, contudo, acaba sendo um risco porque não sabemos se elas ensinarão corretamente;, pondera.

Durante um período de teste de quatro dias, o RoboTurk conseguiu reunir 2.200 demonstrações das duas tarefas, número significativo para otimizar a aprendizagem de máquina, segundo os criadores. ;As atividades que podem ser simuladas no RoboTurk não se restringem apenas às que criamos;, ressalta Mandlekar. ;Qualquer pessoa interessada pode simular, em realidade virtual, uma atividade que queira ensinar a uma máquina.;

Assim, a plataforma cria atividades personalizadas ; desde que factíveis por um braço robô ; e recolhe os dados das experiências em um armazenamento de nuvem para aplicá-los em robôs reais. ;Para isso, porém, criaremos algoritmos capazes de levar os dados coletados das experiências virtuais até uma máquina real;, afirma Mandlekar.

"A equipe precisará testar a criação no mundo real. Não tem como fugir: simulação não é realidade. Em um estágio inicial, é bom utilizar espaços recriados, mas eles não conseguem reproduzir exatamente todos os obstáculos que um robô enfrentaria"
Dante Barone, coordenador do Laboratório de Robótica Inteligente da Universidade Federal do Rio Grande do Sul

Aprendizagem por reforço

A segunda plataforma, intitulada Surreal, parte de uma metodologia diferente, embora também conte com a participação externa de voluntários. Enquanto no RoboTurk os pesquisadores utilizaram algoritmos de imitação, no Surreal, optaram por algoritmos de reforço, que intensificam e agilizam o processo de aprendizado. Nessa versão, seis atividades são disponibilizadas, e todas podem ser controladas e ensinadas a robôs em realidade virtual, ao mesmo tempo, por usuários diferentes. É como se a máquina estivesse aprendendo seis tarefas simultaneamente. Entre elas estão a separação de objetos em caixotes e o levantamento de pequenos blocos.

A coleta de dados ocorre em duas etapas, com a participação de três agentes. O primeiro, o ator, é a própria máquina, que ganha experiência com as múltiplas atividades desempenhadas. Em seguida, um sistema interno do autômato armazena as informações recebidas. Por fim, o ;cérebro; da máquina racionaliza e organiza os dados, trazendo conhecimento sobre como desempenhar determinada atividade.

Kevin Lynch, professor do Departamento de Engenharia Mecânica da Universidade de Northwestern, nos Estados Unidos, diz que os princípios da segunda plataforma, de aprendizagem por reforço, ou seja, por múltiplas experiências, são mais complexos de se trabalhar. ;Nessa aprendizagem, o robô tenta finalizar a tarefa executando uma série de ações, como ;vá para a esquerda, abra a mão, desça, feche a mão, levante;. Então, se ele falhar, tem que tentar descobrir se errou porque deveria ter se movido para a direita ou para esquerda, ou se deveria ter aberto a mão. A única maneira de descobrir isso é tentar muitas sequências diferentes das ações para ver o que funcionou e o que não funcionou. Assim, cria-se uma política de controle para lidar com situações diferentes;, explica.

Modelo inicial

Segundo o especialista, as tarefas de manipulação descritas no trabalho podem ser programadas sem aprendizado, sem muita dificuldade. Mas ele acredita que, em um futuro próximo, esses ensinamentos básicos desempenharão papel importante na manipulação de robôs. ;Para sermos bem-sucedidos, teremos de ter um bom modelo inicial, capaz de raciocinar sobre massa, propriedades de atrito, propriedades do material, entre outras coisas;, justifica.

A ideia de democratizar a disponibilidade da plataforma, ao criá-la em código aberto, pode ajudar nesse processo, acredita Lynch. ;Qualquer um pode testar os algoritmos de aprendizado. Isso permitirá que a comunidade de aprendizado de robôs acelere seus estudos;, afirma. Dante Barone, coordenador do Laboratório de Robótica Inteligente da Universidade Federal do Rio Grande do Sul (UFRGS), também observa com bons olhos a conquista, uma vez que ;o acesso a dados e algoritmos do tipo pode ser bem caro;.

Ainda assim, Barone ressalta que tanto o Surreal quanto o RoboTurk precisarão ser aplicados em robôs reais para se chegar a resultados mais palpáveis e significativos. ;A equipe precisará testar a criação no mundo real. Não tem como fugir: simulação não é realidade. Em um estágio inicial, é bom utilizar espaços recriados, mas eles não conseguem reproduzir exatamente todos os obstáculos que um robô enfrentaria durante a atividade. A força de atrito, por exemplo, é um deles;, observa. A aplicação faz parte dos planos de Ajay Mandlekar e seu time, que afirmam que já investigam como estender o trabalho a robôs reais. (GB)

Encontre e aprenda

Na aprendizagem de máquina não supervisionada, o robô descobre, sozinho, como desenvolver uma atividade. É testando e testando sucessivamente que ele entende o que dá certo e o que dá errado, interagindo com o ambiente à volta e aprendendo com ele. É como dar uma lista com 1.000 trabalhos universitários para uma máquina e pedir para que ela os separe em grupos com características comuns. Ou como pedir para que, em uma sonora barulhenta, um computador diferencie as vozes dos ruídos da rua.

Palavra de especialista

Engatinhando

;O principal problema da aprendizagem de máquina é que o robô não conhece o mundo. Ou seja, ele não sabe o que tem de fazer, nem como fazer. Não tem tato nenhum para entender, por exemplo, a força que deve ser aplicada em uma dada atividade. É como uma criança, que leva anos para aprender a segurar as coisas. No fim das contas, é uma questão de progresso: começamos com as atividades mais básicas até chegarmos às complexas. Antes de correr, uma criança precisa aprender a andar. De passo em passo, teremos um robô autônomo no futuro, um que, se necessário, possa preparar um prato de comida.;

Douglas Macharet, professor do Departamento de Ciência da Computação da Universidade Federal de Minas Gerais.

*Estagiário sob supervisão de Carmen Souza