Programa de computador vence jogadores profissionais de poker

Marianna França*

postado em 27/03/2017 08:00 / atualizado em 17/09/2020 12:24

No pôquer, as únicas cartas que um participante consegue ver são as dele e as que estão na mesa. Não é possível saber a estratégia dos oponentes ou adivinhar as cartas adversárias. Para vencer, precisa-se contar com a sorte e, principalmente, blefar. Um dos maiores desafios da inteligência artificial é trabalhar com esse elemento desconhecido nesse tipo de disputa, classificada como jogo de informação imperfeita. Um time de cientistas da Universidade de Alberta, no Canadá, acaba de avançar nessa área. Eles criaram um programa capaz de vencer jogadores profissionais em uma das variedades mais complexas do pôquer, a No Limit Hold;em. O trabalho, publicado recentemente na revista Science, pode ter implicações além do lúdico, como na área de logística e de saúde.

Batizada de Deep Stack, a solução ganhou de 10 dos 11 profissionais (eficácia de 91%) que chegaram ao fim do experimento, conduzido durante um torneio internacional disputado em dezembro de 2016 (veja arte). Segundo os autores, o programa mescla intuição e capacidade de reajustar a sua estratégia a cada nova decisão do jogo. ;Ele avalia a forma como a rodada atual e a próxima podem ser jogadas e, em seguida, estima o que deve acontecer no resto da partida. Essa estimativa é a intuição dele sobre as situações de pôquer;, resume Marlos Cholodovskis Machado, aluno de doutorado na universidade canadense, sob a orientação de Michael Bowling, um dos líderes da pesquisa.

Leia mais notícias em Tecnologia

[SAIBAMAIS]Marlos explica que o Deep Stack trabalha com mais de uma estratégia: replica as ideias de algoritmos de inteligência artificial de informação perfeita em jogos de informação imperfeita usando uma rede neural e resolve o jogo a partir de uma profundidade limitada na busca. ;Algoritmos que trabalham com informação perfeita não precisam dessa intuição, porque toda a informação necessária para avaliar uma situação está disponível, como em um tabuleiro de xadrez;, diferencia. Esse é um dos fatores que leva, nessas disputas, os computadores programados a vencerem mais facilmente os humanos.

Inspirado em neurônios

A rede neural do Deep Stack é o deep learning, um algoritmo que procura simular o funcionamento do cérebro. Nos homens, os neurônios recebem sinais de entrada de forma química. No caso do computador, tudo é simulado numericamente. A reprodução da rede neural é uma equação matemática que procura imitar como os neurônios reagem. Equações são conectadas e se transformam em uma rede muito grande, com capacidade de aprender.

;Ela é parecida com o funcionamento do cérebro. Vai se adaptando com experiências. Assim como o nosso cérebro, aprende, não decora. Quando você aprende, você pensa e entende o problema. Vai muito mais além do decorar;, explica Fernando Santos Osório, professor do Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (USP), em São Carlos.

A partir dessa rede, o Deep Stack interpreta o oponente, vê como ele joga e busca entender como pode tirar proveito da situação. ;O algoritmo da rede neural tenta montar o perfil do jogador, entender e analisar não só as cartas, mas os tipos de jogadas. Ele simula o jogador para tirar proveito disso;, resume Augusto Baffa, professor do Departamento de Informática do Centro Técnico Científico da Pontifícia Universidade Católica do Rio de Janeiro.

Armazenamento limitado

A estratégia de busca limitada também é baseada em inovações. Segundo Marlos, no passado, era necessário armazenar todas as possibilidades de jogadas. Agora, não mais.;Podemos simplesmente ver o que temos e raciocinar daí para frente. O programa não olha para todas as possibilidades de jogo, ele só olha até uma certa profundidade;, explica o cientista da computação.

Esse posicionamento, segundo ele, não se dá apenas graças ao deep learning, mas em função da capacidade do programa de continuar a resolver o jogo em tempo real. ;Armazenando bem menos informação, somos capazes de reconstruir a estratégia do adversário baseado no estado do jogo;, diz. A solução parte da premissa de que o oponente jogará para ganhar. ;A intuição do Deep Stack é: se eu sei que, quando você joga aqui, necessariamente é pior do que quando joga ali, não preciso avaliar o desenrolar de um jogo numa situação que é pior para você. Eu assumo que você é esperto e vai fazer a coisa certa.;

Essa estratégia de usar a intuição para não precisar olhar os dados e as possibilidades até o fim do jogo ocorre nos jogos de informação perfeita. ;Em xadrez, isso é muito comum. Ninguém consegue avaliar todas as possibilidades. Quando jogamos, olhamos para os próximos 10 movimentos e pensamos: ;Daqui a 10 movimentos, vou estar numa situação muito boa;. Nós usamos nossa intuição, o programa faz o mesmo, só que de forma diferente. Ele não olha só o tabuleiro de xadrez para obter sua intuição, também leva em consideração as estratégias dos jogadores;, diferencia Marlos.

Programas como o Deep Stack podem ser usados em problemas de logística. Um carro automático ou um sistema de tradução de textos, por exemplo. Até mesmo em situações mais complexas, como previsão do tempo e de catástrofes;

Denis Mauá, professor de ciência da computação da Universidade de São Paulo (USP) e especialista em raciocínio sob incerteza

Alto risco

É uma modalidade em que se pode apostar qualquer quantia em qualquer momento. É considerada arriscada porque, a qualquer instante, o jogador pode perder todas as suas fichas. Ele precisar ter habilidades de manipular o tamanho das apostas para afetar o resultado de uma mão. Além disso, o tamanho da aposta é importante para a estratégia do jogo, pois o jogador tem a liberdade para jogar a mão como quiser.

Programa de computador vence jogadores profissionais de poker

Programa criado no Canadá ganha de jogadores de pôquer usando intuição e capacidade de reajustar sua estratégia a cada nova jogada. O índice de vitória em um torneio profissional foi de 91%

Inspirado em neurônios

Armazenamento limitado

Alto risco

Tags