sábado, 11 de fevereiro de 2017

Carnegie Mellon AI bate melhores profissionais de poker - uma primeira


Carnegie Mellon AI beats top poker pros — a first
 Another major milestone in artificial intelligence (AI) - Outro grande marco na inteligência artificial (IA)
January 31, 2017
http://www.kurzweilai.net/carnegie-mellon-ai-beats-top-poker-pros-a-first?utm_source=KurzweilAI+Weekly+Newsletter&utm_campaign=31372410fc-UA-946742-1&utm_medium=email&utm_term=0_147a5a48c1-31372410fc-282071598

Libratus, um AI desenvolvido pela Carnegie Mellon University, derrotou quatro dos melhores jogadores de poker profissional do mundo em uma maratona de 120.000 mãos de Heads-up, No-Limit Texas Hold'em poker jogado mais de 20 dias, CMU anunciou hoje (31 de janeiro ) - juntando Deep Blue (para xadrez), Watson, e Alpha Go como marcos importantes na IA.

Libratus liderou os prós por um coletivo $ 1.766.250 em fichas. * O torneio foi realizado no Rivers Casino em Pittsburgh, de 11 a 30 de janeiro, em uma competição chamada "Brains vs. Inteligência Artificial: Upping the Ante. "

Os desenvolvedores de Libratus - Tuomas Sandholm, professor de ciência da computação, e Noam Brown, um Ph.D. Estudante em ciência da computação - disse que a grande vitória é estatisticamente significativa e não simplesmente uma questão de sorte. "A melhor capacidade de IA de fazer raciocínio estratégico com informações imperfeitas já superou a dos melhores seres humanos", disse Sandholm. "Esta é a última fronteira, pelo menos no horizonte previsível, na resolução de jogos em IA".

Este novo marco tem implicações para qualquer domínio no qual a informação é incompleta e os oponentes semeiam desinformação, disse Frank Pfenning, chefe do Departamento de Ciência da Computação da Escola de Ciência da Computação da CMU. O gerenciamento de negócios, a estratégia militar, a segurança cibernética e o planejamento de tratamento médico poderiam se beneficiar com a tomada de decisão automatizada usando um AI tipo Libratus.

"O computador não pode ganhar no poker se não puder blefar", explicou Pfenning. "Desenvolver um AI que pode fazer isso com sucesso é um enorme passo em frente cientificamente e tem inúmeras aplicações. Imagine que seu smartphone um dia será capaz de negociar o melhor preço em um carro novo para você. Isso é apenas o começo. "

Então como o Libratus foi capaz de melhorar dia a dia durante a competição? Acontece que foram os próprios profissionais que ensinaram Libratus sobre suas fraquezas. "Depois que o jogo terminou a cada dia, um meta-algoritmo analisou quais buracos os profissionais tinham identificado e explorado na estratégia do Libratus", explicou Sandholm. "Em seguida, priorizou os buracos e algebricamente (por algoritmos) foi corrigindo os três erros mais grosseiros usando o supercomputador a cada noite."

"Isso é muito diferente do que o aprendizado tem sido usado no passado no poker. Normalmente, os pesquisadores desenvolvem algoritmos que tentam explorar as fraquezas do oponente. Em contraste, aqui a melhoria diária é sobre os algoritmos de superação dos buracos em nossa própria estratégia."

Sandholm também disse que a estratégia de jogo final de Libratus foi um grande avanço. "O solucionador do jogo final tem uma análise perfeita dos cartões", disse ele. Ele foi capaz de atualizar sua estratégia para cada mão de uma forma que garantiu que qualquer alteração tardia só iria melhorar a estratégia. Ao longo da competição, os profissionais responderam fazendo movimentos mais agressivos no início da mão, sem dúvida para evitar jogar nas águas profundas do endgame onde o AI tinha uma vantagem, acrescentou.

A vitória de Libratus se tornou possível pelo computador das pontes de Pittsburgh Supercomputing Center. Libratus recrutou o poder bruto de aproximadamente 600 dos nós de computação de 846 Bridges (pontes). A velocidade total das pontes é de 1,35 petaflops, cerca de 7.250 vezes mais rápido que um laptop de alta qualidade, e sua memória é de 274 terabytes, cerca de 17.500 vezes você iria usar a memória desse laptop. Esse poder de computação deu a Libratus a capacidade de jogar contra quatro dos melhores jogadores do Texas Hold'em do mundo, de uma só vez e vencê-los.

"Nós projetamos Pontes para convergir computação de alto desempenho e inteligência artificial", disse Nick Nystrom, diretor sênior de pesquisa do PSC e investigador principal do sistema Bridges financiado pela National Science Foundation. A vitória de "Libratus" é um marco importante no desenvolvimento de AIs para resolver problemas complexos e reais. Ao mesmo tempo, Bridges está impulsionando novas descobertas nas ciências físicas, biologia, ciências sociais, negócios e até mesmo as humanidades."

Sandholm disse que continuará seu empurrão da pesquisa nas tecnologias do núcleo envolvidas em resolver jogos imperfeitos da informação e em aplicar estas tecnologias aos problemas reais. Isso inclui o seu trabalho com Optimized Markets, uma empresa que ele fundou para automatizar as negociações.

"CMU desempenhou um papel fundamental no desenvolvimento de ambos o xadrez de computador, que eventualmente vencer o campeão mundial, e Watson, a AI que bateu os mais perigosos concorrentes", disse Pfenning. "Tem sido muito emocionante ver o progresso dos programas de poker que finalmente superaram os melhores jogadores humanos. Cada uma dessas realizações representa um marco importante na nossa compreensão da inteligência".

Head-Up No-Limit O Texas Hold'em é um jogo complexo, com 10 elevado a 160 (o número 1 seguido de 160 zeros) conjuntos de informações - cada conjunto sendo caracterizado pelo caminho de jogo na mão como percebido pelo jogador da vez. A IA deve tomar decisões sem saber todas as cartas em jogo, enquanto tenta perceber o blefe do seu adversário. Como sugere o "sem limite", os jogadores podem apostar ou aumentar qualquer quantia até todas as suas fichas.

Sandholm estará compartilhando os segredos de Libratus, agora que a competição terminou, começando pelo convite para as palestras na reunião da Associação para o Avanço da Inteligência Artificial, de 4 a 9 de fevereiro, em San Francisco e em submissões para conferências e revistas científicas revisadas por pares.

* Os profissionais - Dong Kim, Jimmy Chou, Daniel McAulay e Jason Les - dividirão uma bolsa de prêmio de US $ 200.000 com base em suas respectivas performances durante o evento. McAulay, da Escócia, disse que Libratus era um adversário mais duro do que ele esperava, mas foi emocionante jogar contra ele. "Sempre que você joga um jogador de topo no poker, você aprende com ele", disse ele.
Tradução livre do blog, com uso do Google Tradutor

Nenhum comentário: