A História do AlphaGo — Quando a IA Venceu o Ser Humano

A História do AlphaGo — Quando a IA Venceu o Ser Humano

A História do AlphaGo — Quando a IA Venceu o Ser Humano

Em março de 2016, o mundo do Go — e do mundo da tecnologia — parou para assistir a algo que muitos especialistas acreditavam ser décadas distante: uma inteligência artificial derrotando o melhor jogador humano de Go do planeta.

O AlphaGo, desenvolvido pela DeepMind (então já parte do Google), não apenas venceu — ele o fez de forma que mudou para sempre a forma como jogadores, treinadores e pesquisadores entendem o jogo mais complexo já criado pelo ser humano.

A invasão san-san — uma das jogadas que o AlphaGo popularizou. A sequência mostra pretas em D16 (hoshi 4-4), brancas invadindo em C17 (san-san 3-3), pretas bloqueando em D17, brancas em C16, pretas em D15.

Antes do AlphaGo, a invasão imediata no san-san era considerada 'muito simplista' pelos mestres humanos — dava ao adversário influência facilmente. O AlphaGo mostrou que essa troca (território no canto por influência nos lados) é perfeitamente válida e, em muitos contextos, ótima. Essa reviravolta filosófica foi um dos maiores impactos do AlphaGo no Go profissional.

Para utilizar nossos problemas interativos você deve ativar JavaScript.

O problema do Go para a IA

Antes do AlphaGo, o Go era considerado o “último bastião” da supremacia humana sobre os computadores em jogos de tabuleiro. Enquanto o xadrez havia caído para a IA em 1997 (quando o Deep Blue da IBM derrotou Garry Kasparov), o Go resistia por uma razão simples: complexidade.

O tabuleiro 19×19 do Go tem mais posições possíveis do que átomos no universo observável. As abordagens de força bruta que funcionavam para o xadrez eram completamente inaplicáveis ao Go. Os computadores mais avançados jogavam Go no nível de um amador fraco até meados de 2010.

A DeepMind, fundada em Londres em 2010 e adquirida pelo Google em 2014, escolheu o Go como o objetivo máximo de seu projeto de inteligência artificial de propósito geral.

Fan Hui: a primeira vitória

Em outubro de 2015, em uma partida discreta que só viria a público meses depois, o AlphaGo jogou contra Fan Hui — campeão europeu de Go e profissional 2-dan. O resultado: AlphaGo venceu 5 a 0.

Foi a primeira vez na história que uma IA venceu um profissional de Go em condições de torneio. Você pode ver a análise do torneio em Fan Hui vs. AlphaGo.

Lee Sedol: o confronto do século

O próximo desafio foi um torneio de 5 jogos contra Lee Sedol — o jogador considerado o melhor do mundo na última década, com 18 títulos mundiais. Lee Sedol disse publicamente antes do torneio que esperava vencer 5-0 ou 4-1 “na pior das hipóteses”.

Em março de 2016, em Seul, AlphaGo venceu 4 a 1. A única derrota da IA — o jogo 4 — veio após uma jogada extraordinária de Lee Sedol na 78ª posição, que ficou conhecida como “a jogada divina” (divine move). Mas as quatro vitórias da IA foram convincentes e mostraram um nível de jogo que os profissionais humanos reconheceram como superior.

Posição final de uma partida de 13×13 mostrando a complexidade do Go no final do jogo: grupos estabelecidos em diferentes cantos, fronteiras de território definidas, pedras mortas aguardando remoção. É nesse nível de complexidade que o AlphaGo precisava operar — multiplicado em um tabuleiro 19×19 com mais de 5 vezes esse número de intersecções.

O AlphaGo usou redes neurais profundas (inspiradas no funcionamento do cérebro humano) para avaliar posições como esta e escolher jogadas — algo que os algoritmos tradicionais de busca por força bruta nunca conseguiriam fazer no tabuleiro 19×19.

Para utilizar nossos problemas interativos você deve ativar JavaScript.

Ke Jie e AlphaGo Master

Após Lee Sedol, uma versão melhorada — chamada AlphaGo Master — jogou anonimamente em servidores online, derrotando 60 jogadores profissionais de alto nível consecutivamente. Em 2017, o confronto oficial foi contra Ke Jie, o jogador número 1 do mundo.

AlphaGo venceu 3 a 0. Ke Jie, um jogador conhecido por sua postura fria e confiante, foi às lágrimas durante as partidas.

Após esse torneio, a DeepMind anunciou que o AlphaGo se “aposentaria” do Go profissional. Veja a análise em Ke Jie vs. AlphaGo.

AlphaGo Zero: aprendendo do zero

Em outubro de 2017, a DeepMind publicou um artigo sobre o AlphaGo Zero — uma versão que aprendeu Go sem nenhum dado humano, apenas jogando contra si mesma a partir de regras básicas. Em 40 dias de autoaprendizado, o AlphaGo Zero superou todas as versões anteriores.

O impacto no Go humano

O AlphaGo mudou o Go para sempre: novas aberturas (como a invasão san-san) tornaram-se muito mais populares; jogadas que eram consideradas “ruins” pelos humanos foram reavaliadas; e paradoxalmente, a derrota para a IA fez muitos jogadores humanos se apaixonar mais pelo Go — a profundidade do jogo ficou ainda mais evidente.

O AlphaGo é um dos marcos mais importantes da história da inteligência artificial — e um capítulo fascinante da história do Go.


Quer aprender Go na prática? Comece pelo nosso tutorial interativo ou pratique com problemas de tsumego.