Estudo indica

Esses dias, cheguei a uma notícia que me traz aquele arrependimento de não ter, ao decorrer da vida, juntado uma coletânea das melhores matérias começadas ou terminadas por “estudo indica”. Já vi de tudo, desde estudo indicando o aumento dos preços de guarda-chuva quando chove a pesquisas apontando que o turismo será a indústria mais beneficiada na Copa do Mundo. Essa notícia, no entanto, chocou-me mais que as outras, é ela, da UOL: Estudantes que usam Twitter têm notas melhores e são mais comprometidos, aponta estudo.

A primeira coisa que aprendemos em uma aula de estatística é o lema, que levamos para nossa vida, correlação não implica causalidade. Arrisco dizer que a maior parte das torturas a que a estatística é submetida na mídia vêm dessa confusão, achar que porque duas coisas acontecem juntas, ou parecem acontecer juntas, então uma causa a outra, é o famoso achar que o Sol nasce porque o galo canta. Esse estudo não é diferente.

Somos levados a entender, pela matéria, que o Twitter é algo bom para os estudos. Segundo a autora da pesquisa: “Caroline chegou à conclusão de que o formato ‘tempo real’ do microblog permite que estudantes possam escrever de forma concisa, fazer pesquisas com resultados atualizados e, eventualmente, se comunicando diretamente com autores e pesquisadores.”. Esqueceram de avisar a essa senhora que os adolescentes não estão produzindo poesia moderna fixa a 140 caracteres, as pesquisas atualizadas feitas dificilmente versam sobre temas escolares (para isso se usa Google e Wikipédia) e se o abismo entre um pesquisador e o público já é grande, não são 140 caracteres que ajudarão.

Se precisasse opinar, seguiria Saramago nessa. Quando perguntado se, agora que tinha um blog, faria um Twitter, o escritor não hesitou: “Nem sequer é para mim uma tentação de neófito. Os tais 140 caracteres reflectem algo que já conhecíamos: a tendência para o monossílabo como forma de comunicação. De degrau em degrau, vamos descendo até o grunhido.”. Um pouco drástico, mas me parece mais realista que o Twitter como novo mecanismo literário da juventude.

Ainda, o que me choca não é a ingenuidade panglossiana do estudo, mas a inferência de que se duas coisas vão juntas, uma certamente causa a outra. Uma explicação mais simples, e mais honesta, seria argumentar que alunos que usam Twitter de forma regular têm mais acesso à internet, mais interesse em ter esse acesso, acabam sendo expostos a mais conteúdo e costumam, como em um pacote, ser capazes de aprofundar seus interesses e seus estudos em seus interesses. O Twitter nada tem a ver com isso, e a notícia é propositalmente sensacionalista e enganosa. Causa-me espécie esse tipo de reportagem e o uso que ela faz de estatística.

Não apenas ela, costumamos, de maneiras mais ou menos sutis, associar correlação em causalidade no cotidiano. Desde usar aquela cueca da sorte em dia de final de campeonato a coisas mais sérias, como proibir seu filho de se divertir com um jogo porque o maníaco que atirou e matou cinco jogava o jogo, ou como o absurdo de justificar preconceitos dizendo que todas as vezes em que foi assaltado foram por pessoas de uma raça específica, ou que se vestiam de tal forma. O raciocínio por inferência é natural ao ser humano, devemos nos policiar para que esse instinto não se torne superstição, preconceito, ingenuidade ou, simplesmente, a crença de que o sol nasce porque o galo canta.

Para encerrar, deixo-lhes alguns gráficos para provar estudos muito mais relevantes. Todos nos quais correlação e causalidade são, comicamente, subvertidas e comparadas.

Estudo indica: o número de piratas em atividade pode afetar diretamente o aquecimento global. Salve o planeta, torne-se um pirata.

Estudo indica: comer chocolates aumenta suas chances de ganhar um prêmio Nobel. (Usei esse gráfico como exemplo cômico. Para meu horror, ele foi base de um artigo sério da BBC após a publicação desse post! Eles até colocam no final que correlação não implica causalidade, mas para quem lê os primeiros parágrafos, o jogo está perdido.)

Estudo indica: a qualidade do Rock afeta diretamente a produção de petróleo de um país.

Crime e castigo

Há algum tempo, inspirado em um comentário desse blog, queria escrever algo sobre o fenômeno estatístico conhecido como regressão à média. Desde pequeno fui fascinado pela análise teórica do sermão que recebia de meus pais a cada travessura que aprontava. Quebrei janelas, copos, sujei-me, sujei a casa, nada voluntário, coisa de criança; mas recebia, a cada evento, a devida repreensão de pai ou mãe (ou dos dois, não eram excludentes). Também levava broncas por notas mais baixas, não tantos elogios pelas altas, que eram, afinal, minha obrigação. Achava que as coisas eram daquele jeito, que não poderia ser de outro jeito, até, entrando na faculdade, conversar com um amigo que cursava administração de empresas. Segundo ele, muito mais eficaz que esse método era o inverso, o tal do positive reinforcement, elogiar o que é bom e trabalhar no que está ruim, mostrar ao time vídeos com seus acertos ao invés de erros, meu amigo citava experiências sociológicas e psicológicas bem interessantes para provar seu ponto, mas eu custava a acreditar.

Dizer que a recompensa é o melhor caminho choca nossa experiência. Estamos habituados a ver resultados melhorarem após a repreensão, e muitos dizem que, após o elogio, o elogiado tende a piorar e a decepcionar, como se elogiar estragasse, como se ficar feliz e orgulhoso o tornasse relaxado. O post de hoje serve para desarmar esse argumento, e nossa ideia de que alguém “aprendeu a lição” após uma bronca bem tomada. Vou argumentar que esse fenômeno de fato existe, a piora em relação ao elogio e a melhora em relação à bronca, mas que ele reflete muito mais uma verdade estatística que uma mudança de comportamento.

Vamos imaginar uma criança, Denis, o pimentinha, que, ao decorrer do ano letivo, fará 20 provas. Ele não é o melhor da sala, nem o pior, e estuda um pouco para cada prova, mas não muito. Denis estuda suas matérias para tirar um 7,0, que é uma nota boa em sua opinião. No entanto, algumas vezes a prova é mais fácil, ou mais difícil, então sua nota varia; sua média é constante, mas as flutuações são aproximadamente de dois pontos em sua nota. Ou seja, vamos tratar a nota de Denis como uma variável aleatória de média 7,0 e distribuição normal com variância 1. Dessa forma, a chance de ele tirar acima de 9,0 é de 2,2%, e a chance de tirar abaixo de 5,0 também é de 2,2%, sendo 68,2% a probabilidade de ele tirar entre 6,0 e 8,0.

Esses números podem parecer estranhos, mas esse modelo é um dos mais adequados para representar tarefas humanas, a chamada distribuição gaussiana, ou distribuição normal. Ela diz que teremos um valor esperado (no caso de Denis, 7,0), mas que teremos dias bons e ruins. A maior parte dos dias (68,2%) não será muito longe do valor esperado (entre 6,0 e 8,0), mas alguns, excepcionais (2,2%), podem ser muito bons (acima de 9,0, caiu exatamente o que ele havia estudado!) ou muito ruins (abaixo de 5,0, não caiu quase nada do que ele sabia).

Sua mãe se preocupa com sua educação, e o disciplina como sua mãe a disciplinou. Ela dá um presente a Denis cada vez que ele tira uma nota acima de 9,0, e o castiga cada vez que ele tira uma nota abaixo de 5,0. Vejamos como seriam as notas de Denis em um ano:

O que a mãe de Denis entenderá desse gráfico? Note que toda vez que ela castiga Denis, suas notas tendem a subir, enquanto toda vez que ela o presenteia, ele tende a tirar notas piores! É importante notar que isso nada diz sobre o aprendizado de Denis, eu apenas tirei notas aleatoriamente, dizendo que Denis é um aluno nota 7,0 que tem dias bons e ruins.

Essa ilusão da eficácia do castigo ocorre porque é muito raro ter dois dias ruins seguidos, e a ilusão da ineficácia do elogio é pela também raridade de dois dias excepcionalmente bons. O valor seguinte ao de um dia excepcional tende a ser menos espetacular, ou, como dizemos, tende a regredir à média dos valores.

Note, eu não estou dizendo que o castigo tem eficácia zero no comportamento, ou que o presente também não tem efeito, estou apenas dizendo que o raciocínio de punir e melhorar e não elogiar para não estragar pode ser aplicado até a variáveis aleatórias. Certamente a maneira como uma pessoa é tratada influencia em sua performance, mas uma teoria de castigo e recompensa que pode ser explicada pelo mero acaso, pela estatística, não pode ser tida como uma grande verdade sobre o comportamento humano.

Em outras palavras, imagine-se alguém que considera tirar menos que 5 em um sorteio para o próximo número do bingo algo ruim, e que considera tirar mais que 95 um resultado bom. Você pode, por algum motivo, culpar aquela esfera engradeada que vomita os números pelo resultado, e eu garanto: se você der uma bronca nela após cada resultado menor que 5, ela vai muito provavelmente melhorar bastante na próxima vez. Se você elogiar a cada resultado acima de 95, ela provavelmente irá te decepcionar na próxima bola sorteada.

Não quero, nem pretendo, dizer que broncas são ineficazes, ou que a única resposta possível para educar ou ensinar são elogios, paz e amor. Lanço esse post na polêmica opinião que pede uma revisão de nossos conceitos da eficácia do castigo como aprendizagem. Para que você se pergunte quanto do que você aprendeu veio dos benefícios de um sermão, ou, ainda, quanto de cada melhora que viu após uma bronca foi resultado dessa bronca ou se foi, por puro acaso, um dia melhor que ontem.

Banco Imobiliário

Como todos, joguei bastante Banco Imobiliário em minha infância. Sonhava em morar em Morumbi ou Interlagos, tinha medo de algum dia passar perto da Av. Presidente Vargas, e com ele descobri o significado da palavra “revés”. Gostava, ainda que nunca tenha efetivamente terminado uma partida, sempre me solidarizava com os que empobreciam, deixávamos que continuassem, como se capitalismo e misericórdia combinassem, não dava certo.

Mas sempre fui assombrado pela busca pela tática ótima de se jogar esse jogo, se havia alguma. Inspirado em um estudo que li recentemente, dedico esse post a responder a grande pergunta: quais as casas em que mais paramos em uma partida? Assim, saberemos quais cores de propriedades precisamos, a todo custo, comprar ao parar.

Apesar de esse estudo já ter sido feito, não gostei da apresentação, nem da maneira como foi escrito; refaço-o, torcendo para que poucas pessoas achem, desse post, o que achei do estudo.

Para explicar como farei esse cálculo, preciso começar com um caso mais simples de jogo. Se Quico criou o xadrez para principiantes, apresento a vocês o Banco Imobiliário para iniciantes, ou, para criar uma temática, o Banco Imobiliário Zona Leste, referente à zona leste da cidade de São Paulo (figuras de Pedro Vergani, o mesmo que fez o banner do blog e diversas outras figuras desse blog):

Não há grandes surpresas nesse jogo. Usamos uma moeda e tiramos no cara-ou-coroa quantas casas andaremos: cara nos faz andar uma casa, coroa nos faz andar duas casas. Queremos analisar qual a casa mais provável de se cair e, para isso, precisamos trazer artilharia pesada da álgebra linear.

Vou precisar de uma matriz. Adoro matrizes, trabalho com elas e revolto-me com alunos de colegial que desdenham das aulas em que tiveram que aprender a “multiplicar tabelas”. Não os culpo tanto assim, é de fato bem estúpido querer multiplicar uma tabela por outra sem dar uma razão decente para isso, e hoje lhes apresento uma. Vamos criar a matriz estocástica do Banco Imobiliário Zona Leste. As regras para a matriz são: na primeira linha e segunda coluna, por exemplo, colocamos a probabilidade de, estando na primeira casa, cair na segunda casa. Como vocês sabem, essa probabilidade é ½ (tirar cara). A primeira linha dessa matriz será, portanto: 0, ½, ½, 0; ou seja, a chance é zero de ficar no mesmo lugar (você vai se mover), ½ de avançar uma casa (cara), ½ de avançar duas (coroa) e zero de avançar três. A matriz total será:

\displaystyle M=\left(\begin{matrix}0&\frac{1}{2}&\frac{1}{2}&0\\ 0&0&\frac{1}{2}&\frac{1}{2}\\ \frac{1}{2}&0&0&\frac{1}{2}\\ \frac{1}{2}&\frac{1}{2}&0&0\end{matrix}\right)

E ela vai nos ajudar a fazer todo o resto. A utilidade de escrevê-la, além de ficar claro e bonitinho, é a seguinte: ela representa na linha i e coluna j as probabilidades de, estando na casa número i, ir à casa número j em uma jogada. Se eu quiser a probabilidade de, estando na linha i, ir à coluna j em duas jogadas, basta multiplicar a matriz M por ela mesma! Aos que estão enferrujados em multiplicação de matrizes, eis a resposta:

\displaystyle \left(\begin{matrix}0&\frac{1}{2}&\frac{1}{2}&0\\ 0&0&\frac{1}{2}&\frac{1}{2}\\ \frac{1}{2}&0&0&\frac{1}{2}\\ \frac{1}{2}&\frac{1}{2}&0&0\end{matrix}\right).\left(\begin{matrix}0&\frac{1}{2}&\frac{1}{2}&0\\ 0&0&\frac{1}{2}&\frac{1}{2}\\ \frac{1}{2}&0&0&\frac{1}{2}\\ \frac{1}{2}&\frac{1}{2}&0&0\end{matrix}\right)=\left(\begin{matrix}\frac{1}{4}&0&\frac{1}{4}&\frac{1}{2}\\ \frac{1}{2}&\frac{1}{4}&0&\frac{1}{4}\\ \frac{1}{4}&\frac{1}{2}&\frac{1}{4}&0\\ 0&\frac{1}{4}&\frac{1}{2}&\frac{1}{4}\end{matrix}\right)

Ou seja, a chance de, estando na primeira casa, voltar a ela depois de duas jogadas é 14, a chance de estar na terceira casa depois de duas jogadas também é 14 e a chance de estar na quarta casa é ½. Mas o problema não é saber as chances de 2, 3, 10 ou 100 jogadas, queremos saber qual é a mais provável de cairmos em todo o decorrer da partida, o que é um problema diferente, mas que pode ser resolvido com essa matriz. Basta multiplicar essa matriz por ela mesma um número alto, bem alto de vezes, torcer para que ela comece a convergir para uma matriz razoável e dizer que essas serão as probabilidades em “tempo infinito”, ou seja, as chances de se estar naquelas casas depois de ter jogado muitas vezes.

Note, dizer que em um número alto de jogadas eu estarei mais provavelmente na casa X e dizer que terei passado várias vezes por X são afirmações bem diferentes, mas arrisco dizer que representam a mesma coisa, e o nome dessa afirmação é hipótese ergódica. Esse post não tem a menor pretensão de avançar nessas águas, que esse nome fique sendo, por enquanto, apenas um nome bonito para uma teoria.

Mas se elevar uma matriz ao quadrado é difícil, como elevar uma matriz a um número muito grande? Matematicamente falando, vamos elevar M a n, o número de jogadas, e depois tomar o limite para n\to\infty, ou seja, vamos dizer que n é um número muito, muito grande; o que, para Banco Imobiliário, consiste em uma excelente aproximação.


Parte geek do post, evite se não reconhecer a palavra “autovalor”. A parte rookie continua em seguida.

Os que já fizeram seu curso de álgebra linear conhecem a dica, vamos atrás dos autovalores dessa matriz e elevar esses caras a n, depois mandar n para infinito e ver no que vai dar. Isso porque, felizmente, se escrevemos uma matriz como M=UDU^{-1}, onde D é uma matriz diagonal, elevar M a n é escrever UDU^{-1}UDU^{-1}\ldots UDU^{-1} um número n de vezes, notando que os U^{-1}U do meio se cancelam, isso é o mesmo que UD^nU^{-1}, e elevar uma matriz diagonal a uma potência é simplesmente elevar seus elementos a essa potência.

Posso me colocar várias perguntas como: “e se algum autovalor for maior que 1? A matriz vai explodir!” ou “E se todos forem menores que 1? A matriz vai para zero!” ou ainda: “E se algum for negativo? Como você eleva isso a infinito?!”; mas todas elas são sanadas quando invoco um corolário do poderoso teorema de Perron-Frobenius:

Teorema (de Perron-Frobenius): Entre outras coisas (esse teorema é bem poderoso), uma matriz estocástica como a do banco imobiliário possui o autovalor 1, único (não degenerado), e não há autovalores que, em módulo, sejam maiores que ele. O autovetor associado ao autovalor 1 possui todos os seus componentes de mesmo sinal. Em particular para matrizes como as do Banco Imobiliário, esse valor próprio 1 é o maior de todos os autovalores em módulo.

Eu poderia discutir bastante a razão desses resultados, já que Perron-Frobenius é um canivete suíço, adaptando-se a vários tipos de matrizes não-negativas diferentes. No caso da do Banco Imobiliário temos o fato importante de ser perfeitamente possível estar na casa i e voltar a ela mesma após um número m suficientemente grande de jogadas, e também ser possível voltar após m+1 a essa mesma casa. Essa propriedade garante que 1 será o único autovalor de M no círculo unitário.

Esse corolário não deve surpreender ninguém, pois, se uma matriz estocástica vezes outra matriz estocástica continua uma matriz estocástica (eu teria que demonstrar isso, mas acredite em mim, é verdade), M^n deve também ser estocástica, então não pode ter autovalores maiores que 1 (que explodiriam se elevados a n\to\infty), também não poderia ter apenas autovalores menores que 1, a matriz toda iria a zero quando elevada a n\to\infty, não sobra tantas alternativas além do resultado de Perron-Frobenius. O que ele nos garante de interessante é a unicidade desse autovalor 1 e o sinal do autovetor associado.

E se você elevar todos os demais autovalores a n\to\infty, eles logo logo vão para zero. Sobra o 1. Reconstruindo a matriz multiplicando por U e U^{-1}, teremos uma surpresa, M^n com n\to\infty possui todas as linhas iguais, cujos componentes são os elementos do autovetor associado a 1. Essa surpresa é consequência da teoria ergódica, mas isso fica para outro post Dessa forma, o que queremos é esse autovetor associado ao autovalor 1.

Fim da parte geek.


O método descrito acima, se aplicado a nosso Banco Imobiliário Zona Leste, nos dará que a probabilidade de cair em todas as casas é a mesma, o que é esperado. Somos tentados a achar que no jogo do Banco Imobiliário ocorre o mesmo, mas esquecemos de elementos fundamentais da dinâmica do jogo, em particular da prisão, que muda tudo. Para explicar o efeito da prisão nas probabilidades das casas, introduzo um novo jogo, o Banco Imobiliário Zona Leste Deluxe:

Jogaremos usando um dado de seis faces. Nesse novo jogo, a matriz não será tão bonita quanto a anterior. A casa “Vá para a prisão” leva diretamente à prisão, quebrando a simetria do jogo e beneficiando as casas logo após a prisão, prejudicando aquelas que vêm antes. A matriz completa desse jogo será:

\displaystyle M=\left(\begin{matrix}0&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&0\\ 0&0&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}\\ \frac{1}{6}&0&0&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}\\ \frac{1}{6}&\frac{1}{6}&0&0&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}\\ \frac{1}{6}&\frac{1}{6}&\frac{1}{6}&0&0&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}\\ \frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&0&0&\frac{1}{6}&\frac{1}{6}\\ 0&0&1&0&0&0&0&0\\ \frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&\frac{1}{6}&0&0\end{matrix}\right)

Aquela bela simetria da outra matriz já não mais existe, a prisão é a culpada, note a penúltima linha (representando a casa “Vá para a prisão”). Analisando quais serão as probabilidades de se cair em cada uma das casas após um grande número de jogadas usando a técnica da parte geek, ou seja, multiplicando a matriz por ela mesma muitas vezes, teremos:

O que é bem diferente de uma probabilidade uniforme, como no jogo anterior.

Apliquemos tudo isso ao verdadeiro Banco Imobiliário. Seu tabuleiro é mais completo, ele é jogado com dois dados e andamos a soma dos valores tirados, possui casas de sorte-ou-revés, diversas cores e muitas propriedades. Seu tabuleiro, a quem não se lembra, é:

Não vou escrever sua matriz estocástica, não quero cuspir uma tabela de 40 linhas e 40 colunas nesse blog, mas acreditem, fiz as contas. A probabilidade de se encontrar em cada uma das casas é:

Levei também em conta a chance de 1/18 de se encontrar uma carta de ida à prisão nos espaços de sorte-ou-revés, foi o ajuste mais fino que fiz no modelo, para obter esses resultados. Ainda, ele não afeta em grande coisa a análise, pois as casas de sorte-ou-revés estão bem distribuídas no tabuleiro, apenas acentuam o efeito da prisão.

Notem que as casas rosa não são apenas as mais baratas e de pior rentabilidade, são também aquelas, juntamente com as azuis escuras, mais difíceis de atingir no tabuleiro. Interlagos e Morumbi, as tão desejadas laranjas, formam a dupla mais provável de casas para se atingir: são aquelas mais prováveis de encontrar após sair da prisão e, sendo a prisão a casa de longe mais provável, elas herdam um pouco dessa probabilidade.

Não jogo Banco Imobiliário há muito, entendo um pouco a razão. Podemos imaginar razões para a casa mais cara ser a mais provável, ou outras sutilezas descobertas na análise, mas isso é facilmente refutado pelo fato de países diferentes escolherem distribuições diferentes de valores de casa pelo tabuleiro; no jogo francês, a casa mais cara é a menos provável, substituindo o Jardim Paulista de nossa edição. Percebemos, por isso, que não é um jogo feito com tanto cuidado assim. Contudo, talvez se quando eu jogava soubesse um pouco mais sobre matrizes, mais sobre Frobenius, tivesse mais sorte no dado, talvez assim eu tivesse gostado, jogado, ganhado, ou, quem sabe, até mesmo terminado uma partida de Banco Imobiliário.

Quase arte

Se você, como eu, possui um leve TOC com simetrias, gosta das coisas em seus devidos lugares, detesta paredes não-perpendiculares pelo dilema de ter que escolher um eixo para alinhar coisas na sala ou, jogando Carcassonne, passa mais tempo arrumando as peças que pensando em sua jogada, esse post não é para você.

Quando eu era mais novo, passei por uma fase “física dos materiais” e me interessei bastante por propriedades eletrônicas de sólidos e cristais. Aprendemos que cristais são agregados de átomos em um padrão que se repete, que se reproduz. Um cristal de sódio e cloro, por exemplo, agrupa-se em uma estrutura periódica cúbica que se repete muitas, muitas vezes até formar um conglomerado colossal de átomos, que chamamos de sal.

Nessa aula de cristais, aprendi que toda estrutura cristalina possui um motif, cuja tradução desconheço. Essa palavra não é exclusiva da física ou da matemática, motif é, grosso modo, um fragmento que comporá uma grande obra, como um tijolo compõe casas. A quinta de Beethoven talvez possua o motif musical mais conhecido, as famosas três notas curtas acompanhadas de uma longa que abrem a sinfonia. Nos cristais é o mesmo, vejamos o motif do sal de cozinha:

Sendo a construção de um cristal feita com a repetição indefinida desse motif. Não apenas nos cristais, encontramos problemas similares a esse quando tentamos comprar azulejo para nossa casa. Durante muito, acreditou-se que redes cristalinas pudessem ser apenas de um entre dezessete tipos, conhecidos como os grupos de papéis de parede. Se você tem um azulejo em sua casa, garanto que ele pertence a um desses dezessete grupos.

Mas note que todas essas redes regulares possuem algo em comum: uma simetria. Redes triangulares possuem simetria de rotações por 120°, as quadradas são invariante por rotações de 90° e as hexagonais, por rotações de 60°. Essas simetrias são características dos cristais e uma boa parte de nossas técnicas de medição consiste em medir essa simetria, da seguinte ideia: você lança luz no cristal (ou elétrons, o importante é lançar algo), veja como o cristal rebate a luz e estuda o perfil formado na saída da luz. Com esse perfil, você entende como o cristal funciona. Um cristal de alumínio possui, por exemplo, simetria hexagonal. Não por menos, seu padrão de difração é algo assim:

No entanto, em 1982, Dan Shechtman faria medições de um composto de alumínio e manganês que lhe daria o seguinte padrão de difração:

É difícil entender o quanto esse padrão chocou Shechtman, e como escandalizaria a comunidade da cristalografia. Se o padrão do alumínio era um hexágono, o que é perfeitamente aceitável, esse é um decágono. Em alguns pontos, traçando as linhas certas, percebemos uma simetria pentagonal no desenho. O problema é exatamente esse: a simetria pentagonal (72°) é proibida aos cristais! Você consegue criar um tapete usando quadrados, triângulos e hexágonos, mas jamais pentágonos! Você pode se enganar enfiando um pentágono aqui e ali, mas isso será apenas usar um pentágono para compor seu motif, e esse motif será reproduzido de forma triangular, quadrada ou hexagonal. Shechtman havia descoberto um monstro.

Com medo de sua descoberta, Shechtman levou dois anos para tomar coragem e publicar seus resultados. A comunidade científica estranhou de início, mas a matemática do assunto já havia sido desenvolvida desde 1964, estávamos vendo o primeiro caso de um quasicristal. Apresento-lhes um padrão similar ao do composto estudado por Shechtman, o belíssimo Al-Pd-Mn:

Notem a ausência de um padrão claro de repetição, um motif, e, ainda, uma aparente simetria que se quebra em pontos para ceder a outra simetria em uma dança de padrões pentagonais. Átomos de fato se agrupam assim, por uma razão atomicamente simples: muitas vezes, os compostos desejam fazer cinco ligações eletrônicas, que se repelem mutuamente. Nesse jogo de repulsão, elas forçam um padrão pentagonal e, quando ele não é mais possível (porque não há como cobrir um solo com pentágonos), há a quebra de simetria.

Esse tipo de padrão, ou de quase padrão, não é muito comum em nossa sociedade e nossa arte, mas a história é bem diferente na arte islâmica. Não sou especialista, mas sei que o número cinco não é lá bem visto nas religiões que herdamos, em especial o pentágono ou a estrela de cinco pontas. No mundo árabe, o cinco é um número querido, há cinco orações por dia, cinco meses sagrados no ano, e, em particular, o pentágono ou a estrela não apresentam problema. Não de forma surpreendente, encontramos na arte islâmica criada no período de ouro das civilizações árabes exemplos vastos de quasicristais:

Santuário de Darb-i Imam, em Isfahan

Igualmente interessantes são as propriedades de repetição dos quasicristais. Ainda que eles não possuam motif, possuem regiões que se repetem com alguma frequência. De fato, podemos afirmar que, grosso modo, toda região de diâmetro R se repete em até uma distância de 2R. Como exemplo, note que essas regiões pentagonais verdes assinaladas se repetem em uma distância ainda menor que seu tamanho:

Mais que isso, as diversas regiões assinaladas demonstram todas uma repetição em algum ponto próximo, dependendo do tamanho da região considerada, nunca estando mais que o dobro de seu tamanho de distância de seu irmão gêmeo mais próximo.

Muitos outros compostos foram descobertos com padrões desse tipo, e suas propriedades e aplicações ainda são um terreno aberto. Infelizmente me desviei desse campo, matrizes me atraem mais que pentágonos, mas não deixo de apreciar esses padrões, quase perfeitos, quase simétricos e totalmente belos.

O princípio do pombal

Em física e matemática, é bem comum encontrarmos princípios que parecem óbvios com consequências complicadas. Meu exemplo favorito é a relação conhecida como equação mestra na física estatística que, se lida em português, seria: “o quanto variou é o quanto entrou menos o quanto saiu”. Por mais evidente que isso seja, essa equação toma formas cabulosas em situações não muito complicadas e exige bastante suor para ser resolvida.

Mas o assunto de hoje não é a equação mestra, mas outro princípio, talvez ainda mais simples: o princípio da casa dos pombos, ou princípio do pombal.

Princípio da casa dos pombos: se há mais pombos que casas em um pombal, alguma casa terá mais de um pombo.

Eis uma aplicação desse princípio:

E por mais óbvio que ele pareça, não é nada inútil se lembrar dele como técnica de demonstração de resultados bem interessantes. Um deles, meu favorito, é uma espécie de jogo com sequências. Para ilustrar, imagine uma rua com n casas. Cada casa deve possuir um número, e você pode escolher o número que quiser. Eu afirmo que existe um grupo de casas vizinhas cujos números, somados, resultam em um múltiplo de n.

Vejamos um exemplo. Imagine treze casas que possuem os seguintes números: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 e 14. Se houvesse uma casa com o número 13, ela seria sozinha o múltiplo de 13 que quero, isso não me serve de muita coisa. Note que, nessa rua, temos os vizinhos 5, 6, 7 e 8, e 5+6+7+8=26, que é um múltiplo de 13.

Mas podemos pegar sequências mais complicadas, como, por exemplo, um antigo telefone meu: 41921561. Eu tenho certeza absoluta de que existem números vizinhos que, somados, resultam em um múltiplo de oito (que é o tamanho da sequência). Basta caçar um pouco para encontrar que 4+1+9+2=16.

Ou, ainda, tomemos essa permutação de meu RG: 158313734. Cacemos os vizinhos que somados dão um múltiplo de nove, e uma leve busca nos leva a 5+8+3+1+3+7=27. Você certamente pode encontrar combinações mais simples, eu não disse que era única, apenas que existe.

Esse resultado, que é um divertido jogo quando se está profundamente entediado em uma sala de espera ou durante uma viagem de trem, é provado com o princípio do pombal. Para tal, tome sua sequência de tamanho n, da forma a_1,a_2,\ldots a_n. Pense agora em todas as possíveis sequências com a mesma ordem dessa sua original que começam no a_1, ou seja, as sequências:

a_1

a_1,a_2

a_1,a_2,a_3

E assim por diante. Pense agora na soma dos elementos delas. Se alguma dessas somas já dá um múltiplo de n, nosso problema está resolvido, então vamos supor o pior dos casos, nenhuma delas é um múltiplo de n. Assim, a soma dessas sequências, dividida por n, deve dar algum resto, e haverá n-1 possibilidades de resto.

Ainda em um exemplo, se minha sequência possuísse quatro elementos, as somas dessas subsequências teriam que ter resto ou 1, ou 2, ou 3. Se o resto fosse zero, seria divisível.

Como você tem n sequências possíveis e apenas n-1 restos possíveis, então, pelo princípio do pombal, terá, necessariamente, duas sequências diferentes cuja soma tem o mesmo resto na divisão por n. Ora, subtraia uma da outra que você terá uma sequência de vizinhos cuja soma, dividida por n, possui resto zero, logo, é divisível!

Para entender melhor, vou aplicar esse raciocínio a uma sequência específica: 1 2 1 3 6. As subsequências possíveis são 1, 1 2, 1 2 1, 1 2 1 3 e 1 2 1 3 6. Suas somas serão, respectivamente, 1, 3, 4, 7 e 13. Note que, dividindo por 5, esses números produzem respectivamente resto 1, 3, 4, 2 e 3. A segunda e a última sequência possuem o mesmo resto! Então tirando a segunda da última teremos os elementos 1 3 6 que, somados, dão 10, um múltiplo de 5.

Não sei se ficou claro, na verdade, acho que ficou confuso, mas vou deixar assim enquanto não encontro maneira melhor de escrever. Provar o princípio do pombal, no entanto, me parece mais difícil que esse resultado que acabei de enunciar, talvez usando algum resultado dessa parte mais fundamental de teoria dos conjuntos, propriedades com bijeções, injeções e sobrejeções, a noção de cardinalidade, teria que pensar um pouco. Por enquanto, fica o resultado das sequências, das casas, e a demonstração dos pombos.

Coleção completa

Quando era criança, fui atingido pela mania dos tazos da Elma Chips como todos os meus colegas. Abria o salgadinho antes mesmo de chegar à aula, longe ainda do recreio, e recolhia o precioso prêmio do pacote: um disco plástico que servia de moeda de aposta e demonstração de habilidade no intervalo. Eu não era muito bom nisso, e não tinha tantos amigos, então minha principal fonte de Tazos eram o fandangos.

Via colegas com tubos repletos de tazos, coleções completas, era invadido por essa inveja e, talvez mais, por uma pergunta séria: como aquilo era possível? Eu colecionava havia meses e não chegara perto da metade da coleção, possuía muitos repetidos e aquele do Papa-Léguas era mais difícil de encontrar que filhote de pomba. Não imaginava como aquilo era possível, culpava os pais do garoto sortudo, deviam ter comprado caminhões de baconzitos, e, no fundo, queria saber: de quantos fandangos eu precisaria para completar minha coleção?

Essa pergunta está mal-feita, vamos melhorá-la. Mais interessante seria perguntar: qual o número médio, o valor esperado, de salgadinhos que preciso comprar para completar minha coleção? Em outras palavras, a partir de qual número de fandangos é mais provável que eu já tenha a coleção completa que o contrário? E, como pergunta bônus, quão improvável se torna, a partir desse número, não obter os preciosos tazos?

Havia tazos mais raros, é verdade, mas a pergunta já está bem difícil, então tomo como hipótese que a chance de tirar qualquer um dos tazos é a mesma. E para continuar, precisamos primeiro saber quantos são eles, e eis a coleção toda:

Se você está interessado na resposta, mas não conhece tanto de probabilidade, o que segue não será tão interessante (vou fazer as contas, é o que faço da vida, não consigo evitar). Mas você pode pular para o final do post e ver as conclusões sem culpa, se confiar em mim. Se, no entanto, você entende de probabilidade, jamais confie em mim.

Suponha que eu já tenha k tazos diferentes, sendo n possíveis, a chance de eu tirar um repetido é \frac{k}{n}. Assim, a probabilidade de eu precisar de exatamente s salgadinhos para tirar um diferente é \left(\frac{k}{n}\right)^{s-1}\left(1-\frac{k}{n}\right), que é uma parte a chance de eu tirar s-1 repetidos e outra parte, no s-ésimo salgadinho, tirar um diferente. Essa é P(s), a chance de eu precisar de s fandangos para tirar meu tazo diferente. Para calcular o valor esperado de salgadinhos até o próximo tazo diferente, ou seja, de s, basta tomar:

\displaystyle \sum_{s\geq 0}P(s).s=\sum_{s\geq 0}\left(\frac{k}{n}\right)^{s-1}\left(1-\frac{k}{n}\right).s=\frac{1}{1-\frac{k}{n}}

Essa última passagem fiz na malandragem, vale a pena explicar. Vou chamar \frac{k}{n} de x porque digitar essas coisas no WordPress cansa. Vou aplicar a distributiva, manobrar os índices e converter tudo em uma progressão geométrica de soma bem fácil:

\displaystyle \sum_{s\geq 0}x^{s-1}\left(1-x\right).s=\sum_{s\geq 0}x^{s-1}s-\sum_{s\geq 1}x^s.s=\sum_{s\geq 0}x^s(s+1)-\sum_{s\geq 0}x^s.s=\sum_{s\geq 0}x^s=\frac{1}{1-x}

Então o número esperado de salgadinhos que devo comprar é a soma dos salgadinhos esperados para cada tazo que vou tirando, ou seja:

\displaystyle \sum_{k=0}^{n-1}\frac{1}{1-\frac{k}{n}}=\frac{n}{n}+\frac{n}{n-1}+\ldots+\frac{n}{2}+\frac{n}{1}

Sem magia até agora, eu apenas expandi a série. Eu poderia calcular exatamente esse valor para n=80, mas gosto de resultados mais gerais, e noto que essa soma é n vezes a série harmônica. Ela diverge, e não é surpreendente que eu precise de infinitos fandangos para tirar infinitos tazos, mas felizmente conhecemos razoavelmente bem o comportamento dessa série. O número esperado de salgadinhos necessários para completar uma coleção de n tazos é, portanto, nH_n, onde H_n é o n-ésimo número harmônico. Para n grande, podemos usar a aproximação H_n\approx \log n+\gamma, onde \gamma é a constante de Euler-Mascheroni (aproximadamente 0,5772).

Chegamos ao valor 80*(log(80)+\gamma)=396,74, certamente aproximado. Esse é o número médio de vezes que crianças completam suas coleções. Temos a média, a próxima pergunta é: quão provável é estar longe da média? Ao invés de tentar calcular com manobras intrincadas as flutuações desse número em torno da média, tomarei, a princípio, o exemplo de cinco crianças: Aline, Bruno, Carlos, Daphny e Eduardo. Eles começam suas coleções juntos e têm poucos amigos, logo, contam apenas com os salgadinhos para obter os preciosos discos. Eis uma simulação que fiz do resultado da coleção dessas cinco crianças:

Notamos algumas coisas interessantes. Primeiro, teremos que gastar aproximadamente metade dos salgadinhos totais necessários apenas para conseguir os dez últimos tazos; a matemática é cruel com coleções quase completas. Segundo, o valor necessário para completar é muito diferente nos cinco casos, isso exige um estudo mais sério.

Para tal, calibramos o computador para simular a coleção de tazos, ou o álbum de figurinhas (o problema é o mesmo) de 20.000 crianças. Fiz um histograma com a quantidade de salgadinhos necessária para completar toda a coleção e a porcentagem das crianças simuladas que precisaram daquela quantidade de salgadinhos para obterem o último tazo.

Notamos a larga variância dessa distribuição: haverá um grande número de crianças sortudas e um grande número de azaradas! Confirmamos o valor esperado, 396 parece de fato uma boa média dessa distribuição, e confirmamos o quão sórdido é o raciocínio da Elma Chips: algumas crianças precisariam de 900 salgadinhos para terem a coleção completa!

Contudo, esse modelo não representa bem a realidade, talvez apenas a minha, mas a maior parte das crianças tinha como maior objetivo as trocas de tazos, as disputas, completar a coleção contando com o salgadinho dos outros. Eu mesmo consegui dois amigos para fazer uma sociedade, ainda que cada um quisesse, para si, uma coleção completa. E esse será meu modelo de trocas: os amigos são amigos perfeitos, todo tazo repetido é compartilhado e o objetivo maior é, para y amigos, formar y coleções completas.

De forma não surpreendente, o número de fandangos que cada criança deve comprar reduz drasticamente com as trocas. Se ele antes precisava gastar quase um ano de lanches de salgadinho para encontrar os dez últimos, esses famigerados dez podem ter sido encontrados por algum colega que já até o tirou uma vez. Simulei o resultado com grupos de 1, 5, 10 e 30 crianças, sendo os resultados no histograma abaixo:

Esses valores são quantos fandangos cada um precisará comprar, ou seja, no grupo de dez, se dez amigos precisaram de 2000 fandangos para fechar a conta, contabilizo 200 para cada criança. Os valores médios de salgadinhos individuais obtidos para 1, 5, 10 e 30 são, respectivamente e aproximadamente, 398, 194, 154 e 120. Fiquei curioso para estudar a convergência dessa série, se vai para algum lugar (certamente converge, sendo decrescente e limitada em 80) e se esse lugar é 80, uma utopia em que todas as crianças do país montam suas coleções juntas; mas esse post já está longo e tanto salgadinho não deve fazer bem a esses meninos.

Por fim, noto que a amizade é o melhor investimento, você pode, em poucos meses de lanche, completar sua coleção de tazos ou figurinhas se encontrar, em uma sala de aula, trinta amigos perfeitos. A probabilidade desse fato, no entanto, mesmo em um modelo bem otimista, é extremamente baixa.