Suponha que a probabilidade de você ganhar é de 60%, a probabilidade de perder é de 40%; a probabilidade de ganho é de 100% e a de perda é de 100%; ou seja, se você ganhar, você pode ganhar US$ 1 por cada aposta, e se perder, você perderá US$ 1 por cada aposta. A aposta pode ser feita ilimitadamente, e cada aposta é determinada arbitrariamente por você.
Como é que devemos apostar?
Se não pensarmos muito, imaginemos grosseiramente que, como a minha expectativa de retorno de cada jogo é de 20%, para obter o máximo de retorno a longo prazo, devo tentar colocar o máximo de capital possível em cada jogo.
Mas, obviamente, é irracional colocar 100% do capital em cada jogo de apostas, porque uma vez que o jogo de apostas perde, todo o capital é perdido, não pode mais participar do próximo jogo, só pode sair do campo.
Assim, uma conclusão pode ser tirada: se houver um impasse, a possibilidade de perder todo o capital de uma só vez, mesmo que seja muito pequena, nunca será cheia. Porque, no longo prazo, eventos de pequena probabilidade são inevitáveis, e na vida real, os eventos de pequena probabilidade são muito mais prováveis do que suas probabilidades teóricas.
O que é que a realidade é?
Antes de analisarmos o problema em termos teóricos, podemos fazer uma experiência. Simulamos o impasse e apostamos 99% em cada vez para ver o que acontece.
A simulação é muito simples e pode ser feita no Excel. Veja o gráfico abaixo:
Figura 1
Como mostrado acima, a primeira coluna representa o número de pontos; a segunda coluna é a vitória; o Excel produz 1 com uma probabilidade de 60%, ou seja, uma probabilidade de 60% de retorno líquido; a probabilidade de 1,40% de retorno líquido; a terceira coluna é todo o dinheiro do jogador no final de cada rodada.
Como você pode ver no gráfico, depois de 10 rodadas, a probabilidade de ganhar em 10 rodadas é de 8, maior do que a probabilidade de 60%, perdendo apenas duas vezes.
Quando multipliquei o número de experimentos em 1000, 2000, 3000... o resultado foi imaginável: o dinheiro na mão era basicamente zero.
Como 99% não funciona, vamos experimentar com outras proporções e ver o gráfico abaixo: Como pode ser visto no gráfico, quando a posição é gradualmente reduzida, de 99%, para 90%, 80%, 70%, 60%, o resultado é completamente diferente nos mesmos 10 turnos.
O problema do impasse não é tão simples. Mesmo com um impasse tão grande, não é fácil ganhar dinheiro.
Então, como é que se pode apostar para obter o maior lucro a longo prazo?
É melhor o menor, como o gráfico acima mostra? Não, porque não se ganha dinheiro quando o índice se torna zero.
Então, qual é a proporção ideal?
É esse o problema que a famosa fórmula de Kelly está tentando resolver!
Figura 2
onde f é a proporção de aposta ideal; p é a probabilidade de ganhar; rw é a taxa de retorno líquido quando se ganha, por exemplo, rw = 1 em um impasse 1; rl é a taxa de perda líquida quando se perde, por exemplo, rl = 1 em um impasse 1; note que rl > 0 aqui.
De acordo com a fórmula de Kelly, pode-se calcular que a maior percentagem de apostas no impasse 1 é de 20%.
Podemos fazer uma experiência para entender melhor essa conclusão.
Figura 3
No gráfico, colocamos as posições em 10%, 15%, 20%, 30%, 40%; as colunas correspondentes são D, E, F, G, H.
Quando eu fiz o número de vezes que eu fiz o teste, foi de 3000. Quando eu fiz o número de experiências para 5000, Pode-se ver que a coluna F corresponde ao maior resultado, e a base não é uma escala numérica em relação a outras colunas. A proporção de posições da coluna F corresponde a 20%.
Veja o poder da fórmula de Kelly. Na experiência acima, se você tiver o azar de escolher uma proporção de 40%, ou seja, a coluna H, depois de 5.000 jogos de apostas, seu capital ganha muito, embora tenha passado de 100 para 22799985.75.
É o poder do conhecimento!
A dedução matemática da fórmula de Kelly e sua complexidade, exigem um conhecimento matemático muito profundo, por isso não faz sentido discutir aqui. Aqui vou aprofundar a compreensão subjetiva da fórmula de Kelly através de algumas experiências.
Vamos voltar a um impasse. O impasse 2: as probabilidades de perder e ganhar são de 50%, por exemplo, jogar uma moeda. O retorno líquido quando você ganha é de 1, ou seja, rw = 1, e o prejuízo líquido quando você perde é de 0,5, ou seja, rl = 0,5. Ou seja, quando você ganha um dólar por cada dinheiro que ganha, você ganha 1 dólar, e quando perde, você só paga 5 moedas.
É fácil ver que o ganho esperado do impasse 2 é de 0.25, outro impasse em que os hackers têm uma grande vantagem.
De acordo com a fórmula de Kelly, podemos obter a melhor proporção de apostas por jogo:
Figura 4
O que significa que cada vez que você aposta com metade do seu dinheiro, você obtém o maior lucro no longo prazo.
A seguir, vou experimentar a noção de taxa de crescimento média r.
A primeira coisa a fazer é olhar para a experiência 2.1, que mostra dois gráficos:
Figura 5
Ambos os gráficos são experimentos feitos em um simulador de impasse 2, na segunda coluna, a coluna de ganhos mostra uma probabilidade de 50% de um resultado de 1, ou seja, 100% de lucro. A coluna de 50% mostra uma probabilidade de -0.5, ou seja, 50% de prejuízo. A terceira e quarta colunas mostram o dinheiro que se tem após cada impasse em posições abaixo de 100% e 50%, respectivamente.
Comparando atentamente os dois gráficos, pode-se concluir que, após o mesmo número de jogos, o resultado final está relacionado apenas com o número de jogos ganhos e perdidos nesses jogos, e não com a ordem de jogos ganhos e perdidos nesses jogos. Por exemplo, nos dois gráficos anteriores, foram feitos 4 jogos, assim como em cada gráfico, os dois jogos ganhos perderam dois jogos, mas a ordem de ganho do primeiro gráfico é ganho-ganho-ganho, e a ordem de ganho-ganho do segundo gráfico é ganho-ganho-ganho-ganho.
É claro que essa conclusão é muito fácil de provar (a lei da substituição da multiplicação, os alunos do ensino fundamental), mas não é suficiente para provar que os dois exemplos acima são suficientemente compreensíveis para todos.
Então, como o resultado final não tem relação com a ordem de vitórias e derrotas, então vamos supor que o impasse 2 continue como a experiência 2.2.
Figura 6
Assumimos que as vitórias dos impasses são alternadas, e, por causa da conclusão 1, isso não tem qualquer impacto no resultado financeiro no longo prazo.
Antes de observarmos a imagem, fazemos uma definição. Suponhamos que um impasse de vários jogos é considerado como um todo, no qual a frequência de ocorrência de vários resultados é exatamente igual à sua probabilidade, e o conjunto é o menor número de jogos em que todas as condições são cumpridas. Então chamamos o conjunto de um impasse.
Observe atentamente os números marcados em azul no gráfico acima, eles são o final de um conjunto de impasses. Você verá que os números mantêm um crescimento estável. Quando o posicionamento é de 100%, o número de marcação em azul tem uma taxa de crescimento de 0%, ou seja, o crescimento do capital após um conjunto de impasses é de 0%. Isso também explica que é impossível lucrar no médio e longo prazo no segundo impasse, quando o investimento está cheio. Quando o posicionamento é de 50% (ou seja, a melhor proporção obtida pela fórmula de Kelly), o número de marcação em azul tem uma taxa de crescimento de 12,5%, ou seja, um crescimento do capital após um conjunto de impasses de 12,5%.
É uma lei geral que a taxa de crescimento após cada conjunto de paralisia está relacionada ao posicionamento; e quanto maior a taxa de crescimento após cada conjunto de paralisia, maior o retorno final no longo prazo.
De acordo com a taxa de crescimento de cada conjunto de impasses, pode-se calcular a taxa de crescimento média de cada impasse g. No gráfico acima, se cada conjunto de impasses contém dois impasses, então a taxa de crescimento média de cada impasse é g.
Figura 7
No longo prazo, se quisermos que o capital obtenha o maior crescimento possível, basta maximizar r, ou seja, maximizar g. A melhor proporção de apostas f também é obtida através da solução max ((g)).
A fórmula de Kelly foi originalmente criada pelo físico John Larry Kelly, da AT&T Bell Laboratories, com base em pesquisas de seu colega Claude Elwood Shannon sobre os telegramas de longa distância. Kelly resolveu o problema de como a teoria de informação de Shannon se aplica a um apostador com mensagens de linha interna em um momento de caça. O apostador quer decidir o melhor valor de aposta, e sua mensagem de linha não precisa ser perfeita ("sem mensagens") para ter uma vantagem útil. A fórmula de Kelly foi posteriormente aplicada a 21 pts e ao mercado de ações por outro colega de Shannon, Edward Thorpe. Thorpe usou o excedente do trabalho e, após meses de cálculos árduos, escreveu um artigo matemático intitulado "A estratégia de preferência de 21 pontos de jogo". Utilizando seu conhecimento, ele invadiu todos os casinos da cidade de Reno, Nevada, durante a noite, e conseguiu ganhar milhares de dólares com a mesa de 21 pontos de jogo. Ele também foi o pai dos fundos de hedge de negociação quantitativa de Wall Street nos Estados Unidos, criando o primeiro fundo de hedge de negociação quantitativa nos anos 70.
Aplicação da perspectiva
Como usar a fórmula Kelly para ganhar dinheiro na vida real? É criar um impasse que satisfaça as condições de aplicação da fórmula de Kelly. Recentemente, eu tenho estudado sistemas de negociação, e o que é mais importante para um bom sistema de negociação? Um rendimento esperado é 10% da importância de regras positivas de compra e venda, enquanto um bom método de controle de fundos é 40% da importância, e o restante 50% é o controle psicológico de manipulação de pessoas. A fórmula de Kelly é a ferramenta que me ajuda a controlar as posições de capital. Por exemplo, um sistema de negociação de ações que eu estudei anteriormente, que operava uma vez por semana, com probabilidade de sucesso de 0,8 e de 0.2 por semana. Ganhava 3% quando era bem sucedido, deduzindo comissões e impostos sobre a estamparia, perdendo 5% quando falhava. Antes de saber a fórmula de Kelly, eu era um comerciante cheio de olhos e não sabia que o posicionamento estava errado. Depois de usar a fórmula de Kelly, a posição ideal calculada deveria ser 9.33, ou seja, se a taxa de juros do empréstimo fosse 0, a taxa de crescimento do capital seria mais rápida. É claro que a fórmula de Kelly não pode ser tão simples em sua aplicação prática, e há muitas dificuldades a serem superadas. Por exemplo, o custo de capital necessário para a troca de alavancagem, por exemplo, o dinheiro na realidade não é infinitamente divisível, por exemplo, no mercado financeiro não é tão simples quanto o simples impasse mencionado acima. Mas, de qualquer forma, a fórmula de Kelly nos mostra o caminho a seguir.