Conceitos simples, que talvez muitos desconheçam
Por Hindemburg
Melão Jr.
Um dos conceitos mais básicos no Mercado Financeiro, bem como na Estatística,
é o de dispersão. A forma usual de se medir a dispersão
é considerar que os dados se distribuem normalmente e calcular o desvio-padrão.
O desvio-padrão tem certas propriedades que deveriam ser observadas
e, caso elas não ocorram, certos cuidados precisam ser tomados.
Quem usa cegamente esta e outras ferramentas, sem compreender suas propriedades,
não consegue solucionar muitos problemas simples, e muito menos lidar
com situações inesperadas. Um problema simples é quando
a pessoa tem uma estratégia otimizada para funcionar com timeframe
de 1 dia, mas se numa situação em que precisa usar a mesma estratégia
com timeframe de 15 minutos. Se a pessoa tiver alguma noção
sobre os significados de média e desvio-padrão, poderá
considerar que 1 dia tem 24 horas, portanto 96 ciclos de 15 minutos. Assim,
uma média móvel de 20 períodos de 1 dia deveria ficar
muito semelhante a uma média móvel de 1920 períodos de
15 minutos, bem como os demais indicadores.
Outra propriedade a ser considerada é que o desvio-padrão cresce
aproximadamente com a raiz quadrada do tamanho do período considerado.
Assim, se temos uma volatilidade de R$ 11,00 num período de 1000 horas,
espera-se que ela seja em torno de R$ 1,10 em 10 horas, pois um período
100 vezes menor deveria ser 10 vezes menos volátil. Na verdade, quando
se fala em volatilidade no Mercado, se está falando de desvio-padrão
dos logaritmos, conforme já comentamos em outros artigos.
Pois bem, estes são dois casos típicos, em que um conhecimento
básico ajuda a dar soluções rápidas e apropriadas.
No EURUSD, por exemplo, 3000 períodos de 15 minutos têm volatilidade
de 0,0291. Estes 3000 períodos correspondem a aproximadamente 1 mês
(31,25 dias), então verificamos que em 31 dias a volatilidade é
realmente de 0,0287, diferença de apenas 1,4%. Outro exemplo: no ouro
temos volatilidade de 1050 períodos de 4 horas, o que equivale a 25
períodos de 1 semana (25 x 7 x 24 / 4 = 1050). Ao conferir, vemos que
a volatilidade em 1050 períodos de 4 horas é $ 52,81, enquanto
nas 25 semanas é $ 49,42. Enfim, é coerente e se aplica na grande
maioria dos casos. Mas porque não em todos os casos, já que
um período de 1 dia sempre tem 24 horas, 1 semana sempre tem 7 dias
etc.? Note que não estamos falando de um dia arbitrário, mas
sim do MESMO DIA, ou seja, entre agora e 30 dias atrás e entre agora
e 720 horas atrás (24 x 30 = 720). Deveria ser válido sempre,
mas na prática não é por três motivos, sendo que
dois deles são bastante óbvios:
1) Medias ponderas (exponencial, linear weighted, smoothed) atribuem maior
peso aos dados mais recentes de maneira diferente se usarmos 720 ou 30 períodos.
Então é necessário usar médias simples para que
funcione.
.
2) Qual valor de cada candle deve ser considerado? Isso também faz
diferença. Em candles diários e semanais, o CLOSE é o
mais indicado, por geralmente representar o maior volume. Mas também
serve o OPEN. Não são tão indicados o HIGH e LOW, que
podem assumir valores exagerados, e não são indicados MEDIAN,
WEIGHTED e TYPICAL porque eles atenuam os extremos.
3) O terceiro motivo é mais interessante, por isso deixaremos para
discutir exclusivamente no fórum destinado a conversas dos cotistas.
Recentemente fiz alguns testes usando o Saturno V 3.0 com timeframe de 1 hora,
e depois multipliquei alguns parâmetros por 4,9 e por 24, dependendo
do caso, para usá-lo em timeframe de 1 dia e não ter que gerar
outro arquivo FXT (não confundir o timeframe com a granulosidade da
base. A granulosidade da base é tick-by-tick, os timeframes podem ter
1 minuto, 1 hora, 1 mês etc.).
Para minha surpresa, os resultados foram muito diferentes. Então fui
verificar qual poderia ter sido a causa. O suspeito era o cálculo de
médias e desvios-padrão e, de fato, era o culpado. Teoricamente,
um período de 25 meses deve ter volatilidade cerca de 5 vezes maior
que o período de 1 mês (raiz quadrada de 25). Mas como as propriedades
gerais do Mercado não permanecem, em média, as mesmas, seria
normal que houvesse flutuações consideráveis. Porém
o desvio-padrão de 12 meses deveria ser quase idêntico ao de
365 dias, por cobrirem exatamente o mesmo período, e as pequenas diferenças
deveriam decorrer apenas do fato de os preços terem mais possibilidades
de oscilar dentro dos candles maiores. Claro que em tal caso se deve usar
o método “simple”, isto é, sem ponderação
em função do tempo. Mas não é o que se observa
na prática. No caso da IBM, por exemplo, um período de 52 semanas
tem volatilidade $ 9,43, enquanto um período de 365 dias tem volatilidade
de $ 18,07!!! Quase o dobro! Isso usando exclusivamente os preços de
fechamento, para evitar que as médias dos candles (Typical, Weighted,
Median) agravassem o problema. Mesmo assim, houve um erro de 92%! No caso
do ouro, que comentamos pouco acima, se usar 2100 períodos de 4 horas,
em vez de 1050, o problema também se manifesta! Com 2100 períodos
temos volatilidade $ 101,94, mas com 50 semanas (50 x 7 x 24 / 4 = 2100) a
volatilidade é $ 56,78!
Esse problema também afeta as médias e, certamente, todos os
demais indicadores.
Em suma, isso significa que quando se fala em “volatilidade”,
não basta definir o período a que se está fazendo alusão,
mas também o timeframe usado no cálculo. O ideal seria que todos
os indicadores, especialmente a volatilidade e as médicas, fossem calculados
usando bases de ticks, mas isso teria o sério inconveniente de demandar
muito tempo, pois 1 ano tem cerca de 5 milhões de ticks em divisas
de maior liquidez, então é muito mais rápido calcular
a volatilidade de 1 ano usando 52 semanas, sobretudo numa otimização
que requer 10.000 repetições do mesmo teste.
Leia também: Conceitos
simples, que talvez muitos desconheçam