Diversificação sob estresse: otimização em Min-Var e Min-CVaR e a contribuição de estimadores robustos

Comparativo de desempenho com restrições, custos e bandas; Min-Var com Ledoit–Wolf, Huber e Tyler versus Min-CVaR por cenários

out 06, 2025

Introdução

Este estudo investiga, em dados reais, como diferentes formas de otimizar o risco se comportam fora da amostra quando submetidas a restrições práticas de investimento e custos. O ponto central não é “qual estimador usar”, mas o que se ganha (ou perde) ao escolher entre minimizar a variância (Min-Var) e minimizar perdas de cauda (Min-CVaR), dado um universo amplo, janelas móveis de estimação e políticas realistas de rebalanceamento.

Compararmos duas famílias de carteiras sob as mesmas restrições (long-only, orçamento, limite de concentração por ativo e penalização de turnover) e com custos de transação explícitos. A formulação Min-Var representa a abordagem clássica de Markowitz, dependente da matriz de covariância; já a Min-CVaR segue a formulação de Rockafellar-Uryasev, baseada em cenários e focada diretamente nas perdas extremas. Para dar contexto e um piso de desempenho, incluímos benchmark simples e governável, o (1/N), útil para comparar a complexidade das estratégias otimizadas com regras parcimoniosas.

O desenho empírico é deliberadamente out-of-sample: usamos janelas móveis para estimar parâmetros e gerar pesos, testando rebalanceamento mensal e por bandas de tolerância, de modo a capturar o trade-off entre estabilidade dos pesos, custo de negociação e controle de drawdown. A avaliação considera um conjunto amplo de métricas (retorno e volatilidade anualizados, Sharpe/Sortino, máximo drawdown, VaR/CVaR e medidas de turnover) para comparar não só “quanto rendeu”, mas como a carteira chega a esse resultado.

Os estimadores robustos aparecem como ferramentas para viabilizar a abordagem Min-Var em ambientes com caudas pesadas, assimetrias e alta dimensionalidade, problemas típicos em finanças. Eles estabilizam a covariância e reduzem sensibilidade a outliers.

Em resumo, o objetivo é responder, com evidência empírica e métricas comparáveis, quando e a que custo cada método entrega melhor equilíbrio entre risco, retorno e governança. Nas seções seguintes detalhamos as formulações de otimização, o conjunto de dados, o protocolo de backtest, os resultados e suas implicações práticas.

Observação: todo código utilizado está no repositório PQ MinCVar.

Modelos de otimização

Para contextualizar as estratégias comparadas, definimos abaixo cada método de otimização e estratégia de alocação considerada, bem como suas bases teóricas:

Portfólio de variância mínima (Min-Var)

A estratégia Min-Var visa encontrar a alocação de ativos que minimize a variância do retorno do portfólio, sujeita a restrições (por exemplo, soma dos pesos igual a 1, sem posições short, etc.). Trata-se de um caso particular da otimização média-variância de Markowitz (1952), focado exclusivamente em reduzir o risco (desvio-padrão) sem considerar explicitamente o retorno esperado, o que seria equivalente a assumir retornos iguais ou sem preferência por retorno. Matematicamente, podemos formular o problema clássico de mínima variância como:

\(\begin{aligned} \min_{w}\quad & w^\top \Sigma\, w \\ \text{sujeito a}\quad & \sum_{i=1}^n w_i = 1, \\ & 0 \le w_i \le w_{\max},\quad i=1,\dots,n . \end{aligned} \)

onde w é o vetor de pesos do portfólio, Σ é a matriz de covariância dos retornos dos ativos, e w máximo é um limite superior (opcional) para cada peso, por exemplo, 30% em cada ativo, para evitar concentração. Restrições de long-only (wᵢ ≥ 0) e de orçamento (∑ wᵢ = 1) são comuns em carteiras. Em implementações realistas, também pode-se incluir uma penalização de turnover (mudança dos pesos em relação ao período anterior) para reduzir custos de transação, adicionando um termo λ ∑ᵢ ∣wᵢ − wᵢᵖʳᵉᵛ∣ na função objetivo, com λ controlando a aversão a custos.

O portfólio de variância mínima explora as correlações entre ativos para obter a maior diversificação possível do risco. Como resultado, tende a enfatizar ativos de menor volatilidade e baixa correlação. Contudo, uma crítica comum é sua sensibilidade a erros de estimação na covariância: pequenos erros podem levar a alocações muito instáveis ou concentradas. Por isso, costuma-se empregar estimadores aprimorados de covariância (discutidos adiante) para viabilizar o uso do Min-Var.

Além disso, em nosso estudo limitamos o peso máximo em 30% por ativo, o que evita soluções degeneradas (e.g. alocar quase 100% em um único ativo de baixíssima volatilidade, como um título público). Com tais restrições, o Min-Var resulta num trade-off entre minimização de risco e diversificação imposta.

Portfólio de CVaR mínimo (Min-CVaR)

A estratégia Min-CVaR propõe minimizar o Conditional Value-at-Risk do portfólio, em vez da variância. O CVaR a um nível de confiança α (por exemplo, 95% ou 99%) corresponde à perda média esperada na cauda superior dos piores (1-α)% retornos. Em termos simples, é o valor médio das perdas extremas além do VaR. Diferentemente da variância, o CVaR é uma medida de risco assimétrica focada nas perdas, sendo considerada uma medida coerente de risco (no sentido de Artzner et al., 1999) e mais alinhada à intuição de gestores que querem limitar perdas catastróficas. Rockafellar e Uryasev (2000) demonstraram uma formulação eficaz para otimizar CVaR, introduzindo uma variável auxiliar para o VaR dentro de um problema linear. A formulação típica é:

\(\begin{aligned} \min_{w,\eta,\{z_t\}_{t=1}^T}\quad & \eta + \frac{1}{(1-\alpha)T}\sum_{t=1}^{T} z_t \\ \text{sujeito a}\quad & z_t \ge 0,\quad t=1,\dots,T,\\ & z_t \ge -\,w^\top r_t - \eta,\quad t=1,\dots,T,\\ & \sum_{i=1}^{n} w_i = 1,\\ & 0 \le w_i \le w_{\max},\quad i=1,\dots,n. \end{aligned} \)

onde η representa o VaR no nível α e zₜ são variáveis auxiliares para excedentes de perda além do VaR em cada cenário t, assumindo um conjunto de T cenários de retorno ou histórico. Intuitivamente, o solver ajusta η (VaR) e w para minimizar η + 1∕(1−α) · 𝔼[excesso de perda], o que é equivalente ao CVaR₍α₎. Essa formulação é resolvida como um programa linear, tornando a otimização de CVaR viável mesmo para universos de ativos maiores e contornando dificuldades típicas de métodos não lineares.

Ao minimizar o CVaR, o portfólio tende a reduzir a exposição a eventos de cauda, normalmente alocando menos peso a ativos com distribuições muito assimétricas ou de cauda pesada (alta curtose). No estudo, consideramos níveis de confiança α = 95 % e α = 99 % para avaliar o impacto em diferentes severidades de cauda. Assim como no Min-Var, impusemos soma = 1, wᵢ ≥ 0, wₘₐₓ = 30 % e penalização de turnover na otimização do Min-CVaR, garantindo comparabilidade entre as estratégias.

Um ponto importante é que, apesar do Min-CVaR focar em cauda, na prática observamos que portfólios de CVaR mínimo também apresentam variância baixa, pois, afinal, reduzir as perdas extremas frequentemente reduz a volatilidade total. Rockafellar & Uryasev notaram que “portfólios com baixo CVaR necessariamente têm VaR baixo também”.

Outras estratégias de alocação

Alternativamente ao Min-Var e ao Min-CVaR, destacam-se Risk Parity (RP) e Strategic Asset Allocation (SAA) ou 1/N por combinarem parcimônia e robustez a erro de estimação. Ambas facilitam governança, pois possuem regras simples, comunicação clara, rebalanceamento previsível, têm baixo custo operacional e costumam entregar desempenho ajustado ao risco competitivo em dados ruidosos. RP tende a estabilizar o risco e ser mais resiliente em crises, já o SAA estabelece um piso realista para medir o ganho marginal das técnicas otimizadas. Dessa forma, poderiam servir como benchmark.

Paridade de risco (risk parity)

Busca igualar as contribuições de risco de cada ativo para a volatilidade do portfólio. A condição de Equal Risk Contributions (ERC) é wᵢ (Σw)ᵢ = κ, ∀ i, o que implica pesos menores para ativos mais voláteis e maiores para os mais seguros. Encontrar w é um problema não linear, usualmente resolvido por métodos iterativos ou como variante do Min-Var com restrições de ERC.

O Risk Parity (RP) promove diversificação em unidades de risco e costuma ficar próximo ao Min-Var, sem exigir a estimação de retornos esperados. Ao balancear, por exemplo, risco de ações e títulos, tende a manter estabilidade de risco ao longo do ciclo e maior resiliência em crises. Esse racional é frequentemente associado ao All Weather da Bridgewater pós-2008. Para o RP, espera-se volatilidade semelhante à do Min-Var e composição mais inclinada a títulos para equilibrar o risco, reduzindo indiretamente a exposição às caudas de ações.

Alocação estratégica com pesos fixos (SAA – buy and hold)

Como baseline, usamos um portfólio equally weighted (EW ou 1/n) com rebalanceamento anual; entre rebalanceamentos, os pesos derivam com os retornos. Essa referência é simples, transparente e robusta a erro de estimação (não otimiza parâmetros, apenas mantém pesos alvo). A evidência clássica sugere que 1/N rivaliza modelos otimizados out-of-sample quando os inputs são ruidosos. No backtest, o EW inclui os mesmos 16 ETFs (~6,25% cada). Espera-se volatilidade intermediária: acima do Min-Var por ignorar correlações e drawdowns maiores que Min-CVaR, pois não mira caudas, servindo para quantificar o ganho marginal da otimização.

Estimadores robustos de covariância e média

Um componente crítico na implementação prática do portfólio Min-Var é a estimação dos parâmetros de risco, notadamente, a matriz de covariância dos retornos e, em menor grau, as médias ou outros parâmetros de distribuição. Estimativas ingênuas, como a covariância amostral simples, sofrem quando o número de ativos é grande em relação ao histórico disponível, ou quando os dados contêm outliers e distribuições com caudas pesadas. Para contornar esses problemas, recorremos a estimadores robustos e técnicas de redução de dimensionalidade. O repositório emprega três estimadores principais de covariância/média, que explicamos a seguir:

Shrinkage de Ledoit–Wolf (OAS)

O estimador Ledoit-Wolf OAS (Oracle Approximating Shrinkage) é uma forma de shrinkage linear da matriz de covariância amostral em direção a uma matriz estrutural mais simples (tipicamente, a matriz diagonal de variâncias ou a matriz identidade escalada). A ideia, conforme proposta por Ledoit e Wolf (2004), é combinar a matriz de covariância empírica Σ_sample com uma matriz bem condicionada (por exemplo, I · σ²) de forma ótima, diminuindo o efeito de ruídos na estimação. Em fórmula simplificada:

\(\Sigma_{\mathrm{LW}} = (1-\delta)\,\Sigma_{\mathrm{sample}} + \delta\,\sigma^2 I \)

onde σ² é a variância média dos ativos (traço da amostral dividido por p) e δ ∈ [0,1] é o parâmetro de shrinkage.

Ledoit & Wolf demonstram como calcular δ analiticamente para minimizar o erro de estimação (assintoticamente, conforme p e T crescem). O resultado é um estimador viés-variância otimizado, que produz uma matriz invertível e estável mesmo em alta dimensionalidade.

A denominação OAS se refere a uma versão melhorada do shrinkage de Ledoit-Wolf que assume uma distribuição normal multivariada e obtém uma forma fechada para o shrinkage ótimo. Em resumo, esse estimador reduz a propensão do método de Markowitz clássico de superestimar a diversificação com base em correlações espúrias. Ao usar Σ_LW, esperamos portfólios mais estáveis e desempenho out-of-sample superior ao usar Σ_sample pura.

M-Estimador de Huber (média e covariância)

Peter Huber (1964) introduziu uma classe de estimadores robustos conhecidos como M-estimadores, que generalizam a média e covariância para serem menos sensíveis a outliers. No nosso caso, usamos o Huber M-estimator para a média, calculando uma média truncada/ponderada: intuitivamente, ele atribui menor peso a observações distantes (outliers) além de um certo limite c, que geralmente escolhido para 95% de eficiência sob normalidade. A função de perda de Huber para um resíduo r é:

\(\rho_c(r)= \begin{cases} \frac{r^2}{2}, & |r|\le c,\\[4pt] c\,|r|-\frac{c^2}{2}, & |r|>c. \end{cases} \)

o que significa que resíduos dentro de c usam quadrático (como média quadrática) e resíduos muito grandes são linearizados (reduzindo sua influência). Ao resolver arg min_μ ∑ᵢ ρ_c(xᵢ − μ) iterativamente, obtemos μ_Huber, a média robusta. Para a covariância, combinamos a média de Huber com o shrinkage OAS na covariância dos resíduos, produzindo um estimador robusto para Σ.

Estimador de Tyler (scatter matrix)

O Tyler’s estimator (1987) é um estimador robusto não paramétrico para a matriz de scatter (covariância até uma constante) que possui a propriedade notável de ser invariante à distribuição elíptica. Em outras palavras, mesmo se os retornos tiverem uma distribuição de cauda pesada (por ex. t-Student multivariada), o estimador de Tyler continua válido, ao contrário da covariância amostral que seria muito influenciada por observações extremas. A equação implícita que define a matriz de scatter de Tyler Σ_Tyler para dados xᵢ (i=1,…,T; média assumida 0 para simplificar) é:

\(\Sigma_{\mathrm{Tyler}} \propto \frac{p}{T}\sum_{i=1}^{T} \frac{(x_i-\mu)(x_i-\mu)^\top} {(x_i-\mu)^\top \Sigma_{\mathrm{Tyler}}^{-1} (x_i-\mu)} \)

onde p é a dimensionalidade (número de ativos). Essa equação é resolvida iterativamente via fixed-point, normalizando a cada passo para fixar um escalar, já que Σ_Tyler é definida a menos de um multiplicador. O resultado é uma matriz que ignora a magnitude absoluta das observações, focando apenas na sua direção, o que torna o estimador imune a outliers arbitrariamente grandes, ideal para dados de retornos com distribuições de cauda pesada (grandes kurtoses).

Em contrapartida, ele não fornece uma escala (variância total) consistente, então no projeto combinamos o scatter de Tyler com a escala amostral (variância média) para recuperar as unidades corretas, e então aplicamos um pequeno shrinkage à identidade (similar a Ledoit-Wolf) para evitar problemas numéricos.

Configuração do backtest e dados

Metodologias de otimização

As estratégias de portfolio foram implementadas através de métodos de otimização convexa. O Min-Var utiliza programação quadrática resolvida via OSQP, um solver especializado em problemas QP que emprega métodos de ponto interior com decomposição operator splitting para alta performance computacional.

O Minimum CVaR adota a formulação linear de Rockafellar-Uryasev, que reformula o CVaR como problema de programação linear, resolvido eficientemente pelo solver HiGHS baseado no método simplex revisado dual.

Universo considerado

Conduzimos um backtest histórico para comparar as estratégias acima, utilizando dados de 16 ETFs abrangendo diversas classes de ativos (ações americanas de várias características, ações internacionais desenvolvidas e emergentes, títulos de renda fixa de diferentes prazos e créditos, ouro, prata, imóveis (REITs), commodities e petróleo). Todos os ativos possuem pelo menos 15 anos de histórico de preços (2002–2023 aprox.), garantindo que enfrentaram múltiplos ciclos de mercado, incluindo crises como 2008 e 2020.

Os dados foram obtidos via API da Tiingo e processados para calcular retornos diários (log-returns), com tratamento de outliers de preço (quality control) para evitar erros nos dados. Abaixo, a lista de ETFs considerados.

Ações US (4 ETFs)
- SPY - SPDR S&P 500 (Large Cap)
- IWD - iShares Russell 1000 Value
- IWF - iShares Russell 1000 Growth
- IWM - iShares Russell 2000 (Small Cap)
Ações Internacionais (3 ETFs)
- EFA - iShares MSCI EAFE (Developed Markets ex-US)
- EEM - iShares MSCI Emerging Markets
- VWO - Vanguard FTSE Emerging Markets
Bonds Treasuries (2 ETFs)
- TLT - iShares 20+ Year Treasury Bond
- IEF - iShares 7-10 Year Treasury Bond
Bonds Corporativos (2 ETFs)
- LQD - iShares Investment Grade Corporate Bond
- HYG - iShares High Yield Corporate Bond
Metais (2 ETFs)
- GLD - SPDR Gold Trust
- SLV - iShares Silver Trust
Imóveis (1 ETF)
- VNQ - Vanguard Real Estate Index Fund
Commodities (2 ETFs)
- DBC - Invesco DB Commodity Index Tracking Fund
- USO - United States Oil Fund

Janela de estimação e rebalanceamento

Usamos uma janela móvel de 756 dias (~3 anos) para estimar parâmetros (covariâncias e médias robustas). A cada dia, o modelo olha os 3 anos anteriores e resolve o problema de otimização Min-Var ou Min-CVaR (dependendo da estratégia) para obter os pesos ótimos w⋆. Duas políticas de rebalanceamento foram testadas:

Rebalanceamento mensal (MONTHLY) – os pesos são ajustados para w⋆ no último dia de cada mês;
Rebalanceamento por bandas (BANDS) – os pesos só são ajustados quando a deriva ultrapassa um certo limite (band) em relação aos pesos estratégicos. No caso, consideramos bandas de 2%, 5% e 10%. Essa política simula uma abordagem de tolerância à deriva: deixa-se o portfólio seguir mercado até que as alocações se desviem significativamente, então rebalanceia de volta.

Além disso, rodamos também um caso de rebalanceamento anual para o benchmark de Equal Weight.

Custos de transação

Para tornar o backtest realista, incluímos um custo de transação de 6 pontos-base (0,06%) em cada rebalanceamento, além da penalização de turnover λ na otimização como hiperparâmetro. Isso desencoraja trocas excessivas de posição. A taxa livre de risco (3-month T-Bill proxy via SHY ETF) foi incorporada para cálculo de métricas de retorno ajustado ao risco (Sharpe e Sortino ratios). Os portfolios permanecem 100% investidos nos ativos elencados, não há alocação em caixa.

Combinação de hiperparâmetros

O grid search avaliou 60 configurações testando três valores de penalização de turnover (lambda: 0,0, 0,0003, 0,001) combinados com dois métodos de otimização (MINVAR e MINCVAR), três estimadores robustos de covariância (Ledoit-Wolf, Huber, Tyler), dois níveis de confiança para CVaR (α=95%, 99%), e quatro políticas de rebalanceamento (mensal e bandas de 2%, 5%, 10%). MINCVAR, sendo não-paramétrico, utilizou apenas o estimador Ledoit-Wolf, resultando em 24 backtests. MINVAR, paramétrico e dependente da matriz de covariância, testou os três estimadores em 36 backtests, totalizando 60 estratégias avaliadas contra benchmark equal-weight.

Métricas avaliadas

Avaliamos cada estratégia pelos critérios usuais: retorno anualizado, volatilidade anualizada, Sharpe Ratio, Sortino Ratio, Max Drawdown, VaR e CVaR (95% e 99%), Ulcer Index (volatilidade de downside) e medidas de turnover, como o turnover anualizado e número de rebalanceamentos. Essas métricas dão um panorama completo de desempenho ajustado ao risco e custos.

Resultados

As duas estratégias líderes (uma em Sharpe Ratio e outra em menor max drawdown) obtidas nos resultados revelam filosofias distintas de gestão de risco.

A TYLER-MINVAR BANDS-10% (Sharpe 0,576, lambda 0,0003) demonstrou estabilidade com apenas um rebalanceamento em 18,5 anos, mantendo alocação constante de 78% em renda fixa (principalmente IEF 30%, LQD 22%, HYG 18%), 13% em ações (IWF, SPY) e 9% em diversificadores (ouro e commodities). Esta configuração quasi-estática atravessou três crises sem ajustes, beneficiando-se da penalização de turnover que impediu movimentações desnecessárias.

Já a LW-MINVAR BANDS-5% (drawdown 15,74%, lambda 0,0) adotou postura defensiva com livre adaptação, realizando 16 rebalanceamentos ao longo do período. Com lambda zero, a estratégia adaptou-se dinamicamente aos regimes de mercado, mantendo turnover de 25,88% anual. Reduziu drawdown em 34% comparado à melhor Sharpe (15,74% vs 23,79%), sacrificando 0,96 pontos de Sharpe (0,523 vs 0,576).

A estratégia de melhor drawdown paga 1,11% a.a. a mais em custos de transação devido ao lambda=0,0 (sem penalização), que permite livre adaptação, mas gera turnover 3.6× superior. Esse custo adicional é o preço da proteção contra drawdown (redução de 23,79% → 15,74%).

Surpreendentemente, MINCVAR não liderou em drawdown apesar de otimizar diretamente perdas extremas na cauda. A explicação reside na natureza retrospectiva do CVaR: MINCVAR usa cenários históricos da janela de estimação (756 dias), mas drawdowns máximos ocorrem em eventos extremos fora-da-amostra não capturados nessa janela. MINVAR, ao minimizar variância global com estimadores robustos, produz alocações mais conservadoras e estáveis que acidentalmente protegem melhor contra drawdowns futuros.

As estratégias otimizadas superaram o benchmark equal-weight (1/N). A melhor estratégia (TYLER-MINVAR) alcançou Sharpe de 0,576, 2,6× superior ao benchmark de 0,218, com retorno de 5,92% a.a. versus 4,72% do 1/N, e volatilidade de apenas 7,11% contra 13,3%. O drawdown máximo caiu de 44,60% (benchmark) para 15,74-23,79% nas estratégias líderes. A otimização robusta com penalização de turnover entregou proteção superior contra perdas extremas enquanto aumentou substancialmente o retorno ajustado ao risco.

Para mais detalhes, consulte os resultados diretamente no repositório.

Até mais!

Referências

ARTZNER, P.; DELINE, F.; EBNER, J.; HEATH, D.; KUVERT, H. Coherent Measures of Risk. Mathematical Finance, v.9, n.3, p.203-228, 1999.
DEMIGUEL, V.; GARLAPPI, L.; UPPAL, R. Optimal versus naive diversification: How inefficient is the 1/N portfolio strategy? Review of Financial Studies, v.22, n.5, p.1915-1953, 2009.
HUBER, P. J. Robust estimation of a location parameter. The Annals of Mathematical Statistics, v.35, n.1, p.73-101, 1964.
LEDOTIT, O.; WOLF, M. A well-conditioned estimator for large-dimensional covariance matrices. Journal of Multivariate Analysis, v.88, n.2, p.365-411, 2004.
MAILLARD, S.; RONCALLI, T.; TEILETCHE, J. The properties of equally weighted risk contribution portfolios. Journal of Portfolio Management, v.36, n.4, p.60-70, 2010.
MARKOWITZ, H. M. Portfolio Selection. The Journal of Finance, v.7, n.1, p.77-91, 1952.
ROCKAFELLAR, R. T.; URYASEV, S. Optimization of conditional value-at-risk. Journal of Risk, v.2, p.21-42, 2000.
TYLER, D. E. A distribution-free M-estimator of multivariate scatter. The Annals of Statistics, v.15, n.1, p.234-251, 1987.

Pílulas de Quant

Discussão sobre este post

Pronto para mais?