O futuro do machine learning em finanças quantitativas
Explorando as fronteiras do machine learning em finanças: retornos, fatores e dados alternativos
As finanças quantitativas estão vivenciando uma transformação impulsionada por avanços no machine learning (ML). À medida que os mercados financeiros se tornam mais complexos e repletos de dados não estruturados, o uso de algoritmos de aprendizado de máquina tem se mostrado essencial para lidar com o aumento das dimensões de informações e para explorar relações não lineares que desafiam os modelos econométricos tradicionais. Este artigo explora algumas direções futuras para ML em finanças quantitativas, com base nos principais insights do documento “Financial Machine Learning” de Kelly & Xiu (2024).
Direções futuras e exemplos promissores
1. Aprimoramento na predição de retornos
Um foco crucial é o uso de ML para melhorar a predição de retornos financeiros, tanto em séries temporais quanto em painéis de ativos. Métodos como redes neurais profundas, regressão penalizada e análise de componentes principais supervisionados (SPCA) são essenciais para lidar com grandes conjuntos de dados financeiros.
Exemplo Prático: Redes neurais profundas, como as utilizadas por Gu et al. (2020), demonstram uma capacidade superior em capturar padrões complexos de interação entre características, superando os modelos lineares tradicionais em predições out-of-sample. Essas técnicas podem não apenas identificar padrões, mas também oferecer insights sobre relações dinâmicas em grandes volumes de dados de retornos de ações.
2. Modelos baseados em dados alternativos
O uso de dados alternativos — como textos de notícias, imagens e dados de sensores — está se expandindo. Estes tipos de dados podem revelar informações importantes sobre sentimento de mercado, risco e oportunidades.
Exemplo Prático: Jiang et al. (2023) empregaram modelos de linguagem como o BERT para analisar dados textuais e prever retornos de ações com maior precisão do que métodos tradicionais. Além disso, redes neurais convolucionais (CNNs) têm sido aplicadas para analisar padrões de preços representados graficamente, como gráficos OHLC (open-high-low-close), gerando estratégias de negociação altamente lucrativas.
3. Integração de estruturação econômica e machine learning
Embora os modelos de ML sejam poderosos, há um aumento no interesse pela integração de estruturas econômicas nos algoritmos. Essa combinação pode reduzir os riscos de sobreajuste e melhorar a interpretação dos resultados.
Exemplo Prático: Bali et al. (2020) mostram que a imposição de restrições derivadas do modelo de Merton (1974) melhora as predições de retornos de dívida corporativa, explorando informações estruturais entre preços de dívida e de ações.
4. Modelagem de risco-alpha e fatores de apreçamento
Avanços em modelagem de fatores, como o uso de IPCA (Instrumented Principal Component Analysis), estão permitindo a identificação de fatores condicionalmente relevantes e mais precisos para preçar retornos.
Exemplo Prático: Kelly et al. (2020) destacaram como o IPCA pode superar modelos como o de Fama-French ao capturar dinâmicas não lineares de fatores que variam ao longo do tempo e entre ativos. Isso é especialmente relevante em mercados de alta volatilidade e com dinâmicas setoriais complexas.
5. Estratégias de carteira otimizadas por ML
A integração de ML na otimização de carteiras também está em expansão, com enfoques em previsão de risco, alocação de ativos dinâmica e inclusão de custos de transação.
Exemplo Prático: Modelos como random forests e redes neurais são usados para prever matrizes de covariância de ativos, otimizando a seleção de carteiras para maximizar o índice de Sharpe, mesmo em ambientes de dados escassos ou de alta dimensão.
Desafios e benefícios
Apesar das vantagens, o uso de ML em finanças quantitativas enfrenta desafios importantes, incluindo o baixo sinal em relação ao ruído em dados financeiros, a escassez de observações em séries temporais econômicas e a necessidade de maior transparência nos modelos.
Baixa Razão Sinal/Ruído: Modelos precisam ser robustos para evitar ajustes excessivos a flutuações aleatórias.
Escassez de Dados: A coleta de dados alternativos e o uso de técnicas como transfer learning ajudam a mitigar esse problema.
Interpretação: Estratégias que combinam estruturas econômicas com técnicas de ML, como redes neurais integradas a restrições econômicas, oferecem uma solução viável.
Referências
Bali, T. G., A. Goyal, D. Huang, F. Jiang, & Q. Wen. (2020). “Predicting Corporate Bond Returns: Merton Meets Machine Learning”. Tech. rep. Georgetown University.
Gu, S., Kelly, B., & Xiu, D. (2020). “Empirical Asset Pricing via Machine Learning”. Journal of Econometrics.
Jiang, J., Kelly, B., & Xiu, D. (2023). “News Embedding via Pre-trained Language Models: A Study in Stock Return Prediction”. Tech. rep.
Kelly, B., & Xiu, D. (2021). “Instrumented Principal Component Analysis”. Journal of Finance.
Lettau, M., & Pelger, M. (2020). “Factors That Fit the Time: Risk Premia and Macro-Variables”. Review of Financial Studies.
Merton, R. C. (1974). “On the Pricing of Corporate Debt: The Risk Structure of Interest Rates”. Journal of Finance.