EnANPAD 2011

Trabalhos apresentados


UMA ANÁLISE EM DATA MINING: ÁRVORES DE DECISÃO, REDES NEURAIS E SUPPORT VECTOR MACHINES


Informações

Código: FIN2903
Divisão: FIN - Finanças
Tema de Interesse: Tema 03 - Gestão de Riscos e Derivativos

Autores

Luiz Carlos Jacob Perera, Herbert Kimura, Rui Américo Mathiasi Horta, Fabiano Guasti Lima

Resumo

Este trabalho se alinha às exigências do Basel Committee on Banking Supervision (BCBS) narevisão do Basel Capital Accord e do Basel II os quais, ao vincularem a administração derisco ao capital das instituições bancárias, contribuíram de forma fundamental para odesenvolvimento dos modelos Internal Risk Based (IRB) mostrando o que seriam boaspráticas de administração de risco. Lembra ainda a crise financeira iniciada em 2007 e que seestendeu até 2010, e que também incitou a reação do BCBS (2010) culminando na divulgaçãodo chamado Basel III, o qual entre suas medidas mais severas prevê o aumento do capitalmínimo mais buffer de conservação já em 2013 para 8% chegando a 10,5% em 2019. Estasmedidas austeras aumentam a importância dos IRB e consequentemente da modelagem decrédito e outros elementos que influenciam o risco das instituições financeiras. No Brasil oBanco Central de Brasil (BCB, 2011) está em fase de consulta pública sobre a aplicação dosIRB para cálculo do Patrimônio de Referência Exigido (PRE) que, em outras palavras,delimitará a alavancagem dos bancos. Neste contexto os procedimentos de data miningganham relevância e o mercado tem se debruçado sobre o aperfeiçoamento de modelos quepossam ser incluídos em procedimentos de IRB, que, se aprovados pelo elemento regulador,podem ajudar as instituições financeiras a reduzirem seus PRE, permitindo-lhes umaalavancagem financeira adequada a sua capacidade ótima de administrar riscos. Nestetrabalho buscou-se comparar três metodologias distintas de data mining com a característicacomum de serem não paramétricas. O processo de árvores de decisão foi explorado com ametodologia desenvolvida por Leo Breimam et al. (1984), conhecida como CART. Para redesneurais Utilizou-se o software Statistica @ 6.1 sendo testadas as redes lineares de propagaçãoem múltiplas camadas (multiplayer propragation ou MLP), rede neural polinomial(polynomial neural network ou PNN) e duas redes com função radial (radial basis function ouRBF). Já a técnica de data mining aplicada para extração de padrões foi a da classificação,processada através de máquinas de vetor suporte. No tratamento dos dados foi utilizado osoftware de data mining WEKA 3.5.6 (Witten, et al., 2011). Uma característica relevantedeste trabalho foi o tratamento amostral. A amostra constou de uma base de dados voltadapara o crédito ao consumidor de um grande magazine, com um ano de acompanhamento ecerca de 20.070 processos de crédito. Esta amostra foi dividida aleatoriamente em duassubamostras de 10.035 observações cada uma serviu para treinamento e a outra paravalidação. O percentual de acertos dos três processos aplicados oscilaram entre 68,08% e76,77% na operação de treinamento e 67,70% e 74,65% na validação. O procedimentoatravés de máquinas de vetor suporte mostrou-se superior na análise. Deve ficar claro que osprocedimentos adotados com uma base de dados voltada para crédito ao consumidor, podemser aplicados em outros contextos, como crédito empresarial e bancário. O contexto de créditoé bastante amplo e muitas empresas comerciais e de varejo já admitem a atividade financeiracomo parte relevante de seu negócio.

Abrir PDF