Desenvolvimento de estratégia de negociação usando modelagem neuro-difusa
Estratégia de Negociação no Mercado de Câmbio Estrangeiro Utilizando Sistemas de Neuro-Difusão Hierárquica de Aprendizagem por Reforço.
Marcelo F. Corrêa Marley Vellasco Karla Figueiredo Pedro Vellasco.
Este artigo avalia o desempenho do novo modelo híbrido neuro-fuzzy, Sistema Neuro-Difuso Hierárquico de Aprendizagem por Reforço (RL-HNFP), em um aplicativo de decisão comercial. O modelo proposto foi testado com o Euro / Iene negociado no Mercado Cambial. O principal objetivo do sistema de negociação é otimizar a alocação de recursos, a fim de determinar a melhor estratégia de investimento. O desempenho do RL-HNFP foi comparado com diferentes modelos de benchmark. Os resultados mostraram que o sistema foi capaz de detectar estratégias de longo prazo, obtendo maior lucratividade com menor número de negócios.
Modelagem fuzzy de negociação de ações com castiçais fuzzy.
Destaques.
Uma metodologia para modelar regras de negociação para padrões candlestick usando lógica fuzzy.
O sistema de negociação difuso adapta três padrões candlestick bem conhecidos a regras fuzzy.
O desempenho do sistema fuzzy é testado em dois portfólios de diferentes mercados de ações.
O sistema fuzzy é mais lucrativo do que uma versão nítida das regras candlestick.
A negociação difusa é mais avessa ao risco do que a estratégia Buy and Hold (B & amp; H) usada como referência.
Lógica Difusa em estratégias de negociação.
Introdução.
Os traders freqüentemente se perguntam como melhorar um sistema de negociação ou criar um novo através do aprendizado de máquina. Apesar da abundância de publicações, um método simples e intuitivo ainda é encontrado para criar modelos que não podem ser analiticamente estimados sem recorrer a cálculos auxiliados por computador. A lógica fuzzy é uma janela para o mundo do aprendizado de máquina. Combinado com algoritmos genéticos, é capaz de expandir as capacidades de criar sistemas de negociação de auto-aprendizagem ou facilmente otimizáveis. Ao mesmo tempo, a lógica fuzzy é intuitiva, pois encapsula informações numéricas nítidas em termos nebulosos (borrados), assim como uma pessoa faz no processo de pensar.
Aqui está um exemplo. Em termos de lógica nítida, a velocidade de um carro em movimento é determinada por dispositivos de medição: por exemplo, 60 km / h. Mas um observador casual sem dispositivos de medição só pode estimar aproximadamente a velocidade do carro, confiando em sua experiência ou base de conhecimento. Por exemplo, sabe-se que um carro pode ir rápido, e "rápido" é definido como aproximadamente 100 km / he acima. Sabe-se também que um carro pode ir devagar, o que é 5-10 km / h. E finalmente, a velocidade é visualmente estimada como média (cerca de 60 km / h) se o carro que se aproxima aumentar de tamanho a uma taxa moderada. Assim, é possível caracterizar 60 km / h com quatro diferentes expressões:
velocidade média; velocidade perto da média;
É assim que a informação é encapsulada em uma consciência humana, permitindo-lhe captar apenas as informações necessárias no momento atual, por exemplo: "terei tempo para atravessar a estrada se o carro não estiver se movendo muito rápido?". Pensar em tudo de uma vez e em grande detalhe forçaria uma pessoa a gastar quantias colossais de tempo e recursos energéticos antes de tomar qualquer decisão específica: atravessar a estrada ou deixar o carro passar. Ao mesmo tempo, a situação atual seria minuciosamente estudada, o que nunca poderá ser repetido identicamente no futuro e teria apenas esboços semelhantes. No aprendizado de máquina, tais situações são chamadas de overfitting.
Este artigo não se aprofundará na teoria da lógica fuzzy. As informações sobre este tópico estão amplamente disponíveis na Internet e no site 5. Vamos começar com a prática imediatamente, o que será explicado com trechos da teoria e fatos curiosos.
Para construir um modelo, a biblioteca Fuzzy é usada, disponível no pacote padrão de 5 terminais.
O resultado será um Expert Advisor pronto, baseado em lógica fuzzy, que pode ser tomado como um exemplo para a construção de sistemas personalizados.
Criando um protótipo do sistema de negociação.
Vamos seguir em frente para criar uma lógica TS nítida, que será usada como base em futuras pesquisas. Então dois sistemas idênticos podem ser comparados, onde o segundo utilizará a lógica fuzzy.
3 osciladores RSI com diferentes períodos serão usados como base:
Vamos formular as condições nítidas dos sinais e defini-los na função:
Em seguida, vamos escrever todas as outras funções de serviço e testar o especialista a partir do início de 2017 no EURUSD, nos prazos М15 e М5 (o código completo do especialista é anexado no final do artigo):
Embora as condições nítidas para combinações dos três indicadores tenham sido definidas e as condições sejam lógicas e consistentes, essa abordagem se mostrou muito simples e inflexível. Em média, o sistema não perde nem ganha por um período de 8 meses. Para ganhar, seria necessário passar por várias combinações de condições e, possivelmente, adicionar mais osciladores. Mas não há muito o que otimizar, já que as condições são definidas com extrema precisão.
Vamos tentar desfazer as idéias sobre as condições para tornar lucrativo esse sistema de negociação usando a lógica fuzzy.
Criando um modelo lógico difuso.
Primeiro, é necessário incluir a biblioteca Fuzzy. Para ser exato, um dos dois modelos de lógica difusa disponíveis - Mamdani ou Sugeno. A diferença entre eles é que Sugeno produz um modelo linear sem criar uma variável de saída na forma de um conjunto de termos fuzzy, enquanto Mamdani fornece esse elemento. Desde que o artigo é escrito para comerciantes fuzzy, Mamdani será usado. Mas isso não implica que o modelo Sugeno seja inadequado para algumas tarefas específicas: é sempre possível e necessário experimentar com base na compreensão básica da lógica difusa.
A biblioteca está incluída, uma referência à classe Mamdani é declarada. Isso é tudo o que é necessário para começar.
Agora vamos considerar os principais estágios de construção da inferência fuzzy. Ocupa um lugar central em sistemas de modelagem fuzzy. O processo de inferência fuzzy é um procedimento específico ou um algoritmo para obter conclusões fuzzy baseadas em suposições difusas usando as operações básicas da lógica fuzzy.
Existem 7 estágios de construção da inferência fuzzy.
Determinando a estrutura do sistema de inferência difusa.
O número de entradas e saídas, assim como as funções de associação, são definidos no estágio de projeto. No nosso caso, haverá 4 entradas, 1 saída, e cada uma delas terá 3 funções de associação.
Formando a base de regras do sistema de inferência difusa.
Durante o processo de desenvolvimento, criamos regras personalizadas para inferência fuzzy, com base no nosso julgamento especializado do sistema de negociação.
Estabelecer correspondência entre o valor numérico da variável de entrada do sistema de inferência difusa e o valor da função de pertinência do termo correspondente da variável linguística.
O procedimento de determinar o grau de verdade das condições para cada regra do sistema de inferência difusa.
O processo de encontrar o grau de verdade de cada uma das proposições elementares (subcláusulas) constituindo os consequentes de núcleos de todas as regras de produção difusas.
O processo de encontrar uma função de associação para cada uma das variáveis lingüísticas de saída.
Deve-se notar que apenas os pontos 1 e 2 precisam ser realizados, todos os outros serão feitos pelo sistema sem intervenção. Os interessados nas sutilezas da operação da lógica difusa em todos os estágios podem encontrar mais detalhes aqui.
Determinando a estrutura do sistema de inferência difusa.
Vamos continuar com a criação do modelo. Defina objetos de três entradas e uma saída, bem como objetos auxiliares de dicionário para facilitar o trabalho com a lógica:
Três RSI com diferentes períodos serão usados como entradas. Como o oscilador RSI está sempre no intervalo de 0 a 100, é necessário criar uma variável para ele com a mesma dimensão. Mas, por conveniência, os valores do indicador serão normalizados para um intervalo de 0 a 1. Basta ter em mente que a variável criada deve ter uma dimensão igual à dimensão do vetor de entrada, ou seja, deve conter todos os valores. Um intervalo de 0 a 1 também é definido na saída.
De acordo com o ponto 1 da criação da lógica fuzzy, também é necessário definir e configurar as funções de associação. Isso será feito no manipulador de eventos OnInit ():
Agora vamos ver qual é a função de associação e qual a finalidade dela.
Três termos foram criados para cada variável de entrada (e uma saída): "comprar", "neutro", "vender", cada um com sua própria função de associação. Em outras palavras, os valores do oscilador agora podem ser divididos em 3 grupos fuzzy, e cada grupo pode receber um intervalo de valores usando a função de associação. Falando na linguagem da lógica difusa, 4 conjuntos de termos foram criados, cada um com 3 termos. Para ilustrar o acima, vamos escrever um script simples que pode ser usado para visualização dos termos e suas funções de associação:
Execute o script no gráfico:
Essas funções de associação foram selecionadas porque elas têm apenas dois parâmetros de entrada otimizáveis (isso será feito posteriormente, durante o estágio de teste do sistema). Eles também descrevem bem as posições extrema e central do sistema. Você pode aplicar qualquer função de associação a partir das disponíveis na biblioteca Fuzzy.
Adotamos a regra de que os valores extremos do oscilador indicam uma mudança futura em sua direção e, conseqüentemente, uma reversão de tendência futura. Portanto, o oscilador aproximando-se de zero sugere um possível começo de crescimento. O movimento do oscilador para a marca de 0,5 é acompanhado por uma diminuição gradual em CZ_ShapedMembershipFunction ou termo "Buy zone". Ao mesmo tempo, a incerteza em CNormalMembershipFunction de "Neutral zone" irá crescer, o que é eventualmente substituído por um aumento em CS_ShapedMembershipFunction ou "Sell zone" à medida que o oscilador se aproxima de 1. O mesmo princípio é usado em todas as entradas e saídas. se os valores do indicador pertencerem a uma zona específica com limites imprecisos.
Não há restrições quanto ao número de funções de associação para cada variável. Você pode definir 5, 7, 15 funções em vez de três, mas, é claro, dentro dos limites do senso comum e em nome da lógica difusa.
Formando a base de regras do sistema de inferência difusa.
Nesta fase, adicionamos uma base de conhecimento ao sistema a ser usada ao tomar decisões difusas.
Pelo menos uma condição lógica deve ser adicionada à base de conhecimento: ela é considerada incompleta se pelo menos um termo não estiver envolvido nas operações lógicas. Pode haver uma quantidade indefinida de condições lógicas.
O exemplo fornecido define 12 condições lógicas, que influenciam a inferência difusa quando satisfeitas. Assim, todos os termos participam de operações lógicas. Por padrão, todas as operações lógicas recebem os mesmos coeficientes de peso iguais a 1. Elas não serão alteradas neste exemplo.
Se todos os 3 indicadores estiverem dentro da área difusa para a compra, será emitido um sinal de compra difuso. O mesmo se aplica aos sinais de venda e neutros. (regras 1-3)
Se 2 indicadores mostrarem comprar e um mostrar vender, o valor de saída será neutro, isto é, incerto. (regras 4-6)
Se 2 indicadores mostrarem comprar ou vender, e um for neutro, então, comprar ou vender é atribuído ao valor de saída. (regras 7-12)
Obviamente, esta não é a única variante para criar uma base de regras, você está livre para experimentar. Essa base de regras baseia-se apenas no meu julgamento "especializado" e na visão de como o sistema deve funcionar.
Obtendo um valor de saída nítido após a defuzzificação.
Resta calcular o modelo e obter o resultado como um valor de 0 a 1. Valores próximos a 0 indicam um sinal de compra forte, aqueles próximos a 0,5 são neutros e valores próximos a 1 significam um sinal de venda forte.
Esta função obtém os valores de três osciladores RSI com diferentes períodos, normaliza-os para um intervalo de 0 a 1 (os valores podem ser simplesmente divididos por 100), atualiza a lista com objetos do dicionário Fuzzy (os últimos valores indicadores), envia para cálculos, cria uma lista para a variável de saída e pega o resultado na variável 'res'.
Adicionando funções de serviço e otimizando / testando o sistema resultante.
Como o aprendizado de máquina ou pelo menos seus fundamentos também estão sendo considerados, alguns parâmetros serão movidos para entradas e otimizados.
Os parâmetros do Gaussian (função de associação) serão submetidos à otimização na saída da lógica difusa. Terá seu centro ao longo do eixo X deslocado (parâmetro Gposition), seu sigma alterado (seu sino estreitado e comprimido, parâmetro Gsigma). Isto proporcionará um melhor ajuste do sistema caso os sinais de RSI para compra e venda sejam assimétricos.
Além disso, otimize as condições para abertura de ofertas: o valor mínimo de um sinal neutro e o valor máximo (novas posições não serão abertas no intervalo entre esses valores, pois o sinal não está definido).
O processamento de um sinal na saída da lógica difusa é mostrado na listagem a seguir:
Cálculos serão realizados na nova barra para acelerar a demonstração. Você é livre para personalizar a lógica a seu critério, por exemplo, negociar em cada tick simplesmente removendo a verificação de uma nova barra.
Se houver posições abertas e o sinal contradizer a posição atual ou não estiver definido, feche a posição. Se houver uma condição para abrir uma posição oposta, abra-a.
Este sistema não utiliza stop loss, pois não são reversões de negociação, e o fechamento / reabertura de negociações é baseado em sinais.
O Expert Advisor usa a biblioteca 4Orders para facilitar o trabalho com pedidos e tornar o código facilmente conversível em 4.
Processo de teste.
Selecione o melhor resultado de otimização:
Compare com os resultados do teste do modelo estrito:
A associação resultante funciona na saída, após a otimização (as entradas permanecem inalteradas desde que não foram otimizadas):
Antes das mudanças:
Otimize o sistema com as mesmas configurações, mas no prazo do M5:
Compare com os resultados do teste do modelo estrito:
A associação resultante funciona na saída, após a otimização (as entradas permanecem inalteradas desde que não foram otimizadas):
Antes das mudanças:
Em ambos os casos, a Gaussiana (zona neutra) foi deslocada para compras e o número de posições longas prevalece sobre o número de posições curtas. Isso significa que os sinais de compra e venda se mostraram assimétricos nesse segmento particular da história, que não puderam ser descobertos sem essa experiência. É possível que o sistema consistindo de três RSIs estivesse na zona de sobrevenda (área 1) mais frequentemente do que na zona de sobrecompra (área 0), e a otimização do Gauss ajudou a suavizar esse desequilíbrio. Quanto à saída mais nítida, é analiticamente difícil imaginar por que essa configuração de saída contribuiu para a melhoria dos resultados do sistema comercial, porque o processo de defuzzificação usando o método do centro de gravidade, em conjunto com todo o mapeamento de entradas para conjuntos difusos , já é um sistema complexo por si só.
O sistema mostrou-se bastante estável durante 8 meses, apesar de apenas 4 parâmetros terem sido otimizados. E eles podem ser facilmente reduzidos a dois (Gsigma e Gposition), já que os 2 restantes tiveram pouco impacto no resultado e estão sempre na vizinhança de 0,5. Isto é considerado um resultado satisfatório para um sistema experimental, cujo objetivo é mostrar como o número de parâmetros otimizados pode ser reduzido através da introdução de um elemento de lógica difusa no sistema de negociação. Em contraste, teria sido necessário criar vários critérios de otimização para regras estritas, o que aumentaria a complexidade do desenvolvimento do sistema e o número de parâmetros otimizados.
Também deve ser notado que este ainda é um exemplo muito grosseiro da construção de um sistema de negociação baseado na lógica fuzzy, já que ele usa uma estratégia primitiva baseada em RSI, mesmo sem usar stop loss. No entanto, isso deve ser suficiente para entender a aplicabilidade da lógica fuzzy à criação de sistemas de negociação.
Conclusão.
A lógica Fuzzy permite uma criação rápida de sistemas com regras difusas que são muito simples de otimizar. Ao mesmo tempo, o complexo processo de seleção dos parâmetros do sistema de negociação passa pela otimização genética, liberando o desenvolvedor da rotina de busca por uma estratégia de negociação, desenvolvendo e algoritmizando inúmeras regras do sistema de negociação. Juntamente com outros métodos de aprendizado de máquina (por exemplo, redes neurais), essa abordagem permite alcançar resultados impressionantes. Reduz as hipóteses de overfitting e a dimensão dos dados de entrada (3 indicadores RSI com diferentes períodos se reduziram a um único sinal, o que descreve a situação do mercado de forma mais completa e mais generalizada do que cada indicador em si).
Se você ainda tiver problemas para entender como a lógica difusa funciona, pergunte a si mesmo como você pensa, em que termos você opera e em que base baseia sua tomada de decisão.
Aqui está um exemplo de reforço. Por exemplo, você tem três desejos: ir a uma festa, assistir a um filme em casa ou salvar o mundo. O termo "assistir a um filme em casa" tem o maior peso, porque você já está em casa e não é necessário nenhum esforço adicional. Ir a uma festa é viável se alguém te convida e te pega, mas como isso ainda não aconteceu, as chances de ir são medianas. E, finalmente, para salvar o mundo, você precisa mobilizar todas as suas habilidades sobrenaturais, vestir uma fantasia de super-homem e lutar contra um monstro alienígena. É improvável que você decida fazê-lo hoje e não o deixe até amanhã, então as chances são pequenas.
A inferência fuzzy será algo assim: eu provavelmente ficarei em casa, e talvez eu vá para a festa, mas definitivamente não vou salvar o mundo hoje. Após a defuzzificação, nossas chances podem ser avaliadas em uma escala de 0 a 10, onde 0 é "ficar em casa", 5 é "ir para a festa", 10 é "lutar contra um monstro". Obviamente, o resultado nítido estaria no intervalo de 0 a 3, ou seja, é mais provável que você fique em casa. O mesmo princípio é usado no sistema de negociação apresentado: ele compara os valores de três indicadores e usa condições lógicas para determinar a opção mais preferida no momento atual - comprar, vender ou não fazer nada.
Possíveis maneiras de melhorar este exemplo (para estudo autônomo):
Aumentando o número de entradas e condições lógicas. Isso aumenta a capacidade do sistema e o torna mais adaptável ao mercado. Otimizando não apenas a saída Gaussiana, mas também todas as funções de associação de entradas e saídas. Otimizando a base de regras. Otimize os pesos de expressões lógicas. Criação de um comitê de vários modelos fuzzy responsáveis por diferentes aspectos do sistema de negociação. Usando inferências fuzzy como preditores ("features") e / ou variáveis de destino para redes neurais.
Se houver interesse suficiente no artigo, e eu receber feedback suficiente, eu poderia considerar a possibilidade de escrever um novo artigo dedicado à combinação de lógica difusa e uma rede neural.
Abaixo estão os códigos-fonte dos especialistas e um script de teste para as funções de associação. Para o especialista compilar e trabalhar, é necessário fazer o download da biblioteca 4Orders e da biblioteca Fuzzy atualizada.
Traduzido do russo por MetaQuotes Software Corp.
Desenvolvimento de estratégia de negociação usando modelagem neuro-difusa
Este artigo analisa os sistemas neuro-difusos na última década (2002–2012).
Aplicações de sistemas fuzzy neuro são agrupadas em dez categorias diferentes.
Escopo futuro para cada uma dessas categorias é resumido brevemente.
Um ano de desenvolvimento sábio é estruturado em forma tabular.
Trabalhos de pesquisa de categoria sábia e desenvolvimentos sábios do ano são dados graficamente.
Este artigo investiga o desenvolvimento de sistemas neurais nebulosos (NFS) usando a classificação e revisão de literatura de artigos da última década (2002–2012) para explorar como várias metodologias NFS foram desenvolvidas durante este período. Com base nos periódicos selecionados de diferentes aplicativos NFS e diferentes bancos de dados on-line do NFS, este artigo analisa e classifica os aplicativos NFS em dez categorias diferentes, como sistema de modelagem estudantil, sistema médico, sistema econômico, sistema elétrico e eletrônico, controle de tráfego, processamento de imagens e extração de recursos, manufatura e modelagem de sistemas, previsões e previsões, aprimoramentos do NFS e ciências sociais. Para cada uma dessas categorias, este artigo menciona um breve esboço futuro. Este estudo de revisão indica principalmente três tipos de direções futuras de desenvolvimento para metodologias NFS, domínios e tipos de artigos: (1) as metodologias NFS tendem a ser desenvolvidas para a orientação de especialistas. (2) Sugere-se que diferentes metodologias de ciências sociais possam ser implementadas usando o NFS como outro tipo de metodologia especializada. (3) A capacidade de mudar continuamente e capacidade de aprendizagem é o poder impulsionador das metodologias NFS e será a chave para futuras aplicações inteligentes.
O modelo Black Scholes.
O modelo de precificação Black Scholes é parcialmente responsável pelo mercado de opções e pela negociação de opções se tornando tão popular. Antes de ser desenvolvido, não havia um método padrão para as opções de preço, e era essencialmente impossível atribuir um valor justo a elas. Isso significava que as opções não eram comumente vistas como instrumentos financeiros adequados por investidores e comerciantes, porque era muito difícil determinar se havia bom valor disponível.
O modelo Black Scholes mudou isso; é uma fórmula matemática projetada para calcular um valor justo para uma opção com base em determinadas variáveis. Nesta página, nós fornecemos informações adicionais sobre este modelo e o papel que ele deve desempenhar na negociação de opções. Os seguintes tópicos são abordados:
Histórico Propósito Entrada & amp; Suposições usando o modelo de precificação Black Scholes.
O modelo de precificação Black Scholes é nomeado após os economistas americanos Fischer Black e Myron Scholes. Em 1970, Black, um físico matemático, e Scholes, professor de finanças na Universidade de Stanford, escreveram um artigo intitulado "O preço das opções e do passivo corporativo". Eles tentaram publicar o artigo, mas ele foi rejeitado por vários editores até a Universidade de Chicago. O Journal of Political Economy concordou em publicá-lo em 1973.
Neste artigo, Black e Scholes sugeriram que uma opção tinha um preço correto, que poderia ser determinado usando uma equação que eles incluíram no artigo. Essa equação ficou conhecida como a equação de Black-Scholes ou a fórmula de Black-Scholes. Também em 1973, um artigo posterior, "Theory of Rational Option Pricing", foi escrito por Robert Merton, e ele expandiu essa abordagem matemática e introduziu o termo modelo de precificação de opções Black Scholes.
Na época, a negociação de opções era muito nova e era considerada uma forma muito arriscada e volátil de negociação. Embora inicialmente saudados por uma grande quantidade de ceticismo, Black, Scholes e Merton mostraram que a matemática poderia ser aplicada usando equações diferenciais para determinar um valor justo para chamadas e puts de estilo europeu.
O modelo Black Scholes tornou-se amplamente aceito e contribuiu para o comércio de opções se tornar muito mais popular do que poderia ter sido. O modelo também é conhecido como modelo Black-Scholes-Merton e é considerado um dos conceitos mais significativos da teoria financeira moderna. Robert Merton e Myron Scholes receberam o Prêmio Nobel de Economia em 1997: dois anos após a morte de Fischer Black.
Como mencionamos acima, antes do modelo, era muito difícil para um investidor determinar se uma opção tinha o preço correto ou não e, portanto, se representava ou não um bom valor. Uma grande parte do investimento e da negociação bem-sucedida é encontrar oportunidades em que um ativo está subvalorizado ou superfaturado e, em seguida, negociá-lo de acordo. Porque isso não era realmente possível com as opções, o mercado não foi particularmente favorecido por investidores e comerciantes e foi considerado muito arriscado.
A fórmula do Black Scholes foi desenvolvida para calcular um valor econômico para opções que sejam justas tanto para o comprador quanto para o vendedor. Em teoria, se as opções fossem compradas e vendidas repetidamente ao preço definido por este modelo, então os compradores e vendedores poderiam se equilibrar em média: não incluindo quaisquer comissões cobradas.
A ideia por trás da fórmula é que é possível criar uma perfeita situação de hedge através da combinação de contratos de opções e da garantia subjacente, supondo que os contratos sejam precificados corretamente. Basicamente, a teoria propunha que há apenas um preço verdadeiramente correto para uma opção, e esse preço pode ser calculado matematicamente.
Na prática, o preço é afetado por muitos fatores, incluindo demanda e oferta, e por isso, as opções nem sempre podem ser precificadas corretamente. Ao usar o modelo de precificação Black Scholes, é possível, teoricamente, determinar se o preço de negociação de uma opção é maior ou menor do que seu valor real: o que pode, por sua vez, destacar oportunidades de negociação em potencial.
Entradas e & amp; Premissas.
O modelo de precificação Black Scholes é baseado em uma fórmula matemática e essa fórmula usa um número de variáveis ou entradas para calcular um valor justo para uma opção. Essas variáveis são conhecidas como entradas para o modelo e são as seguintes:
O preço atual do título subjacente O preço de exercício O período de tempo até a expiração A taxa de juros livre de risco durante o período do contrato A volatilidade implícita do título subjacente.
O modelo também se baseia em várias suposições subjacentes para que ele funcione. Essas suposições são as seguintes:
A opção só pode ser exercida após a expiração (ou seja, é um estilo europeu) A segurança subjacente, às vezes, sobe no preço e, às vezes, cai e que a direção do movimento não pode ser prevista. O título subjacente não paga dividendos A volatilidade do título subjacente permanece estável durante o período do contrato As taxas de juros permanecem constantes durante o período do contrato Não há comissões cobradas na compra ou venda da opção Não há oportunidade de arbitragem ( isto é, nem o comprador nem o vendedor devem obter um benefício imediato)
Deve ser razoavelmente óbvio que algumas dessas premissas nem sempre serão válidas, e é muito importante reconhecer isso porque, isso significa que existe uma possibilidade distinta de que os valores teóricos calculados usando o modelo de Black Scholes possam não ser precisos. .
Usando o modelo Black Scholes de preços.
Não há dúvida de que o desenvolvimento do modelo de precificação Black Scholes ajudou a tornar a negociação de opções mais viável aos olhos dos investidores, porque ajudou a mudar a ideia de que a avaliação de opções era pouco mais que um jogo de adivinhação. No entanto, há alguns pontos importantes que você deve conhecer.
Primeiro, não é absolutamente necessário entender completamente a fórmula matemática por trás do modelo de precificação para ter sucesso na negociação de opções e nem é necessário que você a use de forma alguma. Se você quiser usá-lo, provavelmente achará mais fácil usar uma das muitas ferramentas de cálculo do modelo Black Scholes na Internet, em vez de realizar os cálculos por conta própria. Você verá que vários corretores on-line incluem uma ferramenta de cálculo para os clientes usarem.
Em segundo lugar, deve-se notar que ele nunca deve ser considerado um indicador preciso do verdadeiro valor de uma opção, porque há alguns problemas com as suposições que sustentam o modelo. Por exemplo, assume que as taxas de juros e a volatilidade do título subjacente permanecerão constantes durante o período do contrato, e é improvável que isso aconteça.
Também não leva em conta o fato de que algumas ações pagam dividendos, nem o valor extra que as opções de estilo americano têm, porque o detentor delas é capaz de exercê-las a qualquer momento. Existem, no entanto, variantes do modelo Black Scholes que podem ser aplicadas para fatorar tais questões.
Se você planeja usar o modelo como parte de sua estratégia de negociação, então sugerimos fortemente que você não confie nele para retornar valores exatos, mas sim valores teóricos. Esses valores teóricos podem ser usados para fins de comparação de opções para ajudá-lo a determinar quais operações você deve fazer. Você também pode usar o modelo para ajudar a decidir se uma negociação potencial identificada por meio de outros métodos provavelmente será bem-sucedida ou não.
Em resumo, o modelo de precificação Black Scholes desempenhou um papel notável na forma como o mercado de opções e a negociação de opções se desenvolveram e certamente ainda tem seus usos para os traders. Você deve, no entanto, estar plenamente ciente de suas limitações e nunca depender totalmente dela.
Copyright && copy; 2017 OptionsTrading - Todos os direitos reservados.
Previsão de tendências de curto prazo no mercado de ações usando uma metodologia baseada em neuro-fuzzy.
Um sistema neuro-difuso composto por um controlador Adaptive Neuro Fuzzy Inference System (ANFIS) usado para controlar o modelo de processo do mercado de ações, também identificado usando uma tecnologia neuro-difusa adaptativa, é derivado e avaliado para uma variedade de ações. Os resultados obtidos desafiam a forma fraca da Hipótese do Mercado Eficiente (EMH) demonstrando previsões muito melhores e melhores, comparadas a outras abordagens, das tendências do mercado de ações de curto prazo, e em particular a tendência do dia seguinte de ações escolhidas. O controlador ANFIS e as entradas do modelo de processo do mercado de ações são escolhidos com base em um estudo comparativo de quinze diferentes combinações de preços de ações passadas realizadas para determinar as entradas do modelo de processo do mercado de ações que retornam a melhor previsão de tendência de ações para o dia seguinte. Erro Quadrático Médio da Raiz (RMSE). As funções de associação em forma Gaussian-2 são escolhidas sobre as gaussianas e triangulares em forma de sino para difundir as entradas do sistema devido ao RMSE mais baixo. Estudos de casos reais usando dados de mercados de ações emergentes e bem desenvolvidos - a Bolsa de Valores de Atenas e Nova York (NYSE) - para treinar e avaliar o sistema proposto ilustram que, em comparação com a estratégia “comprar e manter” e vários outros métodos relatados, o A abordagem proposta e a precisão do comércio de previsão são de longe superiores.
Escolha uma opção para localizar / acessar este artigo:
Verifique se você tem acesso através de suas credenciais de login ou de sua instituição.
Estratégia de Negociação no Mercado de Câmbio Estrangeiro Usando Sistemas de Neuro-Difusão Hierárquicos de Aprendizagem por Reforço.
Marcelo F. Corrêa Marley Vellasco Karla Figueiredo Pedro Vellasco.
Este artigo avalia o desempenho do novo modelo híbrido neuro-fuzzy, Sistema Neuro-Difuso Hierárquico de Aprendizagem por Reforço (RL-HNFP), em um aplicativo de decisão comercial. O modelo proposto foi testado com o Euro / Iene negociado no Mercado Cambial. O principal objetivo do sistema de negociação é otimizar a alocação de recursos, a fim de determinar a melhor estratégia de investimento. O desempenho do RL-HNFP foi comparado com diferentes modelos de benchmark. Os resultados mostraram que o sistema foi capaz de detectar estratégias de longo prazo, obtendo maior lucratividade com menor número de negócios.
Melhorando a Estimativa de Esforço de Software Usando o Modelo Neuro-Difuso com o SEER-SEM.
Transcrição.
1 Global Jounal de Computação Científica e Tecnológica vol. 10 Edição 12 (Ve. 1.0) Outubro de 2010, 51 anos Impulsionando Estimativa de Ego do Softwae Usando o Modelo de Neuo-Fuzzy com SEER-SEM Wei Lin Du 1, Danny Ho 2, Luiz Fenando Capetz 3 Abstact - A estimativa do effat de desenvolvimento de softwae do Accuate é um tapinha cítica de poemas softwae. O desenvolvimento efetivo de softwae é baseado na estimativa de esforço de accut. Embora muitas técnicas e modelos algorítmicos tenham sido desenvolvidos e implementados por especialistas, a investigação do desenvolvimento de softwaits ainda é um desafio no campo da engenharia softwae, especialmente no manuseio de insumos e colagens não comprovadas e impecáveis. Além de adotar essas questões, os pesquisadores desenvolveram e avaliaram um novo romance de computação suave. Objetivou-se avaliar o comportamento de pediculação do modelo neuo-fuzzy poposed com a Avaliação de Sistemas e Estimativa do Modelo de Estimação de Softwae de Recursos (SEER-SEM) em pactices de estimação de softwae e aplicar o achitectue poposed que combina a technologia neuo-fuzzy com diferentes modelos analíticos. Neste documento, descreve-se uma abordagem combinando a técnica neuo-fuzzy e o algoritmo de estimativa de esforço SEER-SEM. Este modelo populoso possui características positivas como capacidade de inclinação, sensibilidade falecida, genealogia efetiva e integração de conhecimento para a introdução da tecnologia neuo-fuzzy. Moeove, valores contínuos e valores lingüísticos podem ser insumos do modelo proposto para evitar o desvio da estimativa lage entre os objetos de simulação. O personagem do modelo popular é acessado através da concepção e realização de avaliação com dados publicados e dados industriais. Os resultados da avaliação indicam que a estimação com o modelo neuo-fuzzy poposed contendo SEER-SEM é imposta em comparação com os resultados de estimação que utilizam apenas o algoritmo SEER-SEM. Ao mesmo tempo, os resultados deste estudo também demonstram que a família genealógica neuo-fuzzy pode funcionar com modelos alusórios para impor a personalidade da estimativa de esforço softwae. Estimativa de softwaas de Keywods, manejo de softwae, estimativa de esforço softwae, estimativa softwae neuo-fuzzy, SEER-SEM T I. INTRODUÇÃO ele custou e delivey de poemas softwae e a qualidade de poducts ae afetou pela acuacy de estimativa de effe softwae. Em genealogia, as técnicas de estimativa de esforço softwae podem ser subdivididas em baseadas em experiência, 1- Wei Lin Du, o Departamento de Engenharia Elétrica e Computa, a Universidade de Westen Ontaio, Londres, Ontaio, Canadá N6A 5B9 (Aproximadamente 2 - Danny Ho, NFA Estimation Inc., Richmond Hill, Canadá Ontaio L4C 0A2 (cerca de 3-D. Luiz Fenando Capetz, o Depatment de Electical e Compute Engineeing, a Universidade de Westen Ontaio, Londres, Ontaio, Canadá N6A 5B9 (telefone: ext paametic model - baseado em, orientada para a orientação, baseado em dinâmica, baseado em egession, e técnicas compostas (Boehm, Abts e Chulani 2000).Entre esses métodos, técnicas de estimação baseadas em modelos envolvem o uso de equações matemáticas para estimar softwae pefom. é uma função do numbe de variáveis, que ae factos impactam o custo do softwae (Boehm 1981).Estas técnicas de estimação baseadas em modelo compõem a genealogia: E = a Tamanho b, whee E é o effot, tamanho é o tamanho do poduto, um é a podetividade paametes o factos, e b são os paametes de economias de deseconomias (Fischman, McRitchie e Galoath 2005; Jensen, utnam e Roetzheim 2006). Nas últimas décadas, alguns modelos de algoritmos de estimativa softwae impotant foram publicados por pesquisas, por exemplo, o Modelo de Custo Constitucional (COCOMO) (Boehm et al. 2000), Gerenciamento de Ciclo de Vida de Softwae (SLIM) (utnam e Myes 1992), SEER - SEM (Galoath e Evans 2006), e funções Oints (Albecht 1979; Jones 1998). As técnicas baseadas em modelos têm sete comprimentos, sendo o mais importante deles a objetividade, a epine - rabilidade, a importância da análise de sensibilidade e a capacidade de se subordinar a uma experiência anterior (Boehm, 1981). Por outro lado, esses modelos também apresentam algumas desvantagens. Uma das desvantagens dos modelos alitmáticos é a falta de flexibilidade na adaptação a novas circunstâncias. O novo ambiente de desenvolvimento geralmente envolve uma situação indevida, resultando em insumos impecáveis para a estimação por um modelo algorítmico. Como um negócio que muda rapidamente, a indústria softwea enfrenta frequentemente a questão da instabilidade e, portanto, os modelos algorítmicos podem ser rapidamente desatualizados. As saídas de modelos algorítmicos são baseadas nas entradas de tamanho e nas ações de factos o vaiables (Boehm 1981). Portanto, insira os inputs para esses modelos, resultando de informações desatualizadas, fazendo com que a estimativa seja imprecisa. A idéia de modelos algorítmicos é a forte colinacionalidade entre os paametes e as complexas elações não-lineares entre as saídas e os fatos contibuintes. O SEER-SEM recorre a pactitiones softwae por causa de suas proezas poderosas da estimativa. Ele foi desenvolvido com uma combinação de funções de estimativa para fornecer estimativas vaidosas. Ceated especificamente para estimar effot softwae, o modelo SEER-SEM foi influenciado pelos famewoks de utnam (utnam e Myes 1992) e Doty Associates (Jensen, utnam e Roetzheim 2006). Como um dos modelos de estimação algorítmica, o SEER-SEM possui duas limitações principais na estimativa de efot. Em primeiro lugar, você recebeu 50 paametes de entrada exaltados pelos vaiosos fatos de um pojeto, que incidem na complexidade de SEER-SEM, especialmente na administração da incerteza dessas saídas. Segundo,
2 a g e 52 vol. 10 Edição 12 (Ve. 1.0) Outubro de 2010 os detalhes específicos do SEER-SEM incidem na dificuldade de descobrir a relação não-linear entre as entradas de paete e os resultados correspondentes. Ovalmente, essas duas limitações majo podem levar a uma baixa precisão na estimativa de esforço por SEER-SEM. O efeito de estimativa é uma função do número de valores, o que faz com que o custo do softwae seja menor (Boehm, 1981). Essas técnicas de estimativa baseadas em modelos compõem a genealogia: E = a Tamanho b, w e E é o effot, tamanho é o tamanho do poduto, a é a podutividade paametes o factos e b são os paametes de economias de deseconomias (Fischman, McRitchie e Galoath 2005; Jensen, utnam e Roetzheim 2006). Nas últimas décadas, alguns modelos de algoritmos de estimação de softwae impotant foram publicados por pesquisas, por exemplo, Modelo de Custo Constitucional (COCOMO) (Boehm et al. 2000), Modelo de Ciclo de Vida de Softwae (SLIM) (utnam e Myes 1992), SEER - SEM (Galoath e Evans 2006), e funções Oints (Albecht 1979; Jones 1998). As técnicas baseadas em modelos têm sete comprimentos, sendo o mais importante deles a objetividade, a epine - rabilidade, a importância da análise de sensibilidade e a capacidade de se subordinar a uma experiência anterior (Boehm, 1981). Por outro lado, esses modelos também apresentam algumas desvantagens. Uma das desvantagens dos modelos alitmáticos é a falta de flexibilidade na adaptação a novas circunstâncias. O novo ambiente de desenvolvimento geralmente envolve uma situação indevida, resultando em insumos impecáveis para a estimação por um modelo algorítmico. Como um negócio que muda rapidamente, a indústria softwea enfrenta frequentemente a questão da instabilidade e, portanto, os modelos algorítmicos podem ser rapidamente desatualizados. As saídas de modelos algorítmicos são baseadas nas entradas de tamanho e nas entradas de factos o vaiables (Boehm 1981). Portanto, insira os inputs para esses modelos, resultando de informações desatualizadas, fazendo com que a estimativa seja imprecisa. A idéia de modelos algorítmicos é a forte colinacionalidade entre os paametes e as complexas elações não-lineares entre as saídas e os fatos contibuintes. O SEER-SEM recorre a pactitiones softwae por causa de suas proezas poderosas da estimativa. Ele foi desenvolvido com uma combinação de funções de estimativa para fornecer estimativas vaidosas. Ceated especificamente para estimar effot softwae, o modelo SEER-SEM foi influenciado pelos famewoks de utnam (utnam e Myes 1992) e Doty Associates (Jensen, utnam e Roetzheim 2006). Como um dos modelos de estimação algorítmica, o SEER-SEM tem duas limitações principais na estimativa de efot. Em primeiro lugar, você recebeu 50 paametes de entrada exaltados pelos vaiosos fatos de um pojeto, que incidem na complexidade de SEER-SEM, especialmente na administração da incerteza dessas saídas. Second, the specific details of SEER-SEM incease the difficulty of discoveing the nonlinea elationship between the paamete inputs and the coesponding outputs. Ou study attempts to educe the negative impacts of the above majo limitations of the SEER-SEM effot estimation model on pediction accuacy and make contibutions towads esolving the poblems caused by the disadvantages of algoithmic models. Fst, fo accuately estimating softwae effot the neual netwok and fuzzy logic appoaches ae Global Jounal of Compute Science and Technology adopted to ceate a neuo-fuzzy model, which is subsequently combined with SEER-SEM. The Adaptive Neuo-Fuzzy Infeence System (ANFIS) is used as the achitectue of each neuo-fuzzy sub-model. Second, this eseach is anothe evaluation fo effectiveness of the geneal model of neuo-fuzzy with algoithmic model poposed by the pevious studies. Thd, the published data and industial poject data ae used to evaluate the poposed neuo-fuzzy model with SEER-SEM. Although the data was collected specifically fo COCOMO 81 and COCOMO 87, they ae tansfeed fom COCOMOs to COCOMO II and then to the SEER-SEM paamete inputs, utilizing the guidelines fom the Univesity of Southen Califonia (USC) (Madachy, Boehm, and Wu 2006; USC Cente fo Softwae Engineeing 2006). Afte the tansfe of this data, the estimation pefomance is veified to ensue its feasibility. II. BACKGROUND Soft computing, which is motivated by the chaacteistics of human easoning, has been widely known and utilized since the 1960s. The oveall objective fom this field is to achieve the toleance of incompleteness and to make decisions unde impecision, uncetainty, and fuzziness (Nauck, Klawonn, and Kuse 1997; Nguyen, asad, Walke, and Walke 2003). Because of capabilities, soft computing has been adopted by many fields, including engineeing, manufactuing, science, medicine, and business. The two most pominent technues of soft computing ae neual netwoks and fuzzy systems. The most attactive advantage of neual netwoks is the ability to lean fom pevious examples, but it is difficult to pove that neual netwoks ae woking as expected. Neual netwoks ae like black boxes to the extent that the method fo obtaining the outputs is not evealed to the uses (Chulani 1999; Jang, Sun, and Mizutani 1997). The obvious advantages of fuzzy logic ae easy to define and undestand an intuitive model by using linguistic mappings and handle impecise infomation (Gay and MacDonell 1997; Jang, Sun, and Mizutani 1997). On the othe hand, the dawback of this technue is that it is not easy to guaantee that a fuzzy system with a substantial numbe of complex ules will have a pope degee of meaningfulness (Gay and MacDonell 1997). In addition, the stuctue of fuzzy if-then ules lacks the adaptability to handle extenal changes (Jang, Sun, and Mizutani 1997). Although neual netwoks and fuzzy logic have obvious stengths as independent systems, the disadvantages have pompted eseaches to develop a hybid neuo-fuzzy system that minimizes these limitations. Specifically, a neuo-fuzzy system is a fuzzy system that is tained by a leaning algoithm deived fom the neual netwok theoy (Nauck, Klawonn, and Kuse 1997). Jang s (Jang, Sun, and Mizutani 1997; Nauck, Klawonn, and Kuse 1997) ANFIS is one type of hybid neuo-fuzzy system, which is composed of a five-laye feed-fowad netwok achitectue. Soft computing is especially impotant in softwae cost estimation, paticulaly when dealing with uncetainty and with complex elationships between inputs and outputs. In the 1990 s a soft computing technue was intoduced to.
3 Global Jounal of Compute Science and Technology Vol. 10 Issue 12 (Ve. 1.0) Octobe 2010 a g e 53 build softwae estimation models and impove pediction pefomance (Damiani, Jain, and Madavio 2004). As a technue containing the advantages of the neual netwoks and fuzzy logic, the neuo-fuzzy model was adopted fo softwae estimation. Reseaches developed some models with the neuo-fuzzy technue and demonstated the ability to impove pediction accuacy. Hodgkinson and Gaatt (Hodgkinson and Gaatt 1999) intoduced the neuo-fuzzy model fo cost estimation as one of the impotant methodologies fo developing non-algoithmic models. The model did not use any of the existing pediction models, as the inputs ae size and duation, and the output is the estimated poject effot. The clea elationship between Function oints Analysis (FA) s pimay component and effot was demonstates by Aban and Robillad s study (Aban and Robillad 1996). Huang et al. (Huang, Ho, Ren, and Capetz 2005 and 2006) poposed a softwae effot estimation model that combines a neuofuzzy famewok with COCOMO II. The paamete values of COCOMO II wee calibated by the neuo-fuzzy technue in ode to impove its pediction accuacy. This study demonstated that the neuo-fuzzy technue was capable of integating numeical data and expet knowledge. And the pefomance of RED(20%) and RED(30%) wee impoved by moe than 15% and 11% in compaison with that of COCOMO 81. Xia et al. (Xia, Capetz, Ho, and Ahmed 2008) developed a Function oint (F) calibation model with the neuo-fuzzy technue, which is known as the Neuo-Fuzzy Function oint (NFF) model. The objectives of this model ae to impove the F complexity weight systems by fuzzy logic, to calibate the weight values of the unadjusted F though the neual netwok, and to poduce a calibated F count fo moe accuate measuements. Oveall, the evaluation esults demonstated that the aveage impovement fo softwae effot estimation accuacy is 22%. Wong et al. (Wong, Ho, and Capetz 2008) intoduced a combination of neual netwoks and fuzzy logic to impove the accuacy of backfing size estimates. In this case, the neuo-fuzzy appoach was used to calibate the convesion atios with the objective of educing the magin of eo. The study compaed the calibated pediction model against the default convesion atios. As a esult, the calibated atios still pesented the invese cuve elationship between the pogamming languages level and the SLOC/F, and the accuacy of the size estimation expeienced a small degee of impovement. III A NEURO-FUZZY SEER-SEM MODEL A. A Geneal Soft Computing Famewok fo Softwae Estimation This section descibes a geneal soft computing famewok fo softwae estimation, which is based on the unue achitectue of the neuo-fuzzy model descibed in the patent US B2 (Huang, Ho, Ren, and Capetz 2008) and was built by Huang et al. (Huang, Ho, Ren, and Capetz 2006). The famewok is composed of inputs, a neuo-fuzzy bank, coesponding values of inputs, an algoithmic model, and outputs fo effot estimation, as depicted in Fig. 1. Among the components of the poposed famewok, the neuo-fuzzy bank and the algoithmic model ae the majo pats of the model. The inputs ae ating levels, which can be continuous values o linguistic tems such as Low, Nominal, o High. V1,,Vn ae the non-ated values of the softwae estimation algoithmic model. On the othe hand, AI 0,, AI m ae the coesponding adjusted quantitative paamete values of the ating inputs, which ae the inputs of the softwae estimation algoithmic model fo estimating effot as the final output. Figura 1. A Geneal Soft Computing Famewok. This novel famewok has attactive attibutes, paticulaly the fact that it can be genealized to many diffeent situations and can be used to ceate moe specific models. In fact, its genealization is one of the puposes of designing this famewok. Its implementation is not limited to any specific softwae estimation algoithmic model. The algoithmic model in the famewok can be one of the cuent popula algoithmic models such as COCOMO, SLIM o SEER-SEM. When vaious algoithmic models ae implemented into this famewok, the inputs and the nonating values ae diffeent. B. SEER-SEM Effot Estimation Model SEER-SEM stemmed fom the Jensen softwae model in the late 1970s, whee it was developed at the Hughes Acaft Company s Space and Communications Goup (Fischman, McRitchie, and Galoath 2005; Galoath and Evans 2006; Jensen, utnam, and Roetzheim 2006). In 1988, Galoath Inc. (GAI) stated developing SEER-SEM (Galoath and Evans 2006), and in 1990, GAI tademaked this model. The SEER-SEM model was motivated by utnam s SLIM and Boehm s COCOMO (Fischman, McRitchie, and Galoath 2005; Galoath and Evans 2006; Jensen, utnam, and Roetzheim 2006). Ove the span of a decade, SEER-SEM has been developed into a poweful and sophisticated model, which contains a vaiety of tools fo pefoming diffeent estimations that ae not limited to softwae effot. SEER - SEM includes the beakdown stuctues fo vaious tasks, poject life cycles, platfoms, and applications. It also includes the most development languages, such as the thd and fouth geneation pogamming languages, in the estimation. Futhemoe, the uses can select diffeent knowledge bases (KBs) fo latfom, Application, Acquisition Method, Development Method, Development Standad, and Class based on the equements of the pojects. SEER-SEM povides the baseline settings fo paametes accoding to the KB inputs; thee ae ove 50.
4 a g e 54 Vol. 10 Issue 12 (Ve. 1.0) Octobe 2010 paametes that impact the estimation outputs. Among them, 34 paametes ae used by SEER-SEM effot estimation model (Galoath Incopoated 2001 and 2006). Nevetheless, the SEER-SEM model contains some disadvantages. Fo instance, the effots spent on pespecification phases, such as equements collection, ae not included in the effot estimation. In SEER-SEM effot estimation, each paamete has sensitivity inputs, with the atings anging fom Vey Low (VLo-) to Exta High (EHi+). Each main ating level is divided into thee subatings, such as VLo-, VLo, VLo+. These atings ae tanslated to the coesponding quantitative value used by the effot estimation calculation. The SEER-SEM effot estimation is calculated by the following equations: E Ctb K K ctbx ln exp 5TURN 0.4 e, D 1. 2 ( S C C ) te te C tb amadjustment ctbx = ACAAEXALMODCATOOLTERM (4) amadjustment= LANGLEXTSYSTEXDSYSDEXSYSEXS IBRREUSMULTRDEDRLOCDSVLSVLRV OLSECTESTQUALRHST(HOST)DISME MCTIMCRTIMSECRTSVL (5) whee, E is the development effot (in peson yeas), K is the total Life-cycle effot (in peson yeas) including development and maintenance, The elements included in equations (4) and (5) ae paametes o combined paametes; the fomulas fo calculating combined paametes ae shown below: AEXAL = 0.82+(0.47*EX( *(AEX/AL))) (6) LANGLEX = 1+(( *LANG)-1)*EX(-LEX/(LANG/3)) (7) TSYSTEX = 1+( *TSYS)*EX(-3*TEX/TSYS) (8) DSYSDEX = 1+( *DSYS)*EX(-3*DEX/DSYS) (9) (2) (3) (1) Global Jounal of Compute Science and Technology SYSEX (0.91^ SYS 0.23 * SYS* EX(-3* EX /SYS))^0.833, when SYS 0 1, when SYS 0 SIBRREUS = SIBR*REUS +1 C. A Neuo-Fuzzy Model with SEER-SEM a) Oveview (10) (11) This section will descibe the poposed famewok of the neuo-fuzzy model with SEER-SEM, based on the geneal stuctue in the section III. A, as depicted in Fig. 2. The inputs consist of two pats: non-ating inputs and the ating levels of paametes, which include 34 technology and envonment paametes and 1 complexity o staffing paamete. Among the technology and envonment paametes, thee is one paamete (SIBR), which is not ated by the linguistic tem. SIBR is decided by uses, though inputting the pecentage. Hence, simila to the input of size, SIBR is a non-ating value. While the othe paametes ae labeled as R 1 to R 34, SIBR is labeled R 35. Fig.2. A Neuo-Fuzzy Model with SEER-SEM. Each paamete Ri (i = 1,, 34) can be a linguistic tem o a continuous ating value. The linguistic inputs ae fom 18 ating levels ( =1,, 18), which include Vey Low (VLo-), Vey Low (VLo), Vey Low+ (VLo+), Low, Low, Low+, Nominal - (Nom-), Nominal (Nom), Nominal+ (Nom+), High (Hi-), High (Hi), High+ (Hi+), Vey High (VHi-), Vey High (VHi), Vey High+ (VHi+), Exta High (EHi-), Exta High (EHi), and Exta High+ (EHi+). In these atings, thee ae 6 main levels, VLo, Low, Nom, Hi, VHi, and EHi, and each main ating level has thee sub-levels: minus, plus o neutal (Galoath Incopoated 2006 be 2005). NFi (i = 1,, 34) is a neuo-fuzzy bank, which is composed of thty-fou NFi sub-models. The ating levels of each paamete Ri (i = 1,, 34) ae the input of each NFi. Though these sub-models, the ating level of a paamete is tanslated into the coesponding quantitative value (i, i = 1,, 34) as the inputs of the SEER-SEM effot estimation as intoduced in the section III. B, fom.
5 Global Jounal of Compute Science and Technology Vol. 10 Issue 12 (Ve. 1.0) Octobe 2010 a g e 55 equations (1) to (11). The output of the poposed model is the softwae effot estimation. b) Stuctue of NF i function; in ou poposed model, all the membeship functions of each node in Laye 1 ae the same. In subsequent sections, the selected membeship function will be discussed in detail. O 1 A ( R fo i = 1, 2,, 34 ) =1, 2,, 18 (12) i Fig.3. Stuctue of NF i. The neuo-fuzzy bank fulfills an impotant function in the poposed neuo-fuzzy model with SEER-SEM effot estimation model. NF i poduces fuzzy sets and ules fo taining datasets. It tanslates the ating levels of a paamete into a quantitative value and calibates the value by using actual poject data. Accoding to fuzzy logic technues, linguistic tems can be pesented as a fuzzy set. Thee ae 18 ating levels fo each paamete in linguistic tems, which ae used to define a fuzzy set in this eseach. The selected membeship function tanslates the linguistic tems in this fuzzy set to membeship values. Each NF i uses the stuctue of the Adaptive Neuo-Fuzzy Infeence System (ANFIS), which is a five-laye hybid neuo-fuzzy system, as depicted in Fig. 3. Input and Output of NF i Thee is one input and one coesponding output fo each NF. The input of each NF i (R i, i = 1,, 34) is the ating level of a paamete fo SEER-SEM effot estimation model, such as Vey Low (VLo) o High (Hi). On the othe hand, the output is the coesponding quantitative value of this paamete ( i, i = 1,, 34), such as Fuzzy Rule Based on the featues of ANFIS and the stuctue shown in Fig. 3, this wok efes to the fom of the fuzzy if-then ule poposed by Takagi and Sugeno (Takagi and Sugeno 1986). The th fuzzy ule of the poposed model is defined as below: Fuzzy Rule : IF R i is A THEN i =, =1, 2,, 18 whee A is a ating level of the fuzzy set that anges fom Vey Low - to Exta High+ fo the ith paamete and is chaacteized by the selected membeship function, and is the coesponding quantitative value of the th ating level fo the ith paamete. Futhemoe, with this fuzzy ule, the pemise pat is the fuzzy set and the consequent pat is the non-fuzzy value. Oveall, the fuzzy ules build the links between a linguistic ating level and the coesponding quantitative value of a paamete. Functions of Each Laye Laye 1: In this laye, the membeship function of fuzzy set A tanslates the input, R i, to the membeship gade. The output of this laye is the membeship gade of R i, which is the pemise pat of fuzzy ules. Also, the membeship function of the nodes in this laye is utilized as the activation whee O i is the membeship gade of A (=VLo-, VLo, k VLo+, Low-, Low, Low+, Nom-, Nom, Nom+, Hi-, Hi, Hi+, VHi-, VHi, VHi+, EHi-, EHi, o EHi+) with the input R i o A continuous numbe x 0,19 ; is the membeship function of A. Laye 2: oducing the fing stength is the pimay function of this laye. The outputs of Laye 1 ae the inputs of each node in this laye. In each node, Label Π multiplies all inputs to poduce the outputs accoding to the defined fuzzy ule fo this node. Consequently, the outputs of this laye ae the fing stength of a ule. The pemise pat in the defined fuzzy ule of ou poposed model is only based on one condition. Theefoe, the output of this laye, the fing stength, is not changed and is thus the same as the inputs, o membeship gade. O 2 w O 1 A ( Ri (13) Laye 3: The function of this laye is to nomalize the fing stengths fo each node. Fo each node, labeled "N", the atio of the th ule s fing stength to the sum of all ules fing stengths elated to Ri is calculated. The esulting outputs ae known as nomalized fing stengths. O 3 w 18 w w 1 (14) Laye 4: An adaptive esult of i is calculated with the Laye 3 outputs and the oiginal input of i in the fuzzy ules by multiplying. The outputs ae efeed to as w consequent paametes. 4 (15) O w Laye 5: This laye aims to compute the oveall output with the sum of all easoning esults fom Laye 4. O 5 O 4 i w (16) Membeship Function This section descibes the tiangula membeship function utilized in this wok; this paticula function is depicted in Fig. 4. Each ating level has the coesponding tiangula membeship function. This membeship function is a piecewise-linea function. Thoughout the leaning pocess, the membeship function is maintained in a fixed state. The following calculation defines the tiangula membeship function: )
6 Membe shi p Deg ee a g e 56 Vol. 10 Issue 12 (Ve. 1.0) Octobe 2010 Global Jounal of Compute Science and Technology x ( 1), 1 x ( x) ( 1) x, x fo 1 =1, 2,, 18 (17) A 0, othewise whee x = R i o x 0, Vl o - 1 Vl o 2 Vl o+ 3 Low - 4 Low 5 Low+ 6 Nom - 7 Nom 8 Nom+ 9 Hi - 10 Hi 11 Hi + 12 Vhi - 13 Vhi 14 Vhi + 15 Ehi - 16 Ehi 17 Ehi + 18 Thee ae seveal factos that influenced ou selection of the tiangula membeship function; fst, the natue of the NFi outputs was the most cucial eason. is a piecewise-linea intepolation y y xx 0 0 y y x x between paamete values ( i1, i18 ) of the ith paamete, i. Hence, the selection of the tiangula function can be deived fom the same esults as a linea intepolation. Secondly, one of the puposes of this eseach is to evaluate the extent to which Huang s poposed soft computing famewok can be genealized. Theefoe, it was impotant to use the same membeship function as that utilized in Huang s eseach in ode to pefom validation with a simila fuzzy logic technue (Huang 2003). Finally, the tiangula membeship function is easy to calculate. Leaning Algoithm With ANFIS, thee is a two-pass leaning cycle: the fowad pass and the backwad pass. The pass that is selected depends on the tained paametes in ANFIS. In ou poposed model, when the eo exists between the actual effot and the estimated effot, the outputs ae fixed and the inputs ae tained. Hence, the backwad pass is the type of leaning algoithm that this study uses. It is geneally a hybid method of Least Squae Estimate (LSE) and Back Fig.4. Tiangula Membeship Function opagation, which is calculated using a gadient decent algoithm that minimizes the eo. Fo the leaning algoithm, the paametes of the pemise pat and the consequent pat ae defined in two sets, as illustated below: X = = (18) = , ,, > (19) whee N = 34 and M =18; X epesents the inputs of the model, which ae the ating levels, SIBR and Size; and is the paamete values of the paametes. The output of each NF can be defined when substituting (13) and (14) into (16): f 18 w. i i1, i2 i18 i NF i 1 A fo i = 1, 2,, 34 (20) i is the weighted sum of inputs X fo R i. In the section III. B, the equations fo the SEER-SEM Effot Estimation ae descibed in detail. The equations (1), (2), (3), (4), and (5) can be e-witten as follows with the paametes symbols: x Effot 1.2 Size ctbx ln 4.11 exp amadjustment (21) ctbx = (22) amadjustment = (23) 1.2.
7 Global Jounal of Compute Science and Technology Vol. 10 Issue 12 (Ve. 1.0) Octobe 2010 a g e 57 Utilizing equations (18) to (21), the poposed neuo-fuzzy model can be witten: Effot f X, NF (24) If thee ae NN poject data points, the inputs and outputs can be pesented as (X n, E acn ), whee n = 1, 2,, NN, X n contains 34 paametes as well as SIBR and Size, E aen is the actual effot with X n inputs fo poject n. The leaning pocedue involves adopting the gadient descent method to adjust the paamete values of ating levels that minimizes the eo, E. Accoding to LSE, the eo, E, on the output laye is defined as follows: E (25) whee w n is the weight of poject n and E en is the estimation of the output fo poject n. (26) E The following steps ae used to pefom gadient descent accoding to the Back opagation leaning algoithm. Accoding to the SEER-SEM effot estimation model pesented by equations (21) to (23), the esults of the patial deivative of E en with espect to, 1 2 NN w n1 n Effot E en E Eacn f acn, ae diffeent. 2 X, en n NF n E E E en en NN wn 2 n1 Een E en E en i i E acn E n (27) fo i = 1, 2,, 34 (28) i ( f E en NF i en ( f ( NF X n, n) ) i i ( )) ( A ( x ) ) x i (29) A Afte is calculated out, equation (30) is used to calculate the adjusted paamete values. l 1 l E (30) whee α & gt; 0 is the leaning ate and l is the cuent iteation index. Monotonic Constaints A monotonic function is a function that peseves the given ode. The paamete values of SEER-SEM ae eithe monotonic inceasing o monotonic deceasing. The elationship between the monotonic functions and the ating levels have been accepted by the pactitiones as a common sense pactice. Fo instance, the values of ACA ae monotonic deceasing fom VLo - to EHi+, which is easonable because the highe the analysts capability, the less spent on poject effots. As fo TEST, its values ae monotonic inceasing because the highe test level causes moe effot to be spent on pojects. Afte calibating paamete values by the poposed model, the tained esults of these values may contavene the monotonic odes, so that the tained values ae changed to a non-monotonic ode. Fo instance, the paamete value of the ACA ating Hi can be geate than the value of the coesponding ating, EHi. This discepancy can lead to uneasonable inputs fo pefoming estimation and can impact the oveall accuacy. Theefoe, monotonic constaints ae used by ou model in ode to maintain consistency with the ating levels. IV. EVALUATION Fo evaluating the neuo-fuzzy SEER-SEM model, in total, data fom 99 studies is collected, including 93 published COCOMO 81 pojects and 6 industy studies in the fomat of COCOMO 87 (Ho 1996; anlilio-yap and Ho 2000). An algoithmic estimation model, E = a Size b compises the geneal fom of COCOMO and SEER-SEM (Fischman, McRitchie, and Galoath 2005; Jensen, utnam, and Roetzheim 2006). Specifically, this model enables us to use the COCOMO database fo evaluating the poposed SEER - SEM model in spite of the diffeence between COCOMO and SEER-SEM. In fact, vaious studies have evealed the simila estimation pefomances of COCOMO and SEER - SEM (Madachy, Boehm, and Wu 2006; USC Cente fo Softwae Engineeing 2006).
8 a g e 58 Vol. 10 Issue 12 (Ve. 1.0) Octobe 2010 Global Jounal of Compute Science and Technology Fig. 5 shows the main steps of ou evaluation. Fst, in ode to use both published COCOMO 81 and industial poject data in the evaluation, the infomation was tanslated into the coesponding fomat of SEER-SEM data. Second, thee ae fou cases fo evaluating the pediction pefomance of ou neuo-fuzzy model. 1) efomance Evaluation Metics The following evaluation metics ae adapted to assess and evaluate the pefomance of the effot estimation models. Relative Eo (RE) EstimationEffot ActualEffot RE ActualEffot The RE is used to calculate the estimation accuacy. Magnitude of Relative Eo (MRE) EstimationEffot ActualEffot MRE ActualEffot Mean Magnitude of Relative Eo (MMRE) The MMRE calculates the mean fo the sum of the MRE of n pojects. Specifically, it is used to evaluate the pediction pefomance of an estimation model. ediction Level (RED) k RED L n whee L is the maximum MRE of a selected ange, n is the total numbe of pojects, and k is numbe of pojects in a set of n pojects whose MRE <= L. RED calculates the atio of pojects MREs that falls into the selected ange (L) out of the total pojects. (e. g. n = 100, k =80, whee L= MRE <= 30%: RED(30%) = 80/100 = 80%) Fig.5. Main Evaluation Steps. 2) Dataset Thee ae two majo steps in tansfeing data fom COCOMO 81 to SEER-SEM: fst, infomation is conveted fom COCOMO 81 to COCOMO II and then fom COCOMO II to SEER-SEM. The main guidelines ae efeed to (Madachy, Boehm, and Wu 2006; Reife, Boehm, and Chulani 1999). In the method of the second step, 20 of the 34 SEER-SEM technical paametes can be dectly mapped to 14 COCOMO II cost dives and 1 scale factos, 1 COCOMO 81 cost dive, and 2 COCOMO 87 cost dives. The emainde of the SEER-SEM paametes cannot be tansfeed to the COCOMO model, and as a esult, they ae set up as nominal in SEER-SEM. Afte tansfeing 93 COCOMO 81 poject data points, the estimation pefomance with tansfeed data ae evaluated with the estimation pefomance metics. Table 1 pesents the details of the pediction pefomance of COCOMO 81, COCOMO II, and SEER-SEM. Table 1. Estimation efomance with Tansfeed Data. Cocomo 81 Cocomo II See-sem Mme (%) ed(20%) ed(30%) ed(50%) ed(100%) # of Outlies The data tansfeing fom COCOMO 81 to COCOMO II keeps the vey close pefomance with little impovement when doing COCOMO II estimation with the tansfeed data. The tansfeing fom COCOMO II to SEER-SEM causes the MMRE deceasing and the outlies inceasing. Most of the new outlies come fom the embedded pojects whose MREs ae lowe than 50% befoe being tansfeed to SEER-SEM. The RED is still stable and thee is not a huge change. Oveall, tansfeing fom COCOMO 81 to SEER - SEM is feasible fo ou evaluation, especially when the actual poject data in the fomat of SEER-SEM ae difficult to obtain. We use the online calculato of the USC Cente fo Softwae Engineeing to pefom COCOMO 81 and.
9 Global Jounal of Compute Science and Technology Vol. 10 Issue 12 (Ve. 1.0) Octobe 2010 a g e 59 COCOMO II estimation. We do SEER-SEM effot estimation by two methods. One is pefomed by the SEEM - SEM tool (SEER-SEM fo Softwae 7.3) which is offeed by GAI, and the othe is done manually by Micosoft Excel with the equations of SEER-SEM effot estimation model as pesented in the section III. B. The SEER-SEM effot estimation model is also implemented as pat of ou eseach because it is pat of ou poposed model. The estimation pefomance by the SEER-SEM tool and Excel ae vey close. This is a way to make sue the algoithm of SEER - SEM effot estimation pesented in this pape to be coect. We select the esults done manually to avoid the impact fom othe paametes settings in the SEER-SEM tool. The dataset of 6industial poject data points is fom the COCOMO 87 model, which is slightly diffeent than COCOMO 81, as the effot multiplies RUSE, VMVH (Host Volatility), and VMVT (Taget Volatility) ae not used in COCOMO 81. Howeve, RUSE can be tansfeed to COCOMO II dectly because it is one of the COCOMO II cost dives, and VMVH and VMVT can be tansfeed to the SEER-SEM paametes DSVL and TSVL. The est of COCOMO 87 cost dives ae matched to the coesponding cost dives of COCOMO 81. Then, they ae tansfeed to COCOMO II and SEER-SEM. 3) Evaluation Cases Afte tansfeing the data, we conducted fou main case studies to evaluate ou model. These cases, which used diffeent datasets fom 93 pojects, wee utilized to pefom taining on the paamete values. The 93 poject data points and the 6 industial poject data points wee adopted fo testing puposes. The oiginal SEER-SEM paamete values ae tained in each case. The leaned paamete values of the fou cases ae diffeent. This eason causes the pediction pefomance diffeence amongst the cases and the SEER - SEM. In ode to assess the pediction pefomance of the neuo-fuzzy model, we compaed SEER-SEM effot estimation model with ou famewok. Seveal pefomance metics wee used fo the analysis of each case, including MRE, MMRE, and RED. Accodingly, Table 2 pesents the MMRE esults fom Cases 1 to 4, and Table 3 shows the MMRE esults of the industial poject data points. Table 4 shows the RED esults of Cases 1, 2, and 3. The RED esults of Case 4 ae pesented in Table 5.In the tables pesenting the analysis esults, we have included a column named Change, which is used to indicate the pefomance diffeence between SEER-SEM effot estimation model and ou neuo-fuzzy model. Fo the MMRE, the pediction pefomance impoves as the value becomes close to zeo; theefoe, if the change fo these pefomance metics is a negative value, the MMRE fo the neuo-fuzzy model is impoved in compaison with SEER-SEM. Additionally, the RED(L) in Table 4 epesent the pediction level of the selected ange, efeing to the definition pesented in the section IV. A; a highe pediction level indicates a geate level of pefomance fo RED. Fo RED, a negative value fo the Change indicates that ou model shows a deceased level of pefomance as compaed to SEER-SEM. Finally, the esults fo both MMRE and RED ae shown in a pecentage fomat. Table 2. MMRE of 93 ublished Data oints. Case ID SEER-SEM Validation Change C C C C C Table 3. MMRE of Industial oject Data oints. Case ID MMRE (%) SEER-SEM Industial Aveage Change C C C C C SEER-SEM Table 4. RED of Cases 1, 2 and 3. Neuo-Fuzzy Model RED(L) RED (%) C1 C2 C3 RED (%) Change RED (%) Change RED (%) Change RED(20%) RED(30%) RED(50%) RED(100%)
10 a g e 60 Vol. 10 Issue 12 (Ve. 1.0) Octobe 2010 Global Jounal of Compute Science and Technology Case 1 (C1): Leaning with poject data points excluding all outlies This case involved taining the paametes of pojects whee the MREs ae lowe than o equal to 50%. Thee ae 54 pojects that meet this equement. Since we wanted to pefom leaning without any impact fom the outlies, the leaning was done with 54 poject data points, while 93 pieces of poject data and the 6 industial poject data points wee used fo testing. When using the neuo-fuzzy model, the MMRE deceased fom 84.39% to 61.05%, with an oveall impovement of 23.35%. Afte testing data fom the 93 pojects, we used the 6 industial poject data points to pefom testing. The esults of this evaluation pesent the same tendency as the testing esults with the 93 poject data points: the MMRE of the neuo-fuzzy model is lowe than the MMRE of SEER-SEM by 2%. With the neuo-fuzzy model, RED(20%) and RED(30%) deceased by 7.62% and 7.53% in compaison to the same values using SEER-SEM; howeve, RED(50%) and RED(100%) impoved with the neuofuzzy model by a facto of 7.53% and 10.75% espectively, which indicates that the MRE of the neuo-fuzzy model, in compaison with that of SEER-SEM, contained moe outlies that wee less than 100% o 50%. Futhemoe, the MMRE was significantly impoved with the neuo-fuzzy model due to the incease of outlies that wee less than 100%. By integating the esults fom the MMRE, RED, and the industial poject data points, this calibation demonstates that the neuo-fuzzy model has the ability to educe lage MREs. Case 2 (C2): Leaning with all poject data including all outlies In Case 2, we used the data points fom all 93 pojects to calibate the neuo-fuzzy model without emoving the 39 outlies. The testing was pefomed with the same poject dataset used in the taining and with the 6 industial poject data points. In compaison to Case 1, this test attempted to ascetain the pediction pefomance when the leaning involved the outlies as well as the effects of the outlies on the calibation. the MMRE using SEER-SEM compaison to the MMRE using SEER-SEM. Nevetheless, the industial poject data points caused the MMRE to wosen with the neuo-fuzzy model by 10.03%. The esults of RED demonstate that RED(20%), RED(30%), and RED(50%) deceased by moe than 20%, while RED(100%) inceased by 16.13% with the neuo-fuzzy model. Moeove, these esults also indicate that the neuo-fuzzy model is effective fo impoving the MREs that ae geate than 100%. As a esult, the MMRE in all of the datasets ae impoved when the neuofuzzy model is utilized. In Cases 1 and 2, the esults of RED and the 6 industial poject data points show that the neuofuzzy model causes lage inceases in small MREs while educing lage MREs. Hence, the decease of lage MREs leads to the oveall impovement of the MMRE, thus showing the effectiveness of the neuo-fuzzy model. Case 3 (C3): Leaning with poject data excluding pat of outlies Afte taining, which included and then excluded all of the outlies, Case 3 calibated the neuo-fuzzy model by emoving the top 12 of 39 outlies whee the MRE is moe than 150%. In this case, 87 poject data points ae used to pefom taining, and the 93 poject data points and the 6 industial poject data points ae used fo testing. The esults of Case 3 ae almost identical to the esults of MMRE and RED as demonstated in Case 2. Specifically, fo the neuo-fuzzy model, the MMRE of industial poject data points is wosened by 9.62%. Oveall, as compaed to Case 2, calibation excluding the top 12 outlies does not make a significant diffeence in the pefomance of the model. Case 4 (C4): Leaning with pat of poject data points In the pevious thee cases, all data points fom the 93 pojects wee used fo testing. Howeve, in Case 4, we used pat of this dataset to calibate the neuo-fuzzy model, and the est of the data points, along with the 6 industial poject data points, wee used fo testing. The objective of this case was to detemine the impact of the taining dataset size on the calibation esults. Table 2, Table 3, and Table 5 pesent the esults. Case 4-1 (C4-1): Leaning with 75% of poject data points and testing with 25% of poject data points This sub-case pefomed taining with 75% of the 93 poject data points and testing with the emaining 25% of these points. The poject numbes fo the taining data points anged fom 24 to 93, while those fo the testing points anged fom 1 to 23 and also included the 6 industial poject data points. To analyze the esults, we compaed the pefomance of SEER - SEM to that of the neuo-fuzzy model fo ojects 1 to 23. In this case, the neuo-fuzzy model impoved the MMRE by 10.98%. Futhemoe, RED(30%) and RED(100%) with ou model impoved by 4.35% and 8.70% espectively. Finally, with the neuo-fuzzy model, the MREs of all 23 poject data points wee within 100%. In this case, the testing esults of the industial poject data points ae impoved fom the pevious tests by 4.34%. These esults demonstate the effective pefomance of the neuo-fuzzy model in educing lage MREs. Case 4-2 (C4-2): Leaning with 50% of poject data points and testing with 50% of poject data points Case 4-2 divided the 93 poject data points into two subsets. The fst subset included 46 poject data points that ae numbeed fom 1 to 46 and wee used to pefom testing. Em.
11 MMRE and Change Global Jounal of Compute Science and Technology Vol. 10 Issue 12 (Ve. 1.0) Octobe 2010 a g e 61 the othe hand, the second subset contained 47 poject data points, numbeed fom 47 to 93, which wee used to tain the neuo-fuzzy model. In compaison to Case 4-1, this test contains fewe taining data points and moe testing data points. Accodingly, we analyzed the pefomance esults of the 46 poject data points as estimated by both SEER-SEM and the neuo-fuzzy model. In this case, the MMRE impoved by 13.04% when using the neuo-fuzzy model. Specifically, the esults of RED showed impovement fom those in Case 4-1; not only wee the MREs of all 46 poject data points within 100%, but the MREs of most poject data points wee also less than 50%. Futhemoe, in the testing that involved the 6 industial poject data points, the esults wee bette than those in Case 4-1. Using the neuo-fuzzy appoach, the MMRE of the 6 industial poject data points impoved by 7.15%, which was the geatest impovement among all of the cases in this study. impovement. Howeve, the aveage of RED(100%) is inceased by 12.14%, which indicates that the neuo-fuzzy model impoves the pefomance of the MMRE by educing the lage MREs. Table 5. Summay of RED Aveage. SEER - SEM Aveage Validation RED(20%) 39.76% 27.48% RED(30%) 49.27% 36.46% of Change % % RED(50%) 62.02% 55.35% -6.67% RED(100%) 85.55% 97.69% 12.14% 4) EVALUATION SUMMARY In this section, we summaize the evaluation esults by compaing the analysis of all of the cases as pesented in the pevious sections. Fig. 6 shows the validation summay fo the mme acoss all of the cases. Specifically, the mme impoves in all of the cases, with the geatest impovement being ove 25% % % 80.00% 60.00% 40.00% Summay of RED Validation SEER-SEM Validation % Summay of MMRE Validation 20.00% 0.00% RED(20%) Aveage RED(30%) Aveage RED(50%) Aveage RED(100%) Aveage 90.00% 70.00% Fig.7. Summay of RED Validation 50.00% SEER-SEM Validation 30.00% Change 10.00% % % C1 C2 C3 C4-1 C4-2 Aveage Fig.6. Summay of MMRE Validation. Fig. 8 pesents the MMREs of industial poject data points fom all of the cases. The MMRE fom Cases 1 and 4 demonstate an impovement of no moe than 7.15%. The calibations with the outlies in Cases 2 and 3 lowe the pediction pefomance of these two cases. Thus, fo the neuo-fuzzy model, the impovement of the MMRE of industial pojects is minimal. Table 6 illustates the RED aveages fo SEER-SEM in all of the cases, and Fig. 7 shows the RED aveages fo all of the cases using the neuo-fuzzy model. Compaed to the REDs fom SEER-SEM, the aveages of RED(20%), RED(30%), and RED(50%) with the neuo-fuzzy model do not show.
12 a g e 62 Vol. 10 Issue 12 (Ve. 1.0) Octobe 2010 Global Jounal of Compute Science and Technology Fig.6. MMRE of Industial oject Data oints. V. CONCLUSION Oveall, ou eseach demonstates that combining the neuofuzzy model with the SEER-SEM effot estimation model poduces unue chaacteistics and pefomance impovements. Effot estimation using this famewok is a good efeence fo the othe popula estimation algoithmic models. The neuo-fuzzy featues of the model povide ou neuo-fuzzy SEER-SEM model with the advantages of stong adaptability with the capability of leaning, less sensitivity fo impecise and uncetain inputs, easy to be undestood and implemented, stong knowledge integation, and high tanspaency. Fou main contibutions ae povided by this study: a) ANFIS is a popula neuo-fuzzy system with the advantages of neual netwok and fuzzy logic technues, especially the ability of leaning. The poposed neuo-fuzzy model can successfully manage the nonlinea and complex elationship between the inputs and outputs and it is able to handle input uncetainty fom the data. b) The involvement of fuzzy logic technues impoves the knowledge integation of ou poposed model. Fuzzy logic has the ability to map linguistic tems to vaiables. Accodingly, the inputs of ou model ae not limited to linguistic tems and can also wok with numeical values. The defined fuzzy ules ae an effective method fo obtaining the expets undestanding and expeience to poduce moe easonable inputs. c) Thee ae two technues intoduced in this eseach: the tiangula membeship function and the monotonic constaint. Tiangula Membeship Functions ae utilized to tanslate paamete values to membeship values. Futhemoe, monotonic constaints ae used in ode to peseve the given ode and maintain consistency fo the ating values of the SEER-SEM paametes. These technues povide a good genealization fo the poposed estimation model. d) This eseach poves that the poposed neuo-fuzzy stuctue can be used with othe algoithmic models besides the COCOMO model and pesents futhe evidence that the geneal soft computing famewok can wok effective with vaious algoithmic models. The evaluation esults indicate that estimation with ou poposed neuo-fuzzy model containing SEER - SEM is moe efficient than the estimation esults that only use SEER-SEM effot estimation model. Specifically, in all fou cases, the MMREs of ou poposed model ae impoved ove the ones whee only SEER-SEM effot estimation model is used, and thee is moe than a 20% decease as compaed to SEER-SEM. Accoding to these esults, it is appaent that the neuo-fuzzy technology impoves the pediction accuacy when it is combined with the SEER-SEM effot estimation model, especially when educing the outlies of MRE >100%. Although seveal studies have aleady attempted to impove the geneal soft computing famewok, thee is still oom fo futue wok. Fst, the algoithm of the SEER-SEM effot estimation model is moe complex than that of the COCOMO model. io eseach that combines neuo-fuzzy technues with the COCOMO model demonstates geate impovements in the pediction pefomance. Hence, the poposed geneal soft computing famewok should be evaluated with othe complex algoithms. Secondly, the datasets in ou eseach ae not fom the oiginal pojects whose estimations ae pefomed by SEER-SEM. When the SEER-SEM estimation datasets ae available, moe cases can be completed effectively fo evaluating the pefomance of the neuo-fuzzy model. VI. REFERENCES 1) Aban, A. and Robillad,. N. (1996) Function oints Analysis: An Empical Study of Its Measuement ocesses. Jounal of Systems and Softwae, Vol. 22, Issue 12: ) Albecht, A. J. (1979) Measuing Application Development oductivity. oceedings of the Joint SHARE, GUIDE, and IBM Application Development Symposium: ) Boehm, B. W. (1981) Softwae Engineeing Economics. entice Hall, Englewood Cliffs, NJ 4) Boehm, B. W., Abts, C., Bown, A. W., Chulani, S., Clak, B. K., Hoowitz, E., Madachy, R., Reife, D., and Steece, B. (2000) Softwae Cost Estimation with COCOMO II. entice Hall, Uppe Saddle Rive, NJ 5) Boehm, B. W., Abts, C., and Chulani, S. (2000) Softwae Development Cost Estimation Appoaches A Suvey. Annuals of Softwae Engineeing: ) Chulani, S. (1999) Bayesian Analysis of Softwae Cost and Quality Models. Dissetation, Univesity of South Califonia.
Комментарии
Отправить комментарий