quinta-feira, 25 de outubro de 2007

Seven Methods For Transforming Corporate Data Into Business Intelligence - Principais ideias -



Principais ideias retiradas de cada capítulo

Método 1 : SAD orientados aos dados

Sabemos da importância dos dados para uma organização pois representam factos ocorridos algures no tempo e no espaço,factos que caracterizam o negócio e que a qualquer momento podem traduzir informação,conhecimento e sabedoria. O crescendo da complexidade dos negócios, a consequente explosão do volume de dados e as necessidades cada vez mais exigentes e rápidas de informação por parte dos gestores, obrigam à existência de sistemas que simplifiquem e facilitem o acesso à informação de negócio. Este capítulo dá particular ênfase ao papel dos sistemas OLAP e Datawarehouse como exemplos de respostas a estas necessidades. Realce para o facto da criação destes sistemas não estar dependente apenas dos dados corporativos mas também da perspectiva de negócio, das necessidades e nas questões que os utilizadores de negócio pretendem ver satisfeitas. As soluções de OLAP e DataWarehouse devem representar mecanismos que permitam não só integrar os dados corporativos como também permitir uma visão única e transversal da informação de negócio e facilitar o processo de tomada de decisão. Existe,portanto, um destaque neste capítulo relativamente à integração e alinhamento dos dados com o conhecimento do negócio.

Método 2: Soluções Evolutivas – Algoritmos Genéticos -

As necessidades cada vez mais rápidas de resposta aos problemas e o acréscimo da sua complexidade ,tal como referido anteriormente, torna necessária a aplicação de métodos que permitam satisfazer as questões de negócios lançadas pelo decisor em termos temporais cada vez mais rápidos e em níveis de qualidade e certeza cada vez maiores. Como técnica heuristica que é, este capitulo destaca a importância dos Algoritmos Genéticos (AG) como processo optimizador. Os AG representam não só uma forma de resolver problemas cuja resolução é desconhecida, como também de atingir soluções alternativas inesperadas. A optimização surge como um processo que, de acordo com diversos critérios ou medidas, permite combinar diversos componentes do problema com vista a reduzir o leque de potenciais soluções, facilitando a tomada de decisão. A sua utilização pode seguir duas vertentes: a matemática(por exº através da técnica da programação linear) e heuristica (por exº através dos algoritmos genéticos), constituindo pois, um mecanismo facilitador da decisão e da inteligência do negócio, ao ir de encontro (ou até mesmo superar) as expectativas do decisor naquilo a que ele definiu como óptimo para solução do seu problema. Dhar e Stein utilizam uma analogia muito interessante para os problemas de optimização. Um problema de optimização é visto como uma paisagem composta de montanhas e vales, em que as montanhas podem ser vistas como as boas soluções e os vales as piores. A tarefa da optimização consiste em percorrer a paisagem e encontrar as maiores montanhas. Este capitulo realça,portanto, a importância de mecanismos que permitam facilitar o processo de tomada de decisão em cenários complexos, permitindo uma triagem de alternativas e consequente redução de potenciais soluções, numa vertente de optimização.

Método 3: Simular o Cérebro pra resolver os problemas – Redes Neuronais –

A capacidade do nosso cérebro aprender é infinita! Recebemos constantemente um conjunto de inputs ou estimulos nas mais diversas situações aos quais damos resposta produzindo resultados. A relação entre estes estimulos pode conduzir a resultados já obtidos, a alterá-los ou a produzir novos resultados. As Redes Neuronais (RN) tornam-se também elas uma técnica facilitadora da tomada de decisão na medida em que o seu output resulta de um processo ciclico de aprendizagem,descoberta e ajustamento. A aprendizagem feita por uma RN pode,apartir dos dados, conduzir à obtenção do conhecimento, através da descoberta de padrões e da identificação de relacionamentos desconhecidos até então entre eles. Realce para a sua utilidade em situações onde se dispõe dos dados apropriados, mas não existe grande detalhe sobre o problema e as suas alternativas: A própria RN trata de as identificar e destacar. Destaca-se assim, a importância do reajustamento do processo de decisão e da aprendizagem que dele resulta, conduzindo a novas alternativas e ajustes no processo de tomada de decisão.

Método 4: Sistemas baseados em regras

Os Sistemas Baseados em Regras (SBR) usam conhecimento prévio para resolver problemas, baseando-se na lógica booleana e em regras do tipo “IF-THEN” para estabelecer a veracidade ou falsidade das assertações. Um SBR é um modelo que expressa o seu conhecimento em termos de regras explicitas. Grande parte dos problemas de negócio são baseados em regras, isto porque as regras para além de representarem itens de conhecimento, permitem criar uma abstracção do negócio reduzindo a complexidade do espaço dos problemas. É vantajoso usar um sistema do tipo SBR quando se consegue especificar com confiança vários itens de conhecimento que indicam quais as acções a tomar em situações especificas. Por exemplo, o processo de atribuição de um empréstimo bancário é resultante da avaliação de um conjunto especifico de critérios.Antes do processo estar concluido, o decisor muitas das vezes está em condições de especificar com um alto grau de confiança qual o seguimento a dar ao processo. A maior parte do tempo de desenvolvimento de sistemas SBR ocorre na aquisição de conhecimento pois as interacções entre variáveis só começam a emergir à medida que os sistemas evoluem. Uma das formas de diminuir este tempo consiste na utilização de dados históricos associados ao problema. Este capítulo realça a importância do conhecimento tácito no processo de decisão e no potencial deste tipo de conhecimento em conjugação com regras.

Método 5: Lidando com a ambiguidade linguistica: a lógica fuzzy

A lógica fuzzy é um método racional que permite criar descrições parciais ou incompletas das regras, descrevendo um processo linguisticamente e traduzindo-o em poucas e flexiveis regras. Na maioria dos casos, as regras apresentam-se claras e bem definidas, mas existem muitas situações onde isso não acontece e recorre-se a aproximações para categorizar os eventos. Por exemplo, podemos dizer que uma pessoa que ganhe mais que 50.000€/ano é muito bem paga, ou seja estamos a generalizar. Entre uma pessoa que ganha 50.001€/ano e outra que ganha 90.000€/ano ambos seriam considerados muito bem pagos, mas um facto é que a última pessoa seria considerada muito mais bem paga que a primeira. E uma pessoa que ganhe 49.999€ não é ela também bem paga? Ou seja, a questão do ser muito paga torna-se uma noção fuzzy. A lógica fuzzy apenas faz com que o processo racional seja expresso em termos de aproximações, aplicadas a valores numéricos e que possa produzir outputs numéricos. Um sistema fuzzy tenta categorizar e atribuir um grau de aproximação, de modo a que as regras possam ser mais flexiveis e intuitivas na modelação de processos mais exigentes. A pessoa X aproxima-se em 30% da categoria MTO BEM PAGO enquanto que a pessoa Y aproxima-se 100%. Num sistema baseado na lógica fuzzy, uma regra pode ser aplicada a várias situações, mas o grau de pertença a cada uma dessas situações depende do contexto em que se aplicam. A lógica fuzzy não expressa as regras de uma forma precisa,tal como modelos matemáticos, a sua grande utilidade vem ao de cima quando a complexidade dos problemas aumenta, ou seja, quando as variáveis começam a interagir de uma forma não linear (por exº: as variáveis existentes em mercados financeiros: juros,câmbios,etc). Nestas situações, a lógica fuzzy oferece uma técnica mais intuitiva e flexivel de descrever este tipo de comportamento não linear nas variáveis ao generalizar o conceito de categorização. Tal como as redes neuronais, as regras fuzzy tentam aproximar relacionamentos não-lineares associados a sistemas complexos mas enquanto as primeiras precisam de bastante quantidade e qualidade de dados e o conhecimento está implicito na rede, as segundas não: só precisam de peritos que consigam descrever os vários itens de conhecimento sob a forma de regras e o conhecimento está distribuido pelas regras e pelas categorias. Os sistemas fuzzy priveligiam a exactidão de resultados em vez da explicação dos mesmos, ou seja não interessa o “porquê” de ter chegado ao resultado.

Método 6: Resolução de problemas por analogia: Racciocinio Baseado em Casos

Tirar partido do conhecimento obtido de experiências anteriores, é outro dos métodos usados para resolver problemas: o Racciocionio Baseado em Casos (RBC) é disso exemplo. À medida que a base de conhecimento aumenta, aumenta também o nível de certeza que o RBC pode fornecer na resolução de problemas. Este método permite olhar para soluções obtidas em problemas semelhantes, evitando que se criem regras que descrevam de que forma deve ser atingida a solução pretendida, como que houvesse um reaproveitamento de um template. Um CASO é uma colecção de atributos que,em conjunto, descrevem um cenário que envolve uma solução. Nos sistemas RBC , apenas são guardados os casos cuja informação maximize a capacidade de tomar a decisão. A formulação e resolução de problemas pode ser feita de maneira mais rápida, pois já existe uma noção concreta da forma como as soluções são alcançadas através de experiências anteriores. A utilização de um sistema RBC é particularmente vantajosa em cenários altamente escalaveis e flexiveis, onde novos casos são introduzidos ao longo do tempo no sistema melhorando o seu nivel de certeza ou exactidão(por exº quando são efectuadas correcções a erros produzidos anteriormente). O sucesso de um sistema RBC depende da forma como se indexam os casos. Por exemplo, num sistema de catalogação de livros de uma biblioteca, tipicamente os livros são indexados por autor,titulo e assunto. Se houver a necessidade de procurar livros de acordo com o número de páginas,tal não será possivel. O que um sistema deste género faz é apresentar uma solução que possa ser aplicada ao problema dado ter funcionado num problema semelhante. Cabe ao decisor avaliar se a solução é apropriada para a situação actual.

Método 7: Obter regras apartir dos dados – Algoritmos de Aprendizagem

Tipicamente, um Algoritmo de Aprendizagem (AP) tenta encontrar padrões e relacionamentos nos dados, disponibilizando não só bons modelos de predicção e classificação como também regras abstractas. Algoritmos Genéticos,Redes Neuronais e Algoritmos de Particionamento Recursivo são disso exemplos. Quando efectuamos uma consulta aos dados, temos uma ideia minima daquilo que pretendemos obter. E quando essa ideia não existe? Talvez o ideal seria consultar os dados de forma inteligente, onde pudessemos descobrir relações entre eles que até então nunca imaginavamos poderem existir. É aqui que os AP’s são vantajosos. Enquanto que uma consulta a uma base de dados responde à questão “quais os dados que correspondem a estes padrões” um AP responde à questão “ quais os padrões que correspondem a estes dados”. Tal como uma rede neuronal, tenta-se encontrar relacionamentos entre os inputs e os outputs com a diferença reside que os relacionamentos numa rede neural não são explicitos enquanto que num AP o são. Como é que um algoritmo deste tipo se enquadra no processo de decisão? Uma vez especificado o problema e obtidos os seus inputs, o algoritmo tenta produzir através destes um conjunto de regras que permitam descrever como as variáveis dependentes se relacionam com as independentes, ou seja, tenta modelar o problema. O desafio para estes algoritmos é que este processo de descoberta de relacionamentos seja feito de forma clara e rápida, devendo ser acompanhado pelos utilizadores de uma forma iterativa, na medida em que estes devem interpretar os resultados, distinguindo os outputs que fazem sentido daqueles que resultaram de mera coincidência.

Conclusão

Achei este livro particularmente interessante na forma como os autores conseguem descrever ,com um nível de detalhe razoavel e com exemplos bastante elucidativos, as diferentes técnicas usadas em disciplinas como a Investigação Operacional e a Inteligência Artificial, que desempenham um papel crucial nos Sistemas de Apoio à Decisão, e as suas vertentes de aplicação. Mais do que um olhar para a essência de cada uma dessas técnicas, este resumo pretende abordar a sua importância e influência no processo de decisão.

1 comentário:

Zézinha_Trig disse...

Bolas Rui, bom trabalho. Eu só tinha pedido até ao cap. 4! Parabéns.