Newsletter - Siqueira Campos Associados · Prefeitura de Guaíba - Guaíba / RS. Welcome to the...

7
Informativo Bimestral da Siqueira Campos Associados agosto de 2013 - ano VII - Número 21 Nesta edição Lean Office - Dez dicas para economizar tempo no trabalho Estatística Seis Sigma - Estatística não paramétrica Data Analytics - Modelagem Preditiva (Predictive Analytics) Catálogo de Treinamentos 2013 Treinando a sua equipe para aumentar a competitividade da sua empresa. Voz do Cliente Domínio do instrutor sobre o assunto e a possibilidade de aprofundar o conhecimento em temas relevantes da estatística. Caio Vinícius de Matos Estatística Aplicada Natura - Itapecerica da Serra / SP As múltiplas ferramentas que o curso ensinou. Trouxe para mim grande quantidade de oportunidades de melhoria no setor. Gustavo Biachi Reis Curso Lean Office Thyssen Krupp Elevadores - Guaíba / RS Exercícios práticos utilizando dados da organização, didática. Lisandro Iusry Abulatif Curso de Data Mining Prefeitura de Guaíba - Guaíba / RS

Transcript of Newsletter - Siqueira Campos Associados · Prefeitura de Guaíba - Guaíba / RS. Welcome to the...

Informativo Bimestral daSiqueira Campos Associadosagosto de 2013 - ano VII - Número 21

Nesta ediçãoLean Office - Dez dicas para economizar tempo no trabalhoEstatística Seis Sigma - Estatística não paramétricaData Analytics - Modelagem Preditiva (Predictive Analytics)

Catálogo de Treinamentos 2013Treinando a sua equipe para aumentar a competitividade da sua empresa.

Voz do Cliente

Domínio do instrutor sobre o assunto e a possibilidade de aprofundar o conhecimentoem temas relevantes da estatística.Caio Vinícius de MatosEstatística AplicadaNatura - Itapecerica da Serra / SP

As múltiplas ferramentas que o curso ensinou. Trouxe para mim grande quantidade

de oportunidades de melhoria no setor.Gustavo Biachi ReisCurso Lean OfficeThyssen Krupp Elevadores - Guaíba / RS

Exercícios práticos utilizando dados da organização, didática.

Lisandro Iusry AbulatifCurso de Data MiningPrefeitura de Guaíba - Guaíba / RS

Welcome to the Process Excellence Revolution

Lean Office - Dez dicas para economizar tempo no trabalhoUsualmente, o aprendizado da utilização dos recursos de tecnologia ocorre pela observação doscolegas trabalhando. Não existem cursos específicos sobre isto, logo sempre existirá alguma lacuna nouso dos recursos. Abaixo, estão listadas algumas dicas de coisas simples, que nem todos conhecem,mas que podem acelerar e simplificar muito a nossa vida:

Estatística Seis Sigma - Estatística não paramétrica"Os silenciosos estatísticos mudaram o nosso mundo, não por descobrir fatos novos oudesenvolvimentos técnicos, mas mudando as maneiras como nós raciocinamos, experimentamos eformamos a nossa opinião."Ian Hacking - Filósofo e professor universitário canadense.

O teste de hipóteses é uma das principais ferramentas estatísticas utilizadas no aprimoramento deprocessos, pois com ele confirmamos nossas suposições, assim como a efetividade das soluções. É um

1 - Controle sua ansiedade com a chegada de e-mails em sua caixa de entrada. O e-mail é umtremendo matador de produtividade, procure não olhar a caixa de entrada a todo momento. Definaperíodos e limite o tempo com os e-mails em, no máximo, 25 minutos por vez.

2 - Quando enviar um e-mail, procure abordar um só assunto, pois isto evita diversas confusões efacilita a busca no caso de pesquisas.

3 - Quando estiver fazendo uma apresentação no MS-PowerPoint e quiser avançar ou retornar paraum slide específico, é só digitar o número do slide e digitar “enter”.

4 - Em uma apresentação no MS-PowerPoint, para deixar a tela em branco, digite a tecla “C” (claro) ou“,” e para apagar a tela, digite “E” (escuro) ou “.”.

5 - Quando utilizar o processador de texto, se quiser corrigir ou trocar de ordem uma palavra,simplesmente click duas vezes em cima da palavra em qualquer letra, e se quiser corrigir, e só digitarpor cima. Evite utilizar o mouse para marcar toda a extensão da palavra.

6 - Quando navegar pela internet e quiser rolar a página para baixo, utilize a “barra de espaço” aoinvés do mouse.

7 - Quando quiser aumentar o tamanho das imagens em uma página na internet, digite “Ctrl” e “+” e sequiser diminuir digite “Ctrl” e “-“.

8 - Quando o notebook é usado no trabalho e em casa frequentemente, tenha duas fontes dealimentação externa, uma em casa e outra no trabalho, pois além de economizar tempo e carregarmenos peso, você terá um back-up, já que provavelmente o cabo da fonte irá arrebentar.

9 - Use e abuse dos atalhos no Desktop (área de trabalho) para acessar páginas na internet, arquivos,sites e pastas que são manuseados com regularidade, permitindo que sejam acessados com um sóclick, isto simplifica a vida e poupa muito tempo.

10 - Tendo que trabalhar com várias janelas abertas, ou minimizar programas constantemente, utilizedois monitores. Isto não é nenhum luxo, é aumento de velocidade, é produtividade.

método fundamental para conhecer a causa raiz. Infelizmente, para sua utilização, várias suposiçõesnecessitam ser atendidas e uma delas é a normalidade dos dados. Dados normalmente distribuídos sãousuais nos processos industriais, porém quando trabalhamos com processos administrativos ecomerciais, a normalidade passa ser mais uma exceção do que regra.

Felizmente, nestes casos, nem tudo está perdido, pois existe um campo na estatística chamado deestatística não paramétrica, onde podem ser realizados testes de hipóteses independente dadistribuição original dos dados. Os testes não paramétricos podem ser realizados em uma grandevariedade de situações, porque não necessitam atender a suposições rigorosas dos testes de hipótesesclássicos (paramétricos). De forma particular, não necessitam da normalidade dos dados.

Por exemplo: se quisermos comparar o desempenho de notas de duas turmas de uma escola, temosque comparar a média do desempenho destas duas turmas. Para realizarmos o teste de hipótesesclássico, os dados das duas turmas terão que ser normalmente distribuídos. Utilizando os testes nãoparamétricos, ordenamos todos os dados dos dois grupos e depois comparamos estatisticamente aordem (posição) dos dois grupos, sem necessitar fazer qualquer suposição sobre os dados, como anormalidade.

Os testes não paramétricos têm como vantagens:

Facilidade de aplicação;

Aplicação quase que universal.

E as seguintes desvantagens:

Desperdiça informação;

É menos sensível;

É necessária uma amostra maior para ter as mesmas conclusões com o mesmo grau de confiança deum teste paramétrico.

Para cada situação de um teste de hipóteses paramétrico, existe um equivalente não paramétrico. Atabela e os fluxos abaixo ilustram as situações típicas de uso dos testes não paramétricos.

Tabela 1

Figura 1

Os testes de hipóteses aumentam a certeza na tomada de decisão e podem ser utilizados mesmoquando os dados não seguem a distribuição normal.

Data Analytics - Modelagem Preditiva (Predictive Analytics)"A tomada de decisão, e as tecnologias para apoiá-la e automatizá-la, será o próximo campo de batalhacompetitivo para as organizações. Aqueles que estão usando as regras de negócios, data mining,analítica e otimização hoje serão as tropas de choque da próxima onda de inovação nos negócios."Competição Analítica,Thomas Davenport e Jeanne Harris

Recentemente, uma universidade privada, preocupada com a evasão dos alunos, resolveu usar umanova estratégia para enfrentar este problema: utilizar os métodos analíticos em particular os modelospreditivos. Através desta abordagem, analisando dados históricos dos alunos que saíram dauniversidade, foi possível relacionar algumas variáveis como faltas, atrasos de pagamento e notas com aevasão passada.

A partir destes dados, utilizando um método estatístico denominado regressão logística foi possívelprever, com um alto grau de precisão, quais os próximos alunos que provavelmente deixarão auniversidade. Com esta informação foi possível desenvolver várias ações e reduzir a evasão.

Este exemplo ilustra uma das diversas aplicações da modelagem preditiva, que engloba uma variedadede técnicas estatísticas, modelagem, aprendizado de máquina e mineração de dados que permitemanalisar os fatos atuais e históricos para fazer previsões sobre o futuro.

A modelagem preditiva faz parte do que denominamos inteligência analítica, que é bem diferente derelatórios e BI, pois o foco é na previsão e não na descrição dos eventos. A figura abaixo ilustra muitobem este fato. A inteligência analítica é a utilização extensiva de dados, análises quantitativas eestatísticas e gestão baseada em fatos para orientar decisões e ações.

Figura 2 - Inteligência Analítica fonte: Adaptado Competição analítica Thomas Davenport e JeanneHarris

Nos negócios, modelos preditivos exploram padrões encontrados em dados históricos e transacionaispara identificar riscos e oportunidades. Os modelos capturam relacionamentos entre muitos fatores quepermitem a avaliação de risco ou potencial associado a um determinado conjunto de condições.Atualmente, são utilizados por empresas de seguro, cartões de crédito, seguradoras, seguradoras desaúde, empresas de telecomunicações, bancos e redes de varejo.

Uma das aplicações mais conhecidas é o credit scoring, que é utilizado em todos os serviços financeiros.Modelos de credit scoring processam a história de um cliente de crédito, os pedidos deempréstimo/financiamento, os dados do cliente, etc, a fim de classificar os indivíduos por suaprobabilidade de honrar o empréstimo/financiamento.

A modelagem preditiva olha para o passado, inclui cenários hipotéticos e avaliação de riscos, parafornecer informações sobre o que acontecerá. Ela pode ser usada para a previsão, modelagem de risco,e modelagem a propensão de compras.

Entre exemplos de aplicação temos:

Tabela 2 - Adaptado de Competing in Analytics, Thomas Davenport, Harvard Business Review

As técnicas de modelagem preditivas se dividem em dois grupos:

Técnicas de regressão: Os modelos de regressão são a base da análise preditiva. O princípio é oestabelecimento de uma equação matemática como um modelo para representar as interações entre asdiferentes variáveis consideradas. Dependendo da situação, existe uma grande variedade de modelosque podem ser aplicados durante a execução de análises de previsão. Entre as mais utilizadas estão:regressão linear, regressão logística, modelos de séries temporais, classificação e árvore de regressão.

Técnicas de aprendizado de máquina: Aprendizagem de máquina é um ramo da inteligência artificial,originalmente empregada para desenvolver técnicas que permitam aos computadores aprenderem, queinclui um número de métodos estatísticos avançados para a classificação.

Existem diferentes níveis de aprendizagem de máquina, desde a utilização de análises de classificação,que permitem prever a variável dependente diretamente, sem focar nas relações entre as variáveissubjacentes, até métodos mais complexos, que simulam o comportamento do cérebro humano, quandoexistem muitos relacionamentos subjacentes que impedem a criação de um modelo matemático. Nestescasos, a aprendizagem de máquina ocorre a partir de exemplos de treinamento para prever eventosfuturos.

Entre as técnicas mais utilizadas estão: Redes neurais, naïve Bayes e a regra dos k-vizinhos maispróximos.

Há 21 anos, a Siqueira Campos atua em métodos estatísticos, analítica e modelagem preditiva,trabalhando tanto com softwares comerciais, como com softwares livres. Tendo auxiliado centenas deorganizações com treinamento, consultoria e desenvolvimento, para que a utilização de dados setransforme em vantagem competitiva. Atualmente, possui os seguintes programas de treinamento nestaárea:

Fale com a genteA Siqueira Campos agradece seus comentários, sugestões e questionamentos sobre esta edição.

© 2013 Siqueira Campos Associados - [email protected] - www.siqueiracampos.com - Fone: 0800 7030603

Data mining e analítica preditiva com o Weka (software livre)

Data mining e analítica preditiva com o R (software livre)

Estatística aplicada com R (software livre)

Modelagem preditiva (predictive analytics) e data mining para gestores

Entre as aplicações em que atuamos destacam-se: detecção de desvios (fraude/roubo), modelagem desegmentação (clustering), predição de consumo, previsão de vendas/consumo, modelagem dedirecionadores de satisfação dos clientes, modelagem de direcionadores de satisfação dos funcionáriose modelos de retenção.