EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS,...

40
EpiData EpiData Analysis Analysis The Union, Paris, França The Union, Paris, França MSF – Centro Operacional de Bruxelas, MSF – Centro Operacional de Bruxelas, Luxemburgo Luxemburgo OMS, Genebra OMS, Genebra

Transcript of EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS,...

Page 1: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

EpiData EpiData AnalysisAnalysis

The Union, Paris, FrançaThe Union, Paris, FrançaMSF – Centro Operacional de Bruxelas, MSF – Centro Operacional de Bruxelas,

LuxemburgoLuxemburgoOMS, GenebraOMS, Genebra

Page 2: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Antes de começar esta Antes de começar esta sessãosessão

ExcluaExclua todos os arquivos do todos os arquivos do EpiData da pasta Epidata_courseEpiData da pasta Epidata_course

Abra a Abra a pasta Resources Day 3 pasta Resources Day 3 resourcesresources

Lecture 1 folderLecture 1 folder Copie os arquivos Copie os arquivos A_Analysis.RecA_Analysis.Rec e e

A_Analysis.ChkA_Analysis.Chk e cole-os na pasta e cole-os na pasta Epidata_courseEpidata_course

Page 3: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

ObjetivosObjetivos Aprender a configuração/funções básicas do EpiData

Analysis Aprender a realizar a síntese estatística usando os

comandos do menu Aprender a criar novas variáveis Aprender a realizar análises bivariadas simples Aprender a criar gráficos Aprender a usar o ‘Editor’ para escrever comandos

num programa que pode ser salvo para criar um “arquivo de execução” permanente

* Observe que este curso não se destina a ensinar métodos * Observe que este curso não se destina a ensinar métodos analíticos sofisticados (para isso, utilize o arquivo e os analíticos sofisticados (para isso, utilize o arquivo e os comandos de ajuda – F1)comandos de ajuda – F1)

Page 4: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Tela do EpiData Tela do EpiData AnalysisAnalysis

Janela de resultados (visualização)

Comandos (escolha com F2)

Histórico (escolha com F7)

Barra de comandos – digite os comandos aqui (selecione com o mouse ou com F4)

Barra de processos – selecione os comandos aqui

Page 5: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Conceito do EpiData Conceito do EpiData AnalysisAnalysis

O programa lê bases de dados (que podem ser O programa lê bases de dados (que podem ser arquivos *.Rec do EpiData, mas também arquivos *.Rec do EpiData, mas também arquivos de texto gerados pelo Excel, como arquivos de texto gerados pelo Excel, como *.csv)*.csv)

É possível navegar, modificar e analisar os dados É possível navegar, modificar e analisar os dados mas, no uso normal do programa, as mas, no uso normal do programa, as alterações alterações nos dados não são salvasnos dados não são salvas – ou seja, a sua base – ou seja, a sua base de dados central permanece intactade dados central permanece intacta

Para documentar e reproduzir a sua análise, é Para documentar e reproduzir a sua análise, é possível escrever um possível escrever um programaprograma no no editor editor que que pode posteriormente ser executado na base de pode posteriormente ser executado na base de dados sempre que você queira repetir a análisedados sempre que você queira repetir a análise

Page 6: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Exercício básico no EpiData Exercício básico no EpiData AnalysisAnalysis

Leia os dados que deseja analisar Leia os dados que deseja analisar (A_analysis.rec) no programa; para isso:(A_analysis.rec) no programa; para isso: CTRL+O → selecione o arquivoCTRL+O → selecione o arquivo ALT+R → selecione o arquivoALT+R → selecione o arquivo Digite Digite Read "c:\epidata_course\A_analysis.rec"Read "c:\epidata_course\A_analysis.rec" na na

barra de comandosbarra de comandos

Clique em “Read” na barra de processos → Clique em “Read” na barra de processos → selecione o arquivoselecione o arquivo

Page 7: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.
Page 8: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Navegação pelos dadosNavegação pelos dados

Para navegar pelos dados, clique em “Browse” na barra de processo.

Selecione variáveis específicas para navegação, ou selecione todas para uma visualização completa

É possível navegar pelos dados manualmente – os valores e etiquetas dos dados podem ser alternados com o botão “Values/Labels”

Todas as variáveis no conjunto de dados lido (alterne com F3)

Para navegar pelos dados, clique em “Browse” na

barra de processo.Selecione variáveis específicas para

navegação, ou selecione todas para uma

visualização completaÉ possível navegar pelos dados manualmente – os valores e rótulos dos dados podem ser alternados com o botão “Values/Labels”

Page 9: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Navegação pelos dadosNavegação pelos dados

Para ver um resumo geral do conjunto de dados (número e tipo de variáveis, rótulos de dados etc.), digite “var” na linha de comando

Page 10: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Análise dos dadosAnálise dos dados Depois que os dados foram lidos, podemos Depois que os dados foram lidos, podemos

realizar seu processamento e análiserealizar seu processamento e análise Vamos inserir todos os comandos pela barra Vamos inserir todos os comandos pela barra

de processos, mas eles também podem ser de processos, mas eles também podem ser digitados na barra de comandosdigitados na barra de comandos

Page 11: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Análise univariada Análise univariada utilizando a síntese utilizando a síntese

estatísticaestatística Variáveis categóricas Variáveis Variáveis categóricas Variáveis contínuascontínuas

Frequências, Média, mediana, Frequências, Média, mediana, intervalo, desvio intervalo, desvio Proporções padrão, IIQ, Proporções padrão, IIQ, percentispercentis

Page 12: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Síntese de variáveis Síntese de variáveis categóricas: Frequências e categóricas: Frequências e

proporçõesproporções Usando a barra de processos:Usando a barra de processos:

Na tela que surgir, selecione Na tela que surgir, selecione as opções desejadas – aqui, as opções desejadas – aqui, vamos avaliar a frequência desordenada de homens vamos avaliar a frequência desordenada de homens e mulheres, com percentuais por linha e intervalos e mulheres, com percentuais por linha e intervalos de confiançade confiança

Page 13: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Frequências e Frequências e proporçõesproporções

Observe que todos os comandos introduzidos Observe que todos os comandos introduzidos pela barra de processos também são exibidos pela barra de processos também são exibidos na seção de resultados, para você se na seção de resultados, para você se familiarizar com o formato exigido para digitar familiarizar com o formato exigido para digitar comandos na barra de comandoscomandos na barra de comandos

Page 14: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Frequências e Frequências e proporçõesproporções

Se inserido na barra de comandosSe inserido na barra de comandosTables gender /R /CI /FTables gender /R /CI /F

Outros comandos alternam a forma de exibição dos dados:Outros comandos alternam a forma de exibição dos dados: /v: somente o valor é exibido/v: somente o valor é exibido /vl: valor e etiqueta são exibidos/vl: valor e etiqueta são exibidos /vn: nome da variável é exibido/vn: nome da variável é exibido /vnl: nome e etiqueta da variável são exibidos/vnl: nome e etiqueta da variável são exibidos

Page 15: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Síntese de variáveis Síntese de variáveis contínuascontínuas

Para variáveis contínuas (como Para variáveis contínuas (como idade, peso etc.), o comando idade, peso etc.), o comando describedescribe permite calcular a média, a permite calcular a média, a mediana, o intervalo e os percentis:mediana, o intervalo e os percentis:

Page 16: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Síntese de variáveis Síntese de variáveis contínuascontínuas

Devemos apresentar a média ou a mediana?

Page 17: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Síntese de variáveis Síntese de variáveis contínuascontínuas

Vimos quais sínteses estatísticas Vimos quais sínteses estatísticas podem ser feitas usando o comando podem ser feitas usando o comando describedescribe

Outro comando útil, e às vezes mais Outro comando útil, e às vezes mais informativo, é o comando informativo, é o comando meansmeans

Page 18: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Síntese de variáveis Síntese de variáveis contínuascontínuas

Cuidado! •Se na sua variável faltarem dados aos quais foi atribuído um valor específico (99, por exemplo), estes devem ser excluídos antes de executar os comandos describe ou means (caso contrário, esses valores serão incluídos nos cálculos da média, mediana etc.) •Isso é feito com o comando select not

Page 19: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Comando Comando select notselect not• A variável t0weight tem dados faltantes

(indicados pelo valor 999) que devem ser excluídos antes de executar o comando describe

Page 20: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Mais sobre o comando Mais sobre o comando selectselect

Como vimos anteriormente:Como vimos anteriormente:select NOT(t0weight=999)select NOT(t0weight=999)seleciona todos os seleciona todos os registros nos quais o valor de t0weight registros nos quais o valor de t0weight nãonão é é 999999

Obs:Obs: As operações subsequentes só serão As operações subsequentes só serão executadas nesse subconjunto de dadosexecutadas nesse subconjunto de dados

Para desfazer a seleção (ou seja, restaurar o Para desfazer a seleção (ou seja, restaurar o conjunto de dados completo), digiteconjunto de dados completo), digite selectselect

Qualquer operador lógico (>, <, =, OR, AND, Qualquer operador lógico (>, <, =, OR, AND, NOT) pode ser usado com o comando “select”NOT) pode ser usado com o comando “select”

Page 21: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Geração de novas Geração de novas variáveisvariáveis Suponha que queremos categorizar uma variável Suponha que queremos categorizar uma variável

contínua, como a idade:contínua, como a idade: Passo 1:Passo 1: Defina uma nova variável numérica de Defina uma nova variável numérica de

dimensão 1: dimensão 1: define agegroup #define agegroup # Ao navegarmos pelos dados Ao navegarmos pelos dados vemos uma nova variável, ainda vemos uma nova variável, ainda

vazia em todos os registrosvazia em todos os registros

Page 22: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Geração de novas Geração de novas variáveisvariáveis

Passo 2:Passo 2: Indique as categorias da variável Indique as categorias da variável agegroup:agegroup:if age<35 then agegroup=1if age<35 then agegroup=1if age>=35 AND age<55 then agegroup=2if age>=35 AND age<55 then agegroup=2if age>=55 then agegroup=3if age>=55 then agegroup=3Obs: Pode ser usado qualquer operador lógico Obs: Pode ser usado qualquer operador lógico (>, <, =, OR, AND, NOT)(>, <, =, OR, AND, NOT)

Passo 3:Passo 3: Rotule os valores de agegroup: Rotule os valores de agegroup:labelvalue agegroup /1=“<35 anos” /2=“35–54 labelvalue agegroup /1=“<35 anos” /2=“35–54 anos” / 3=“55+ anos”anos” / 3=“55+ anos”

Page 23: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Geração de novas Geração de novas variáveisvariáveis

Ao navegar pelos dados, vemos Ao navegar pelos dados, vemos agora:agora:

Page 24: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Geração de novas Geração de novas variáveisvariáveis

Suponha que queremos recategorizar uma Suponha que queremos recategorizar uma variável categórica, como o desfecho. variável categórica, como o desfecho.

Neste exemplo, queremos agrupar os Neste exemplo, queremos agrupar os desfechos favoráveis (‘Vivo em TAR’) ou desfechos favoráveis (‘Vivo em TAR’) ou adversos (‘Óbito’, ‘Abandono terapêutico’ e adversos (‘Óbito’, ‘Abandono terapêutico’ e ‘Transferido’):‘Transferido’):

Page 25: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Geração de novas Geração de novas variáveisvariáveis

Vamos chamar esta nova variável de Vamos chamar esta nova variável de desfecho de ‘bioutcome’desfecho de ‘bioutcome’define bioutcome #define bioutcome #if outcome =1 then bioutcome=1if outcome =1 then bioutcome=1 if outcome >1 then bioutcome=2if outcome >1 then bioutcome=2labelvalue bioutcome /1=Favorável labelvalue bioutcome /1=Favorável /2=Adverso /2=Adverso

Page 26: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Exclusão de variáveisExclusão de variáveis Se você gerou uma variável e Se você gerou uma variável e

depois deseja excluí-la, pode usar o depois deseja excluí-la, pode usar o comando drop:comando drop:

drop agegroupdrop agegroupdrop bioutcomedrop bioutcome

excluindo assim a variável recém-excluindo assim a variável recém-gerada.gerada.

Page 27: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Introdução à análise Introdução à análise bivariadabivariada A análise de A análise de duas variáveis categóricasduas variáveis categóricas pode ser feita pode ser feita

usando a usando a tabulação cruzadatabulação cruzada dos dados – vejamos como dos dados – vejamos como os desfechos favoráveis e adversos (‘bioutcome’) estão os desfechos favoráveis e adversos (‘bioutcome’) estão distribuídos segundo o tipo de HIV:distribuídos segundo o tipo de HIV:

Page 28: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Análise de dados – Análise de dados – tabelastabelas

Page 29: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Análise de dados – Análise de dados – tabelastabelas

Se executado pela barra de comando:Se executado pela barra de comando:Tables bioutcome hivtype /RTables bioutcome hivtype /R

Outros comandos permitem um maior refinamento (e análise):Outros comandos permitem um maior refinamento (e análise): /C exibe as colunas com porcentagens/C exibe as colunas com porcentagens /d0, /d2,... define o número de casas decimais dos percentuais/d0, /d2,... define o número de casas decimais dos percentuais

Page 30: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Análise bivariada de uma Análise bivariada de uma variável categórica e variável categórica e

contínuacontínua

Page 31: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

GráficosGráficos Também é possível gerar gráficos usando a Também é possível gerar gráficos usando a

barra de comandos ou de processos. Por barra de comandos ou de processos. Por exemplo, para criar um histograma simples:exemplo, para criar um histograma simples:

Page 32: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

GráficosGráficos

Os gráficos são salvos automaticamente num arquivo Os gráficos são salvos automaticamente num arquivo gráfico *.png na pasta analysis do seu computadorgráfico *.png na pasta analysis do seu computador

Page 33: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

GráficosGráficos Outros gráficos têm opções mais Outros gráficos têm opções mais

complexas – tente gerar gráficos de complexas – tente gerar gráficos de dispersão, caixas e pizza para dispersão, caixas e pizza para diferentes variáveis:diferentes variáveis:

Page 34: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

EpiData EditorEpiData Editor As alterações nos dados (novas variáveis, cálculos

etc.) não são armazenadas na memória Para fazer um registro permanente de tudo o que

foi feito (reprodutibilidade, compartilhamento dos dados da análise etc.), é possível escrever um programa no EpiData Editor

Esse programa pode então ser executado em outros conjuntos de dados (como atualizações na base de dados etc.) e pode ser compartilhado com outras pessoas para, por exemplo, resolver problemas

Essencialmente, o programa é escrito usando as mesmas linhas de comandos

Page 35: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Como usar o EditorComo usar o Editor O programa Editor pode ser

acessado: Pressionando F5 Clicando em “Editor” na barra de

processos:

Page 36: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Como usar o Editor – Como usar o Editor – primeiros passosprimeiros passos

A maioria dos programas começa com: * Este é o nome do programa* Este é o nome do programa (qualquer texto após (qualquer texto após

um asterisco é considerado um comentário, e não um asterisco é considerado um comentário, e não um comando do programa)um comando do programa)

clscls (limpa a tela) (limpa a tela) closeclose (fecha todos os arquivos que possam estar (fecha todos os arquivos que possam estar

abertos)abertos) logcloselogclose (fecha todos os logs de sessões (fecha todos os logs de sessões

anteriores)anteriores) cd c:/file_locationcd c:/file_location (define a localização do (define a localização do

arquivo que desejamos abrir)arquivo que desejamos abrir) read "database_filename"read "database_filename" (abre o arquivo em que (abre o arquivo em que

estamos interessados) estamos interessados)

Page 37: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Como usar o Editor – Como usar o Editor – primeiros passosprimeiros passos

Portanto, um programa geralmente começa com :

Pressione F9 ou clique em “Run” para executar o programa, linha por linha

Page 38: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Como usar o Editor – Como usar o Editor – programaçãoprogramação

Os diferentes comandos podem ser inseridos como se tivessem sido digitados na linha de comandos.

Page 39: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Como usar o Editor – Como usar o Editor – programaçãoprogramação Os primeiros resultados depois de executar

o programa:

Page 40: EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra.

Como usar o Editor – Como usar o Editor – programaçãoprogramação O programa pode ser salvo (como um

arquivo .pgm) – se você enviar esse arquivo .pgm junto com os arquivos .rec e.chk, qualquer pessoa poderá refazer e conferir a sua análise.