Introduction.to.Biostatistics.2nd.ed Ublog.tk

download Introduction.to.Biostatistics.2nd.ed Ublog.tk

of 374

Transcript of Introduction.to.Biostatistics.2nd.ed Ublog.tk

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    1/373

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    2/373

    INTRODUCTION TOBIOS TATIS TIC SSECOND EDITION

    Rob ert R . Sokal and F. Jam es RohlfState University of New York at Stony Brook

    D O V E R P U B L I C A T I O N S I N C .M i n e o l a N e w Y ork

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    3/373

    CopyrightC o p y r i g h t 1 9 6 9, 1 9 7 3 . 1 9 8 1 . 1 9 8 7 b y R o b e r t R . S o k a l a n d F . J a m e s R o h l fA l l r i g h t s r e s e r v e d .

    Bibliographical NoteT h i s D o v e r e d i t i o n , first p u b l i s h e d i n 2 0 0 9 , i s a n u n a b r i d g e d r e p u b l i c a t i o n o ft h e w o r k o r i g i n a l l y p u b l i s h e d i n 1 9 69 b y W . H . F r e e m a n a n d C o m p a n y , N e w

    Y o r k . T h e a u t h o r s h a v e p r e p a r e d a n e w P r e f a c e f o r t h i s e d i t i o n .

    Library of Congress Cataloging-in-Publication DataS o k a l , R o b e r t R .

    I n t r o d u c t i o n t o B i o s t a t is t i c s / R o b e r t R . S o k a l a n d F . J a m e s R o h l f .D o v e r e d .

    p . c m .O r i g i n a l l y p u b l i s h e d : 2 n d e d . N e w Y o r k : W . H . F r e e m a n , 1 9 69 .I n c l u d e s b i b l i o g r a p h i c a l r e f e r e n c e s a n d i n d e x .I S B N - 1 3 : 9 7 8 - 0 - 4 8 6 - 4 6 9 6 1 - 4I S B N - 1 0 : 0 - 4 8 6 - 4 6 9 6 1 - 1

    I . B i o m e t r y . I . R o h l f , F . J a m e s , 1 9 3 6 - I I . T i t l e .Q H 3 2 3 . 5 . S 6 3 3 2 0 0 95 7 0 . 1 ' 5 1 9 5 d c 2 2

    2 0 0 8 0 4 8 0 5 2

    M a n u f a c t u r e d in t h e U n i t e d S t a l e s o f A m e r i c aD o v e r P u b l i c a t i o n s , I n c . , 3 1 F a s t 2 n d S t r e e t , M i n e o l a , N . Y . 1 1501

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    4/373

    to Julie and Janice

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    5/373

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    6/373

    Contents

    P R E F A C E T O T H E D O V E R E D I T I O N x iP R E F A C E x i i i

    1. I N T R O D U C T I O N 11.1 Some definitions 11.2 The development of bioslatistics 21.3 The statistical frame of mind 4

    2 . D A T A I N B i O S T A T l S T I C S 62.1 Samples and populations 72.2 Variab les in biostatisties 82.3 Accuracy and precision of data 1 02.4 Derived variables 132.5 Frequency distributions 1 42.6 The handling of data 2 4

    3 . D E S C R I P T I V E S T A T I S T I C S 273.1 The arithmetic mean 2 83.2 Other means 3 13.3 The median 3 23.4 The mode 3 33.5 The range 3 43.6 The standard deviation 3 63.7 Sample statistics and parameters 3 73. Practical methods for computing mean and standard

    deviation 3 93.9 The coefficient of variation 4 3

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    7/373

    V1U C O N T E N T S

    4 . I N T R O D U C T I O N T O P R O B A B I L I T Y D I S T R I B U T I O N S :T H E B I N O M I A L A N D P O I S S O N D I S T R I B U T I O N S 46

    4.1 Probability, random sampling, and hypothesis testing 4 84.2 The binomial distribution 5 44.3 The Poisson distribution 6 3

    5. T H E N O R M A L P R O B A B I L I T Y D I S T R I B U T I O N 745.1 Frequency distributions of continuous variables 7 55.2 Derivation of the normal distribution 7 65.3 Properties of the normal distribution 7 85.4 Applications of the normal distribution 8 25 . 5 Departures from normality: Graphic methods 8 5

    6 . E S T I M A T I O N A N D H Y P O T H E S I S T E S T I N G 936.1 Distribution and variance of means 9 46.2 Distribution and variance of other statistics 1 0 16.3 Introduction to confidence limits 1 0 36.4 Studen t's t distribution 1 0 66.5 Confidence limits based on sample statistics 1 0 96.6 The chi-square distribution 1 1 26.7 Confidence limits for variances 1 1 46.8 Introduction lo hypothesis testing 1 1 56.9 Tests of simple hypotheses employing the t distribution 1 2 66.10 Testing the hypothesis ,,: 2 = al 1 2 9

    7. I N T R O D U C T I O N T O A N A L Y S I S O F V A R I A N C E 1337.1 The variances of samples and their means 1 3 47.2 The F distribution 1 3 87.3 The hypothesis / / : ] = 1 4 37.4 Heterogeneity among sample means 1 4 37 . 5 Partitioning the total sum of squares and degrees of freedom 1 5 07.6 Model I anova 1 5 47 . 7 Model II anora 1 5 7

    8. S I N G L E - C L A S S I F I C A T I O N A N A L Y S I S O F V A R I A N C E 160H.l Computational formulas 161H.2 Equal 1 6 2 . J Unequal 1 6 5X.4 Two groups 1 6 8

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    8/373

    CO N T E N T S ix

    9. T W O - W A Y A N A L Y S I S O F V A R I A N C E 1859.1 Two-way anova with replication 1 8 69.2 Two-way anova: Significance testing 1 9 79.3 Two-way anova without replication 1 9 9

    10. A S S U M P T I O N S O F A N A L Y S I S O F V A R I A N C E 21110.1 The assumptions of anova 2 1 210.2 Transformations 2 1 610.3 Nonparametric methods in lieu of anova 2 2 0

    11 . R E G R E S S I O N 2 3011.1 Introduction to regression 2 3 111.2 Models in regression 2 3 311.3 The linear regression equation 2 3 511.4 More than one value of Y for each value of X 2 4 311.5 Tests of significance in regression 2 5 011.6 The uses of regression 2 5 711.7 Residuals and transformations in regression 2 5 911.8 A nonparametric test for regression 2 6 3

    12 . C O R R E L A T I O N 26712.1 Correlation an d regression 2 6 812.2 The product-moment correlation coefficient 2 7 012.3 Significance tests in correlation 2 8 012.4 Applications of correlation 2 8 412.5 Kendall s coefficient of rank correlation 2 8 6

    13. A N A L Y S I S O F F R E Q U E N C I E S 29413.1 Tests for goodness of Jit: introduction 2 9 513.2 Single-classification goodness of fit tests 3 0 113.3 Tests of independence: Two-way tables 3 0 5

    A P P E N D I X E S 3 1 4AI Mathema tical appendix 3 1 4A2 Statistical tables 3 2 0

    B I B L I O G R A P H Y 3 4 9I N D E X 3 5 3

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    9/373

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    10/373

    Preface to the Dover Edition

    We are p leased and honored to see the re - i ssue of the second edi t ion of our In t roduc-t ion to B ios t a t i s t i c s by Dov e r P ub l i c a t ion s . On r e v ie w ing the c opy , w e find the r eis l i t t le in i t tha t needs changing for an in t roduc tory tex tbook of b ios ta t i s t ic s for ana d v a n c e d u n d e r g r a d u a t e o r b e g i n n i n g g r a d u a t e s t u d e n t . T h e b o o k f u r n i s h e s a n i n tr o -duc t ion to most of the s ta t i s t ica l top ics such s tudents a re l ike ly to encounte r in the i rc ou r se s a nd r e a d ings in the b io log ic a l a nd b iom e d ic a l s c i e nc e s .The r e a de r m a y wonde r wha t we wou ld c ha nge i f we we r e to wr i t e t h i s book a ne w.B e c a use o f t he va s t c ha nge s tha t ha ve t a ke n p l a c e in m oda l i t i e s o f c om pu ta t ion in thel a s t t w e n t y y e a r s , w e w o u l d d e e m p h a s i z e c o m p u t a t i o n a l f o r m u l a s t h a t w e r e d e s i g n e df o r p r e - c o m p u t e r d e s k c a l c u l a t o r s ( a n a g e b e f o r e s p r e a d s h e e t s a n d c o m p r e h e n s i v es t a t i s t i c a l c om pu te r p r og r a m s) a nd r e f oc us the r e a de r ' s a t t e n t ion to s t r uc tu r a l f o r -mulas tha t not only expla in the na ture of a g iven s ta t i s t ic , bu t a re a lso le ss prone tor ou nd in g e r r o r in c a l c u la t ion s pe r f o r m e d by c om pu te r s . In th i s sp i r i t , we wou ld o m i tthe e qua t ion ( 3 .8 ) on pa g e 39 a nd d r a w the r e a de r s ' a t t e n t ion to e qu a t ion ( 3 .7 ) i n s t e a d .S imi la r ly , we would use s t ruc tura l formulas in Boxes 3 .1 and 3 .2 on pages 41 and 42 ,respec t ive ly ; on page 161 and in Box 8 .1 on pages 163/164, a s we l l a s in Box 12 .1on pa ge s 278 /279 .S e c o n d l y , w e w o u l d p u t m o r e e m p h a s i s on p e r m u t a t i o n t e s t s a n d r e s a m p l i n g m e t h o d s .P e r m uta t ion t e s t s a nd boo t s t r a p e s t im a te s a r e now qu i t e p r a c t i c a l . We ha ve f ound th i sa pp r oa c h to be no t on ly e a s i e r f o r s tud e n t s t o und e r s t a nd bu t in m a ny c a se s p r e f e r a b leto the t r a d i t i ona l pa r a m e t r i c m e thods tha t a r e e m pha s iz e d in th i s book .

    Rober t R . Soka lF . Ja m es Ro hlf

    N o v e m b e r 2 0 0 8

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    11/373

    Preface

    T h e f a v o r a b l e r e c e p t i o n t h a t t h e first e d i t i o n o f t h i s b o o k r e c e i v e d f r o m t e a c h e r sa n d s t u d e n t s e n c o u r a g e d u s t o p r e p a r e a s e c o n d e d i t i o n . I n t h i s r e v i s e d e d i t i o n ,w e p r o v i d e a t h o r o u g h f o u n d a t i o n in b i o l o g i c a l s t a t is t i c s f o r t h e u n d e r g r a d u a t es t u d e n t w h o h a s a m i n i m a l k n o w l e d g e of m a t h e m a t i c s . W e i n t e n d Introductionto Biostatistics t o b e u s e d i n c o m p r e h e n s i v e b i o s t a t i s t i c s c o u r s e s , b u t it c a n a l s ob e a d a p t e d f o r s h o r t c o u r s e s i n m e d i c a l a n d p r o f e s s i o n a l s c h o o l s ; t h u s , w ei n c l u d e e x a m p l e s f r o m t h e h e a l t h - r e l a t e d s c i e n c e s .

    W e h a v e e x t r a c t e d m o s t o f t h i s t e x t f r o m t h e m o r e - i n c l u s i v e s e c o n d e d i t i o no f o u r o w n Biometry. W e b e l ie v e t h a t t h e p r o v e n p e d a g o g i c f e a t u r e s o f t h a tb o o k , s u c h a s i t s i n f o r ma l s t y l e , w i l l b e v a l u a b l e h e r e .

    W e h a v e m o d i f i e d s o m e o f t h e f e a t u r e s f r o m Biometry, f o r e x a m p l e , i nIntroduction to Biostatistics w e p r o v i d e d e t a i l e d o u t l i n e s f o r s t a t i st i c a l c o m p u -t a t i o n s b u t w e p l a c e le ss e m p h a s i s o n t h e c o m p u t a t i o n s t h e m s e l v e s . W h y ?S t u d e n t s i n m a n y u n d e r g r a d u a t e c o u r s e s a r e n o t m o t i v a t e d t o a n d h a v e f e wo p p o r t u n i t i e s t o p e r f o r m le n g t h y c o m p u t a t i o n s w i t h b i o lo g i c a l r e s e a rc h m a -t e r i a l ; a l s o , s u c h c o m p u t a t i o n s c a n e a s i l y b e m a d e o n e l e c t r o n i c c a l c u l a t o r sa n d m i c r o c o m p u t e r s . T h u s , w e r el y o n t h e c o u r s e i n s t r u c t o r t o a d v i s e s t u d e n t so n t h e b e s t c o m p u t a t i o n a l p r o c e d u r e s t o f o l l o w .

    W e p r e s e n t m a t e r i a l i n a s e q u e n c e t h a t p r o g r e s s e s f r o m d e s c r i p t i v e s t a t i s t i c s

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    12/373

    XIV PRE FACE

    ( w h i c h i s t r e a t e d a s a s p e c i a l c a s e o f t h e a n a l y s i s o f v a r i a n c e a n d r e l e g a t e d t os e v e r a l s e c t i o n s of t h e b o o k ) . W e d o t h i s d e l i b e r a t e l y f o r t w o r e a s o n s : (1 ) s i n c et o d a y ' s b i o l o g i s t s a l l n e e d a t h o r o u g h f o u n d a t i o n i n t h e a n a l y s i s o f v a r i a n c e ,s t u d e n t s s h o u l d b e c o m e a c q u a i n t e d w i t h t h e s u b j e c t e a r l y i n t h e c o u r s e ; a n d ( 2 )if a n a l y s i s of v a r i a n c e is u n d e r s t o o d e a r l y , t h e n e e d t o u s e t h e f d i s t r i b u t i o n i sr e d u c e d . ( O n e w o u l d s t i l l w a n t t o u s e i t f o r t h e s e t t i n g o f c o n f i d e n c e l i m i t s a n di n a f e w o t h e r s p e c i a l s i t u a t i o n s . ) A l l t t e s t s c a n b e c a r r i e d o u t d i r e c t l y a s a n a l -y s e s o f v a r i a n c e , a n d t h e a m o u n t of c o m p u t a t i o n o f t h e s e a n a l y s e s o f v a r i a n c eis g e n e r a l l y e q u i v a l e n t t o t h a t of t tes t s .

    T h i s l a r g e r s e c o n d e d i t i o n i n c l u d e s t h e K o l g o r o v - S m i r n o v t w o - s a m p l e t e s t,n o n p a r a m e t r i c re g r e s s io n , s t e m - a n d - l e a f d i a g r a m s , h a n g i n g h i s t o g r a m s , a n d t h eB o n f e r r o n i m e t h o d of m u l t i p l e c o m p a r i s o n s . W e h a v e r ew r i t te n t h e c h a p t e r o nt h e a n a l y s i s o f f r e q u e n c i e s i n t e r m s o f t h e G s t a t i s t i c r a t h e r t h a n 2 , b e c a u s e t h ef o r m e r h a s b e e n s h o w n t o h a v e m o r e d e s i r a b l e s t a t i s t i c a l p r o p e r t i e s . A l s o , b e -c a u s e of t h e a v a i l a b i li t y of l o g a r i t h m f u n c t i o n s o n c a l c u l a t o r s , th e c o m p u t a t i o nof t he G s t a t i s t i c is n o w e a s i e r t h a n t h a t o f t h e e a r l i e r c h i - s q u a r e t e s t. T h u s , w er e o r i e n t t h e c h a p t e r t o e m p h a s i z e l o g - l i k e i i h o o d - r a t i o t e s ts . W e h a v e a l s o a d d e dn e w h o m e w o r k e x e r ci se s .

    W e c a l l s p e c i a l , d o u b l e - n u m b e r e d t a b l e s " b o x e s . " T h e y c a n b e u s e d a s c o n -v e n i e n t g u i d e s f o r c o m p u t a t i o n b e c a u s e t h e y s h o w t h e c o m p u t a t i o n a l m e t h o d sf o r s o l v i n g v a r i o u s t y p e s o f b i o s t a t i s t i c a l p r o b l e m s . T h e y u s u a l l y c o n t a i n a l lt h e s t e p s n e c e s s a r y t o s o l v e a p r o b l e m f r o m t h e i n i ti a l s e t u p t o t h e fin al r e s u l t .T h u s , s t u d e n t s f a m i l i a r w i t h m a t e r i a l in t h e b o o k c a n u s e t h e m a s q u i c k s u m -m a r y r e m i n d e r s o f a t e c h n i q u e .

    W e f o u n d i n t e a c h i n g t h i s c o u r s e t h a t w e w a n t e d s t u d e n t s t o b e a b l e t or e f e r t o t h e m a t e r i a l n o w i n t h e s e b o x e s . W e d i s c o v e r e d t h a t w e c o u l d n o t c o v e re v e n h a l f a s m u c h o f o u r s u b j e c t if w e h a d t o p u t t h i s m a t e r i a l o n t h e b l a c k -b o a r d d u r i n g t h e l e c t u r e , a n d s o w e m a d e u p a n d d i s t r i b u t e d b o x e ^ a n d a s k e ds t u d e n t s t o r e f e r t o t h e m d u r i n g t h e l e c t u r e . I n s t r u c t o r s w h o u s e t h i s b o o k m a yw i s h t o u s e t h e b o x e s i n a s i m i l a r m a n n e r .

    W e e m p h a s i z e t h e p r a c t i c a l a p p l i c a t i o n s of s t a t i s ti c s t o b i o l o g y in t h i s b o o k ;t h u s , w e d e l i b e r a t e l y k e e p d i s c u s s i o n s of s t a t i s ti c a l t h e o r y t o a m i n i m u m . D e -r i v a t i o n s a r e g i v e n f o r s o m e f o r m u l a s , b u t t h e s e a r c c o n s i g n e d t o A p p e n d i x A l ,w h e r e t h e y s h o u l d b e s t u d i e d a n d r e w o r k e d b y t h e s t u d e n t . S t a t i s t i c a l t a b l e st o w h i c h t h e r e a d e r c a n r e f er w h e n w o r k i n g t h r o u g h t h e m e t h o d s d is c u s s e d i nt h i s b o o k a r e f o u n d i n A p p e n d i x A 2 .

    W e a r e g r a t e f u l t o K.. R . G a b r i e l , R . C . L e w o n t i n , a n d M . K a b a y f o r t h e i re x t e n s i v e c o m m e n t s o n t h e s e c o n d e d i t i o n o f Biometry a n d t o M . D . M o r g a n ,E . R u s s e k - C o h e n , a n d M . S i n g h f o r c o m m e n t s o n a n e a r ly d r a f t o f t h i s b o o k .W e a l s o a p p r e c i a t e t h e w o r k o f o u r s e c r e t a r i e s , R e s a C h a p e y a n d C h e r y l D a l y ,w i t h p r e p a r i n g t h e m a n u s c r i p t s , a n d o f D o n n a D i G i o v a n n i , P a t r i c i a R o h l f , a n dB a r b a r a T h o m s o n w ith p r o o f r e a d i n g .

    R o b e r t R . S o k a l

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    13/373

    INTRODUCTIONTOBIOSTATISTICS

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    14/373

    C H A P T E R

    Introduction

    Th i s c h a p t e r s e t s t h e s t a g e f o r y o u r s t u d y o f b i o s t a t i s t i c s . I n S e c t i o n 1 .1 , wede f in e th e f ie ld i t se lf . W e then cas t a ne ces sa r i ly b r ie f g l an ce a t i ts h i s to r ic a ld e v e l o p m e n t i n S e c t i o n 1.2. T h e n in S e c t i o n 1.3 w e c o n c l u d e t h e c h a p t e r w i t ha d i s c u s s i o n o f t h e a t t i t u d e s t h a t t h e p e r s o n t r a i n e d i n s t a t i s t i c s b r i n g s t ob i o l o g i c a l r e s e a r c h .

    I . I So m e def in i t ionsW c s h a l l d e f i n e biostatistics a s the app lication of statistical methods to the so-lution of biological problems. T h e b i o l o g i c a l p r o b l e m s o f t h i s d e f i n i t i o n a r e t h o s ea r i s i n g i n t h e b a s i c b i o l o g i c a l s c i e n c e s a s we l l a s i n s u c h a p p l i e d a r e a s a s t h eh e a l t h - r e l a t e d s c i e n c e s a n d t h e a g r i c u l t u r a l s c ie n c e s . B i o s t a t i s t i c s is a l s o c a l l e dbiological statistics o r biometry.

    T h e d e f i n i t i o n o f b i o s t a t i s t i c s l e a v e s u s s o m e w h a t u p i n t h e a i r " s t a t i s t i c s "h a s n o t b e e n d e f i n e d . Statistics is a s c i c n c e we l l k n o w n b y n a m e e v e n t o t h e

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    15/373

    2 C HAS 'T E R 1 / INT R O DUC T ION

    s e n s e a s the scientific study of numerical data based on natural phenom ena. Allp a r t s of t h i s d e f i n i t i o n a r e i m p o r t a n t a n d d e s e r v e e m p h a s i s :

    Scientific study: S t a t i s t i c s m u s t m e e t t h e c o m m o n l y a c c e p t e d c r i te r i a o fv a l i d i t y o f s c i e n t i f ic e v i d e n c e . W e m u s t a l w a y s b e o b j e c t i v e i n p r e s e n t a t i o n a n de v a l u a t i o n o f d a t a a n d a d h e r e t o t h e g e n e r a l e t h i c a l c o d e o f s c i en t i fi c m e t h o d -o l o g y , o r w e m a y fin d t h a t t h e o l d s a y i n g t h a t " f i g u r e s n e v e r l ie , o n l y s t a t i s t i c i a n sd o " a p p l i e s t o u s .

    Data: S t a t i s t ic s g e n e r a l l y d e a l s w i t h p o p u l a t i o n s o r g r o u p s o f i n d i v i d u a l s ;h e n c e i t d e a l s w i t h quantities o f i n f o r m a t i o n , n o t w i t h a s i n g le datum. T h u s , t h em e a s u r e m e n t o f a si n g le a n i m a l o r t h e r e s p o n s e f r o m a s i n g le b i o c h e m i c a l t e s tw i l l g e n e r a l l y n o t b e o f i n t e r e s t .

    Numerical: U n l e s s d a t a o f a s t u d y c a n b e q u a n t i f i e d i n o n e w a y o r a n o t h e r ,t h e y w i ll n o t b e a m e n a b l e t o s t a t i s t i c a l a n a l y s i s . N u m e r i c a l d a t a c a n b e m e a -s u r e m e n t s ( t h e l e n g t h o r w i d t h o f a s t r u c t u r e o r t h e a m o u n t o f a c h e m i c a l i na b o d y f l u i d , f o r e x a m p l e ) o r c o u n t s ( s u c h a s t h e n u m b e r o f b r i s t l e s o r t e e t h ) .

    Natural phenomena: W e u se t h i s t e r m i n a w i d e s e n se t o m e a n n o t o n l y a l lt h o s e e v e n t s i n a n i m a t e a n d i n a n i m a t e n a t u r e t h a t t a k e p l a c e o u t s i d e th e c o n t r o lo f h u m a n b e i n g s , b u t a l s o t h o s e e v o k e d b y s c i e n t i s t s a n d p a r t l y u n d e r t h e i rc o n t r o l , a s i n e x p e r i m e n t s . D i f f e r e n t b i o l o g i s t s w il l c o n c e r n t h e m s e l v e s w i t hd i f f e r e n t l e v e l s o f n a t u r a l p h e n o m e n a ; o t h e r k i n d s o f s c i e n t i s t s , w i t h y e t d i f f e r e n to n e s . B u t a ll w o u l d a g r e e t h a t t h e c h i r p i n g of c r i c k e t s , t h e n u m b e r o f p e a s i na p o d , a n d t h e a g e o f a w o m a n a t m e n o p a u s e a r e n a t u r a l p h e n o m e n a . T h eh e a r t b e a t o f r a t s i n r e s p o n s e t o a d r e n a l i n , t h e m u t a t i o n r a t e in m a i z e a f t e ri r r a d i a t i o n , o r t h e i n c i d e n c e o r m o r b i d i t y i n p a t i e n t s t r e a t e d w i t h a v a c c i n em a y s ti ll b e c o n s i d e r e d n a t u r a l , e v e n t h o u g h s c i e n t i s t s h a v e i n t e r f e r e d w i t h t h ep h e n o m e n o n t h r o u g h t h e i r i n t e r v e n t i o n . T h e a v e r a g e b i o l o g i s t w o u l d n o t c o n -s i d e r t h e n u m b e r o f s t e r e o s e t s b o u g h t b y p e r s o n s in d i f f e r e n t s t a t e s in a g i v e ny e a r t o b e a n a t u r a l p h e n o m e n o n . S o c i o l o g i s t s o r h u m a n e c o l o g i s ts , h o w e v e r ,m i g h t s o c o n s i d e r it a n d d e e m i t w o r t h y of s t u d y . T h e q u a l i f i c a t i o n " n a t u r a lp h e n o m e n a " i s i n c l u d e d i n t h e d e f i n i t i o n of s t a t is t i c s m o s t l y t o m a k e c e r t a i nt h a t t h e p h e n o m e n a s t u d i e d a r e n o t a r b i t r a r y o n e s t h a t a r e e n t i r el y u n d e r t h ew i ll a n d c o n t r o l of t h e r e s e a r c h e r , s u c h a s t h e n u m b e r o f a n i m a l s e m p l o y e d i na n e x p e r i m e n t .

    T h e w o r d " s t a t i s t i c s " is a l s o u s e d in a n o t h e r , t h o u g h r e l a t e d , w a y . It c a nb e t h e p l u r a l o f t h e n o u n statistic , w h i c h r e f e r s t o a n y o n e o f m a n y c o m p u t e do r e s t i m a t e d s t a t i s t i c a l q u a n t i t i e s , s u c h a s t h e m e a n , t h e s t a n d a r d d e v i a t i o n , o rt h e c o r r e l a t i o n c o e f f i c i e n t . E a c h o n e o f t h e s e is a s t a t i s t i c .

    1 .2 T he dev e lopm ent o f b ios ta t i s t i c sM o d e r n s t a t i s ti c s a p p e a r s t o h a v e d e v e l o p e d f r o m t w o s o u r c e s a s f a r b a c k a st h e s e v e n t e e n t h c e n t u r y . T h e firs t so u r c e w a s p o l i t i c a l s c i e n c e ; a f o r m o f s t a t i s t i c sd e v e l o p e d a s a q u a n t i t i v e d e s c r i p t i o n o f t h e v a r i o u s a s p e c t s o f t h e a f f a i r s o fa g o v e r n m e n t o r s t a t e ( h e n c e t h e t e r m " s ta t i s t ic s " ) . T h i s s u b j e c t a l s o b e c a m ek n o w n a s p o l i t ic a l a r i t h m e t i c . T a x e s a n d i n s u r a n c e c a u s e d p e o p l e t o b e c o m e

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    16/373

    1 . 2 / T H E D E V E L O P ME N T O F BI O ST A T I ST ICS 3

    i n t e r e s t e d i n p r o b l e m s of c e n s u s e s , l o n g e v i t y , a n d m o r t a l i t y . S u c h c o n s i d e r a t i o n sa s s u m e d i n c r e a s i n g i m p o r t a n c e , e s p e ci a ll y i n E n g l a n d a s t h e c o u n t r y p r o s p e r e dd u r i n g t h e d e v e l o p m e n t o f i ts e m p i r e . J o h n G r a u n t ( 1 6 2 0 - 1 6 7 4 ) a n d W i l l ia mP e t t y ( 1 6 2 3 - 1 6 8 7 ) w e r e e a r l y s t u d e n t s o f v i t a l s t a t i s t i c s , a n d o t h e r s f o l l o w e d i nt h e i r f o o t s t e p s .

    A t a b o u t t h e s a m e t i m e , t h e s e c o n d s o u r c e o f m o d e r n s t a t i s t i c s d e v e l o p e d :t h e m a t h e m a t i c a l t h e o r y o f p r o b a b i l i t y e n g e n d e r e d b y t h e i n t e r e s t i n g a m e sof c h a n c e a m o n g t h e l e i s u re c l a s s e s o f t h e t i m e . I m p o r t a n t c o n t r i b u t i o n s t ot h i s t h e o r y w e r e m a d e b y B l a i s e P a s c a l ( 1 6 2 3 - 1 6 6 2 ) a n d P i e r r e d e F e r m a t( 1 6 0 1 - 1 6 6 5 ) , b o t h F r e n c h m e n . J a c q u e s B e r n o u l l i ( 1 6 5 4 - 1 7 0 5 ) , a S w i s s , l a i d t h ef o u n d a t i o n of m o d e r n p r o b a b i l i t y t h e o r y i n / I r s Conjectandi. A b r a h a m d eM o i v r e ( 1 6 6 7 - 1 7 5 4 ) , a F r e n c h m a n l iv i n g i n E n g l a n d , w a s t h e first t o c o m b i n et h e s t a t i s t ic s o f h i s d a y w i t h p r o b a b i l i t y t h e o r y i n w o r k i n g o u t a n n u i t y v a l u e sa n d t o a p p r o x i m a t e t h e i m p o r t a n t n o r m a l d i s t r i b u t i o n t h r o u g h t h e e x p a n s i o no f t h e b i n o m i a l .

    A l a t e r s t i m u l u s f o r t h e d e v e l o p m e n t o f s t a t i s t i c s c a m e f r o m t h e s c i e n c e o fa s t r o n o m y , i n w h i c h m a n y i n d i v i d u a l o b s e r v a t i o n s h a d t o b e d i g e s t e d i n t o ac o h e r e n t t h e o r y . M a n y of t h e f a m o u s a s t r o n o m e r s a n d m a t h e m a t i c i a n s of t h ee i g h t e e n t h c e n t u r y , s u c h a s P i e r r e S i m o n L a p l a c e ( 1 7 4 9 - 1 8 2 7 ) i n F r a n c e a n dK a r l F r i e d r i c h G a u s s ( 1 7 7 7 - 1 8 5 5 ) i n G e r m a n y , w e r e a m o n g t h e l e a d e r s i n t h i sfield . T h e l a t t e r ' s l a s t i n g c o n t r i b u t i o n t o s t a t i s t i c s is t h e d e v e l o p m e n t o f t h em e t h o d o f l e a s t s q u a r e s .P e r h a p s t h e e a r l i e s t i m p o r t a n t figure in b i o s t a t i s t i c t h o u g h t w a s A d o l p h eQ u e t e l e t ( 1 7 9 6 - 1 8 7 4 ) , a B e l g i a n a s t r o n o m e r a n d m a t h e m a t i c i a n , w h o i n h i sw o r k c o m b i n e d t h e t h e o r y a n d p r a c t i c a l m e t h o d s o f s t a t i s ti c s a n d a p p l i e d t h e mt o p r o b l e m s o f b i o l o g y , m e d i c i n e , a n d s o c i o l o g y . F r a n c i s G a l t o n ( 1 8 2 2 - 1 9 1 1 ) ,a c o u s i n o f C h a r l e s D a r w i n , h a s b e e n c a l l e d t h e f a t h e r o f b i o s t a t i s t i c s a n de u g e n i c s . T h e i n a d e q u a c y o f D a r w i n ' s g e n e t i c t h e o r i e s s t i m u l a t e d G a l t o n t o tr yt o s o l v e t h e p r o b l e m s o f h e r e d i t y . G a l t o n ' s m a j o r c o n t r i b u t i o n t o b i o l o g y w a sh is a p p l i c a t i o n o f s t a t i s t i c a l m e t h o d o l o g y t o t h e a n a l y s i s of b i o l o g i c a l v a r i a t i o n ,p a r t i c u l a r l y t h r o u g h t h e a n a l y s i s of v a r i a b i l i t y a n d t h r o u g h h i s s t u d y of r eg r e s -s i o n a n d c o r r e l a t i o n i n b i o l o g i c a l m e a s u r e m e n t s . H i s h o p e o f u n r a v e l i n g t h el a w s o f g e n e t i c s t h r o u g h t h e s e p r o c e d u r e s w a s i n v a i n . H e s t a r t e d w i t h t h e m o s td if fi cu l t m a t e r i a l a n d w i t h t h e w r o n g a s s u m p t i o n s . H o w e v e r , h is m e t h o d o l o g yh a s b e c o m e t h e f o u n d a t i o n f o r t h e a p p l i c a t i o n o f s t a t i s t i c s t o b i o l o g y .

    K a r l P e a r s o n ( 1 8 5 7 - 1 9 3 6 ) , a t U n i v e r s i t y C o l l e g e , L o n d o n , b e c a m e i n t e r -e s t e d i n t h e a p p l i c a t i o n o f s t a t i s t i c a l m e t h o d s t o b i o l o g y , p a r t i c u l a r l y i n t h ed e m o n s t r a t i o n o f n a t u r a l s e l ec t io n . P e a r s o n ' s in t er e s t c a m e a b o u t t h r o u g h t h ei n f l u e n c e o f W . F . R . W c l d o n ( 1 8 6 0 - 1 9 0 6 ) , a z o o l o g i s t a t t h e s a m e i n s t i t u t i o n .W e l d o n , i n c i d e n t a l l y , is c r e d i t e d w i t h c o i n i n g t h e te r m " b i o m e t r y " f o r t h e t y p eo f s t u d i e s h e a n d P e a r s o n p u r s u e d . P e a r s o n c o n t i n u e d i n t h e t r a d i t i o n of G a l t o na n d l a id t h e f o u n d a t i o n fo r m u c h of d e s c r i p t i v e a n d c o r r e l a t i o n a l s t a t is t i c s .

    T h e d o m i n a n t f ig ure in s t a t i s t i c s a n d b i o m e t r y in t h e t w e n t i e t h c e n t u r y h a sb e e n R o n a l d A . F i s h e r ( 1 8 9 0 1 96 2). H i s m a n y c o n t r i b u t i o n s to s t a t i s t i c a l t h e o r yw i l l b e c o m e o b v i o u s e v e n t o t h e c u r s o r y r e a d e r o f t h i s b o o k .

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    17/373

    4 C H A P T E R 1 / I N T R O D U C T I O N

    S t a t i s t i c s t o d a y is a b r o a d a n d e x t r e m e l y a c t i v e field w h o s e a p p l i c a t i o n st o u c h a l m o s t e v e r y s c i e n c e a n d e v e n t h e h u m a n i t i e s . N e w a p p l i c a t i o n s f o r s t a -t is t ic s a r e c o n s t a n t l y b e i n g f o u n d , a n d n o o n e c a n p r e d i c t f r o m w h a t b r a n c ho f s t a t i s t i c s n e w a p p l i c a t i o n s t o b i o l o g y w i ll b e m a d e .

    1.3 T he s tat i s t ica l f ram e of mindA b r ie f p e r u s a l o f a l m o s t a n y b i o l o g i c a l j o u r n a l r e v e a l s h o w p e r v a s i v e t h e u s eo f s t a t i s t i c s h a s b e c o m e i n t h e b i o l o g i c a l s c i e n c e s . W h y h a s t h e r e b e e n s u c h am a r k e d i n c r e a s e i n t h e u s e o f s t a t i s t ic s in b i o l o g y ? A p p a r e n t l y , b e c a u s e b i o l -o g i s t s h a v e f o u n d t h a t t h e i n t e r p l a y of b i o l o g i c a l c a u s a l a n d r e s p o n s e v a r i a b l e sd o e s n o t fit t h e c l a s s i c m o l d o f n i n e t e e n t h - c e n t u r y p h y s i c a l s c i e n c e . I n t h a tc e n t u r y , b i o l o g i st s s u c h a s R o b e r t M a y e r , H e r m a n n v o n H e l m h o l t z , a n d o t h e r st r i e d t o d e m o n s t r a t e t h a t b i o l o g i c a l p r o c e s s e s w e r e n o t h i n g b u t p h y s i c o c h e m i -c a l p h e n o m e n a . I n s o d o i n g , t h e y h e l p e d c r e a t e t h e i m p r e s s i o n t h a t t h e e x p e r i -m e n t a l m e t h o d s a n d n a t u r a l p h i l o s o p h y t h a t h a d le d t o s u c h d r a m a t i c p r o g r e s si n t h e p h y s i c a l s c i e n c e s s h o u l d b e i m i t a t e d f u l l y i n b i o l o g y .

    M a n y b i o l o g i s t s , e v e n t o t h i s d a y , h a v e r e t a i n e d t h e t r a d i t i o n o f s tr i c t l ym e c h a n i s t i c a n d d e t e r m i n i s t i c c o n c e p t s o f t h i n k i n g (w h i l e p h y s i c i s t s , i n t e r e s t -i n g l y e n o u g h , a s t h e i r sc i e n c e h a s b e c o m e m o r e re f i n e d , h a v e b e g u n t o r e s o r tt o s t a t is t i c a l a p p r o a c h e s ) . In b i o l o g y , m o s t p h e n o m e n a a r e a f f e c t ed b y m a n yc a u s a l f a c t o r s , u n c o n t r o l l a b l e in t h e i r v a r i a t i o n a n d o f t e n u n i d e n t i f i a b l e . S t a -t i st i c s is n e e d e d t o m e a s u r e s u c h v a r i a b l e p h e n o m e n a , t o d e t e r m i n e t h e e r r o ro f m e a s u r e m e n t , a n d t o a s c e r t a i n t h e r e a l i t y o f m i n u t e b u t i m p o r t a n t d i f f e r e n c e s .

    A m i s u n d e r s t a n d i n g o f t h e s e p r i n c i p l e s a n d r e l a t i o n s h i p s h a s g i v e n r i s e t ot h e a t t i t u d e of s o m e b i o l o g i s t s t h a t if d i f f e r e n c e s i n d u c e d b y a n e x p e r i m e n t , o ro b s e r v e d b y n a t u r e , a r e n o t c l e a r o n p l a i n i n s p e c t i o n ( a n d t h e r e f o r e a r e in n e e do f s t a t i s t i c a l a n a l y s i s ) , t h e y a r c n o t w o r t h i n v e s t i g a t i n g . T h e r e a r e f e w l e g i t i m a t efield s o f i n q u i r y , h o w e v e r , i n w h i c h , f r o m t h e n a t u r e of t h e p h e n o m e n a s t u d i e d ,s t a t i s t i c a l i n v e s t i g a t i o n i s u n n e c e s s a r y .

    S t a t i s t i c a l t h i n k i n g is n o t re a l l y d i f f e r e n t f r o m o r d i n a r y d i s c i p l i n e d s c i e n t i f i ct h i n k i n g , i n w h i c h w c t r y t o q u a n t i f y o u r o b s e r v a t i o n s . I n s t a t i s t i c s w e e x p r e s so u r d e g r e e o f b e l i e f o r d i s b e l i e f a s a p r o b a b i l i t y r a t h e r t h a n a s a v a g u e , g e n e r a ls t a t e m e n t . F o r e x a m p l e , a s t a t e m e n t t h a t i n d i v i d u a l s of s p e c i e s A a r e l a r g e rt h a n t h o s e o f s p e c i c s o r t h a t w o m e n s u f f e r m o r e o f t e n f r o m d i s e a s e X t h a nd o m e n is o f a k i n d c o m m o n l y m a d e b y b i o l o g i c a l a n d m e d i c a l s c i en t i s t s . S u c hs t a t e m e n t s c a n a n d s h o u l d b e m o r e p re c i s el y e x p r e s s e d i n q u a n t i t a t i v e f o r m .

    I n m a n y w a y s th e h u m a n m i n d i s a r e m a r k a b l e st a ti s ti c a l m a c h i n e , a b s o r b -i n g m a n y f a c t s f r o m t h e o u t s i d e w o r l d , d i g e s t i n g th e s e , a n d r e g u r g i t a t i n g t h e min s i m p l e s u m m a r y f o r m . F r o m o u r e x p e r i e n c e w e k n o w c e r t a i n e v e n t s t o o c c u rf r e q u e n t l y , o t h e r s r ar e ly . " M a n s m o k i n g c i g a r e t t e " is a f r e q u e n t l y o b s e r v e de v e n t , " M a n s l i p p i n g o n b a n a n a p e e l ," r a r e . W e k n o w f r o m e x p e r i e n c e t h a tJ a p a n e s e a r c o n th e a v e r a g e s h o r t e r t h a n E n g l i s h m e n a n d th a t E g y p t i a n s a r eo n t h e a v e r a g e d a r k e r t h a n S w e d e s . W e a s s o c i a t e t h u n d e r w i t h l i g h t n i n g a l m o s ta l w a y s , flics w i t h g a r b a g e c a n s in t h e s u m m e r f r e q u e n t l y , b u t s n o w w i t h t h e

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    18/373

    1 . 3 / T H E ST A T I ST I CA L FRA M E O F MI N D 5

    s o u t h e r n C a l i f o r n i a n d e s e r t e x t r e m e l y r a re l y . A l l s u c h k n o w l e d g e c o m e s t o u sa s a r e s u l t o f e x p e r i e n c e , b o t h o u r o w n a n d t h a t o f o t h e r s , w h i c h w e l e a r na b o u t b y d ir e c t c o m m u n i c a t i o n o r t h r o u g h r e a d i n g . A ll t h e s e f a c t s h a v e b e e np r o c e s s e d b y t h a t r e m a r k a b l e c o m p u t e r , t h e h u m a n b r a i n , w h i c h f u r n i s h e s a na b s t r a c t . T h i s a b s t r a c t is c o n s t a n t l y u n d e r r e v is i o n , a n d t h o u g h o c c a s i o n a l l yf a u l t y a n d b i a s e d , it i s o n t h e w h o l e a s t o n i s h i n g l y s o u n d ; it i s o u r k n o w l e d g eo f t h e m o m e n t .

    A l t h o u g h s t a t i s t i c s a r o s e t o s a t i s f y t h e n e e d s o f s c i e n t i f ic r e s e a r c h , t h e d e v e l -o p m e n t o f i t s m e t h o d o l o g y i n t u r n a f f e c t e d t h e s c i e n c e s in w h i c h s t a t i s t i c s isa p p l i e d . T h u s , t h r o u g h p o s i t i v e f e e d b a c k , s t a t i s t i c s , c r e a t e d t o s e r v e t h e n e e d so f n a t u r a l s c ie n c e , h a s i ts e lf a f f e c t e d t h e c o n t e n t a n d m e t h o d s o f t h e b i o l o g i c a ls c i e n c e s . T o c i t e a n e x a m p l e : A n a l y s i s o f v a r i a n c e h a s h a d a t r e m e n d o u s e f f e c ti n i n f l u e n c i n g t h e t y p e s of e x p e r i m e n t s r e s e a r c h e r s c a r r y o u t . T h e w h o l e field o fq u a n t i t a t i v e g e n e t i c s , o n e o f w h o s e p r o b l e m s i s t h e s e p a r a t i o n of e n v i r o n m e n t a lf r o m g e n e t i c e f f ec t s , d e p e n d s u p o n t h e a n a l y s i s o f v a r i a n c e f o r i t s r e a l i z a t i o n ,a n d m a n y o f t h e c o n c e p t s o f q u a n t i t a t i v e g e n e t i c s h a v e b e e n d i r e c t l y b u i l ta r o u n d t h e d e s i g n s i n h e r e n t i n t h e a n a l y s i s of v a r i a n c e .

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    19/373

    C H A P T E R

    Data in Biostatistics

    I n S e c t i o n 2 .1 w e e x p l a i n t h e s t a t i s t i c a l m e a n i n g of t h e t e r m s " s a m p l e " a n d" p o p u l a t i o n , " w h i c h w e s h a l l b e u s i n g t h r o u g h o u t t h i s b o o k . T h e n , in S e c t i o n2 .2 , w e c o m e t o t h e t y p e s of o b s e r v a t i o n s t h a t w e o b t a i n f r o m b i o l o g i c a l r e s e a r c hm a t e r i a l ; w e s h a ll s ee h o w t h e s e c o r r e s p o n d t o t h e d i f f e r e n t k i n d s o f v a r i a b l e su p o n w h i c h w e p e r f o r m ( h e v a r i o u s c o m p u t a t i o n s in t h e r es t o f t h i s b o o k . I nS e c t i o n 2 . 3 w e d i s c u s s t h e d e g r e e o f a c c u r a c y n e c e s s a r y f o r r e c o r d i n g d a t a a n dt h e p r o c e d u r e f o r r o u n d i n g o f f f i g u re s . W e s h al l t h e n b e r e a d y t o c o n s i d e r i nS e c t i o n 2 .4 c e r t a i n k i n d s o f d e r i v e d d a t a f r e q u e n t l y u s e d in b i o l o g i c a l s c i e n c ea m o n g t h e m r a t i o s a n d i n d i c e s a n d t h e p e c u l i a r p r o b l e m s o f a c c u r a c y a n dd i s t r i b u t i o n t h e y p r e s e n t u s . K n o w i n g h o w t o a r r a n g e d a t a in f r e q u e n c y d i s t r i -b u t i o n s is i m p o r t a n t b e c a u s e s u c h a r r a n g e m e n t s g i v e a n o v e r a l l i m p r e s s i o n o ft h e g e n e r a l p a t t e r n o f t h e v a r i a t i o n p r e s e n t in a s a m p l e a n d a l s o f a c i l i t a t e f u r t h e rc o m p u t a t i o n a l p r o c e d u r e s . F r e q u e n c y d i s t r i b u t i o n s , a s w e ll a s t h e p r e s e n t a t i o no f n u m e r i c a l d a t a , a r e d i s c u s s e d i n S e c t i o n 2 .5 . I n S e c t i o n 2 . 6 w e b r i e fl y d e s c r i b et h e c o m p u t a t i o n a l h a n d l i n g of d a t a .

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    20/373

    2 . 1 / S A M P L E S A N D P O P U L A T I O N S 7

    2 .1 Sam ple s and populat ionsW e s h a l l n o w d e f i n e a n u m b e r of i m p o r t a n t t e r m s n e c e s s a r y f o r a n u n d e r -s t a n d i n g o f b i o l o g i c a l d a t a . T h e data i n b i o s t a t i s t i c s a r e g e n e r a l l y b a s e d o nindividual observations. T h e y a r e observations or measurements taken on thesmallest sampling unit. T h e s e sm a l l e s t s a m p l i n g u n i t s f r e q u e n t l y , b u t n o t n e c e s -s a r il y , a r e a l s o i n d i v i d u a l s i n t h e o r d i n a r y b i o l o g i c a l s e n s e . If w e m e a s u r e w e i g h ti n 1 00 r a t s , t h e n t h e w e i g h t o f e a c h r a t i s a n i n d i v i d u a l o b s e r v a t i o n ; t h e h u n d r e dr a t w e i g h t s t o g e t h e r r e p r e s e n t t h e sample of observations, d e f i n e d a s a collectionof individual observations selected by a specified procedure. I n t h i s i n s t a n c e , o n ei n d i v i d u a l o b s e r v a t i o n ( a n item) is b a s e d o n o n e i n d i v i d u a l i n a b i o l o g i c a ls e n s e t h a t is, o n e r a t . H o w e v e r , if w e h a d s t u d i e d w e i g h t i n a s i n g l e r a t o v e ra p e r i o d o f t i m e , t h e s a m p l e o f i n d i v i d u a l o b s e r v a t i o n s w o u l d b e t h e w e i g h t sr e c o r d e d o n o n e r a t a t s u c c e s s i v e t i m e s . If w e w i s h t o m e a s u r e t e m p e r a t u r ei n a s t u d y o f a n t c o l o n i e s , w h e r e e a c h c o l o n y i s a b a s i c s a m p l i n g u n i t , e a c ht e m p e r a t u r e r e a d i n g f o r o n e c o l o n y is a n i n d i v i d u a l o b s e r v a t i o n , a n d t h e s a m p l eo f o b s e r v a t i o n s i s t h e t e m p e r a t u r e s f o r a ll th e c o l o n i e s c o n s i d e r e d . If w e c o n s i d e ra n e s t i m a t e o f t h e D N A c o n t e n t of a s i n g l e m a m m a l i a n s p e r m c e ll t o b e a ni n d i v i d u a l o b s e r v a t i o n , t h e s a m p l e of o b s e r v a t i o n s m a y b e t h e e s t i m a t e s of D N Ac o n t e n t o f a ll t h e s p e r m c e l ls s t u d i e d i n o n e i n d i v i d u a l m a m m a l .

    W e h a v e c a r e f u l l y a v o i d e d s o f a r s p e c i f y i n g w h a t p a r t i c u l a r v a r i a b l e w a sb e i n g s t u d i e d , b e c a u s e t h e t e r m s " i n d i v i d u a l o b s e r v a t i o n " a n d " s a m p l e o f o b -s e r v a t i o n s " a s u s e d a b o v e d e f i n e o n l y t h e s t r u c t u r e b u t n o t t h e n a t u r e o f t h ed a t a i n a s t u d y . T h e actual property m e a s u r e d b y t h e i n d i v i d u a l o b s e r v a t i o n sis the character, o r variable. T h e m o r e c o m m o n t e rm e m p l o y e d in g e n e r a l s ta -t i st i c s is " v a r i a b l e . " H o w e v e r , in b i o l o g y t h e w o r d " c h a r a c t e r " is f r e q u e n t l y u s e ds y n o n y m o u s l y . M o r e t h a n o n e v a r i a b l e c a n b e m e a s u r e d o n e a c h s m a l l e sts a m p l i n g u n i t . T h u s , i n a g r o u p o f 2 5 m i c e w e m i g h t m e a s u r e t h e b l o o d p Ha n d t h e e r y t h r o c y t e c o u n t . E a c h m o u s e ( a b i o l o g i c a l i n d i v i d u a l ) is t h e s m a l l e s ts a m p l i n g u n i t , b l o o d p H a n d r e d c el l c o u n t w o u l d b e t h e t w o v a r i a b l e s s t u d i e d ,t h e r e a d i n g s a n d c e ll c o u n t s a r e in d i v i d u a l o b s e r v a t i o n s , a n d t w o s a m p l e so f 2 5 o b s e r v a t i o n s ( o n a n d o n e r y t h r o c y t e c o u n t ) w o u l d r e s u l t . O r w e m i g h tspeak o f a bivariate samp le o f 2 5 o b s e r v a t i o n s , e a c h r e f e r r i n g t o a />H r e a d i n gp a i r e d w i t h a n e r y t h r o c y t e c o u n t .

    N e x t w e d e f i n e population. T h e b i o l o g i c a l d e f i n i t i o n o f t h i s t e r m i s w e llk n o w n . I t r e f e r s t o a l l t h e i n d i v i d u a l s o f a g i v e n s p e c i e s ( p e r h a p s o f a g i v e nl i f e - h i s t o r y s t a g e o r s e x ) f o u n d in a c i r c u m s c r i b e d a r e a a t a g i v e n t i m e . I ns t a t i s t i c s , p o p u l a t i o n a l w a y s m e a n s the totality of individual observations aboutwhich inferences are to he mad e, existing anyw here in the world or at least withina definitely specified samp ling area limited in space and time. If y ou t a k e f ivem e n a n d s t u d y t h e n u m b e r o f l e u c o c y t e s in t h e i r p e r i p h e r a l b l o o d a n d y o ua r e p r e p a r e d t o d r a w c o n c l u s i o n s a b o u t a l l m e n f r o m t h i s s a m p l e o f f i v e , t h e nt h e p o p u l a t i o n f r o m w h i c h th e s a m p l e h a s b e e n d r a w n r e p r e s e n t s t h e l e u c o c y t ec o u n t s o f a l l e x t a n t m a l e s o f t h e s p e c i e s Hom o sapiens. If , o n t h e o t h e r h a n d ,y o u r e s t r i c t y o u r s e l f t o a m o r e n a r r o w l y s p e c i f i e d s a m p l e , s u c h a s l i v e m a l e

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    21/373

    8 CHA PTER 2 / DATA IN BIOSTATISTICS

    C h i n e s e , a g e d 20 , a n d y o u a r e r e s t r ic l i n g y o u r c o n c l u s i o n s t o t h i s p a r t i c u l a rg r o u p , t h e n t h e p o p u l a t i o n f r o m w h i c h y o u a r e s a m p l i n g w i l l b e l e u c o c y t en u m b e r s o f a l l C h i n e s e m a l e s o f a g e 2 0 .

    A c o m m o n m i s u s e o f s t a t i s t i c a l m e t h o d s i s t o f a i l t o d e f i n e t h e s t a t i s t i c a lp o p u l a t i o n a b o u t w h i c h i n f e r e n c e s c a n b e m a d e . A r e p o r t o n t h e a n a l y s i s o fa s a m p l e f r o m a r e s t r i c t e d p o p u l a t i o n s h o u l d n o t i m p l y t h a t t h e r e s u l t s h o l di n g e n e r a l . T h e p o p u l a t i o n i n t h i s s t a t i s t i c a l s e n s e is s o m e t i m e s r e f e r r e d t o a st h e universe.

    A p o p u l a t i o n m a y r e p r e s e n t v a r i a b l e s o f a c o n c r e t e c o l l e c t i o n of o b j e c t s o rc r e a t u r e s , s u c h a s t h e t a i l l e n g t h s of a ll t h e w h i t e m i c e i n t h e w o r l d , t h e l e u c o c y t ec o u n t s of a l l t h e C h i n e s e m e n i n t h e w o r l d o f a g e 20 , o r t h e D N A c o n t e n t o fa l l t h e h a m s t e r s p e r m c e l l s i n e x i s t e n c e : o r i t m a y r e p r e s e n t t h e o u t c o m e s o fe x p e r i m e n t s , s u c h a s a ll t h e h e a r t b e a t f r e q u e n c i e s p r o d u c e d i n g u i n e a p i g s b yi n j e c t i o n s o f a d r e n a l i n . I n c a s e s o f t h e f i r s t k i n d t h e p o p u l a t i o n i s g e n e r a l l yf i n it e . A l t h o u g h i n p r a c t i c e i t w o u l d b e i m p o s s i b l e t o c o l le c t , c o u n t , a n d e x a m i n ea l l h a m s t e r sp e r m c e l ls , a l l C h i ne se m e n o f a g e 20 , o r a ll w h i t e m ic e in th e w or ld ,t h e s e p o p u l a t i o n s a r e i n f a c t fin ite. C e r t a i n s m a l l e r p o p u l a t i o n s , s u c h a s a ll t h ew h o o p i n g c r a n e s i n N o r t h A m e r i c a o r al l t h e r e c o r d e d c a s e s o f a r a r e b u t e a s i l yd i a g n o s e d d i s e a s e X , m a y w e l l l ie w i t h i n r e a c h o f a t o t a l c e n s u s . B y c o n t r a s t ,a n e x p e r i m e n t c a n b e r e p e a t e d a n i n f i n i t e n u m b e r o f t i m e s ( at l e a s t i n t h e o r y ) .A g i v e n e x p e r i m e n t , s u c h a s t h e a d m i n i s t r a t i o n o f a d r e n a l i n t o g u i n e a p i g s,c o u l d b e r e p e a l e d a s l o n g a s t h e e x p e r i m e n t e r c o u l d o b t a i n m a t e r i a l a n d h i so r h e r h e a l t h a n d p a t i e n c e h e l d o u t . T h e s a m p l e of e x p e r i m e n t s a c t u a l l y p e r -f o r m e d is a s a m p l e f r o m a n i n f in i t e n u m b e r t h a t could b e p e r f o r m e d .

    S o m e of t h e s t a t i st i c a l m e t h o d s t o be d e v e l o p e d l a t e r m a k e a d i s t i n c t i o nb e t w e e n s a m p l i n g f r o m f inite a n d f r o m i n f i n i te p o p u l a t i o n s . H o w e v e r , t h o u g hp o p u l a t i o n s a r e t h e o r e t i c a l l y fin ite i n m o s t a p p l i c a t i o n s i n b i o l o g y , t h e y a r eg e n e r a l l y s o m u c h l a r g e r t h a n s a m p l e s d r a w n f r o m t h e m t h a t t h e y c a n b e c o n -s i d e r e d d e f a c t o i n f i n i t e - s i z e d p o p u l a t i o n s .

    2.2 Variables in b iostat is t iesE a c h b i o l o g i c a l d i s c i p l i n e h a s i ts o w n s et o f v a r i a b l e s , w h i c h m a y i n c l u d e c o n -v e n t i o n a l m o r p h o l o g i c a l m e a s u r e m e n t s ; c o n c e n t r a t i o n s o f c h e m i c a l s in b o d yf l u i d s ; r a t e s o f c e r t a i n b i o l o g i c a l p r o c e s s e s ; f r e q u e n c i e s o f c e r t a i n e v e n t s , a s i ng e n e t i cs , e p i d e m i o l o g y , a n d r a d i a t i o n b i o l o g y ; p h y s i c a l r e a d i n g s o f o p t i c a l o re l e c t r o n i c m a c h i n e r y u s e d in b i o l o g i c a l re s e a r c h ; a n d m a n y m o r e .

    W e h a v e a l r e a d y r e f e r r e d t o b i o l o g i c a l v a r i a b l e s in a g e n e r a l w a y , b u t w eha ve no t ye t de f ine d the m . We sha l l de f ine a variable a s a properly with respectto which individuals in a sample d i f f e r in some ascertainable way. I f t h e p r o p e r t yd o e s n o t d i f fe r w i t h i n a s a m p l e a t h a n d o r a t l e a s t a m o n g t h e s a m p l e s b e i n gs t u d i e d , it c a n n o t b e o f s t a t i s t i c a l i n t e r e s t . L e n g t h , h e i g h t , w e i g h t , n u m b e r o ft e e t h , v i t a m i n ( ' c o n t e n t , a n d g e n o t y p e s a r e e x a m p l e s o f v a r i a b l e s i n o r d i n a r y ,g e n e t ic a l ly a n d p h c n o t y p i c a l l y d i v e rs e g r o u p s of o r g a n i s m s . W a r m - b l o o d e d n e s si n a g r o u p o f m a m m a l s i s n o t , s i n c e m a m m a l s a r e a l l a l i k e i n t h i s r e g a r d .

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    22/373

    2 .2 / VAR IABLES IN BIOSTAT ISTICS 9

    a l t h o u g h b o d y t e m p e r a t u r e of i n d i v i d u a l m a m m a l s w o u l d , o f c o u r s e , b e av a r i a b l e .

    W e c a n d i v i d e v a r i a b l e s a s f o l l o w s :

    VariablesMeasurement var iablesCont inuous va r i ab l e sDiscont inuous var iablesRanked variablesAttributes

    Measurement variables a r e those measurements and counts that are expressednumerically. M e a s u r e m e n t v a r i a b l e s a r e o f t w o k i n d s . T h e fi rs t k i n d c o n s i s t s o fcontinuous variables, w h i c h a t l e a st t h e o r e t i c a l l y c a n a s s u m e a n in f i n i t e n u m b e ro f v a l u e s b e t w e e n a n y t w o fix ed p o i n t s . F o r e x a m p l e , b e t w e e n t h e t w o l e n g t hm e a s u r e m e n t s 1 .5 a n d 1.6 c m t h e r e a r e a n i n f i n i t e n u m b e r o f l e n g t h s t h a t c o u l db e m e a s u r e d if o n e w e r e s o i n c l i n e d a n d h a d a p r e c i s e e n o u g h m e t h o d o fc a l i b r a t i o n . A n y g i v e n r e a d i n g of a c o n t i n u o u s v a r i a b l e , s u c h a s a l e n g t h of1 .5 7 m m , is t h e r e f o r e a n a p p r o x i m a t i o n t o t h e e x a c t r e a d i n g , w h i c h in p r a c t i c eis u n k n o w a b l e . M a n y of t h e v a r i a b l e s s t u d i e d in b i o l o g y a r c c o n t i n u o u s v a r i -a b l e s . E x a m p l e s a r e l e n g t h s , a r e a s , v o l u m e s , w e i g h t s , a n g l e s , t e m p e r a t u r e s ,p e r i o d s o f t i m e , p e r c e n t a g e s , c o n c e n t r a t i o n s , a n d r a t e s .

    C o n t r a s t e d w i t h c o n t i n u o u s v a r i a b l e s a r e t h e discontinuou s variables , a l sok n o w n a s meristic o r discrete variables. T h e s e a r e v a r i a b l e s t h a t h a v e o n l y c e r -t a i n f ix e d n u m e r i c a l v a l u e s , w i t h n o i n t e r m e d i a t e v a l u e s p o s s i b l e in b e t w e e n .T h u s t h e n u m b e r o f s e g m e n t s in a c e r t a i n i n se c t a p p e n d a g e m a y b e 4 o r 5 o r6 b u t n e v e r 5 l o r 4. 3. E x a m p l e s of d i s c o n t i n u o u s v a r i a b l e s a r e n u m b e r s of ag i v e n s t r u c t u r e ( s u c h a s s e g m e n t s , b r i s t le s , l ee l h , o r g l a n d s ) , n u m b e r s o f o f f s p r i n g ,n u m b e r s o f c o l o n i c s of m i c r o o r g a n i s m s o r a n i m a l s , o r n u m b e r s of p l a n t s in ag i v e n q u a d r a t .

    S o m e v a r i a b l e s c a n n o t b e m e a s u r e d b u t a t l ea s t c a n b e o r d e r e d o r r a n k e db y t h e i r m a g n i t u d e . T h u s , in a n e x p e r i m e n t o n e m i g h t r e c o r d t h e r a n k o r d e ro f e m e r g e n c e o f t e n p u p a e w i t h o u t s p e c i f y i n g t h e e x a c t t im e a t w h i c h e a c h p u p ae m e r g e d . I n s u c h c a s e s w e c o d e t h e d a t a a s a ranked variable. Ihe o rd e r o fe m e r g e n c e . S p e c i a l m e t h o d s f o r d e a l i n g w i t h s u c h v a r i a b l e s h a v e b e e n d e v e l -o p e d , a n d s e v e r a l a r c f u r n i s h e d in t h i s b o o k . B y e x p r e s s i n g a v a r i a b l e a s a s e r ie so f r a n k s , s u c h a s 1 , 2 , 3, 4 . 5 , w e d o n o t i m p l y t h a t t h e d i f f e r e n c e in m a g n i t u d eb e t w e e n , s a y , r a n k s I a n d 2 is i d e n t i c a l l o o r e v e n p r o p o r t i o n a l t o t h e d i f -f e r e n c e b e t w e e n r a n k s 2 a n d 3 .

    V a r i a b l e s t h a t c a n n o t b e m e a s u r e d b u t m u s t b e e x p r e s s e d q u a l i t a t i v e l y a r eca l l ed attributes , o r nominal variables. T h e s e a r e a ll p r o p e r t i e s , s u c h a s b l a c ko r w h i t e , p r e g n a n t o r n o t p r e g n a n t , d e a d o r a l i v e , m a l e o r f e m a l e . W h e n s u c ha t t r i b u t e s a r e c o m b i n e d w i t h f r e q u e n c i e s , t h e y c a n b e t r e a t e d s t a t i s t ic a l l y . O f

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    23/373

    1 0 CHA PTER 2 / DATA IN BIOSTATISTICS

    r e s t g r a y . W h e n a t t r i b u t e s a r e c o m b i n e d w i t h f r e q u e n c i e s i n t o t a b l e s s u i t a b l ef o r s t a t i s t i c a l a n a l y s i s , t h e y a r e r e f e r r e d t o a s enumera tion data. T h u s t h e e n u -m e r a t i o n d a t a o n c o l o r i n m i c e w o u l d b e a r r a n g e d a s f o l l o w s :

    Color FrequencyB l a c k 4A g o u t i 2G r a y 7 4T o t a l n u m b e r o f m i c e 8 0

    I n s o m e c a s e s a t t r i b u t e s c a n b e c h a n g e d i n t o m e a s u r e m e n t v a r i a b l e s if t h i s isd e s i r e d . T h u s c o l o r s c a n b e c h a n g e d i n t o w a v e l e n g t h s o r c o l o r - c h a r t v a l u e s .C e r t a i n o t h e r a t t r i b u t e s t h a t c a n b e r a n k e d o r o r d e r e d c a n b e c o d e d t o b e -c o m e r a n k e d v a r i a b l e s . F o r e x a m p l e , t h r e e a t t r i b u t e s r e f e r ri n g t o a s t r u c t u r ea s " p o o r l y d e v e l o p e d , " "w e ll d e v e l o p e d , " a n d " h y p e r t r o p h i e d " c o u l d b e c o d e d1, 2, and 3.

    A t e r m t h a t h a s n o t y e t b e e n e x p l a i n e d i s variate. I n th i s b o o k w e sha l l u seit a s a s i n g l e r e a d i n g , s c o r e , o r o b s e r v a t i o n o f a g i v e n v a r i a b l e . T h u s , if w e h a v em e a su r e m e n t s o f t he l e ng th o f t he t a i l s o f f i ve m ic e , t a i l l e ng th w i l l be a c on -t inuous va r i a b le , a nd e a c h o f t he f ive r e a d ings o f l e ng th w i l l be a va r i a t e . I nt h i s t e x t w e i d e n t i f y v a r i a b l e s b y c a p i t a l l e t t e r s , t h e m o s t c o m m o n s y m b o l b e i n gY. T h u s V m a y s t a n d f o r t a i l l e n g th o f m ic e . A va r i a t e w i ll r e f e r t o a g iv e nl e n g t h m e a s u r e m e n t ; Yt i s t he m e a su r e m e n t o f t a i l l e n g th o f t he /'th m ou se , a ndy 4 is t h e m e a s u r e m e n t o f t a i l l e n g t h o f t h e f o u r t h m o u s e i n o u r s a m p l e .

    2.3 Accuracy and prec is ion of data" A c c u r a c y " a n d " p r e c i s i o n " a r e u s e d s y n o n y m o u s l y i n e v e r y d a y s p e e c h , b u t i ns t a t i s t i c s w e d e f i n e t h e m m o r e r i g o r o u s l y . Accuracy is the closeness of a measuredor computed value to its true value. Precision i s the closeness of repeated measure-ments. A b i a s e d b u t s e n s i t i v e s c a le m i g h t y i e ld i n a c c u r a t e b u t p r e c i s e w e i g h t . Byc h a n c e , a n i n s e n s i t i v e s c a l e m i g h t r e s u l t i n a n a c c u r a t e r e a d i n g , w h i c h w o u l d ,h o w e v e r , b e i m p r e c i s e , s i n c e a r e p e a t e d w e i g h i n g w o u l d b e u n l i k e l y t o y i e l d a ne q u a l l y a c c u r a t e w e i g h t . U n l e s s t h e r e is b i a s in a m e a s u r i n g i n s t r u m e n t , p r e c i s i o nw il l l e a d t o a c c u r a c y . W e n e e d t h e r e f o r e m a i n l y b e c o n c e r n e d w i t h t h e f o r m e r .

    P r e c i s e v a r i a t e s a r c u s u a l l y , b u t n o t n e c e s s a r i l y , w h o l e n u m b e r s . T h u s , w h e nw e c o u n t f o u r e g g s in a n e st , t h e r e i s n o d o u b t a b o u t t h e e x a c t n u m b e r o f e g g sin th e nes t if we h av e co u n te d co r re c t ly ; it is 4 , no t 3 or 5 , an d c l ea r ly i t cou ldn o t b e 4 p l u s o r m i n u s a f r a c t i o n a l p a r t . M e r i s t i c , o r d i s c o n t i n u o u s , v a r i a b l e s a r eg e n e r a l l y m e a s u r e d a s e x a c t n u m b e r s . S e e m i n g l y , c o n t i n u o u s v a r i a b l e s d e r i v e df r o m m c r i s t i c o n e s c a n u n d e r c e r t a i n c o n d i t i o n s a l s o b e e x a c t n u m b e r s . F o ri n s t a n c e , r a t i o s b e t w e e n e x a c t n u m b e r s a r c t h e m s e l v e s a l s o e x a c t . If in a c o l o n yof a n im a l s t he r e a r e 18 f e m a le s a n d 12 m a le s , t he r a t io o f f e m a le s to m a le s (a

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    24/373

    2 . 3 / A C C U R A C Y A N D PR E C I SI O N O F D A T A 1 1

    M o s t c o n t i n u o u s v a r i a b l e s , h o w e v e r , a r e a p p r o x i m a t e . W e m e a n b y t h i st h a t t h e e x a c t v a l u e o f t h e s i n g le m e a s u r e m e n t , t h e v a r i a t e , i s u n k n o w n a n dp r o b a b l y u n k n o w a b l e . T h e l a st d i g i t o f t h e m e a s u r e m e n t s t a t e d s h o u l d i m p l yp r e c i s i o n ; t h a t is , it s h o u l d i n d i c a t e t h e l i m i t s o n t h e m e a s u r e m e n t s c a l e b e t w e e nw h i c h w e b e li e v e t h e t r u e m e a s u r e m e n t t o lie . T h u s , a l e n g t h m e a s u r e m e n t o f1 2.3 m m i m p l i e s t h a t t h e t r u e l e n g t h o f t h e s t r u c t u r e li es s o m e w h e r e b e t w e e n1 2 .2 5 a n d 1 2 .3 5 m m . E x a c t l y w h e r e b e t w e e n t h e s e implied limits t h e r e a l l e n g t his w e d o n o t k n o w . B u t w h e r e w o u l d a t r u e m e a s u r e m e n t o f 1 2 .2 5 f a ll ? W o u l di t n o t eq ua l ly l i ke ly fa l l i n e i t h e r o f t h e tw o c l a s se s 12 .2 a n d 12 .3 cle a r ly anu n s a t i s f a c t o r y s t a t e o f a f f a i r s ? S u c h a n a r g u m e n t i s c o r r e c t , b u t w h e n w e r e c o r da n u m b e r a s e i t h e r 1 2 .2 o r 1 2 .3 , w e i m p l y t h a t t h e d e c i s i o n w h e t h e r t o p u t iti n t o t h e h i g h e r o r l o w e r c l a s s h a s a l r e a d y b e e n t a k e n . T h i s d e c i s i o n w a s n o tt a k e n a r b i t r a r i l y , b u t p r e s u m a b l y w a s b a s e d o n t h e b e s t a v a i l a b l e m e a s u r e m e n t .I f t h e s c a l e o f m e a s u r e m e n t i s s o p r e c i s e t h a t a v a l u e of 1 2 .2 5 w o u l d c l e a r l yh a v e b e e n r e c o g n i z e d , t h e n t h e m e a s u r e m e n t s h o u l d h a v e b e e n r e c o r d e dor ig ina l l y t o four s i gn i f i can t f i gure s . Implied limits, therefore, always carry onemore figure beyond the last significant one mea sured by the observer.

    H e n c e , it f o l l o w s t h a t if w e r e c o r d t h e m e a s u r e m e n t a s 1 2 .3 2 , w e a r e i m p l y i n gt h a t t h e t r u e v a l u e l ie s b e t w e e n 1 2 . 3 1 5 a n d 1 2 . 32 5 . U n l e s s t h i s is w h a t w e m e a n ,t h e r e w o u l d b e n o p o i n t i n a d d i n g t h e l a s t d e c i m a l f i g u r e t o o u r o r i g i n a l m e a -s u r e m e n t s . If w e d o a d d a n o t h e r fig ure, w e m u s t i m p l y a n i n c r e a s e i n p r e c i s i o n .W e s ee , t h e r e f o r e , t h a t a c c u r a c y a n d p r e c i s i o n in n u m b e r s a r e n o t a b s o l u t e c o n -c e p t s , b u t a r e r e l a ti v e . A s s u m i n g t h e r e i s n o b i a s , a n u m b e r b e c o m e s i n c r e a s i n g l ym o re ac cu ra t e a s we a r e ab l e t o w r i t e m o re s i g n i f i can t figure s f o r i t ( i n c re a se i t sp r e c i s i o n ) . T o i l l u s t r a t e t h i s c o n c e p t of t h e r e l a t i v i t y o f a c c u r a c y , c o n s i d e r t h ef o l l o w i n g t h r e e n u m b e r s :

    Implied limits

    1 9 3 1 9 2 . 5 1 9 3 . 51 9 2 . 8 1 9 2 . 7 5 1 9 2 . 8 51 9 2 . 7 6 1 9 2 . 7 5 5 1 9 2 . 7 6 5

    W e m a y i m a g i n e t h e s e n u m b e r s t o b e r e c o r d e d m e a s u r e m e n t s o f t h e s a m e s t r u c -t u r e . L e t u s a s s u m e t h a t w e h a d e x t r a m u n d a n e k n o w l e d g e t h a t th e t r u e l e n g t ho f t h e g i v e n s t r u c t u r e w a s 1 9 2 .7 5 8 u n i t s . If t h a t w e r e so , t h e t h r e e m e a s u r e m e n t sw o u l d i n c r e a s e i n a c c u r a c y f r o m t h e t o p d o w n , a s t h e i n t e r v a l b e t w e e n t h e i ri m p l i e d l i m i t s d e c r e a s e d . Y o u w il l n o t e t h a t t h e i m p l i e d li m i t s o f t h e t o p m o s tm e a s u r e m e n t a r e w i d e r t h a n t h o s e o f t h e o n e b e l o w it, w h i c h in t u r n a r e w i d e rt h a n t h o s e o f t h e t h i r d m e a s u r e m e n t .

    M e r i s t ic v a r i a t e s , t h o u g h o r d i n a r i l y e x a c t , m a y b e r e c o r d e d a p p r o x i m a t e l yw h e n l a r g e n u m b e r s a r e i n v o l v e d . T h u s w h e n c o u n t s a r e r e p o r t e d t o t h e n e a r e s tt h o u s a n d , a c o u n t o f 3 6 , 0 0 0 i n s e c t s i n a c u b i c m e t e r o f s o i l , f o r e x a m p l e , i m p l i e st h a t t h e t r u e n u m b e r v a r i e s s o m e w h e r e f r o m 3 5 , 5 0 0 t o 3 6 , 5 0 0 i n s e c t s .

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    25/373

    1 2 CH APT ER 2 / DATA IN BIOSTATISTICS

    o n e , a n e a s y r u l e t o r e m e m b e r i s t h a t the num ber of unit steps from the smallestto the largest m easurement in an array shou ld usually be between 30 a n d 300.T h u s , if w e a r e m e a s u r i n g a se r i e s o f s h e l ls t o t h e n e a r e s t m i l l i m e t e r a n d t h el a rge s t is 8 m m an d t h e smal l e s t is 4 m m w ide , t he re a re on ly fo u r un i t s t ep sb e t w e e n t h e l a r g e s t a n d t h e s m a l l e s t m e a s u r e m e n t . H e n c e , w e s h o u l d m e a s u r eo u r s h e l l s t o o n e m o r e s i g n i f i c a n t d e c i m a l p l a c e . T h e n t h e t w o e x t r e m e m e a s u r e -m e n t s m i g h t b e 8 . 2 m m a n d 4 . 1 m m , w i t h 4 1 u n i t s t e p s b e t w e e n t h e m ( c o u n t i n gt h e l a s t s i g n i f i c a n t d i g i t a s t h e u n i t ) ; t h i s w o u l d b e a n a d e q u a t e n u m b e r o f u n i ts t eps . The reason fo r such a ru l e i s t ha t an e r ro r o f 1i n t he l a s t s i gn i f i ca n t d ig i to f a r e a d i n g o f 4 m m w o u l d c o n s t i t u t e a n i n a d m i s s i b l e e r r o r o f 2 5 % , b u t a n e r r o rof 1in th e las t d ig i t of 4 .1 i s l ess th a n 2 .5% . S im i lar ly , if we m e a su re d th e he igh to f t he t a l l e s t o f a s e r ie s of p l an t s a s 173 .2 cm a n d t ha t o f t he s ho r t e s t o f t h esep l a n t s a s 2 6 .6 c m , t h e d i f f e r e n c e b e t w e e n t h e s e li m i t s w o u l d c o m p r i s e 1 4 6 6 u n i ts t e p s (o f 0 .1 c m ) , w h i c h a r e f a r t o o m a n y . I t w o u l d t h e r e f o r e b e a d v i s a b l e t orec o r d t he he ig h t s t o t he ne a re s t cen t im ete r , a s fo l l ows : 173 cm fo r t he t a l l e s tan d 27 cm fo r t he sh o r t es t . Th i s wou ld y i e ld 146 un i t s t eps . U s in g t he ru l e w ehave s t a t ed fo r t he number o f un i t s t eps , we sha l l r eco rd two o r t h ree d ig i t s fo rm o s t m e a s u r e m e n t s .

    T he l a s t d ig i t sh ou ld a lw ay s be s i gn i f i can t ; t h a t i s, i t sh ou ld imp ly a r an gef o r t h e t r u e m e a s u r e m e n t o f f r o m h a l f a " u n i t s t e p " b e l o w t o h a l f a " u n i t s t e p "above t he r eco rded sco re , a s i l l u s t r a t ed ea r l i e r . Th i s app l i es t o a l l d ig i t s , ze roi n c l u d e d . Z e r o s s h o u l d t h e r e f o r e n o t b e w r i t t e n a t t h e e n d of a p p r o x i m a t e n u m -bers t o t he r i gh t o f t he dec imal po in t un l es s t hey a re mean t t o be s i gn i f i can td ig i t s . Thus 7 .80 must imply the l imi t s 7 .795 to 7 .805. I f 7 .75 to 7 .85 i s impl ied ,t h e m e a s u r e m e n t s h o u l d b e r e c o r d e d a s 7 . 8 .

    W h e n t h e n u m b e r o f s i g n i f i c a n t d i g i t s is t o b e r e d u c e d , w e c a r r y o u t t h ep roces s o f rounding off n u m b e r s . T h e r u l e s f o r r o u n d i n g o f f a r e v e ry s im p l e . Adigi t to be rounded off i s not changed i f i t i s fo l lowed by a d ig i t l ess than 5 . I ft he d ig i t t o be ro u nd ed o f f is fo l l o w ed by a d ig i t g re a t e r t h an 5 o r by 5 fo l l o w edby o t he r no nz er o d ig i t s , it is i nc rea sed by 1. W he n th e d ig i t t o be rou nd ed o f fis fo l l o w ed by a 5 s t an d i n g a lon e o r a 5 fo l l o w ed by ze ros , it is un ch an ge d if itis ev en b ut in cre ase d by 1 if it is od d. Th e re as on fo r th i s l ast ru le is th at w he ns u c h n u m b e r s a r e s u m m e d i n a l o n g s e r i e s , w e s h o u l d h a v e a s m a n y d i g i t sr a i s e d a s a r c b e i n g l o w e r e d , o n t h e a v e r a g e ; t h e s e c h a n g e s s h o u l d t h e r e f o r eb a l a n c e o u t . P r a c t i c e t h e a b o v e r u l e s b y r o u n d i n g o ff t h e f o l l o w i n g n u m b e r s t ot h e i n d i c a t e d n u m b e r o f s i g n i f i c a n t d i g i ts :

    Number Significant digits desired Answer2 6 . 5 8

    1 3 3 . 7 1 3 70 . 0 3 7 2 50 . 0 3 7 1 5

    533

    2 71 3 3 . 7 1

    0 . 0 3 7 20 . 0 3 7 28.000

    1 7 . 31 8 , 3 1 61 7 . 3 4 7 6 3

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    26/373

    2 . 4 / D E R I V E D V A RI A BL E S 1 3

    M o s t p o c k e t c a l c u l a t o r s o r l a r g e r c o m p u t e r s r o u n d o ff t h e i r d i s p l a y s u s i n ga d i f f e r e n t r u l e : t h e y i n c r e a s e t h e p r e c e d i n g d i g i t w h e n t h e f o l l o w i n g d i g i t i s a5 s t a n d i n g a l o n e o r w i t h t r a i l i n g z e r o s . H o w e v e r , si n c e m o s t of t h e m a c h i n e su s a b l e f o r s t a t i s t i c s a l s o r e t a i n e i g h t o r t e n s i g n i f i c a n t fig ures i n t e r n a l l y , t h ea c c u m u l a t i o n o f r o u n d i n g e r r o r s is m i n i m i z e d . I n c i d e n t a l l y , if t w o c a l c u l a t o r sg ive an sw er s w i th s l i gh t d i f f e re nc es i n t h e f inal ( l e a s t s i g n i f i can t ) d ig i t s , su sp ec ta d i f f e r e n t n u m b e r o f s i g n i f i c a n t d i g i t s in m e m o r y a s a c a u s e o f t h e d i s a g r e e m e n t .

    2 .4 Der ived var iab lesT h e m a j o r i t y of v a r i a b l e s in b i o m e t r i c w o r k a r e o b s e r v a t i o n s r e c o r d e d a s d i re c tm e a s u r e m e n t s o r c o u n t s o f b i o l o g i c a l m a t e r i a l o r a s r e a d i n g s t h a t a r e t h e o u t p u to f v a r i o u s t y p e s o f i n s t r u m e n t s . H o w e v e r , t h e r e is a n i m p o r t a n t c l a s s o f v a r i a b l e si n b i o l o g i c a l r e s e a r c h t h a t w e m a y ca l l t h e derived o r comp uted variables. T h e s ea r e g e n e r a l l y b a s e d o n t w o o r m o r e i n d e p e n d e n t l y m e a s u r e d v a r i a b l e s w h o s er e l a t i o n s a r e e x p r e s s e d i n a c e r t a i n w a y . W e a r e r e f e r r i n g t o r a t i o s , p e r c e n t a g e s ,c o n c e n t r a t i o n s , i n d i c e s , r a t e s , a n d t h e l i k e .

    A ratio e x p r e s s e s a s a s i n g l e v a l u e t h e r e l a t i o n t h a t t w o v a r i a b l e s h a v e , o n et o t h e o t h e r . I n i ts s i m p l e s t f o r m , a r a t i o is e x p r e s s e d a s i n 6 4 : 2 4 , w h i c h m a yr e p r e s e n t t h e n u m b e r of w i l d - t y p e v e r s u s m u t a n t i n d i v i d u a l s , t h e n u m b e r o fm a l e s v e r s u s f e m a l e s , a c o u n t of p a r a s i t i z e d i n d i v i d u a l s v e r s u s t h o s e n o t p a r a -s i t i z e d , a n d s o o n . T h e s e e x a m p l e s i m p l y r a t i o s b a s e d o n c o u n t s . A r a t i o b a s e do n a c o n t i n u o u s v a r i a b l e m i g h t b e s i m i l a r l y e x p r e s s e d a s 1 . 2 :1 . 8 , w h i c h m a yre pr e s en t t he ra t i o o f w id th t o l en g th i n a sc l e r i t e o f an i nse c t o r t h e r a t i ob e t w e e n t h e c o n c e n t r a t i o n s o f t w o m i n e r a l s c o n t a i n e d i n w a t e r o r s o il . R a t i o sm a y a l s o b e e x p r e s s e d a s f r a c t i o n s ; t h u s , t h e t w o r a t i o s a b o v e c o u l d b e e x p r e s s e da s f | a n d f ^ - . H o w e v e r , f o r c o m p u t a t i o n a l p u r p o s e s it is m o r e u s e f u l t o e x p r e s st h e r a t i o a s a q u o t i e n t . T h e t w o r a t i o s c i te d w o u l d t h e r e f o r e b e 2 . 6 6 6 . . . a n d0 . 6 6 6 . . . , r e s p e c ti v e l y . T h e s e a r e p u r e n u m b e r s , n o t e x p r e s s e d i n m e a s u r e m e n tu n i t s o f a n y k i n d . I t i s t h i s f o r m f o r r a t i o s t h a t w e s h a l l c o n s i d e r f u r t h e r .Percentages a r e a l s o a t y p e o f r a t i o . R a t i o s , p e r c e n t a g e s , a n d c o n c e n t r a t i o n sa r e b a s i c q u a n t i t i e s in m u c h b i o l o g i c a l r e s e a r c h , w i d e l y u s e d a n d g e n e r a l l yf a m i l i a r .

    A n index is the ratio of the value o f one variable to the value of a so-calledstandard one. A w e l l - k n o w n e x a m p l e o f a n i n d e x i n t h i s s e n s e is t h e c e p h a l i ci n d e x i n p h y s i c a l a n t h r o p o l o g y . C o n c e i v e d i n t h e w i d e s e n s e , a n i n d e x c o u l db e t h e a v e r a g e o f t w o m e a s u r e m e n t s e i t h e r s i m p l y , s u c h a s { ( l e n g t h o f A +l e n g t h of ), o r in w e i g h t e d f a s h i o n , s u c h a s ^ [ ( 2 l e n g t h o f A) + l e n g t h o f B\.

    Rates a r e i m p o r t a n t in m a n y e x p e r i m e n t a l field s o f b i o l o g y . T h e a m o u n to f a s u b s t a n c e l i b e r a t e d p e r u n i t w e i g h t o r v o l u m e of b i o l o g i c a l m a t e r i a l , w e i g h tg a i n p e r u n i t t i m e , r e p r o d u c t i v e r a t e s p e r u n i t p o p u l a t i o n s i ze a n d t i m e ( b i r t hr a t e s ) , a n d d e a t h r a t e s w o u l d f a ll i n t h i s c a t e g o r y .

    T h e u s e of r a t i o s a n d p e r c e n t a g e s is d e e p l y i n g r a i n e d in s c i e n t if i c t h o u g h t .O f t e n r a t i o s m a y b e t h e o n l y m e a n i n g f u l w a y to i n t e r p r e t a n d u n d e r s t a n d c e r -

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    27/373

    1 4 C HA P T E R 2 / DAT A IN B IOS T AT IS T IC S

    o p e r a t e s o n t h e r a t i o o f t h e v a r i a b l e s s t u d i e d , o n e m u s t e x a m i n e t h i s r a t i o t ou n d e r s t a n d t h e p r o c e s s . T h u s , S i n n o t t a n d H a m m o n d ( 1 93 5 ) f o u n d t h a t i n h e r i -t a n c e o f t h e s h a p e s o f s q u a s h e s o f t h e s p e c i e s Cucurb ita pepo c o u l d b e i n t e r -p r e t e d t h r o u g h a f o r m i n d e x b a s e d o n a l e n g t h - w i d t h r a t i o , b u t n o t t h r o u g ht h e i n d e p e n d e n t d i m e n s i o n s of s h a p e . B y s i m i l a r m e t h o d s o f i n v e s t i g a t i o n , w es h o u l d b e a b l e t o fin d s e l e c t i o n a f f e c t i n g b o d y p r o p o r t i o n s t o e x i s t i n t h e e v o l u -t i o n o f a l m o s t a n y o r g a n i s m .

    T h e r e a r e s e v e r a l d i s a d v a n t a g e s t o u s i n g r a t i o s . F i r s t , t h e y a r e r e l a t i v e l yi n a c c u r a t e . L e t u s r e t u r n t o t h e r a t i o m e n t i o n e d a b o v e a n d r e c a ll f r o m t h ep r e v i o u s s e c t io n t h a t a m e a s u r e m e n t of 1.2 i m p l i e s a t r u e r a n g e of m e a s u r e m e n to f t h e va r i a b l e f r om 1 .15 to 1 .25 ; s im i l a r ly , a m e a su r e m e n t o f 1.8 im p l i e s a r a n gef r o m 1 . 75 t o 1 .8 5. W e re a l iz e , t h e r e f o r e , t h a t t h e t r u e r a t i o m a y v a r y a n y w h e r ef r o m - f ^ J - t o - H i " , o r f r o m 0 . 6 2 2 t o 0 . 7 1 4 . W e n o t e a p o s s i b l e m a x i m a l e r r o r o f4 . 2% if 1.2 is a n o r i g i n a l m e a s u r e m e n t : (1 . 2 5 1 .2 )/ 1 .2 ; t h e c o r r e s p o n d i n g m a x i -m a l e r r o r f o r t h e r a t i o is 7 . 0 % : ( 0 . 7 1 4 - 0 . 6 6 7 ) / 0 . 6 6 7 . F u r t h e r m o r e , t h e b e s te s t i m a t e o f a r a t i o is n o t u s u a l l y t h e m i d p o i n t b e t w e e n i t s p o s s i b l e r a n g e s . T h u s ,i n o u r e x a m p l e t h e m i d p o i n t b e t w e e n t h e i m p l i e d l i m i t s is 0 . 6 6 8 a n d t h e r a t i oba se d o n 4~ is 0 .666 . . . ; wh i l e t h i s is on ly a s li gh t d i f f e r e n c e , t he d i sc r e pa nc ym a y b e g r e a t e r in o t h e r i n s t a n c e s .

    A s e c o n d d i s a d v a n t a g e t o r a t i o s a n d p e r c e n t a g e s is t h a t t h e y m a y n o t b ea p p r o x i m a t e l y n o r m a l l y d i s t r i b u t e d (s ee C h a p t e r 5 ) a s r e q u i r e d b y m a n y s t a ti s -t ic a l te s t s. T h i s d i f f i c u l ty c a n f r e q u e n t l y b e o v e r c o m e b y t r a n s f o r m a t i o n o f t h ev a r i a b l e ( a s d i s c u s s e d i n C h a p t e r 1 0). A t h i r d d i s a d v a n t a g e o f r a t i o s is t h a ti n u s i n g t h e m o n e l o s es i n f o r m a t i o n a b o u t t h e r e l a t i o n s h i p s b e t w e e n t h e t w ov a r i a b l e s e x c e p t f o r t h e i n f o r m a t i o n a b o u t t h e r a t i o i t s e l f .

    2.5 Frequency d is tr ibut ionsIf w e w e r e t o s a m p l e a p o p u l a t i o n o f b i r t h w e i g h t s of i n f a n t s , w e c o u l d r e p r e s e n te a c h s a m p l e d m e a s u r e m e n t b y a p o i n t a l o n g a n a x i s d e n o t i n g m a g n i t u d e o fb i r th w e igh t . Th i s i s i l l u s t r a t e d in F ig u r e 2 .1 A , f o r a s a m pl e o f 25 b i r th we igh t s .If w e s a m p l e r e p e a t e d l y f r o m t h e p o p u l a t i o n a n d o b t a i n 1 00 b i r t h w e i g h t s , w es h a l l p r o b a b l y h a v e t o p l a c e s o m e o f t h e s e p o i n t s o n t o p o f o t h e r p o i n t s ino r d e r t o r e c o r d t h e m a ll c o r r e c t l y ( F i g u r e 2.1 B ). A s w e c o n t i n u e s a m p l i n g a d -d i t i o n a l h u n d r e d s a n d t h o u s a n d s o f b i r t h w e i g h t s ( F i g u r e 2 . 1 C a n d D ) , t h ea s s e m b l a g e o f p o i n t s w i l l c o n t i n u e t o i n c r e a s e i n s i z e b u t w i l l a s s u m e a f a i r l yd e f i n i t e s h a p e . T h e o u t l i n e o f t h e m o u n d o f p o i n t s a p p r o x i m a t e s th e d i s t r i b u t i o no f t h e v a r i a b l e . R e m e m b e r t h a i a c o n t i n u o u s v a r i a b l e s u c h a s b i r t h w e i g h t c a na s s u m e a n i n f i n i t y o f v a l u e s b e t w e e n a n y t w o p o i n l s o n t h e a b s c i s s a . T h e r e f i n e -m e n t o f o u r m e a s u r e m e n t s w ill d e t e r m i n e h o w f i ne t h e n u m b e r o f r e c o r d e dd i v i s i o n s b e t w e e n a n y t w o p o i n t s a l o n g t h e a x i s w i l l b e .

    T h e d i s t r i b u t i o n of a v a r i a b l e is o f c o n s i d e r a b l e b i o l o g i c a l i n t e r e s t . If w ef in d t h a i t h e di s l r i b u t i o n is a s y m m e t r i c a l a n d d r a w n o u t i n o n e d i r e c t i o n , it t el l su s t h a t t h e r e i s. p e r h a p s , s e l e c t i o n t h a t c a u s e s o r g a n i s m s t o f al l p r e f e r e n t i a l l yi n o n e o f t h e t a i l s o f t h e d i s t r i b u t i o n , o r p o s s i b l y t h a t t h e s c a l e o f m e a s u r e m e n t

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    28/373

    2 . 5 / FRE QUE NCY DIST RIBUT IONS

    10 l /0

    10

    I III I . ll.l I.

    . I. . . . i l . . i . i . l l i l i l i l l i lH i h ul l Li.11 ,,

    1 5

    2 5

    100

    30 r

    2

    10

    05 0 0

    i I L

    7 0

    6

    5 0

    4 0

    3 0

    2

    10

    0 ll. 11 111

    2

    n i " l -t .l6 0 7 0 8 0 9 0 1 0 0 1 1 0 1 2 0 1 3 0 1 4 0 1 5 0 1 6 0

    B i r t h w e i g h t ( o z )f i g u r k 2 . 1S a m p l i n g f r o m ;i p o p u l a t i o n o f b i r t h w e i g h t s of i n f a n t s ( a c o n t i n u o u s v a r i a b l e ) . . s a m p l e of 25 . . s a m pl e o f KM). C. A sa m pl e o f 500 . D . s a m pl e o f 2(XX).

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    29/373

    1 6 CH APT ER 2 / DATA IN BIOSTATISTICS

    200 -

    150 -

    J J _ F I G U R E 2 . 22 ' " " B a r d i a g r a m . F r e q u e n c y o f t h e s e d g e Car ex

    flacca i n 5 0 0 q u a d r a t s . D a t a f r o m T a b l e 2 .2 ;I o r g i n a l l y f r o m A r c h i b a l d ( 1 9 5 0 ).

    0 1 2 3 4 5 (i 7 SN u m b e r o f p l a n t s q u a d r a t

    c h o s e n i s s u c h a s t o b r i n g a b o u t a d i s t o r t i o n o f t h e d i s t r i b u t i o n . If , in a s a m p l eo f i m m a t u r e in s e c ts , w e d i s c o v e r t h a t t h e m e a s u r e m e n t s a r e b i m o d a l l y d i s t r i b -u t e d (w i t h t w o p e a k s ) , t h i s w o u l d i n d i c a t e t h a t t h e p o p u l a t i o n is d i m o r p h i c .T h i s m e a n s t h a t d i f f e r e n t s p e c i e s o r r a c e s m a y h a v e b e c o m e i n t e r m i n g l e d ino u r s a m p l e . O r t h e d i m o r p h i s m c o u l d h a v e a r i s e n f r o m t h e p r e s e n c e o f b o t hse xe s o r o f d i f f e r e n t i n s t a r s .

    T h e r e a r e s e v e r a l c h a r a c t e r i s t i c s h a p e s o f f r e q u e n c y d i s t r i b u t i o n s . T h e m o s tc o m m o n is t h e s y m m e t r i c a l b e ll s h a p e ( a p p r o x i m a t e d b y t h e b o t t o m g r a p h inF i g u r e 2 .1 ), w h i c h i s t h e s h a p e of t h e n o r m a l f r e q u e n c y d i s t r i b u t i o n d i s c u s s e din C h a p t e r 5 . T h e r e a r e a l s o s k e w e d d i s t r i b u t i o n s ( d r a w n o u t m o r e a t o n e t a ilt h a n t h e o t h e r ) , L - s h a p e d d i s t r i b u t i o n s a s in F i g u r e 2.2 , U - s h a p e d d i s t r i b u t i o n s ,a n d o t h e r s , a ll o f w h i c h i m p a r t s ig n i f i c a n t i n f o r m a t i o n a b o u t t h e r e l a t i o n s h i p st h e y r e p r e s e n t . W e s h a l l h a v e m o r e t o s a y a b o u t t h e i m p l i c a t i o n s o f v a r i o u st y p e s o f d i s t r i b u t i o n s in l a t e r c h a p t e r s a n d s e c t i o n s .

    A f t e r r e s e a r c h e r s h a v e o b t a i n e d d a t a i n a g i v e n s t u d y , t h e y m u s t a r r a n g et h e d a t a in a f o r m s u i t a b l e f o r c o m p u t a t i o n a n d i n t e r p r e t a t i o n . W e m a y a s s u m et h a t v a r i a t e s a r c r a n d o m l y o r d e r e d i n i t i a l l y o r a r e i n t h e o r d e r i n w h i c h t h em e a s u r e m e n t s h a v e b e en t a k e n . A s i m p l e a r r a n g e m e n t w o u l d b e a n array ofthe da t a by o r de r o f m a g n i tu de . Th u s , f o r e x a m pl e , t he va r i a t e s 7 , 6 , 5 , 7 , 8 , 9 ,6 , 7 , 4 , 6 , 7 c ou ld be a r r a ye d in o r d e r o f de c r e a s in g m a g n i t u d e a s f o l lo ws : 9 . 8 ,7 , 7 , 7 , 7 , 6 , 6 , 6 , 5 , 4 . W h e re th e r e a r e so m e v ar ia te s of th e sa m e va lue , such ast h e 6 's a n d 7 ' s in t h i s F i c ti ti o u s e x a m p l e , a t i m e - s a v i n g d e v i c e m i g h t i m m e d i a t e l yh a v e o c c u r r e d t o y o u n a m e l y , t o list a f r e q u e n c y f o r e a c h of t h e r e c u r r i n gva r ia tes ; thu s : 9 , 8 , 7 (4 ). 6 (3 ), 5 , 4 . Su ch a sh o r t h a n d n o ta t i o n is o n e w ay tor e p r e s e n t a frcqucncy distribution, w h i c h is s i m p l y a n a r r a n g e m e n t o f t h e c l a s s e so f v a r i a t e s w i t h t h e f r e q u e n c y o f e a c h c l a s s i n d i c a t e d . C o n v e n t i o n a l l y , a f r e -q u e n c y d i s t r i b u t i o n is s t a t e d in t a b u l a r f o r m ; f o r o u r e x a m p l e , t h i s is d o n e a sf o l l o w s :

  • 7/21/2019 Introduction.to.Biostatistics.2nd.ed Ublog.tk

    30/373

    2 . 5 / FRE QU E NCY DIST RIBUT ION S 1 7

    Variable FrequencyV /9 I8 17 46 35 14 1

    T h e a b o v e is a n e x a m p l e o f a quantitative frequency distribution, s i n c e Y isc l ea r ly a m e a s u r e m e n t v a r i a b le . H o w e v e r , a r r a y s a n d f r e q u e n c y d i s t r i b u t i o n sn e e d n o t b e l i m i t e d t o s u c h v a r i a b l e s . W e c a n m a k e f r e q u e n c y d i s t r i b u t i o n s o fa t t r i b u t e s , c a l l e d qualitative frequency distributions. I n t h e s e , t h e v a r i o u s c l a s s e sa r e l i s t e d i n s o m e l o g i c a l o r a r b i t r a r y o r d e r . F o r e x a m p l e , i n g e n e t i c s w e m i g h th a v e a q u a l i t a t i v e f r e q u e n c y d i s t r i b u t i o n a s f o l l o w s :

    Phenolype JA - 8 6an 32

    T h i s t e l l s u s t h a t t h e r e a r e t w o c l a s s e s o f i n d i v i d u a l s , t h o s e i d e n t i f e d b y t h e A -p h e n o t y p e , o f w h i c h 8 6 w e r e f o u n d , a n d t h o s e c o m p r i s i n g t h e h o n i o z y g o t e r e-ce ss ive aa, o f w h i c h 3 2 w e r e s e e n in t h e s a m p l e .

    A n e x a m p l e o f a m o r e e x t e n s i v e q u a l i t a t i v e f r e q u e n c y d i s t r i b u t i o n i s g i v e ni n T a b l e 2 .1 , w h i c h s h o w s th e d i s t r i b u t i o n o f m e l a n o m a (a t y p e o f s k i n c a n c e r )o v e r b o d y r e g i o n s i n m e n a n d w