Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

15
Towards Extrac-ng Author Networks from Secondary Literature Using Seman-c Similarity on Poe-c Corpora Paul Buitelaar INSIGHT @ NUIGalway

Transcript of Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

Page 1: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

Towards  Extrac-ng  Author  Networks  from  Secondary  Literature    

Using  Seman-c  Similarity  on  Poe-c  Corpora    

Paul  Buitelaar  INSIGHT  @  NUIGalway  

Page 2: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

Popula-ng  the  Women  Writers  Database  

•  NUIG  English  Department  •  Interns:  Margaret  Coleman,  Michael  Lydon  • Dr.  Marie-­‐Louise  Coolahan  

•  INSIGHT  @  NUIGalway  (Unit  for  Natural  Language  Processing  &  Knowledge  Discovery  Unit)  • Dr.  Brian  Davis,  Dr.  Georgeta  Bordea,  Dr.  Paul  Buitelaar  

Page 3: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

Overview  of  the  Database  

Page 4: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

From  Database  to  Text  

Title  Author  

RecepIon  Type  

Receiver  

Page 5: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

Rela-ons/Arguments  to  be  Extracted  I.  RecepIon  relaIons    

 1.  engage-­‐with      2.  transmission-­‐of      3.  owns      4.  engage-­‐with    

 II.  RelaIon  arguments:    

 X  (1)  Y      X  (2)  Y  to  Y'      X  (3)  Y      X  (4)  Z      Where  X  can  be  a  person,  group  or  organisaIon,  Y  is  a  text  by  a  female  author  Z,  and  Y'  can  be  a  person,  group  or  organisaIon.  

 III.  Example  of  trigger  words  for  each  relaIon:    

 1.  read,  like,  dislike,  imitate,  mine      2.  translate,  circulate,  print,  reprint      3.  –      4.  commission,  meeIng,  like  

Page 6: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

Annota-ng  Recep-ons  

Page 7: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

Work  completed  so  far  

•  Manually  annotated  3  Monographs  in  XML  (gold  standard)  for  RecepIon,  Authors  and  Works  – Woman,  WriIng  and  Language  in  Modern  Ireland  by  Dr.  Coolahan  

– Women  LaIn  Poets  by  Jane  Stevenson  –  Literary  RelaIons  by  Jane  Spenser  

•  Constructed  a  gaze\eer  (dicIonary)  for  – Works  –  Authors  –  Trigger  Verbs  for  RecepIon  (113)  

 

Page 8: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

Using  Seman-c  Similarity  on    Poe-c  Corpora  

•  NUIG  English  Department  • Dr.  JusIn  Tonra  

•  INSIGHT  @  NUIGalway  (Unit  for  Natural  Language  Processing)  • NiIsh  Aggarwal,  Dr.  Paul  Buitelaar  

Page 9: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

  Problem:  Can  we   idenIfy   and   trace   the   influence   of   Lord   Byron   on  Thomas  Moore’s  wriIng?  (19th  century  authors,  RomanIc  Orientalism)  

9  

Lord Byron Thomas Moore

Influence on Writing

Tracing  Author  Influence  in  Poetry  

Page 10: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

•  AutomaIc  comparison*  of  poems  by  Lord  Byron  and  Thomas  Moore  •  Use  of  ‘distribuIonal  semanIcs’  (measure  of  word  distribuIon)  

10  

Thomas Moore Calm is the wave-- heavn's brilliant lights Reflected dance beneath the prow; -- Time was when, on such lovely nights, She who is there, so desolate now, Could sit all cheerful, though alone, And ask no happier joy than seeing

Lord Byron Know ye the land where the cypress and myrtle Are emblems of deeds that are done in their clime, Where the rage of the vulture--the love of the turtle-- Now melt into sorrow--now madden to crime?-- Know ye the land of the cedar and vine?

*  Segments  with  high  probabilisIc  similarity  

Approach  

Page 11: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

Distribu-onal  Seman-cs  •  DistribuIonal  Hypothesis  

–  words  that  occur  in  the  same  contexts  tend  to  have  similar  meanings  (Harris,  1954)  

 

11  

D1   D2   D3   D4   D5  

book   0.40   0.12   0.14   0.03   0.13  

paper   0.17   0.14   0.10   0.02   0.17  

tree   0.04   0.02   0.03   0.13   0.40  

Page 12: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

Experiments  •  Data  set  –  Training  corpus:  Wikipedia  (to  be  replaced  by  poetry  corpus)  –  Sample  data:  4  poems  of  Byron,  4  poems  of  Moore  

•  Extract  ‘line  groups’  from  all  poems  –  201  line  groups  from  Byron  –  272  line  groups  from  Moore  

•  Calculate  ‘ESA  relatedness’  scores  –  Relatedness  between  every  line  group  of  Byron’s  poems  and  every  line  group  of  Moore’s  poems  

12  

Page 13: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

 Byron:    What    not  receive  my  foolish  flower?      Nay  then  I  am  indeed  unblest    On  me  can  thus  thy  forehead  lower?  And  knowst  thou  not  who  loves  thee  best?  Oh    Selim  dear!    Oh    more  than  dearest!  Say    is  it  I  thou  hatst  or  fearest?  Come    lay  thy  head  upon  my  breast    And  I  will  kiss  thee  into  rest    Since  words  of  mine    and  songs  must  fail    Even  from  my  fabled  nighIngale    I  knew  our  sire  at  Imes  was  stern    But  this  from  thee  had  yet  to  learn    Too  well  I  know  he  loves  thee  not    But  is  Zuleika  s  love  forgot?  Ah!  deem  I  right?  the  Pacha  s  plan      This  kinsman  Bey  of  Carasman  Perhaps  may  prove  some  foe  of  thine      If  so    I  swear  by  Mecca  s  shrine    If  shrines    that  neer  approach  allow  To  woman  s  step    admit  her  vow      Without  thy  free  consent    command      The  Sultan  should  not  have  my  hand!  Thinkst  thou  that  I  could  bear  to  part  With  thee    and  learn  to  halve  my  heart?  Ah!  were  I  severed  from  thy  side    Where  were  thy  friend    and  who  my  guide?  Years  have  not  seen    Time  shall  not  see  The  hour  that  tears  my  soul  from  thee      Even  Azrael  from  his  deadly  quiver  When  flies  that  shak    and  fly  it  must      That  parts  all  else    shall  doom  for  ever  Our  hearts  to  undivided  dust!    

 

 Moore:    Oh  !  curse  me  not      she  cried    as  wild  he  tossd      His  desperate  hand  tow  rds  heavn    though  I  am  lost        Think  not  that  guilt    that  falsehood  made  me  fall        No    no          twas  grief      twas  madness  did  it  all!      Nay    doubt  me  not        though  all  thy  love  hath  ceasd          I  know  it  hath      yet    yet  believe    at  least        That  every  spark  of  reason  s  light  must  be      Quenchd  in  this  brain    ere  I  could  stray  from  thee!      They  told  me  thou  wert  dead        why    Azim    why      Did  we  not    both  of  us    that  instant  die      When  we  were  parted  ?        oh  !  couldst  thou  but  know      With  what  a  deep  devotedness  of  woe      I  wept  thy  absence        oer  and  oer  again      Thinking  of  thee    sIll  thee    Ill  thought  grew  pain        And  memory    like  a  drop  that    night  and  day        Falls  cold  and  ceaseless    wore  my  heart  away  !      Didst  thou  but  know  how  pale  I  sat  at  home        My  eyes  sIll  turnd  the  way  thou  wert  to  come        And    all  the  long    long  night  of  hope  and  fear        Thy  voice  and  step  sIll  sounding  in  my  ear          Oh  God!  thou  wouldst  not  wonder  that    at  last        When  every  hope  was  all  at  once  oercast        When  I  heard  frighnul  voices  round  me  say      Azim  is  dead  !        this  wretched  brain  gave  way        And  I  became  a  wreck    at  random  driven        Without  one  glimpse  of  reason  or  of  Heaven            All  wild        and  evn  this  quenchless  love  within      Turnd  to  foul  fires  to  light  me  into  sin  !      Thou  piIest  me    I  knew  thou  wouldst    that  sky      Hath  nought  beneath  it  half  so  lorn  as  I        The  fiend    who  lurd  me  hither    hist!  come  near        Or  thou  too    thou  art  lost    if  he  should  hear            Told  me  such  things        oh!  with  such  devilish  art        As  would  have  ruind  evn  a  holier  heart          Of  thee    and  of  that  ever  radiant  sphere        Where  blessd  at  length    if  I  but  servd  him  here        I  should  for  ever  live  in  thy  dear  sight        And  drink  from  those  pure  eyes  eternal  light!      Think    think  how  lost    how  maddend  I  must  be        To  hope  that  guilt  could  lead  to  God  or  thee  !      Thou  weepst  for  me    do    weep    oh  !  that  I  durst      Kiss  off  that  tear  !  but    no    these  lips  are  curst        They  must  not  touch  thee            one  divine  caress        One  blessed  moment  of  forgenulness      I  ve  had  within  those  arms    and  that  shall  lie        Shrind  in  my  soul  s  deep  memory  Ill  I  die  !      The  last  of  joy  s  last  relics  here  below        The  one  sweet  drop    in  all  this  waste  of  woe        My  heart  has  treasurd  from  affecIon  s  spring        To  soothe  and  cool  its  deadly  withering  !      But  thou    yes    thou  must  go        for  ever  go          This  plaçe  is  not  for  thee    for  thee!  oh  no        Did  I  but  tell  thee  half    thy  torturd  brain      Would  burn  like  mine    and  mine  go  wild  again  !      Enough    that  Guilt  reigns  here        that  hearts  once  good        Now  tainted  child  and  broken    are  his  food            Enough    that  wie  are  parted      that  there  rolls      A  flood  of  headlong  fate  between  our  souls        Whose  darkness  severs  me  as  wide  from  thee      As  hell  from  heavn    to  all  eternity  !        

Page 14: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

 Related   Percentage    

Highly   26.5  

Maybe   46.5  

Not   27  

Some  Preliminary  Results  

Page 15: Extracting Author Networks & Using Semantic Similarity on Poetic Corpora - Paul Buitelaar

   

QUESTIONS?    

nlp.deri.ie