Visual Concept Detection and Linked Open Data at...

23

Felix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept Detection and Linked Open Data at the TIB AV- Portal

Upload
tranbao
Category

Documents
view
214
download
0

Embed Size (px):

Transcript of Visual Concept Detection and Linked Open Data at...

Page 1: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Felix Saurbier, Matthias Springstein

Hamburg, November 6

SWIB 2017

Visual Concept Detection and

Linked Open Data at the TIB AV-

Portal

Page 2: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Agenda

1. TIB and TIB AV-Portal

2. Automated Video Analysis

3. Visual Concept Detection

4. Data Quality

5. Data Model

6. Data Publication & Reuse

Page 3: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Agenda

1. TIB and TIB AV-Portal

2. Automated Video Analysis

3. Visual Concept Detection

4. Data Quality

5. Data Model

6. Data Publication & Reuse

Page 4: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 4

Technische Informationsbibliothek (TIB)

German National Library of Science and Technology

University Library at Hannover

The world’s largest science and technology library

An infrastructure provider for the whole scientific work process

TIB strategy: Move beyond text

Competence Centre for Non-Textual Materials

Visual Analytics Research Group

Page 5: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 5

Platform for quality-tested scientific videos

Online since April 2014

Developed by TIB and Hasso Plattner Institute

TIB AV-Portal (av.tib.eu)

11,500 Videos (December 2017)

Conference recordings, lectures, experiments, video

abstracts, simulations, animations

Videos predominantly under open access licenses

Automatic metadata enrichment, DOI/MFID,

long-term preservation, semantic search

Page 6: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Agenda

1. TIB and TIB AV-Portal

2. Automated Video Analysis

3. Visual Concept Detection

4. Data Quality

5. Data Model

6. Data Publication & Reuse

Page 7: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 7

Scene Recognition (SBD)

Speech Recognition (ASR)

Image Recognition (VCD)

Named Entity Linking (NEL)

Text Recognition (OCR)

Video Analysis – Process

Page 8: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 8

Video Analysis – Results

Video Segments

Audio Transcript

Named Entities

Page 9: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 9

Video Analysis – Results (VCD)

Video Keyframes

Visual Concepts

Page 10: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Agenda

1. TIB and TIB AV-Portal

2. Automated Video Analysis

3. Visual Concept Detection

4. Data Quality

5. Data Model

6. Data Publication & Reuse

Page 11: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 11

Visual Concept Detection – Supervised Learning

Supervised Learning Pipeline

Training: Modify the model parameters to reduce the classification loss

Prediction: Use the trained model to propagate the label of new data

Page 12: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 12

Visual Concept Detection – Previous Approach

SIFT BoVW SVM

System is trained on a manually annotated dataset with over 8000 images

Classification of 49 visual concepts (16 deployed)

Page 13: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 13

Visual Concept Detection – Current Approach

Utilizing a deep learning approach (Convolutional Neural Network)

Training feature extraction and classifier model together

Page 14: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 14

Dataset

System is trained on a semi-supervised dataset with 50,000 images

Utilizing Google Image Search to find training samples

VCD Modul

Using Inception-Resnet-v2 network structure designed by Google

Neural network pre-trained with one million images

Classification of 73 visual concepts

Trained for 40 epochs

Visual Concept Detection – Current Approach

Page 15: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Agenda

1. TIB and TIB AV-Portal

2. Automated Video Analysis

3. Visual Concept Detection

4. Data Quality

5. Data Model

6. Data Publication & Reuse

Page 16: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 16

Validation during training

Using 1100 manually annotated images

Estimate the mean average precision for each concept

0.33 mAP over all concepts

Compute the F1-Score to determine thresholds for the binary label

Testing

Separate testing for the whole processing pipeline

Future Work

Adjust the threshold

Filter noisy images in the training dataset

Data Quality

Page 17: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Agenda

1. TIB and TIB AV-Portal

2. Automated Video Analysis

3. Visual Concept Detection

4. Data Quality

5. Data Model

6. Data Publication & Reuse

Page 18: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 18

Data Model

Vocabularies

Bibframe Vocabulary

DCMI Metada Terms

DCMI Type Vocabulary

Friend of a Friend Vocabulary

Open Annotation Data Model

NLP Interchange Format

Internationalization Tag Set (ITS) Ontology

https://av.tib.eu/opendata

tib:vcd/15907_1291662_30904

oa:hasTarget tib:video/15907#t=smpte-25:0:20:36:04 ;

oa:annotatedBy tib:annotator/VCD-1.0.0 ;

oa:hasBody tib:visualconcepts/molecular_geometry .

tib:visualconcepts/molecular_geometry skos:related gnd:4170383-2 .

Resource Description Framework (RDF)

Page 19: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 19

Data Model

tib:video/15907

tib:video/15907#t=smpte-25:0:20:36:04

tib:vcd/15907_1291662_30904

dcterms:isPartOf

oa:hasTarget

oa:annotation

rdf:type

tib:annotator/VCD-1.0.0

oa:annotatedBy

tib:visualconcepts/molecular_geometry

oa:hasBody

oa:semanticTag

rdf:type

skos:related

gnd:4170383-2

wd:Q911331

Page 20: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Agenda

1. TIB and TIB AV-Portal

2. Automated Video Analysis

3. Visual Concept Detection

4. Data Quality

5. Data Model

6. Data Publication & Reuse

Page 21: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 21

CC0 RDF dumps

Dereferencable URIs & content negotiation with LodView

LDF server at https://labs.tib.eu/ldf

Planned: public SPARQL endpoint

Metadata Publication & Linked Open Data

Page 22: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Page 22

Library catalogues & discovery services

Virtual libraries

Interlinking & Mash-Up

Reuse

Page 23: Visual Concept Detection and Linked Open Data at …swib.org/swib17/slides/saurbier_visual-concept.pdfFelix Saurbier, Matthias Springstein Hamburg, November 6 SWIB 2017 Visual Concept

Contact

Felix Saurbier

T +49 511 762-14645, [email protected]

More Infos

[email protected]

av.tib.eu

State Workforce Innovation Board (SWIB) Meeting Presentationswib.mt.gov/Portals/150/Documents/Meetings/6-8...• In Fall 2015, the Department of Commerce requested $80.4 million from

State Workforce Innovation Board (SWIB) Meeting Presentationswib.mt.gov/Portals/150/Documents/Meetings/6-8...• In Fall 2015, the Department of Commerce requested $80.4 million from

SWIB Semantic Web in Libraries swib

SWIB Semantic Web in Libraries swib

SWIB 2010: Linked Open Projects

SWIB 2010: Linked Open Projects

Wikidata - SWIB

Wikidata - SWIB

Swissbib Goes Linked Data - SWIB17swib.org/swib16/slides/bensmann_swissbib.pdf · Swissbib Goes Linked Data linked.swissbib.ch SWIB 2016 ... Balancing performance and LOD • ElasticSearch

Swissbib Goes Linked Data - SWIB17swib.org/swib16/slides/bensmann_swissbib.pdf · Swissbib Goes Linked Data linked.swissbib.ch SWIB 2016 ... Balancing performance and LOD • ElasticSearch

Will you be my bf: forever?swib.org/swib17/slides/bigelow_bf-forever.pdf · 2017. 12. 7. · Overview of the Casalini SHARE VDE Project An @Cult and Casalini Libri partnership “ALIADA

Will you be my bf: forever?swib.org/swib17/slides/bigelow_bf-forever.pdf · 2017. 12. 7. · Overview of the Casalini SHARE VDE Project An @Cult and Casalini Libri partnership “ALIADA

enrichment practices in digital libraries: steps towards ...swib.org/swib15/slides/charles_enrichment.pdf · Evaluation of metadata enrichment practices in digital libraries: steps

enrichment practices in digital libraries: steps towards ...swib.org/swib15/slides/charles_enrichment.pdf · Evaluation of metadata enrichment practices in digital libraries: steps

Hamburg 2017 Around Town - SWIB · Hamburg 2017 Around Town Tips and Information Welcome to the SWIB17 from 4 to 6 December 2017! ... Tanz der Vampire Theater an der Elbe Stage Theatre

Hamburg 2017 Around Town - SWIB · Hamburg 2017 Around Town Tips and Information Welcome to the SWIB17 from 4 to 6 December 2017! ... Tanz der Vampire Theater an der Elbe Stage Theatre

SWIB 2013 Tutorial on · Named Graphs RDF 1.1 14:30 Short Break (15 min) Part 1 Linked Data Provenance. SWIB 2013 Tutorial on Metadata Provenance 5 Agenda 14:45 Metamodels in Practice

SWIB 2013 Tutorial on · Named Graphs RDF 1.1 14:30 Short Break (15 min) Part 1 Linked Data Provenance. SWIB 2013 Tutorial on Metadata Provenance 5 Agenda 14:45 Metamodels in Practice

When Semantics support Multilingual Access to …swib.org/swib14/slides/charles_swib14_8.pdfWhen Semantics support Multilingual Access to Cultural Heritage The Europeana Case Valentine

When Semantics support Multilingual Access to …swib.org/swib14/slides/charles_swib14_8.pdfWhen Semantics support Multilingual Access to Cultural Heritage The Europeana Case Valentine

Lessons from representing library metadata in OCLC Research's …swib.org/swib19/slides/09_smith-yoshimura_lessons-from... · 2019. 11. 28. · WorldCat Godby, Jean, Karen Smith-

Lessons from representing library metadata in OCLC Research's …swib.org/swib19/slides/09_smith-yoshimura_lessons-from... · 2019. 11. 28. · WorldCat Godby, Jean, Karen Smith-

Using LOD to crowdsource Dutch WW2 underground newspapers ...swib.org/swib16/slides/janssen_using_lod.pdf · Using LOD to crowdsource Dutch WW2 underground newspapers on Wikipedia

Using LOD to crowdsource Dutch WW2 underground newspapers ...swib.org/swib16/slides/janssen_using_lod.pdf · Using LOD to crowdsource Dutch WW2 underground newspapers on Wikipedia

Building a BIBFRAME Catalog - SWIBswib.org/swib17/slides/trail_bibframe.pdf · • Daily nametitle and bib ingests from ILS to database to simulate the real catalog Nate Trail, NDMSO,

Building a BIBFRAME Catalog - SWIBswib.org/swib17/slides/trail_bibframe.pdf · • Daily nametitle and bib ingests from ILS to database to simulate the real catalog Nate Trail, NDMSO,

BIBFRAME - swib.orgswib.org/swib17/slides/denenberg-bibframe.pdf · BIBFRAME Ray Denenberg ... the play “Candide” Work: the book Candide” Work: ... Quintet: score bf:NotatedMusic

BIBFRAME - swib.orgswib.org/swib17/slides/denenberg-bibframe.pdf · BIBFRAME Ray Denenberg ... the play “Candide” Work: the book Candide” Work: ... Quintet: score bf:NotatedMusic

Entitifying Europeana: Building an ecosystem of …swib.org/swib16/slides/manguinhas_europeana.pdf · Europeana Linked Data Strategy . ... Building an ecosystem of networked references

Entitifying Europeana: Building an ecosystem of …swib.org/swib16/slides/manguinhas_europeana.pdf · Europeana Linked Data Strategy . ... Building an ecosystem of networked references

The OpenCat Prototype: linking Public Libraries to ...swib.org/swib13/slides/simon_swib13_104.pdf · Logilab (specialists in SemWebTech) Fresnes’ library has been retrieving data

The OpenCat Prototype: linking Public Libraries to ...swib.org/swib13/slides/simon_swib13_104.pdf · Logilab (specialists in SemWebTech) Fresnes’ library has been retrieving data

Dario Taraborelli - swib.orgswib.org/swib17/slides/taraborelli_unlocking.pdf · “The visualization shows a structure of science that is well known from earlier large-scale bibliometric

Dario Taraborelli - swib.orgswib.org/swib17/slides/taraborelli_unlocking.pdf · “The visualization shows a structure of science that is well known from earlier large-scale bibliometric

Improving data quality at Europeana - swib.org · Improving data quality at Europeana New requirements and methods for better measuring metadata quality . Péter Király. 1, Hugo

Improving data quality at Europeana - swib.org · Improving data quality at Europeana New requirements and methods for better measuring metadata quality . Péter Király. 1, Hugo

Hamburg 2017 Around Townswib.org/swib17/docs/hamburg-guide.pdf · 2017. 11. 27. · Hamburgische Staatsoper Hamburg State Opera Große Theaterstraße 25 20354 Hamburg T: +49 (0)40

Hamburg 2017 Around Townswib.org/swib17/docs/hamburg-guide.pdf · 2017. 11. 27. · Hamburgische Staatsoper Hamburg State Opera Große Theaterstraße 25 20354 Hamburg T: +49 (0)40

Hamburg, Germany SWIB 2017, 4 December 2017 Introduction ...

Hamburg, Germany SWIB 2017, 4 December 2017 Introduction ...

Languages

Pages

Legal

Copyright © 2022 FDOCUMENTS