CIAT Workshop: Data Management Community of Practice

40
CIAT Workshop: Data Management Community of Practice www.ciat.cgiar.org Since 1967 / Science to cultivate change July 9 th 2015 – CIAT HQ, Cali Leroy Mwanzia Data & Information Manager Data Management COP Context

Transcript of CIAT Workshop: Data Management Community of Practice

CIAT Workshop: Data Management Community of Practice

www.ciat.cgiar.orgSince 1967 / Science to cultivate change

July 9th 2015 – CIAT HQ, CaliLeroy MwanziaData & Information Manager

Data Management COP Context

Do you believe CIATs work is important in tackling global challenges such as hunger and poverty?

¿Cree usted que el trabajo del CIAT es importante para enfrentar retos globales como el hambre y la pobreza?

Do you believe quality data contributes to the quality of CIAT research?

¿Cree usted que los datos de buena calidad contribuyen a la calidad de la investigación del CIAT?

Do you believe good data management contributes to the quality of data?

¿Cree usted que una buena gestión de los datos contribuye a la calidad de los datos?

Do you believe data has significant value outside the original purpose it was collected for?

¿Cree que los datos tienen un valor significativo por fuera del propósito original por el que fueron recopilados?

Do you believe open data accelerate the impact of CIATs work?

¿Cree usted que el acceso abierto a los datos acelera el impacto del trabajo del CIAT?

CIAT Mission / Misión del CIAT

“To reduce hunger and poverty and improve human nutrition in the tropics through research aimed at increasing eco-efficiency of agriculture.”

“Reducir el hambre y la pobreza y mejorar la nutrición humana en los trópicos mediante una investigación que busca aumentar la eco-eficiencia en la agricultura”.

Big PicturePanorama General

Global Demand for Open Research ResultsDemanda global de acceso a los resultados de la investigación

Funders of Research want Open Research OutputsLos donantes desean acceso abierto a los resultados de la

investigación

Funders of Research want Open Research OutputsLos donantes desean acceso abierto a los resultados de la

investigación

Funders of Research want Open Research OutputsLos donantes desean acceso abierto a los resultados de la

investigación

1. Public funded research outputs are a international public goods

2. Should be preserved and made available

CGIAR Open Access and Data Management Policy Política de Acceso Abierto y Gestión de Datos de CGIAR

• CGIAR regards its intellectual assets as International Public Goods (IPG) – CGIAR considera sus activos intelectuales como Bienes Públicos Internacionales (BPI)

• Maximize the global accessibility and ensure broadest possible impact of IPGs – Maximimar la accesibilidad mundial para asegurar el mayor impacto possible de los BPI

CGIAR Open Access and Data Management Policy Política de Acceso Abierto y Gestión de Datos de CGIAR

• CGIAR Intellectual assets policy actually is applied to data and other research outputs – La política de activos intelectuales de CGIAR se aplica a datos y otros resultados de investigación

• Open Access – Publications, policies, images, videos, toolkits….. (all information products) – Acceso Abierto – Publicaciones, políticas, imágenes, videos, kits de herramientas… (todos los productos de información)

• Open Data – Databases, datasets, linked open data – Datos abiertos – Bases de datos, conjuntos de datos, datos abiertos relacionados

CGIAR OpenAg

Knowledge Commons

Spatial Commons

Research Commons

Crop Data Commons

Real-time AR4D News

CGIAR.org

CRP Websites

Center Websites

CGIAR goalMeta de CGIAR

Devare, Medha. 'Moving CGIAR Towards Open Access'. 2014. Presentation.

CGIAR OA Policy Milestones Hitos en la Política de Acceso Abierto de CGIAR

Policy

Funding

Flexible Guidelines

Center/CRP Implementation

Plans

Center/CRP Implementation

CG-level metadata harvesters/

open.cgiar.org

Partner engagement

Documentation, Monitoring &

Evaluation

Done. Approved by Consortium Board and all 15 Centers

In progress. $5M in W1 already from BMGF. FO reviewing latest version.

In progress. V3 ready for review by March

Devare, Medha. 'Moving CGIAR Towards Open Access'. 2014. Presentation.

Why / Por qué

Importance / Importancia

Information Entropy (Michener, William K., et al. "Nongeospatial metadata for the ecological sciences." Ecological Applications 7.1 (1997): 330-342.)

Importance / Importancia

Piwowar, Heather A., Roger S. Day, and Douglas B. Fridsma. "Sharing detailed research data is associated with increased citation rate." PloS one 2.3 (2007): e308. http://dx.doi.org/10.1371/journal.pone.0000308

Importance / Importancia• Increases visibility of scientific research / Aumenta la

visibilidad de la investigación científica• Increases research efficiency / Aumenta la eficiencia de

la investigación• Ensures re-use of value, uniqueness and importance of

data / Asegura la reutilización, singularidad e importancia de los datos

• Facilitates science – discoverable and promotes scientific enquiry and replication / Facilita la ciencia – descubrible y promueve la consulta científica y la replicación

Importance / Importancia• Prevents duplication / Evita la duplicación• Protects public investment in research and

development / Protege la inversion pública en la investigación y el desarrollo

• Good management ensures research data is accurate, complete and reliable / Una buena gestión asegura que los datos de investigación sean precisos, completos y confiables

What about in CIAT¿Y qué sucede en el CIAT?

Fully adopted CGIAR OA/OD PolicyPolítica completamente adoptada

This can only happen with proper research data management throughout the research life cycle

Esto solo puede suceder con una gestión apropiada de los datos de investigación durante todo el ciclo de vida de la investigación

Proposal Stage

Grant Opening

Project ResearchPublishing

Grant Close out

Research Life CycleCiclo de Vida de la Investigación

Proposal Stage

Grant Opening

Project ResearchPublishing

Grant Close out

Archive & Preserve

Share

Cite

Produce Data Management & Sharing Plan

Resource Data Management plan

Store Data Securely

Create / Reuse Data

Organize & label

Document

Analyze

Research Data Management

Gestión de los Datos de Investigación

Research Data Management Tenemos estándares?

Data Acquisition

Shared Workspace and document collaboration

Data Storage For direct use & data backup

shorter term Longer term

Metadata and Documentation

dc.titledc.descriptiondc.authordc.Producer

Analysis

Structured data is always better than unstructured

Tener los datos estructurados siempre es mejor que no tenerlos estructurados

Documentation at every level is key

La documentación en todos los niveles es clave

Archiving and SharingArchivar y Compartir

Data Publishing

Data collections shared through online access

service

ArchivingLong term access and

retention of data

StorageFor direct use &

data backup

Archiving and Sharing

Data Publishing

Data collections shared through online access

service

ArchivingLong term access and

retention of data

StorageFor direct use &

data backup

Need to preserve primary data, you can always aggregate up but cannot disaggregate downSe deben preservar los datos primarios. Siempre se pueden agregar, pero no se pueden desagregar

Prioritize data (in open formats) more than platform or tool. Technology changes quickly

Priorizar los datos (en formatos abiertos) más que una plataforma o herramientaLa tecnología cambia rápidamente

Internal Research TransparencyTransparencia de la Investigación Interna

HR data

Archived Research

Data

Published Outputs

Project Data

Donor Data

Data Publishing

Data collections shared through online access

service

ArchivingLong term access and

retention of data

StorageFor direct use &

data backup

Data should be FindableData should be AccessibleData should be InteroperableData should be Re-usable.

DisponibleAccessibleInteroperableReutilizable

FAIRness of Data

CRP 2.0 Call

Our Role Vs ResearchNuestro rol vs. la investigación

Big data y TICs: Una serie de organizaciones científicas han desarrollado instalaciones computarizadas de alto desempeño y capacidades analíticas de datos complejos. Existe una oportunidad importante para que CGIAR potencialice esta inversión en capacidades e infraestructura para avanzar en la misión de bienes públicos globales de CGIAR.

Data in Research: Use of big data and high performance computing to answer global questions.Datos en la investigación:Uso de datos complejos y computación de alto desempeño para responder a interrogantes mundiales.

Our Role Vs Research

Research Data Management: • Acquiring, caring for, adding value, facilitating access and preserving research

data throughout life cycle.• Policies, standards, long term preservation, open access

Gestión de Datos de Investigación:• Adquirir, cuidar, agregar valor, facilitar acceso y preservar los datos de

investigación a lo largo del ciclo de vida• Políticas, estándares, preservación de largo plazo, acceso abierto

Credit:www.valdo.com