J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 -...

28

Transcript of J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 -...

Page 1: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

RETO

NUEVA

PESCANOVA

Contacto :

p .conesa@cleverpy .com ( +34 ) 722 271 385

Page 2: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

Índice 1 - Presentación 4 

2 - Briefing del reto 5 

3 - Objetivos a alcanzar mediante la solución 6 3.1 - Objetivos cualitativos 6 3.2 - Objetivos cuantitativos 6 

4 - La solución 7 4.1 - Descripción de la solución 7 4.2 - Composición de la herramienta 7 

4.2.1 - Interfaz 7 4.2.1.1 - Perfiles de administración 7 4.2.1.2 - Perfiles de operarios 8 

4.3. - Módulos que componen la solución 8 4.3.1 - Panel de control 9 4.3.2 - Indicadores 9 4.3.3 - Calidad del agua 9 4.3.4 - Transferencias y aclimatación 10 4.3.5 - Alimentación 10 4.3.6 - Estimación de Biomasa 12 4.3.7 - Cosecha 12 4.3.8 - Curvas 14 4.3.9 - Sistema de ayuda a la toma de decisiones 16 4.3.10 - Informes 16 

4.4 - Tecnologías aplicadas en la solución 17 4.4.1 - Los modelos predictivos 17 4.4.2 - Modelos predictivos de machine learning aplicados 17 4.4.3 - Modelos predictivos de deep learning aplicados 17 4.4.4 - Lenguajes y librerías utilizadas 17 4.4.5 - Servidores en la nube 18 

4.5 - Esquema de recopilación de datos, generación de modelos y envío de predicciones 18 

5 - Ejecución del proyecto 19 5.1 - Principales actividades del proyecto 19 5.2 - Duración del proyecto 20 5.3 - Fases del proyecto 21 

5.3.1 - Interfaz del piloto 21 5.3.2 - Piloto sin ML 21 5.3.3 - Piloto final 22 

5.4 - Posibles riesgos potenciales del proyecto 22 5.5 - Plan de contingencias 23 

1

Page 3: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

6 - Equipo responsable del proyecto 24 6.1.1 - Pedro Conesa (CEO) 24 6.1.2 - Jesús Vieco (CDO) 24 6.1.3 - Jordi Boix (CTO) 25 

7 - Estimación de costes 25 

7 - Seguimiento y evaluación del proyecto 27 7.1 - Indicadores clave 27 7.2 - Nuevos hitos 27 7.3 - Reporte periódico 27 

8 - Resumen final 27 

 

 

 

 

 

   

2

Page 4: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

1 - Presentación  El grupo Nueva Pescanova, a través de Galicia Open Future propone un reto al ecosistema emprendedor en el que se lanza una pregunta:  “¿Cómo podemos modelizar los datos recogidos en los sucesivos ciclos de cría del langostino para predecir y corregir, en su caso, comportamientos y optimizar la toma de decisiones presentes y futuras?”  En esta pregunta, queda claramente manifestada la necesidad de implementar tecnologías basadas en Inteligencia Artificial que ayuden a la compañía a mejorar la toma de decisiones y las acciones que suponen la cría de langostino aprovechando el Big Data generado por la empresa.  En Cleverpy, nos dedicamos específicamente al desarrollo de soluciones basadas en machine learning y deep learning para empresas que buscan mejorar su eficiencia, eficacia y/u obtener ayuda en la toma de decisiones a través del uso de estas tecnologías. Por lo que nos ha resultado gratificante trabajar en una propuesta al reto.  A lo largo de las próximas páginas, planteamos una solución al grupo Nueva Pescanova que les ayude a mejorar la productividad de su proceso de cría de langostino a través del uso de tecnologías IA, sin que ello suponga una gran curva de adaptación para los trabajadores encargados de interactuar con dicha solución.  Además, haremos hincapié en la mejora de los principales indicadores planteados por la compañía para cada una de las curvas de crecimiento / supervivencia, estos son:  

1. Biomasa: supervivencia por tamaño  2. Índice de conversión (cantidad de alimento necesario para producir 

un kilo de langostino)  3. Velocidad de crecimiento 4. Cultivo kg/ha/día. 

  Por último, y para concluir esta introducción, en caso de que esta propuesta sea seleccionada para conocer en profundidad los procesos de cría de langostino, podremos llevar a cabo todos los posibles ajustes detectados que ayuden a que la solución inicial planteada en este documento se ajuste lo máximo a las necesidades e incluso a nuevas oportunidades detectadas durante la visita a la compañía.  

3

Page 5: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

2 - Briefing del reto  La influencia de multitud de factores en el proceso del cultivo extensivo de langostino es a día de hoy un desafío no resuelto.  Algunos de esos factores que intervienen en el proceso son: 

 ● Ambientales Físico/químicos ● Ambientales Biológicos ● Sanitarios ● Genéticos ● Manejo (incluye alimentación) 

 A su vez, existen una gran combinaciones de variables entre los diversos factores que hacen que la gestión del cultivo sea realmente complicada, y la eficiencia no sea óptima.  Esto supone lastres a la hora del manejo y pérdidas económicas para la compañía. 

 El Grupo Nueva Pescanova dispone de más de 1.000 piscinas para la cría del langostino, ubicadas en diferentes países, recogiendo sistemáticamente y de diferente manera (manual y automatizada) mediciones de las distintas variables, así como de los resultados obtenidos en cada siembra.   Sin embargo no se dispone de una solución que proporcione la realización de modelo de análisis predictivo que relacione dichas variables con los resultados y que facilite información que ayude a la toma de decisiones.  Por tanto, es clave para la empresa encontrar una solución tecnológica para el control y la gestión integral de las explotaciones de langostino, con capacidad de autoaprendizaje, que, partiendo de los valores de determinadas variables, permita construir de forma predictiva:  

● Curvas de supervivencia ● Curvas de crecimiento para cada tipo de alimento ● Curvas de rentabilidad 

 

4

Page 6: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

3 - Objetivos a alcanzar mediante la solución  Enfocamos los objetivos marcados para este reto desde dos ángulos: Objetivos cualitativos y objetivos cuantitativos.  Dichos objetivos se centran en paliar o eliminar las ineficiencias y problemáticas manifestadas por la empresa en sus procesos de cría de langostino. 

3.1 - Objetivos cualitativos 

● Reducir la tasa de mortalidad del animal en las fases iniciales del ciclo de cría. 

● Mejorar la toma de decisiones en cada uno de los criaderos, tanto para tratamiento del medio como para la alimentación en base a las necesidades en cada momento. 

● Facilitar la monitorización y el control en los parámetros ambientales y del medio que afectan al cultivo del langostino. 

● Optimizar la decisión basada en recogida de las cosechas. ● Facilitar unas curvas de supervivencia, crecimiento y rentabilidad 

apoyadas en modelos predictivos eficientes. ● Reducir la incertidumbre de la calidad y cantidad de langostino al 

final de cada una de las fases de cría. ● Optimizar la velocidad de crecimiento en la cría de langostino. 

3.2 - Objetivos cuantitativos  

● Reducir de un 60% a un 50% el índice de mortalidad en la transferencia entre tanques. 

● Reducir los costes de alimento necesario para la cría intensiva en un 25% gracias a la medición óptima durante el crecimiento de los ejemplares. 

● Alcanzar una precisión del 60% en la versión piloto del proyecto (y entre un 70% a 90% en la versión final) en los modelos creados para las curvas de supervivencia, crecimiento y rentabilidad. 

● Aumentar hasta un 20% la producción Kg/Ha/Día de la empresa.    

5

Page 7: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

4 - La solución 

4.1 - Descripción de la solución  Proponemos una herramienta de gestión para la cría de langostino compuesta por un conjunto de modelos de inteligencia artificial que ayudan a mejorar la toma de decisiones y la productividad de la empresa.  Dichos modelos predictivos están a disposición de los trabajadores responsables de los procesos de cría a través de una interfaz (panel de control) en la que pueden interactuar monitorizando los factores intervinientes en el proceso de cría y obteniendo predicciones basadas en el análisis que dichos modelos extraen de los datos proporcionados durante el proceso.  De esta manera, tanto los operarios como los mandos intermedios dispondrán de información predictiva en tiempo real que les permita decidir de manera eficaz cada una de sus acciones. 

 

4.2 - Composición de la herramienta 

4.2.1 - Interfaz  Una interfaz para facilitar a los operarios y mandos intermedios tanto a introducir los datos al sistema, como la visualización de las predicciones en tiempo real que les ayuden a tomar las decisiones más apropiadas para mejorar la productividad de cada una de las etapas del proceso de cría.  Para que cada trabajador pueda llevar a cabo una gestión eficiente y relevante de sus tareas, la interfaz de la herramienta quedará personalizada a la información y toma de datos que necesita tener cada empleado.  Para una primera fase, dividimos esta personalización de la interfaz en dos tipos: Perfiles de administración y perfiles de operario.  

4.2.1.1 - Perfiles de administración 

 Dicha interfaz permite acceder a información de cada uno de los criaderos/estanques de forma fácil y sencilla y así poder monitorizar de forma centralizada la información en su conjunto.  

6

Page 8: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

Añadido a esto, el perfil de administración también tiene la capacidad para ver todas las predicciones de las diferentes curvas de supervivencia, crecimiento y rentabilidad para en el conjunto de la granja. 

  

4.2.1.2 - Perfiles de operarios 

 Los trabajadores encargados de las tareas de gestión de la cría tienen a su disposición paneles de gestión en los que introducir los datos de sus mediciones y de las actividades que llevan a cabo con el fin de recibir predicciones que les ayuden a decidir correctamente qué futura acción han de llevar a cabo en base a los datos actuales obtenidos.  Para simplificar su tarea este recibe solo la información y predicciones procedentes del estanque o estanques que gestiona, de esta manera, evitamos excesos de información y se pone el foco en las acciones recomendadas para el operario en concreto.   

Anotación sobre los perfiles de la Interfaz.  Actualmente no tenemos información acerca de los diferentes perfiles profesionales que componen el proceso completo de cría, pero una vez conocidos, es posible personalizar la interfaz según el tipo de permiso y representar de manera inequívoca las acciones/predicciones específicas a las que debe de prestar especial atención cada trabajador según su puesto en el ciclo de cría del langostino.  

4.3. - Módulos que componen la solución  Este conjunto de módulos hacen referencia a todas las necesidades detectadas en el ciclo de cría del animal, es decir, a estas fases: 

 1. Fecundación 2. Desove 3. Eclosión 4. Fases larvarias 5. Engorde 6. Cosecha 7. Procesado 

 Y concretamente, nos hemos centrado en resolver a través de los próximos módulos, las principales ineficiencias y necesidades que a día de hoy hemos detectado en el proceso de cría. 

7

Page 9: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

4.3.1 - Panel de control 

 Se proporcionará un panel de control a través del cual el operario, el administrador u otro responsable podrán introducir datos referentes al proceso y los factores que intervienen en la cría.  

4.3.2 - Indicadores 

 En dicho módulo se muestra los principales indicadores de rendimiento que debe de tener en cuenta el trabajador o responsable según su puesto en el proceso de cría de langostino.  Por ejemplo: Un responsable de la alimentación tendrá en su panel indicadores relativos al tamaño de la biomasa, la velocidad de crecimiento o las curvas de crecimiento según tipo de alimento utilizado.  

4.3.3 - Calidad del agua 

 En este módulo se pueden monitorizar el estado de los factores como la salinidad, temperatura, ph, oxígeno, etc… de los estanques en los que están siendo criados los animales.  Por un lado los factores mencionados quedan representados con sus respectivas gráficas y la evolución de estas, y por otro lado, a través de una tabla se muestra el estado actual de los factores a medir y la predicción de estos para las próximas horas 

 A modo de ejemplo, la visualización de la tabla sería:  

  Temperatura  Oxígeno  Salinidad  Ph  etc 

Óptimo  28º  12 ppm  17 ‰  7´5  ‘’ 

última medición  27  8 ppm  16 ‰  7´4  ‘’ 

Predicción a 3 h  26  7 ppm  18 ‰  7´1  ‘’ 

Predicción a 6 h  25  9 ppm  19 ‰  7´0  ‘’ 

Predicción a 12 h  25  11 ppm  20 ‰  6´3  ‘’ 

  A través de dicho módulo se alcanza el objetivo de facilitar la monitorización y el control en los parámetros ambientales y del medio que 

8

Page 10: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

afectan al cultivo del langostino y al mismo tiempo se ayuda a prevenir posibles enfermedades o focos de estrés.   Por último, el módulo va acompañado de un modelo de inteligencia artificial para la predicción de anomalías, por lo que cualquier posible cambio en los factores o combinación de estos que pueda suponer riesgos para la cría quedará avisado al operario a través de un sistema de alertas que ayude a los trabajadores responsables de la calidad del agua a monitorizar de forma preventiva la evolución de dichos factores. 

 

4.3.4 - Transferencias y aclimatación 

 Sabemos que la transferencia entre estanques es un proceso que supone mucho estrés para los animales y que se produce una elevada mortalidad (hasta el 60% según datos facilitados). Por lo que hemos elaborado un módulo específico centrado en la transferencia y aclimatación de los estanques.  La funcionalidad de dicho módulo es la de poder hacer una comparativa proyectada de los factores actuales de los estanques de origen y destino y de una predicción de las condiciones de los estanques para la hora de transferencia concretada.  Por tanto, se aplican tablas con valores predictivos similares al punto anterior pero de modo comparado entre ellas.  De esta forma, los trabajadores pueden conocer de forma anticipada en qué estado estará el estanque y podrá tomar acciones específicas para la aclimatación de dichos estanques a las condiciones más óptimas posibles para realizar la transferencia.  Gracias al uso de este módulo, conseguimos ayudar a reducir la mortalidad de los animales al tiempo que incrementamos la producción mediante la reducción del estrés en las transferencias.   

4.3.5 - Alimentación 

 Uno de los mayores costes que suponen el proceso de cría de langostino es el que está relacionado con la alimentación de estos animales.  Es por ello que proponemos un módulo centrado específicamente en la alimentación del animal que ayude a optimizar el suministro de alimento según las necesidades en cada momento de la cría. 

9

Page 11: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

 Para poder hacer esto, proponemos proyecciones basadas en el crecimiento del animal según cada alimento, velocidad de crecimiento, tamaño medio y conversión alimenticia (C.A) en cada fase del ciclo de cría.  A modo de ejemplo, estas son las representaciones de algunas de las curvas y sus predicciones:  Curva de crecimiento según alimento: 

 Curva del índice de conversión por alimento: 

   

10

Page 12: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

Además, dichos indicadores y sus proyecciones van acompañados de un modelo de recomendación de acciones que en base a los datos actuales y proyecciones proponga las cantidades, horas, número de veces al día y tipo de alimento que optimizarán la producción.   

4.3.6 - Estimación de Biomasa 

Para mejorar la medición actual de la biomasa utilizamos una estimación por media de tres valores.  

- La primera es mediante el muestreo semanal del operario. - La segunda mediante el uso de un modelo de deep learning de 

visión por computador que utiliza una cámara para estimar la cantidad de biomasa del tanque. 

- El tercero se basa en la estimación haciendo uso de la supervivencia teórica. 

 De estas estimaciones se extrae la media ponderada y se representan gráficamente en el módulo. 

 

11

Page 13: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

 

4.3.7 - Cosecha 

A través de este módulo, nos centramos en facilitar la monitorización de las predicciones que aporten a la empresa los mejores valores posibles en la fase de cosecha.  El objetivo perseguido es el de tomar las mejores decisiones en las fases de cosecha que puedan ayudar a maximizar la rentabilidad de cada proceso de ciclo de cría.  Para ello, se proponen diferentes modelos predictivos representados en los principales indicadores relacionados con la rentabilidad del producto.  Entre ellos destacamos: Cálculo de los kilos totales  Haciendo uso de modelos predictivos calculamos el tamaño medio de los langostinos y la supervivencia que tendrán en cada momento de la cría.  Con ambos valores podemos estimar los kilos totales de langostino que obtendremos.  

     

12

Page 14: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

Precio de mercado  Mediante el análisis de series temporales creamos un modelo capaz de estimar el precio de mercado en diferentes países/ciudades/lonjas en aras de buscar el mejor momento para realizar la cosecha.  

 Momento óptimo de cosecha  Haciendo uso de los modelos de predicción generados podemos calcular el momento de máxima rentabilidad para realizar la cosecha teniendo en cuenta, los Kg de langostino que obtendremos en base a cada tipo de alimento, el gasto que conlleva la alimentación con cada tipo y el precio de mercado que tendrá el Kg de langostino contando con el tiempo de envío.  Este modelo queda representado en el módulo de curvas que veremos a continuación.  

4.3.8 - Curvas  

 Este módulo ofrece una visión en conjunto de las curvas de crecimiento, supervivencia y rentabilidad en cada etapa del ciclo de cría del langostino. Se utilizarán los datos ya presentes en el sistema para generar predicciones y dar forma a las curvas previamente dichas. 

     

13

Page 15: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

4.3.8.1 - Curvas de crecimiento según etapa y alimento  En primer lugar, la curva de crecimiento muestra la evolución del peso de los langostinos a lo largo del proceso de cría. La curva contiene una traza de los resultados obtenidos hasta la fecha actual y predicciones realizadas mediante los datos ya presentes, completando la curva con el crecimiento esperado utilizando los diferentes tipos de alimentos hasta el final de ciclo.  

 4.3.8.2 - Curvas de supervivencia según etapa  La curva de supervivencia muestra la probabilidad de supervivencia de los langostinos en su ciclo respectivo. Se utilizan modelos predictivos basados en muestreos y resultados de cosechas para generar la curva. 

 

  

 

14

Page 16: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

4.3.8.3 - Curvas de rentabilidad (Momento óptimo de cosecha)  Finalmente, la curva de rentabilidad para el momento óptimo de cosecha se genera a partir del valor de mercado esperado, los kilos de langostinos previstos, las necesidades alimentarias y el coste de mantenimiento.   También tenemos en cuenta el tiempo que se tarda en enviar los langostinos al país en el que se vayan a vender para realizar una mejor estimación de la rentabilidad. 

 

 

4.3.9 - Sistema de ayuda a la toma de decisiones  

 Como hemos comentado en el análisis de cada módulo, cada uno de ellos posee sus respectivas recomendaciones de acciones basadas en las predicciones que los modelos producen.  De este modo, cualquier cambio no habitual en algún parámetro o combinación de parámetros actuará como detonante del sistema de alertas que ayude al responsable a actuar de manera más eficaz y relevante en cada momento.  

 

4.3.10 - Informes  

 Muy útiles para mostrar la evolución de cada criadero y facilitar el descubrimiento de deficiencias y errores ocultos. 

 Esta funcionalidad aprovecha los datos históricos y actuales recogidos por parte de la empresa en cada uno de los criaderos de langostinos para la extracción de información de calidad.  

15

Page 17: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

Dicha información queda sintetizada en forma de los principales indicadores en los que quiera hacer referencia las personas responsables de tomar decisiones en torno al rendimiento de estos.  Es una funcionalidad pensada principalmente para mandos superiores. 

  

4.4 - Tecnologías aplicadas en la solución 

4.4.1 - Los modelos predictivos  

Se aplican diversos tipos de modelos predictivos que a través de los datos actuales ayudan a predecir aspectos como son:  

1. Las curvas de supervivencia, crecimiento y rentabilidad para cada una de las piscinas de cría de langostino según la fase en la que se encuentren. 

2. La evolución de las condiciones quimico/biologicas de los estanques. 3. El crecimiento respecto alimento. 4. Las condiciones físico/químicas de los estanques en la aclimatación 

y transferencia. 5. El momento óptimo de cosecha en base al tamaño del animal. 6. El precio de venta de cada kg de langostino. 7. Estimación de la biomasa. 

4.4.2 - Modelos predictivos de machine learning aplicados  

● Support Vector Machines ● K-nearest Neighbors ● Tree Boosting ● Random Forest ● Stochastic Gradient Descent 

 

4.4.3 - Modelos predictivos de deep learning aplicados  

● Deep Neural Networks ● Recurrent Neural Networks ● Fast Region-based Convolutional Neural Networks 

 

16

Page 18: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

 

4.4.4 - Lenguajes y librerías utilizadas  

● Python ○ Tensorflow ○ Numpy ○ Scipy ○ Bokeh ○ Scikit-learn ○ XGBoost ○ Flask ○ PyMongo ○ Pandas ○ Matplotlib ○ Statsmodels 

 ● HTML5 ● CSS3 ● Javascript ● Jquery ● Bootstrap ● Apache ● Docker 

  

4.4.5 - Servidores en la nube 

● EC2 de Amazon Web Services ● MongoDB Atlas 

  

4.5 - Esquema de recopilación de datos, generación de modelos predictivos y envío de predicciones 

 La herramienta obtiene los datos con los que se van a generar los modelos predictivos a través de tres fuentes:  

1. El trabajador que los introduce manualmente. 2. PLC’s de las propias piscinas/estanques. 3. El ERP de la empresa. 

17

Page 19: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

 Dicha información es almacenada en la base de datos y además se realizarán las predicciones que devolverán información relevante. Dichas predicciones procedentes de los modelos pueden ser visualizadas a través de la interfaz de la solución.  De esta manera, las predicciones y condiciones analizadas se enviarán de nuevo al operario o a los mandos intermedios para que puedan llevar a cabo las acciones más eficaces y eficientes en base al análisis de datos que su herramienta le ha proporcionado.  El esquema es el siguiente: 

 

 

5 - Ejecución del proyecto 

5.1 - Principales actividades del proyecto  Para la realización del proyecto hemos creado la siguiente estructura de actividades y subactividades:  Obtención de los datos.  

- Creación de una base de datos temporal. 

18

Page 20: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

- Transferencia y almacenamiento de los datos.  Análisis y tratamiento de los datos.  

- Análisis exploratorio. - Reparación y tratamiento de los datos. - Análisis de correlación entre variables. 

 Desarrollo de los modelos predictivos.  

- Normalización y preprocesado. - Generación de modelos con un conjunto reducido de datos. - Testeo y mejora con un conjunto reducido de datos. - Generación de modelos predictivos con la totalidad de los datos. - Testeo de modelos predictivos con la totalidad de los datos. 

 Diseño y desarrollo de la aplicación.  

- Diseño de la base de datos del servidor. - Implementación de la base de datos del servidor. - Diseño gráfico de la interfaz de usuario. - Implementación de la interfaz del usuario. - Implementación del backend del servidor. 

 Puesta a punto  

- Instalación y configuración del servidor. - Testeo de la herramienta. 

 

5.2 - Duración del proyecto  

Hemos generado un diagrama de Gantt adjunto en el fichero Tareas.xlsx y se pueden encontrar disponible aquí . En dicho diagrama planteamos tres escenarios:  

● Escenario optimista , donde asumimos un conjunto de datos informatizado, bien organizado y sin inconsistencias. 

 ● Escenario probable , donde también asumimos que el conjunto de 

datos está informatizado y bien organizado pero contiene ciertas inconsistencias que dificultan el tratamiento de datos y la generación de modelos predictivos. 

 

19

Page 21: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

● Escenario pesimista, donde asumimos que los datos no están informatizados y contienen gran cantidad de inconsistencias que dificultan en gran medida el tratamiento de datos y la generación de los modelos predictivos haciendo necesario incluso la obtención de nuevos datos. 

 Para calcular el tiempo necesario para llevar a cabo el proyecto vamos a utilizar la fórmula PERT (Program Evaluation and Review Technique):  

 

tiempo estimado = 6optimista + 4 probabilista + pesimista*  

  

Por tanto tenemos que el total de horas del proyecto son:   

(1150+4×1350+2140)÷6 = 1448,33 Horas.   

 Y el tiempo estimado de entrega será:   

(900+4×1060+1730)÷6 = 1145, es decir, 7/8 meses.  

 

5.3 - Fases del proyecto El milestone del proyecto lo planteamos en tres entregas. Estas son las siguientes:  

1. Interfaz del piloto. 2. Piloto sin modelos predictivos. 3. Piloto con modelos predictivos. 

 

5.3.1 - Interfaz del piloto  En esta primera fase entregamos la parte visual del proyecto, en la que se puede ver cuál será el aspecto de la solución y la manera en la que el usuario puede interactuar con ella tanto en la introdución de datos como en la visualización de las predicciones e indicadores de importancia.  

20

Page 22: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

Una vez acabado el diseño y desarrollo de la interfaz gráfica del usuario realizamos una presentación de la misma para recibir el feedback oportuno que ayude a optimizar su usabilidad y realizar los ajuste necesarios..  Duración estimada: (100+4×120+160)÷6 = 123,33 => 4 semanas 

 

5.3.2 - Piloto sin modelos predictivos  En esta segunda fase se entrega tanto la interfaz con la usabilidad optimizada así como implementación del backend del servidor.  En este momento los usuarios de la solución ya pueden comenzar a interactuar con ella e introducir datos reales de la actividad en el ciclo de cría.  Por tanto el objetivo de esta entrega lo que se busca es probar la interactividad de la herramienta y los módulos de introducción de datos.  Duración estimada: (220+4×260+280)÷6 = 256,67 => 7 semanas  

5.3.3 - Piloto final  Esta es la entrega final del proyecto entregamos la interfaz optimizada con la capacidad de interactuar con ella introduciendo los datos y con los modelos de inteligencia artificial entrenados e implementados en la solución.  Por tanto, los datos que el usuario introduzca en la herramienta afectarán a las curvas y predicciones de los distintos módulos y se podrá utilizar para trabajar de manera real con la solución.  Duración estimada: (900+4×1060+1730)÷6 = 1145 => 29 semanas  

5.4 - Posibles riesgos potenciales del proyecto  Esta propuesta al reto de Nueva Pescanova, se enfrenta a ciertos riesgos potenciales, principalmente centrados en la forma en la que actualmente la compañía recopila los datos del proceso de cría.  Entre los riesgos detectados destacamos los siguientes: 

21

Page 23: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

● Inconsistencias o incompletitudes en los datos históricos. ● Los datos históricos no se encuentran informatizados. ● Variables no almacenadas históricamente que son importantes para 

el ajuste óptimo del modelo. ● Desinterés por parte de los empleados a querer utilizar la 

herramienta de introducción de datos. ● Introducción errónea de nuevos datos por parte de los empleados. ● No disponer de PLC ● PLC no conectados al servidor ● No disponer de un ERP ● ERP que no disponga de API con la que interactuar ● Falta de conexión a internet en los puntos de recopilación de datos 

 

5.5 - Plan de contingencias 

Riesgos potenciales  Acciones a tomar 

Inconsistencias o incompletitudes en los datos históricos.

Reparación de datos consultando a los propios trabajadores de la variable y piscina/criaderos donde encontremos las inconsistencias y en caso extremo descartar los datos erróneos de dicho criaderos o variable.

Los datos históricos no se encuentran informatizados.

Informatizarlos de forma manual, si es posible haciendo uso del personal de Pescanova para reducir al máximo el tiempo de informatización.

Variables no almacenadas históricamente que son importantes para el ajuste óptimo del modelo.

Si son variables fácilmente localizables como puede ser el tiempo, adquirir dichos datos. En caso de ser difícil de obtener contemplar si afecta en gran cantidad a la precisión de los modelos para decidir si intentar adquirirlos o descartarlos asumiendo dicha pérdida de precisión.

Desinterés por parte de los empleados a querer utilizar la herramienta de introducción de datos.

Modificación de la interfaz para hacerla más amigable y hacer ver a los empleados que la introducción de datos es necesaria para mejorar la herramienta que les facilitará la organización del criadero.

Introducción errónea de nuevos datos por parte de los empleados.

Proporcionar una interfaz sencilla para poder corregir valores erróneos.

No disponer de PLC 

Añadir a la interfaz una sección para que el operario pueda introducir los datos por sí mismo.

22

Page 24: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

PLC no conectados al servidor Realizar una conexión haciendo uso de SCADA para poder obtener y tratar los datos.

No disponer de un ERP 

Descartar la integración con un ERP.

ERP que no disponga de API con la que interactuar

Descartar la integración con un ERP o proponer la migración a un ERP que disponga de API para poder introducir y obtener información.

Falta de conexión a internet en los puntos de recopilación de datos. 

Desarrollo de una aplicación de escritorio (Ya sea para Windows, Android, IOS o Linux) que pueda trabajar sin conexión a la red. Esta aplicación debería conectarse al menos una vez por día a una red de internet para poder actualizar los datos. 

 

Como se puede ver, gran parte de estos riesgos pueden ser resueltos con una ampliación de la duración del proyecto o realizando modificaciones en la solución final.

6 - Equipo responsable del proyecto  El equipo que compone Cleverpy está formado por tres socios que trabajarán a tiempo completo y plena dedicación.  

6.1.1 - Pedro Conesa (CEO)  Graduado en administración de empresas y experto profesional en marketing digital Con más de 10 años de experiencia profesional en gestión empresarial, en los últimos años ha realizado trabajos de transformación digital para PYMEs. Es el responsable de la gestión y coordinación del proyecto.  Linkedin: https://www.linkedin.com/in/pedro-conesa/  

6.1.2 - Jesús Vieco (CDO)  Ingeniero Informático con máster en inteligencia artificial 

23

Page 25: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

Ha sido investigador en la Universidad politécnica de Valencia y ha trabajado para la startup Neuronalbite, en la que diseñó los modelos predictivos de machine learning. Es el responsable del tratamiento de datos y creación de los modelos predictivos..  Linkedin: https://www.linkedin.com/in/jesusviecoperez/   

6.1.3 - Jordi Boix (CTO)  Ingeniero informático Ha trabajado para el ayuntamiento de La Alcudia como responsable de informática y sistemas, así como en la desarrolladora de software STC soluciones y en la startup Neuronalbite, en la que desarrolló el backend de la herramienta. Es el responsable del frontend y backend de la solución. 

 Linkedin: https://www.linkedin.com/in/jordiboixramos/ 

 

7 - Estimación de costes  Ya que en este punto inicial no se conocen todos los detalles necesarios para aplicar una estimación detallada del proyecto, el coste del piloto para el reto de Nueva Pescanova lo vamos a calcular aplicando una estimación inicial con márgenes de error de ± 15-25%. 

 Dicha estimación se desglosa en tres áreas: Acciones previstas, recursos técnicos necesarios, costes imprevistos (reservas).  Las acciones previstas se presupuestan en base al valor del precio/hora y al número de horas previstas (35€/h) y el número de horas estimadas (calculado en el punto 4.1. Duración del proyecto). 

 (Coste por hora) x (nº horas estimadas) = Coste por acción prevista  

   

24

Page 26: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

 

Acciones previstos  Coste acción prevista 

Obtención de datos  1,050 € 

Análisis y tratamiento de los datos  8,400 € 

Desarrollo de los modelos predictivos  20,650 € 

Desarrollo e implementación de la aplicación  8,750 € 

Puesta a punto  1,400 € 

Subtotal (I.V.A no incluido)  40,250 € 

  

 Los recursos técnicos son principalmente los costes necesarios para trabajar con los datos de la empresa, siendo este el presupuesto aproximado para el reto:  

 

Recursos técnicos  Coste 

Servidor AWS  250 € 

Mongo DB  1,200 € 

Subtotal (I.V.A incluido)  1,450 € 

  Se plantean dos fondos destinados a posibles acciones o recursos no considerados en los dos puntos anteriores:  El fondo de gestión para posibles inconvenientes que sucedan durante el desarrollo de las acciones previstas . El fondo de contingencias , para posibles inconvenientes desconocidos actualmente. 

 

Reservas  Coste 

Reserva de gestión  5,000 € 

Reserva de contingencias  3,000 € 

Subtotal (I.V.A no incluido)  8,000 € 

 

25

Page 27: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

 El coste final estimado incluyendo los fondos de gestión y contingencia quedaría en: 

 

Coste final  Precio 

Total (I.V.A no incluido)  49.700 € 

  

7 - Seguimiento y evaluación del proyecto 

7.1 - Indicadores clave  Los indicadores clave para medir el éxito del proyecto serán:  

- % de efectividad de los modelos:  Para la versión piloto se considera un 60% de eficacia 

 - > % Índice de conversión del alimento (C.A) 

 - > % mortalidad  

 Anotación: Tanto el índice de conversión del alimento como el de mortalidad en el proceso de cría se debe de concretar en valor a alcanzar del indicador con la empresa, ya que actualmente no conocemos las cifras actuales de estos indicadores en la compañía.  

7.2 - Nuevos hitos  Otros posibles logros a tener en cuenta durante el desarrollo del proyecto y que pueden suponer un valor añadido a los objetivos marcados serán:  

- Porcentaje de precisión de los modelos: Mayor de 70% - Reducción de los tiempos de entrega. - Nuevos módulos. - Nuevos modelos predictivos de inteligencia artificial. - Mejorar la estimación de la biomasa. 

 

   

26

Page 28: J S= 8W ` G N 8=` - cleverpy.comcleverpy.com/wp-content/uploads/2018/03/Reto_Nueva_Pescanova.pdf2 - Briefing del reto La influencia de multitud de factores en el proceso del cultivo

7.3 - Reporte periódico  Cada 30 días se realizará el reporte de las actividades completadas, en desarrollo y pendientes del proyecto, con el fin de que la empresa conozca el estado actual del proyecto.  La persona responsable del reporte será Pedro Conesa. 

8 - Resumen final  En síntesis a lo expuesto en el documento para el reto de Nueva Pescanova, planteamos este resumen final.  Solución.  

- Plataforma de gestión del proceso de la cría de langostino con modelos predictivos utilizando tecnologías de inteligencia artificial y análisis de big data.  

 Objetivo.  

- Aumentar la productividad de la empresa en el proceso de cría de langostino en base a una mejor gestión de los factores que intervienen en dicho proceso facilitando la toma de decisiones. 

 Tecnologías.  

- Modelos predictivos utilizando inteligencia artificial. - Aplicación web para la recopilación de datos, su visualización y toma 

de decisiones. - Base de datos con MongoDB para el almacenamiento de nueva 

información.  Equipo.  

- Tres personas a tiempo completo.  Duración del proyecto.  

- Entre 7 y 8 meses  Presupuesto para el reto  

- 49.700 euros. 

27