Artículos

Aproximación a un modelo contextual para calidad de datos en agricultura de precisión

Towards a contextual model for data quality in precision agriculture

Fulvio Yesid Vivas
Universidad del Cauca, Colombia
Juan Carlos Corrales
Universidad del Cauca, Colombia
Gustavo Ramírez-González
Universidad del Cauca, Colombia

Aproximación a un modelo contextual para calidad de datos en agricultura de precisión

Revista Ingenierías Universidad de Medellín, vol. 15, núm. 29, pp. 99-112, 2016

Universidad de Medellín

Recepción: 04 Agosto 2015

Aprobación: 02 Mayo 2016

Resumen: La agricultura de precisión es un concepto agronómico de gestión de parcelas agrícolas, basado en la existencia de variabilidad en campo. Comprende varias etapas: recolección de datos, procesamiento de in formación y toma de decisiones. Después de una extensa revisión de la literatura, se observa que el control de calidad de los datos es un proceso muy importante para agricultura de precisión que puede ser considerado en la recolección de datos. En este artículo se da una aproximación a una arquitectura de control de calidad de datos utilizando la información de contexto del sistema de adquisición (SAD) y el medio ambiente. Este enfoque puede proporcionar a los SAD la capacidad de comprender las situaciones de su entorno con el fin de mejorar la calidad de datos para la toma de decisiones.

Palabras clave: control de calidad de los datos, agricultura de precisión, metadatos, sistemas de adquisición de datos, modelo contextual.

Abstract: Precision agriculture is a farming management concept, based on the crop variability in the field; it comprises several stages: data collection, information processing and decision-making. After an extensive review of the literature, it appears that data quality control is an important process in precision agriculture and can be considered in the data collection process. This paper makes an approach to data architecture quality control by applying the contextual information of the acquisition system (sad) and environment context information. This approach can provide the sad the capability to understand the situations of their environment in order to improve the quality of data for decision-making.

Key words: data quality control, precision agriculture, metadata, data acquisition systems, contextual model.

INTRODUCCIÓN

Los sistemas productivos en Colombia se verán afectados por el cambio climático. Se indica que un 80 % de los cultivos sembrados y más del 60 % del área nacional cultivable sufrirán las consecuencias del incremento de la temperatura y la alteración en el patrón de las lluvias 1. Serán los pequeños productores quienes sufran con mayor fuerza las inclemencias de la oferta climática cambiante. Lo anterior se traduce en problemas de índole socio-económica, ya que los pequeños productores no solo son responsables del 30 % de la producción de alimentos sino que generan el 50 % del empleo rural 1.

En términos generales, el desconocimiento y la falta de acceso a tecnología que facilita el proceso de toma de decisiones hacen que esta población sea más vulnerable. En este sentido, la agricultura de precisión es un concepto relativamente reciente que se enfoca en optimizar el uso de los recursos agrícolas con el propósito de hacer una gestión eficiente de las parcelas. Se basa en el reconocimiento de la variabilidad espacio-temporal intrínseca que supone el manejo de un cultivo considerando tres etapas: la recolección de datos al nivel intensivo de las variables de suelo, cultivo y microclima; la generación de información y el uso de esta información en la toma de decisiones.

La presente propuesta está centrada en la primera fase de la agricultura de precisión, específicamente en la recolección de datos, que lo lleva a cabo el sistema de adquisición de datos -SAD- entre los cuales están las estaciones climatológicas y las redes de sensores que monitorizan continuamente variables agroclimatológicas (temperatura, humedad, precipitación, presión atmosférica, radiación solar, viento, temperatura del suelo y humedad del suelo).

La función principal de un SAD es la medición de una variable física por medio de sensores, realizar algunas tareas simples de procesamiento y, por último, enviar los datos a un centro para su posterior análisis. Con base en esto, la energía se consume en tres formas: adquisición, procesamiento de datos y operaciones de comunicación. Estos sistemas son desatendidos ya que se despliegan en un área determinada del cultivo, reciben poca intervención humana y son susceptibles a fallas.

En 2 se describe una taxonomía de fallas presentadas en la etapa de adquisición del SAD que se clasifican: en centrada en los datos recolectados de los sensores (pa rámetros fuera del rango, valores atípicos, pocas o nulas variaciones para un periodo de tiempo más largo de lo esperado y ruido excesivo), y fallas centrada en el sistema (falta de calibración de los instrumentos, fallas en el hardware, batería baja, los valo res ambientales superan las capacidades del sensor). Para la etapa de transmisión la confiabilidad de los datos, según 3)-(4 se basa en métricas de redes tradicionales. La mitigación o la reducción de todos los tipos, fuentes y causas posibles de errores o fallas por medio de un conjunto de mecanismos y procedimientos es lo que se llama un control de calidad de los datos y es el enfoque de nuestra propuesta.

En agricultura de precisión la mayoría de procesos y mecanismos de control de calidad de los datos se ejecutan en el centro de datos 5)-(7, sobre una base de datos y hacen uso del contexto que según Dey 8 se define como “cualquier información que puede ser caracterizada para definir una situación de una entidad” y almacenados como metadatos 5)-(6. Los metadatos son el resultado de la interacción y el conocimiento de información relacionada con el ambiente y la información procesada de otros sistemas de adquisición llamada información contextual que ayuda a modelar la situación de recolección de datos.

Nuestra propuesta se enmarca en definir y adaptar ciertos mecanismos de control de calidad de datos en el SAD, planteando una arquitectura que haga frente a los re cursos limitados de los sistemas de adquisición e integre los metadatos para enriquecer el proceso de control de calidad 9.

El resto del documento se estructura de la siguiente forma: la sección 2 plantea la arquitectura de alto nivel; en la sección 3 se explica el modelo lógico del proceso de control de calidad de los datos; la sección 4 muestra en detalle los niveles funcionales de la capa de control de calidad y en la sección 5 se presentan algunas conclusiones.

1. TRABAJOS RELACIONADOS

A continuación se resumen algunos trabajos relacionados, agrupados en las siguientes temáticas de interés: las arquitecturas presentes en un SAD, los mecanismos de control de calidad y los atributos de información contextual.

En la arquitectura se tienen tres niveles 7: en el primero se encuentran los datos y metadatos de los sensores; en el segundo se procesan los datos con una base de conocimiento (local y global), y en el tercero, el almacenamiento de los datos.

Los mecanismos de control de calidad de los datos en estaciones climatológicas deben seguir una serie de criterios tanto en el diseño, como en la operación de redes climatológicas y la trazabilidad de los datos según la WMO (World Meteorological Organization) en donde se aplican técnicas, reglas de decisión y detección de errores sobre cada sensor. Por lo general, dichos mecanismos se operan sobre un solo sensor y se computan en una base de datos central. 5)-(7), (10.

Los atributos de información contextual se evidencian en la etapa de transmisión de datos en un SAD, representados por los parámetros de comunicación 4, entre ellos: el retardo, el ancho de banda del canal, la capacidad de la red y la velocidad detransmisión. Sumado a esto la descripción de algunos atributos y metadatos es alma cenada en una base de datos central 5)-(6, 11. Estos metadatos no son utilizados, ni procesados dentro del SAD, sino que generan nuevos servicios para los usuarios en el centro de datos.

No existen mecanismos de control de calidad que se ejecuten en la etapa de adqui sición y procesamiento del SAD. Además, la información contextual que está inmersa en este proceso de captura de información no se integra a los procesos de control de calidad de los datos.

2. ARQUITECTURA QUE CONSIDERA EL CONTEXTO

La arquitectura propuesta a través de sus componentes persigue generar en el SAD una mejora en la calidad de los datos capturados de los sensores y enviarlos al centro de datos como información de alta confiabilidad para la toma de decisiones en el ámbito agrícola. En el proceso de definir una arquitectura se establecen las siguientes funcionalidades:

Dicha arquitectura se concibe desde tres aspectos: el primero de ellos el modelo físico de un sistema de adquisición representado en un nodo sensor, el segundo un modelo contextual 12 que enriquece el proceso de control de calidad de los datos y el tercero un modelo interoperable, orientado a servicios y conectado a la web como es SWE (Sensor Web Enablement) especificado por la OGC (Open Geospatial Con sortium) 13.

El modelo físico se basa en la estructura hardware de un nodo sensor que se com pone de la unidad de sensado, la unidad de procesamiento, la unidad de comunicación y la unidad de energía. La unidad de sensado recopila los datos del sensor y los transfiere a la unidad de procesamiento, esta a su vez posee un pequeño almacenamiento que almacenan los datos temporalmente durante las tareas de procesamiento. La unidad de comunicación transfiere los datos desde el nodo a otros nodos o estación base y por último la unidad de energía que suministra al sensor y al nodo la fuente de energía para realizar sus funciones. Se debe tener en cuenta las restricciones de estos componentes hardware para mantener un grado de autonomía aceptable.

El modelo contextual 12 describe la información contextual presente en un nodo sensor: un contexto de sensado que ofrece el conocimiento relacionado con la captura de los datos; un contexto de nodo que evalúa el estado del nodo y el impacto de interoperabilidad con otros nodos; el contexto de red referida a las funcionalidades de colaboración e interrelación con otros nodos y, por último, el contexto al nivel de la organización que impone los objetivos, la seguridad y las restricciones de privacidad de la organización. Estos contextos buscan enriquecer el proceso de control de calidad de los datos definiendo un conjunto de metadatos.

El modelo interoperable se basa en SWE 14 que aporta un framework de estánda res y buenas prácticas al nivel del modelo de información con acceso a los parámetros y capacidades del sensor desde un entorno web; SWE abarca: el esquema de observaciones y medidas (Observation & Measurement Schema, O&M) 15 que define un modelo de datos y esquemas XML para representar observaciones y medidas obtenidas por un sensor; el lenguaje de modelamiento de sensor (Sensor Model Language, SensorML) 16 que define un modelo de datos y esquemas XML para describir sistemas y pro cesos de sensores, y el servicio SOS 17 que define una interfaz de servicio web para la petición, filtrado y lectura de información de observaciones y sistemas de sensores.

En la Figura 1 se muestra la arquitectura de alto nivel propuesta, en donde el modelo contextual se sobrepone sobre el modelo físico con el fin de evidenciar los metadatos que son descritos para ser interoperables según la iniciativa SWE.

Arquitectura contextualizada de un SAD
Figura 1
Arquitectura contextualizada de un SAD

A continuación se describe cada componente de la arquitectura propuesta.

3. CONTROL DE CALIDAD DE LOS DATOS

El control de calidad de datos (CCD) se refiere a los procesos y técnicas enfocados a mejorar la eficacia de los datos existentes. Además, debe incluir procedimientos para el retorno a la fuente de datos para verificarlos y prevenir la repetición de los errores. Es decir, si el valor de temperatura ambiente para la ciudad de Popayán, Colombia, registrado en el SAD es de 42 °C y según promedios históricos de temperatura para la ciudad es de 19 °C, este valor está por fuera del patrón de referencia ambiental, y el dato debe ser marcado como inconsistente para llevar a cabo las acciones necesarias, tales como la calibración del sensor, o su mantenimiento debido a un posible ruido en la medición de la variable temperatura producto de un agente externo.

El conocimiento de los procedimientos relativos al proceso de captura de los datos y al control de calidad permite a los usuarios evaluar la validez de la observación y convertir el proceso en un ciclo de mejora continua. Es por ello que se construye un modelo lógico (Figura 2) que describe el flujo de los datos, las actividades para mejorar la calidad y los resultados obtenidos del proceso.

Modelo lógico capa de control de calidad de datos
Figura 2
Modelo lógico capa de control de calidad de datos

La propuesta aborda:

Q.1. Buenos (datos con errores menores o iguales a un valor especificado)

Q.2. Inconsistentes (uno o más parámetros son incompatibles)

Q.3. Dudoso (sospechoso)

Q.4. Erróneos (datos con errores superiores a un valor especificado)

Q.5. Perdidos o faltantes.

4. NIVELES DE CONTROL DE CALIDAD

A continuación se muestra una jerarquía que se establece en la capa de control de calidad de los datos en un SAD producto del contexto de los datos y del sistema. To dos los niveles siguen el mismo modelo lógico propuesto anteriormente, teniendo sus diferencias en la información de los metadatos, los mecanismos de control de calidad utilizados, y las acciones a seguir cuando los datos son considerados sospechosos o erróneos.

5. CONCLUSIONES

La arquitectura propuesta refleja la capa de control de calidad de los datos y la forma como interactúa con las demás capas del SAD considerando el contexto de variables agroclimatológicas para agricultura de precisión. Esto fue posibles gracias a situarse en el modelo físico de un SAD, para sobreponerlo con un modelo contextual de sensado y enriquecerlo con estándares abiertos e interoperables como el SWE.

La capa de control de calidad y sus diferentes niveles muestran un modelo de da tos contextual compuesto por valores agroclimatológicos capturados por los sensores, información proveniente de otros niveles e información contextual almacenada como metadatos. Además, los mecanismos de control de calidad seleccionados tienen el conocimiento del contexto de sensado, y sus salidas son datos controlados en calidad a partir de una serie de marcas de calidad que siguen las normas de la OMM para su futura transmisión a un centro de datos donde se toman las decisiones del negocio.

La división por niveles de la capa de control de calidad permite una especialización en el manejo de datos resultantes que conducen a una mejora continua en el control de calidad de todo el SAD.

6. AGRADECIMIENTOS

Proyecto AgroCloud WP2 del programa RICCLISA financiado por Colciencias, Grupo de Ingeniería Telemática, Universidad del Cauca.

REFERENCIAS

1 [] C. LAU, A. Jarvis, and J. Ramírez, “Agricultura Colombiana: Adaptación al Cambio Climático”, Cent. Int. Agric. Trop. (CIAT). 4p. …, vol. 1, p. 4, 2011.

2 [] K. Ni, M. Srivastava, N. Ramanathan, M. N. H. Chehade, L. Balzano, S. Nair, S. Zahedi, E. Kohler, G. Pottie, and M. Hansen, “Sensor network data fault types”, ACM Transactions on Sensor Networks, vol. 5, N.° 3. pp. 1-29, 2009.

3 [] E. C.-H. Ngai and P. Gunningberg, “Quality-of-information-aware data collection for mobile sensor networks”, Pervasive Mob.Comput., vol. 11, pp. 203-215, 2014.

4 [] S. Ji, R. Beyah, and Y. Li, “Continuous data collection capacity of wireless sensor networks under physical interference model”, Mob. Adhoc Sens. Syst. …, 2011.

5 [] C. L. Muller, L. Chapman, C. S. B. Grimmond, D. T. Young, and X.-M.Cai, “Toward a Stan dardized Metadata Protocol for Urban Meteorological Networks”, Bull. Am. Meteorol. Soc., vol. 94, no. 8, pp. 1161-1185, 2013.

6 [] K. Hubbard, J. You, and M. Shulski, “Toward a Better Quality Control of Weather Data”, pp. 3-30, 2012.

7 [] C. Gwilliams, A. Preece, and A. Hardisty, “Local and global knowledge to improve the quality of sensed data”, Int. J. …, vol. 2, N.° 2, pp. 164-180, 2012.

8 [] A. K. Dey, “Understanding and Using Context,” Pers. Ubiquitous Comput., vol. 5, N.° 1, pp. 4-7, 2001.

9 [] Organizacion Meteorológica Mundial - OMM, Guía de prácticas climatológicas Edición de 2011 OMMN.°100. GinebraSuiza, 2011.

10 [] D. C. Van Essen, K. Ugurbil, E. Auerbach, D. Barch, T. E. J. Behrens, R. Bucholz, A. Chang, L. Chen, M. Corbetta, S. W. Curtiss, S. Della Penna, D. Feinberg, M. F. Glasser, N. Harel, a C. Heath, L. Larson-Prior , D. Marcus, G. Michalareas, S. Moeller, R. Oostenveld, S. E . Peter sen , F. Prior, B. L. Schlaggar, S. M. Smith, a Z. Snyder, J. Xu, and E. Yacoub, “The Human Connectome Project: a data acquisition perspective”, Neuroimage, vol. 62, N.° 4, pp. 2222-31, 2012.

11 [] C. a. Fiebrich, C. R. Morgan, A. G. McCombs, P. K. Hall, and R. a. McPherson, “Quality Assurance Procedures for Mesoscale Meteorological Data”, J. Atmos. Ocean. Technol., vol. 27, N.° 10, pp. 1565-1582, 2010.

12 [] D. Ballari, M. Wachowicz, and M. A. M. Callejo, “Metadata behind the interoperability of wireless sensor networks”, Sensors, vol. 9, N.° 5, pp. 3635-3651, 2009.

13 [] G. Percivall, C. Reed, and J. Davidson, “Open Geospatial Consortium Inc . OGC White Pa per OGC ® Sensor Web Enablement: Overview And High Level Architecture”, 2007 IEEE Autotestcon, vol. 4540, N.° December, pp. 1-14, 2007.

14 [] R. Lemmens, T. Everding, C. Stasch, I. Simonis, J. Echterhoff, S. Liang, A. Bröring, and S. Jirka, New generation Sensor Web Enablement., vol. 11, N.° 3. 2011.

15 [] S. Cox, “Observations and measurements-XML implementation”, OGC document. Open Geospatial Consortium Inc., pp. 1-76, 2011.

16 [] M. Botts and A. Robin, “OpenGIS ® Sensor Model Language ( SensorML) Implementation Specification”, Design. p. 180, 2007.

17 [] A. Na and M. Priest, “Sensor Observation Service”, English, vol. OGC 06-009, N.° OGC 06-009r6, pp. 1-104, 2007.

18 [] S. J. K. Mason, S. B. Cleveland, P. Llovet, C. Izurieta, and G. C. Poole, “A centralized tool for managing, archiving, and serving point-in-time data in ecological research laboratories”, Environ. Model.Softw., vol. 51, pp. 59-69, 2014.

19 [] G. Huang, X. Y. Wu, M. Yuan, and R. F. Li, “Research on Data Quality of E&P Database Base on Metadata-Driven Data Quality Assessment Architecture”, Appl. Mech. Mater., vol. 530-531, pp. 813-817, 2014.

20 [] J. Estévez, P. Gavilán, and J. V. Giráldez, “Guidelines on validation procedures for meteorolo gical data from automatic weather stations”, J. Hydrol., vol. 402, N.° 1-2, pp. 144-154, 2011.

21 [] A. M. D. S. A. D. J. A. RitabanDutta Claire D’Este , “Dynamic Evaluation and Visualisation of the Quality and Reliability of Sensor Data Sources”, Int. J. Adv. Comput. Sci. Appl ., vol. 4, N.° 8, pp. 96-103, 2013.

22 [] C. Atzberger, “Advances in Remote Sensing of Agriculture: Context Description, Existing Operational Monitoring Systems and Major Information Needs”, Remote Sens., vol. 5, N.° 2, pp. 949-981, 2013.

HTML generado a partir de XML-JATS4R por