\documentclass[12pt]{article}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% Preambulo
\usepackage[lmargin=2cm,rmargin=2cm,top=1.5cm,
bottom=2cm]{geometry}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[english,spanish,es-tabla]{babel}
\textheight=20cm
\parindent=0cm %modificar tamaño de sangria 
\usepackage{amsmath}
\usepackage{amssymb,amsfonts,latexsym,cancel}
\usepackage{graphicx}
\usepackage{epstopdf}
\usepackage{float}
\usepackage{subfigure}
\usepackage{array}
\usepackage{longtable}
\newcolumntype{E}{>{$}c<{$}}
\setcounter{MaxMatrixCols}{40}
\usepackage{bm}
\usepackage{fancyhdr}
\usepackage{enumerate}
\pagestyle{fancy}
{\fancyhead[R]{
		\includegraphics[scale=1.09]{figuraspa5/encabezado}
	}
}

\headheight=100pt %para cambiar el tamaño del encabezado

\fancyfoot{}
\fancyfoot[R]{\thepage}
\fancyfoot[L]{http://revistas.utm.edu.ec/index.php/Informaticaysistemas}
\renewcommand{\footrulewidth}{0.9pt}
\date{5 de Octubre de 2019}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% Paquetes o configuración nueva 
%---->%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\usepackage[sc]{mathpazo}
\usepackage{multicol}
\usepackage{titling}
\usepackage{titlesec}
\usepackage[colorlinks = true,
linkcolor = blue,
urlcolor = black,
citecolor = blue ]{hyperref}

\titleformat{\section}[block]{\bfseries}{\thesection.}{3mm}{}
\titleformat{\subsection}[block]{\bfseries\centering}{\thesubsection.}{1mm}{}
%% Titulo del articulo
%%
%%------------------------------------------------
\setlength{\droptitle}{-4.5\baselineskip}
\title{{\Huge\textbf{APLICACIÓN DE UN ALGORITMO DE DETECCIÓN DE FRONTERAS LINEALES A IMÁGENES DE ELECTROFORESIS }}}

\author{
	Yandi Fernández Ochoa$^{1}$, Leydis Lamoth Borrero$^{2}$, Marlen Machado Orges$^{3}$,\\Luis Velázquez Pérez$^{4}$\\ \\
	\small{$^{1}$Universidad UTE, Ecuador, yandi.fernandez@ute.edu.ec,\\ \small{$^{2}$Universidad de Holguín, Cuba, llamothb@facinf.uho.edu.cu,}\\
	\small{$^{3}$Universidad de Holguín, Cuba, zmachado@facinf.uho.edu.cu,}\\
\small{$^{4}$Centro para la Investigación y Rehabilitación de las Ataxias Hereditarias (CIRAH),ataxia@cristal.hlg.sld.cu}}\\
}
%---->%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\begin{document}
	\maketitle
	\begin{abstract}
		El Sistema para el Análisis de Electroforesis surge como requerimiento del Centro para la Investigación y Rehabilitación de las Ataxias Hereditarias (CIRAH) en la ciudad de Holguín, Cuba, motivado por la necesidad de contar con una herramienta informática de apoyo al diagnóstico de este grupo de padecimientos. El objetivo del sistema es facilitar y humanizar el proceso de análisis de las bandas de ADN de los pacientes, resultantes de la aplicación de la técnica de electroforesis en gel de agarosa, con el propósito de favorecer la toma de deci-siones de los especialistas encargados del proceso de diagnóstico de la Ataxia Hereditaria en el CIRAH. Para el procesamiento de las imágenes obtenidas de la aplicación de esta técnica y la detección de las fronteras de las bandas de ADN se implementa un algoritmo que es resultado de modificaciones al que emplea el software profesional GelMaster con objetivos similares al descrito anteriormente pero inaccesible al centro asistencial por su elevado costo. 
		
		\textbf{Palabras-clave:}análisis digital de imágenes, reconocimiento de patrones, algoritmo, electroforesis, ataxia.
	\end{abstract}
	
	\newpage
	\selectlanguage{english}
	\begin{abstract}
		The Electrophoresis Analysis software was developed as a requirement of the Center for Research and Reha-bilitation of Hereditary Ataxias (CIRAH in Spanish) in the city of Holguin, Cuba, motivated by the need to have a computer tool to support the diagnosis of this group of health conditions. The objective of the system is to facilitate and humanize the process of analyzing the DNA bands of the patients, resulting from the applica-tion of the agarose gel electrophoresis technique, with the purpose of facilitating the decision-making process of the specialists in charge of the process of diagnosis of Hereditary Ataxia in CIRAH. For the processing of the images obtained from the application of this technique and the detection of the borders of the DNA bands, an algorithm was implemented, which modifies the one used by the professional GelMaster software with ob-jectives similar to that described above but inaccessible to the health center because of its high cost.
		\textbf{Keywords:} digital image analysis, pattern recognition, algorithm, electrophoresis, ataxia.
		
	\end{abstract}
	\section{Introducción}
La ataxia espinocerebelosa tipo 2 (SCA2) es una enfermedad caracterizada por el desorden en los movimien-tos, torpeza y pérdida de la coordinación y puede afectar los brazos, piernas, cuerpo en general, el habla y los movimientos oculares, causados por condiciones médicas y neurológicas diferentes. En Cuba, específicamente en Holguín, se localiza el mayor número de personas afectadas por la enfermedad. Por ello se crea, en 2002,  el Centro para la  Investigación y Rehabilitación de las Ataxias Hereditarias (CIRAH), que cuenta con el perso-nal técnico y profesional calificado para brindar una atención integral y sistemática al paciente atáxico. Entre sus funciones se encuentra la de diagnosticar la enfermedad [1] [2] [3].\\
Para el diagnóstico de la Ataxia Hereditaria se demanda de un estudio molecular, o lo que es lo mismo, el aná-lisis del ADN de los pacientes con riesgos, para lo cual se emplea la técnica de electroforesis para obtener imá-genes que sirvan de apoyo a la toma de decisiones. En virtud de lograr la informatización de esta actividad es necesario el procesamiento digital de las imágenes resultantes de la utilización de dicha técnica [4] [5]. \\
Esta técnica permite separar fragmentos de ADN en función de su tamaño al aplicar una corriente eléctrica a un gel en el interior del cual se ha introducido una mezcla de fragmentos. Éstos comienzan a moverse desde el polo negativo al polo positivo de tal modo que los fragmentos más pequeños se mueven más rápido que los más grandes. Cuando la corriente cesa, los fragmentos de ADN se han distribuido a lo largo del gel, situándose los más pequeños más cerca del polo positivo, adoptando una apariencia similar a un código de barras. Cada barra contiene un fragmento de ADN de un tamaño determinado. Un componente fluorescente es empleado para visualizar la posición de las bandas de ADN en el gel para ser fotografiada y obtener una prueba perma-nente del experimento [5] [6].
	\begin{figure}[H]
		\centering
		\includegraphics[scale=1]{figuraspa5/figura1}
		\caption{Imagen de electroforesis.}
	\end{figure}
En la figura 1 se presenta la imagen de un gel obtenida tras la realización de una electroforesis. Los elementos fundamentales de la imagen son:
\begin{enumerate}[•]
	\item  Pozos, que representan el lugar donde se depositan los fragmentos de ADN en el gel y el punto de ori-gen de movimiento de estos. 
	\item  Sendas, que representan el espacio entre las líneas verticales, cada una está relacionada con una mues-tra de ADN de un paciente.
	\item  Bandas, que representan los conjuntos de líneas horizontales ubicado en las sendas con los fragmentos de ADN.
	\item   Distancia de movilidad, que representa la posición de las bandas respecto al pozo en píxeles [7].
\end{enumerate}
En el CIRAH, el análisis de estas bandas hasta ahora se ha realizado de forma visual a partir de la imagen cap-tada por una cámara digital por los especialistas encargados de ello, por lo que se incurre en diferencias de criterios y lentitud en el diagnóstico. \\
El presente trabajo se centra en el diseño de un algoritmo que detecte las bandas de ADN en las imágenes de electroforesis, así como en el procesamiento digital de las zonas de interés de dichas imágenes. Este algoritmo fue implementado en un sistema  informático para facilitar el análisis y gestión de la información de las imá-genes resultantes de electroforesis, por parte de los especialistas encargados del proceso de diagnóstico de la Ataxia Hereditaria en el CIRAH.
\section{Desarrollo}	
\textbf{Imágenes. Imágenes biomédicas}\\
Una gran parte de los estudios que se realizan en la medicina se basan en el análisis de imágenes resultantes de tomografías axiales computarizadas, resonancias magnéticas y rayos X, por mencionar algunos. En el caso del análisis de ADN empleando la técnica de electroforesis, se emplea la imagen de las bandas para la determina-ción de un conjunto de indicadores.\\
Una imagen digital es un conjunto de puntos denominados píxeles. Cada píxel está formado por cuatro com-ponentes, de los cuales se puede obtener toda la información que una imagen pueda brindar: Alfa (Nivel de transparencia), R (Nivel de rojo), G (Nivel de verde) y B (Nivel de azul). Estos valores pueden fluctuar entre 0 y 255 y su combinación forma los demás colores [8]. En el caso de las imágenes de electroforesis se requiere calcular cuatro valores de relevancia, los cuales están asociados a información proveniente de los píxeles de la imagen.\\
\\	\textbf{Tabla I. Relación entre parámetros médicos e informáticos.}\\
	
	\begin{tabular}{m{6cm}m{10cm}}
		\hline
		Intensidad, Masa &Valor medio de los píxeles que forman la banda \\
		\hline 
		Peso molecular, Distancia de movilidad & Distancia entre el pozo y la banda, en píxeles \\

	\end{tabular}\\ \\
Para el estudio de cualquier tipo de imagen se demanda de un procesamiento digital. Este procesamiento, tam-bién nombrado filtrado de imagen, describe cómo puede ser manipulada una imagen matemáticamente y pue-de dividirse en una serie de etapas que se muestran en la figura 2.
		\begin{figure}[H]
		\centering
		\includegraphics[scale=0.75]{figuraspa5/figura2}
		\caption{Etapas del procesamiento digital de imágenes.}
	\end{figure}
El procesamiento de una imagen tiene como primera etapa la reducción de ruido y otros elementos que puedan dificultar el posterior análisis de la misma. Este problema puede ser resuelto con la aplicación de uno o varios filtros a la imagen, los cuales se encargan de tratar los píxeles de la vecindad, homogeneizando los valores de los mismos. En el caso del análisis de imágenes de electroforesis, el primer filtro que se aplica a la imagen es la conversión de la misma de RGB a escala de grises. Luego se aplica una convolución espacial, que en términos matemáticos significa calcular el color de cada píxel de acuerdo al de sus vecinos. Un operador de convolu-ción puede ser empleado para suavizar o contrastar los elementos de una imagen [8]. \\
El suavizado de una imagen es muy útil en aquellas que presentan ruido en sus componentes, lo cual significa que la información de la misma no es confiable [8]. Considerando la necesidad de eliminar el ruido en las imágenes de electroforesis por la importancia que reviste obtener valores confiables,  se decidió que lo más conveniente era emplear un filtro de suavizado. Los operadores de convolución emplean los kernel para espe-cificar la combinación del píxel fuente con sus vecinos. Un kernel es simplemente una matriz, donde el ele-mento central representa el píxel fuente y los demás elementos, la vecindad de este. El color final del píxel fuente está determinado la suma de estos resultados de la multiplicación del color de cada píxel por el coefi-ciente correspondiente del kernel. Una vez creado el kernel es muy fácil crear un operador de convolución que lo emplee. Siempre que se quiera preservar el brillo original de la imagen, es necesario que los elementos del kernel sumen 1. El kernel empleado para el Sistema para el Análisis de Electroforesis fue:
		\begin{figure}[H]
	\centering
	\includegraphics[scale=1.25]{figuraspa5/figura3}
\end{figure}
Una vez obtenida una imagen mejorada con respecto a la original, es necesario detectar los bordes o fronteras de esta. Una frontera no es más que una discontinuidad fuerte entre niveles de gris adyacentes y para su detección existen algunas técnicas o procedimientos matemáticos. Entre ellos se pueden citar los basados en el gradiente y en la laplaciana, pero son muy sensibles al ruido, omiten algunos trozos de fronteras quedando estas cortadas, obtienen fronteras de grosor superior a un píxel y a veces detectan fronteras dobles. \\
Otro procedimiento empleado para la localización de contornos se puede mencionar el descrito por John Canny y conocido como Filtro de Canny. El filtro propuesto por Canny ha de ser óptimo sobre la base de que logran una buena detección, localización y devuelven una respuesta única. Sin embargo, todos estos métodos están dirigidos únicamente a la detección de fronteras. Para el completo análisis y comprensión de la imagen son necesarias otras técnicas que permitan obtener la información que brinda la imagen y que resulte relevante para el resultado que se desee obtener [9].
	\section{Algoritmo empleado}
	Teniendo como referencia el algoritmo que emplea el software GelMaster, creado con el mismo propósito que el Sistema para el Análisis de Electroforesis, se decidió su implementación para la confección de este dada su eficiencia en la eliminación de ruidos en las imágenes, detección de fronteras y eliminación de fronteras falsas, así como en la determinación de resultados. Sin embargo, GelMaster solamente está orientado al análisis de imágenes y no a la gestión de los resultados, cuestión tenida en cuenta para la confección del Sistema para el Análisis de Electroforesis [10].\\
	El algoritmo consta de una serie de pasos, algunos de los cuales han sido modificados con el objetivo de estimar con mayor precisión las fronteras que limitan las bandas y mejorar los resultados que se brindan al usuario.\\
	El primer paso del algoritmo es la transformación de la imagen a escala de grises. Cuando una imagen es trabajada en escala de grises, el valor de los componentes R, G y B de cada píxel toman un mismo valor, por lo que esta puede ser trabajada como una matriz cuyos valores son los componentes de la imagen, o sea, un valor entre 0 y 255.\\
	Para detectar las fronteras de las bandas, se toma la región de la imagen seleccionada como una matriz con un número de filas igual al alto de la región objeto de análisis y un número de columnas igual al ancho de la misma. Los valores de la matriz serán los valores de los píxeles de la región en la intersección de las filas con las columnas. \\
	Ej. Región de la imagen seleccionada (16 filas x 7 columnas)\\
	\newpage
\textbf{Tabla II. Matriz de ejemplo de píxeles de una región de imagen.}	
		\begin{figure}[H]
	\centering
	\includegraphics[scale=1]{figuraspa5/figura4}
\end{figure}	
El segundo paso es la obtención de fronteras candidatas. Con este fin, para cada una de las filas de la imagen se calcula la diferencia acumulativa vertical, consistente en la suma de las diferencias entre los valores de los píxeles de una misma columna de una fila con su adyacente superior. Para el caso de la primera fila se asigna valor 0. \\	
\textbf{Tabla III. Diferencia acumulativa vertical.}	
\begin{figure}[H]
	\centering
	\includegraphics[scale=1]{figuraspa5/figura5}
\end{figure}	
Luego se compara el valor obtenido para cada una de las filas con sus adyacentes. En caso de que algún valor sea mayor que sus vecinos, se toma la fila como una frontera candidata.\\
\textbf{Tabla IV. Fronteras candidatas.}	
\begin{figure}[H]
	\centering
	\includegraphics[scale=1]{figuraspa5/figura6}
\end{figure}	
Estas fronteras candidatas dividen la región de la imagen en subregiones que pueden formar parte del fondo o de una banda. El tercer paso consiste en el refinamiento de las fronteras candidatas, razón por la cual se anali-zan las regiones comprendidas entre las fronteras candidatas. Para evitar el efecto de la vecindad, cada región es dividida en dos subregiones excluyentes por una línea equidistante de las fronteras candidatas que forman la región, para las cuales se calcula la media de los valores de los píxeles pertenecientes a dicha subregión.  Si una región estuviera formada por menos de tres filas, no se divide en subregiones y es considerada como una subregión única.\\	
\textbf{Tabla V. Regiones y subregiones del segmento de imagen.}	
\begin{figure}[H]
	\centering
	\includegraphics[scale=1.10]{figuraspa5/figura7}
\end{figure}	
El algoritmo que emplea el Sistema para el Análisis de Electroforesis usa un parámetro que determina la espe-cificidad que se  quiere lograr en la detección de las fronteras denominado umbral.\\
\newpage
\textbf{Tabla VI. Diferencia entre subregiones vecinas.}	
\begin{figure}[H]
	\centering
	\includegraphics[scale=1.10]{figuraspa5/figura8}
\end{figure}	
Si para dos regiones vecinas se cumple que las medias de sus subregiones adyacentes no difieren más que el nivel del umbral, se elimina la frontera candidata que divide a ambas regiones, pues se asume que forman par-te de una región homogénea. Una vez obtenidas las fronteras tras el primer proceso de umbralización, se calcu-la la media de las regiones formadas entre las fronteras candidatas adyacentes.	\\
\textbf{Tabla VII. Diferencia entre regiones vecinas.}	
\begin{figure}[H]
	\centering
	\includegraphics[scale=1.10]{figuraspa5/figura9}
\end{figure}	
Cada una de las medias de las regiones es comparada con sus vecinas. En caso de ser mayor que la de estas, y teniendo en cuenta que las bandas son las regiones más intensas de la imagen, la región es considerada parte de una banda, y las regiones superiores e inferiores de las mismas son analizadas de la siguiente manera: Si la diferencia entre la media de la región y la siguiente es menor que el factor de umbralización, la región es in-corporada a la banda. Este procedimiento se realiza hasta que la diferencia entre dos regiones adyacentes sea menor que dicho factor. De esta forma, al terminar este proceso, se obtendrán las fronteras horizontales de la región analizada.\\
Para la detección de las fronteras verticales de cada una de las bandas detectadas se realiza el mismo procedi-miento, sólo que la región que se analiza es la matriz de valores de los píxeles que se encuentran delimitados por las fronteras de la banda, rotando la misma para aplicar el algoritmo de manera horizontal.\\
Tras aplicar horizontal y verticalmente este algoritmo a la región de la imagen, se obtienen las bandas delimita-da por sus fronteras en ambas direcciones. Para estas bandas se calcula el valor medio de los píxeles que la conforman; así como la distancia a la que se encuentra del pozo donde fue depositado el ADN que da lugar a las mismas. Una comparación con patrones establecidos por el departamento de Biología Molecular del CIRAH, permite la homologación de estos parámetros de la imagen con indicadores  médicos de relevancia para el estudio del ADN.
\newpage
\section{Conclusiones}	
	El desarrollo de esta investigación estuvo orientado a la obtención de un algoritmo de detección de fronteras para su implementación en una herramienta informática para el apoyo al diagnóstico de la Ataxia Hereditaria, la cual repercuta en el mejoramiento de la calidad de trabajo y satisfacción de los encargados de llevar a cabo el proceso de análisis de las imágenes resultantes de electroforesis para determinar el estado de los posibles portadores de la enfermedad. Se evidenció que para la obtención de información relevante de las imágenes obtenidas al aplicar la técnica de electroforesis en gel de agarosa es necesaria la aplicación de algún método de reconocimiento de patrones que permita detectar las zonas de interés en las fotografías. Teniendo en cuenta la necesidad de la precisión en la información es de suma importancia la eliminación de falsos positivos (fronte-ras falsas), mediante el uso del álgebra matricial. Con el fin de perfeccionar la labor realizada en el presente trabajo, se sugiere continuar el refinamiento de la detección de fronteras en las esquinas de las bandas de ADN.
	
	\newpage
	\selectlanguage{spanish}
	\begin{thebibliography}{99}
		\bibitem{Nombre1} L. Velázquez Pérez, «Nueva era en las investigaciones e intervención sobre la ataxia espinocerebelosa tipo 2,» Correo Científico Médico, vol. 19, nº 4, pp. 598-604, 2015. 
		\bibitem{Nombre2} «CIRAH,» [En línea]. Available: http://www.ataxiacubana.sld.cu/code/ataxia.html. [Último acceso: 25 09 2019].
		\bibitem{Nombre3} «CIRAH,» [En línea]. Available: http://www.ataxiacubana.sld.cu/code/historia.html. [Último acceso: 25 09 2019].
		\bibitem{Nombre4} J. J. Magaña, M. D. Vergara, M. Sierra-Martínez, E. García-Jiménez, A. Rodríguez y M. R. Gómez, «Análisis molecular de los repetidos CAG en pacientes mexicanos con ataxia espinocerebelosa tipo 2,» Gaceta Médica de México, nº 5, pp. 413-418, 2008. 
		\bibitem{Nombre5} J. C. Prieto, O. L. Pedraza, M. Gómez y C. Durán, «Análisis molecular de la Ataxia de Friederich en Colombia,» Acta Neurológica Colombiana, vol. 20, nº 1, 2004. 
		\bibitem{Nombre6} L. Velázquez Pérez, L. Almaguer Mederos, R. Santos Falcón, R. Hechavarría Pupo, G. Sánchez Cruz y M. Paneque Herrera, «Ataxia espinocerebelosa tipo 2en Cuba. Estudio del fenotipo electrofisiológico y su correlación con variables clínicas y moleculares,» Revista Neurológica, vol. 33, nº 12, pp. 1129-1136, 2001. 
		\bibitem{Nombre7} F. Fierro Fierro, «Electroforesis de ADN,» Herramientas moleculares aplicadas en ecología: aspectos teóricos y prácticos, vol. 27, 2014. 
		\bibitem{Nombre8} J. E. Elizondo y L. P. Maestre, «Fundamentos de procesamiento de imágenes,» de Documentación Universidad Autónoma de Baja California, Unidad Tijuana, 2002. 
		\bibitem{Nombre9} «Canny edge detection step by step in Python,» [En línea]. Available: https://towardsdatascience.com/canny-edge-detection-step-by-step-in-python-computer-vision-b49c3a2d8123 [Último acceso: 25 09 2019].
		\bibitem{Nombre10} I. Bajla, I. Hollander, S. Fluch, K. Burg, M. Collar, «An alternativ method for electrophoretic gel image analysis in the GelMaster software,» Computer methods and programs in biomedicine, nº 3, pp. 209-231, 2005.
	\end{thebibliography}
\newpage
\section{Anexos}
\textbf{Interfaz del sistema informático que emplea el algoritmo de detección de fronteras}	
\begin{figure}[H]
	\centering
	\includegraphics[scale=0.75]{figuraspa5/figura10}
\end{figure}
\end{document}