Ir al contenido principal

Tarea #1 VIsión Computacional - Python, Convolución discreta


Que tal para esta entrada se nos encargo hacer lo siguiente:

Objetivo
1) subrutina para aplicar una máscara de convolución discreta, de preferencia centralizado al pixel en cuestión;
2) con esa subrutina, calcular por lo menos un gradiente horizontal y un gradiente vertical, posiblemente más o también diagonales, con la posibilidad de combinarlos al tiempo de calcularlos a uno solo o combinando entre múltiples matrices de gradiente una vez terminada la aplicación de todas las máscaras de gradiente:
a) normalización de la matriz resultante de la manera que perciben factible y útil a [0, 255];
b) binarización que deje los bordes como zonas blancas y el resto negro


Antes de empezar
Si están en blanco de que se tiene que hacer (como nosotros al principio) les recomiendo entrar a las siguientes ligas y se refresquen un rato, están muy bien explicadas.
http://docs.gimp.org/es/plug-in-convmatrix.html (español)
http://www.songho.ca/dsp/convolution/convolution2d_example.html (ingles)

El código completo esta disponible en mi git.


Explicación
Ahora supondremos que ya saben lo que se tiene que hacer, así que continuemos.

Lo primero que tenemos que hacer es sacar TODOS los vecinos del PIXEL ACTUAL, yo hice 2 rutinas, una para sacar los vecinos en forma de cruz(arriba, izquierda, derecha, abajo) y la otra para los vecinos en diagonales(izqArriba, derArriba, izqAbajo, derAbajo).


Cada vecino esta en un bloque TRY-EXCEPT, esto para capturar el error(asignar el vecino(pixel) a cero) y el programa no termine.

Como podemos ver, cada rutina regresa 4 valores. Ahora lo que sigue es juntar esas variables(yo lo hice en forma de lista) y después ordenarlas para que queden de la siguiente forma:

Imagen 1

Les muestro el pedazo de código en donde lo hago:

Ahora que ya tenemos la matriz de la forma "imagen 1", es fácil multiplicar por cualquier mascara de 3x3. Por que ambas matices(los vecinos ordenados y la mascara) tienen la misma cantidad de elementos y se encuentran CENTRALIZADO, a que me refiero con "CENTRALIZADO": que el PIXEL ACTUAL se encuentra en el centro de la matriz.

Ahora sigue lo interesante.... la multiplicación de matrices, normalización y binarización.

Como yo lo hice... 
Aclaración: Yo para no batallar tanto, en vez de trabajar con matrices trabaje con listas... digamos que es un amor suicida.

La convolución a grandes rasgos es una suma de las multiplicaciónes de la "matriz X" mas las sumas de cada multiplicación de la "matriz Y". Un poco mas técnico:

Donde
F  = es la nueva imagen
f = imagen original
x = pixel en el eje x de la imagen original
y = pixel en el eje y de la imagen original
g/h = mascara
i = pixel en el eje x de la mascara
j = pixel en el eje y de la mascara


Aquí el pedazo de código en donde lo hago...

Este es la función para normalizar y binarizar.
Donde:
MINN  = (int) = El mínimo pixel localizado hasta el momento
MAXN = (int) = El máximo pixel localizado hasta el momento
RANGO_BINARIZACION = (int) Dato de entrada entre [0- 255]

El programa y sus parámetros
 PARÁMETROS DE ENTRADA                            
argv[1] = (string)nombre de la imagen a procesar  
argv[2] = (int)Rango mínimo - para el umbral      
argv[3] = (int)Rango máximo - para el umbral    
argv[4] = (string) mascara a usar (sobel || prewiit)
argv[5] = (int)Rango para binarizacion            


Todos cuentan con bloque try-except por si los llego a olvidar.


Resultados 


imagen original


Con mascara SOBEL - [DIMENCIONES] 1160 x 547

Convolución con mascara SOBEL


Normalizacion - SOBEL

y sus tiempos:
Umbral este en "0.0" porque para esta prueba fue desactivada


Con mascara PREWIIT - [DIMENCIONES] 1160 x 547


Convolución con mascara prewiit
Normalización - PREWIIT
y sus tiempos



 Binarización
Binarizacion con rango 30

Binarizacion con rango 150


Comentarios
No me gustaron los resultados tal vez aplicando otra formula para normalización saldrían los bordes mas claros... y por lógica la normalización se observaría con bordes mas precisos :|

Otro camino: http://es.wikipedia.org/wiki/Operador_Sobel



REFERENCIAS: 
http://elisa.dyndns-web.com/~elisa/teaching/comp/vision/bordes.pdf
y las ligas al principio de la entrada.

Comentarios

  1. Ojo con los acentos. Había que tomar tiempos. Estás muy cerca de perder un punto, pero por lo completo de la entrada te perdono. 5 pts.

    ResponderEliminar

Publicar un comentario

Entradas populares de este blog

Pequeño Juego con LEDS y Dip Switch

Siguiendo con los mini-proyectos, lo que quería hacer originalmente era un tipo "candado" con push-button y LEDs, el objetivo seria, meter la combinacion de botones correcta y los LEDS encendería por un motivo practico, en forma de serpiente. El objetivo no cambio, pero por falta de "material" lo hice con un dip switch de X entradas(depende de que tan grande quieras la combinación). CONOCIMIENTOS(max. 7 estrellas): Electronica:     ★ ★ Programación: ★ ★ Juego de Combinación + LEDs El programa es un poco mas complicado que el mini-proyecto pasado , pero aun asi es basico. Guardamos las salidas de los LEDs en un arreglo, despues con los valores recibidos y comparados de los dip switch jugamos con los LEDś. Hardware Requerido (1) Arduino Uno (6) LED (8) Resistencias 330 Ω (1) Dip Switch Circuito Usamos las salidas del ARduino 2-7 para los LEDS Usamos la salida A5, A4 para el dip switch Para hacer prender los LEDS tienes que encontrar la

Tarea #5 - Codigo Hamming - Python

Codigo hamming Liga al repo Teoria segun wikipedia Antes de los códigos Hamming se utilizaron ciertos códigos detectores de error, como lo fueron el código linteing, pero ninguno llegó a ser tan eficaz como los de Hamming. A continuación se describen algunos de estos códigos. Paridad   La   paridad   consiste en añadir un bit, denominado   bit de paridad , que indique si el número de los bits de valor 1 en los datos precedentes es par o impar. Si un solo bit cambiara por error en la transmisión, el mensaje cambiará de paridad y el error se puede detectar (nótese que el bit donde se produzca el error puede ser el mismo bit de paridad). La convención más común es que un valor de paridad   1   indica que hay un número impar de unos en los datos, y un valor de paridad de   0   indica que hay un número par de unos en los datos. info. completa y un vídeo que me ayudo mucho para esta tarea: (TIENEN QUE VERLO - OBLIGATORIO) http://www.youtube.com/watch?v=xiDPFm9PeLU Impleme

Potenciometro + pushboton + led

Bueno, estos días he estado practicando con los ejemplos de la pagina de Arduino , algunos que me llamaron la atención los voy a compartir, por supuesto con modificaciones. Nivel de conocimientos: Electronica:        ★   Programació n :    ★    Potenciometro + push-boton = LEDintensidad El mini-proyecto es controlar la intensidad de un LED mediante un potenciometro el cual combinado con push-botton para prenderlo o apagarlo. Hardware Requerido (1) Arduino UNO (1) Potenciometro (1) Push-boton (1) LED (1) Resistencia 330 Ω Circuito Conectamos el LED al PIN 9 del Arduino Conectamos el PUSH_BOTON al PIN ANOLOGICO 0 (A0) Conectamos el POTENCIOMETRO al PIN ANOLOGICO 1 (A1) El funcionamiento del circuito es basico, mientras tengas pulsado el Push-Boton el LED se mantendrá encendido y con el pontenciometro controlas la intensidad del LED. Código Video