[MÚSICA] PermÃtanme presentarme. Soy Ramón Baldrich, profesor de departamento de ciencias de la computación, de la Universidad Autónoma de Barcelona. En el ámbito de investigación estoy trabajando en visión por computador y en el ámbito académico soy profesor de varias asignaturas relacionadas con inteligencia artificial. Bien, hasta el momento hemos visto un esquema general que cubre todas las etapas de un sistema de clasificación de imágenes basado en el paradigma de bag of words. Vamos a ver a continuación, en los próximos vÃdeos diferentes alternativas a cada una de las etapas que conforman el paradigma. Vamos a centrarnos especialmente en estos primeros vÃdeos en la etapa de extracción de caracterÃsticas y en la transición a la construcción de un vocabulario. Para ello veremos diferentes alternativas a cada una de las partes. La primera alternativa que vamos a ver va a ser una alternativa al descriptor que hemos visto hasta el momento SIFT, llamado SURF, Speeded Up Robust Features. En este caso el descriptor tiene una etapa de detección igual que SIFT, y una etapa de descripción. Vamos a ver cuáles son sus caracterÃsticas, y la idea que persigue este descriptor es aumentar la velocidad de respuesta, haciendo varias aproximaciones. La primera y más importante es la aproximación de los filtros de Gaussianos, o combinaciones de Gaussianas continuos a una aproximación binaria, con números enteros, con lo cual hace que las operaciones sean más eficientes. Y una segunda propuesta que es el uso de lo que llamamos imágenes integrales, que nos permiten hacer cálculos sobre regiones de la imagen si previamente hemos hecho unos sencillos cálculos sobre la totalidad de la imagen, ya la veremos en detalle con posterioridad. La siguiente alternativa que presentamos son diferentes propuestas para la detección de puntos, para la selección de puntos de interés. Hemos visto hasta ahora que la selección de puntos lo hacÃamos con un esquema de piramide, en la que detectábamos en diferentes escalas cuáles eran los principales. Existen otras alternativas, y entre ellas la de usar los descriptores o usar diferentes tipos de muestreos. Veremos las ventajas y desventajas de cada uno de ellos. Básicamente el descriptor es algo más compacto, los muestreos permiten cubrir toda la zona de la imagen que en el caso de descriptores no cubren, pero la desventaja evidentemente será el coste computacional y de memoria. Veremos cómo podemos solucionarlo. La siguiente alternativa a presentar es cómo podemos ampliar nuestra capacidad de describir los puntos. En la etapa de descripción, hasta ahora, hemos usado caracterÃsticas locales de forma para describir cada uno de los puntos de interés, y veremos cómo podemos añadir color, en este caso particular a esta información. El color es importante porque si tenemos este tipo de imágenes, que es con lo que trabaja SIFT, en imágenes en blanco y negro, en grises, nos es imposible distinguir cuál es el color de cada una delas flores que tenemos aquà presentes. Sin embargo con color es una tarea extremadamente fácil, y es lo que vamos a proponer, 2 esquemas, 2 técnicas para introducir el color dentro del descriptor que hemos introducido en la primera fase. Hay un esquema basado en histogramas y el otro esquema basado en los propios descriptores que estamos utilizando hasta el momento. Y finalmente vamos a ver cómo podemos conseguir mayor velocidad de respuesta si jugamos con el propio descriptor, olvidándonos de cómo está formado, de dónde proviene, simplemente tomando el descriptor como un vector, qué herramientas matemáticas podemos usar para que la dimensionalidad se reduzca. En el caso que nos ocupa tenemos SIFT con 128 dimensiones, si el número de puntos es muy elevado para que camins pueda trabajar con cierta soltura, necesitarÃamos que este vector no fuera tan grande. Tenemos esta técnica, la PCA, que a partir de una distribución de puntos, en este caso en 2 dimensiones, en el SIFT serÃan 128 dimensiones, ver que esta respuesta hay una dirección predominante. Por tanto lo que haremos es hacer una transformación donde esta dirección sea el eje principal, de manera que si solo usamos este eje la recuperación serÃa lo más fiel posible a los datos originales. Y con esto esperamos dar diferentes alternativas y esperamos que los siguientes vÃdeos mantengan el interés por el tema de clasificación de imágenes. [AUDIO_EN_BLANCO]