La Recuperación de Información Multimedia, Multimedia Information Retrieval (MIR), estudia el problema de extraer y buscar información en imágenes, audio, videos, textos y, en general, cualquier documento no estructurado.
En los sistemas de Recuperación de Información Multimedia destacan dos fases principales:
-
Representación de contenido donde se extrae información relevante para describir el contenido de cada documento.
-
Búsqueda por similitud donde se analizan y comparan descriptores de contenido con el objetivo de buscar y ordenar los documentos relevantes a la consulta.
Este curso estudia ambas fases, esto es, técnicas de representación de contenido para audio, imagen, video y texto, y varios algoritmos de búsqueda eficientes y efectivos para grandes cantidades de datos.
El material docente del curso está dividido en cuatro partes.
-
Preliminares
-
Descripción de Contenido Multimedia
-
Búsquedas por Similitud
-
Métodos Avanzados
Código fuente para C++ 11:
- En un terminal cambiar al directorio donde está el archivo de
Makefile
y escribirmake
. - Ejecutar:
- Linux:
build/Ejemplo1
- Windows:
build\Ejemplo1.exe
- Linux:
Código fuente para Python 3:
- Los archivos
.py
se ejecutan desde un terminal con el comandopython
. - Los archivos
.ipynb
deben ser abiertos con Jupyter.
- Handbook of Multimedia Information Retrieval. Eidenberger. 2012.
- Modern Information Retrieval. Baeza-Yates, Ribeiro-Neto, 2011.
- Multimedia Retrieval. Blanken, de Vries, Blok, Feng. 2007.
- Foundations of Multidimensional and Metric Data Structures. Samet. 2006.
- Deep Learning with Python. Chollet. 2018.
- The Essential Guide to Image/Video Processing. Bovik. 2009.
- H.264 and MPEG-4 Video Compression. Richardson. 2003.
- Digital Image Processing. Gonzalez, Woods. 2008.
- Data Mining: The Textbook. Aggarwal. 2015.
- Similarity Search The Metric Space Approach. Zezula, Amato, Dohnal, Batko. 2006.
- Computer Vision. Algorithms and Applications. Szeliski. 2011.
- Deep Learning: A Practitioner's Approach. Patterson, Gibson. 2017.
El curso CC5213 se dicta en el Departmento de Ciencias de la Computación de la Universidad de Chile. Es un curso electivo de la carrera de ingeniería civil en computación y es tomado por estudiantes de pregrado de ingeniería (computación, eléctrica, industrial) y estudiantes de posgrado (magíster y doctorado en computación).
Actualmente (Otoño 2020) el curso se está dictando en la FCFM, Universidad de Chile.
Parte del material de este curso también se usa en el curso Recuperación de Información del Diplomado de Ciencia de Datos.