Pasar al contenido principal

Bases de Datos de Grafos

Los objetivos del curso son (1) Presentar los fundamentos de los sistemas de gestión de bases de datos de grafos (GDBMS).
Entender los modelos de datos en los que se basan, su implementación, y su uso en el contexto actual de “Big
Data”. Distinguir los problemas para los cuales utilizar grafos es más eficiente que utilizar los sistemas tradicionales.
(2) Presentar y discutir los temas de investigación y problemas abiertos. (3) Interesar a los participantes a integrar
proyectos de investigación en el tema. Se discutirán los dos tipos de grafos utilizados actualmente: property graphs
y RDF triple stores. Se caracterizarán y estudiarán diferentes tipos de consultas sobre BD de grafos. Luego se
profundizará sobre property graphs, y su implementación más difundida, Neo4j.
 

Objetivos

(1) Presentar los fundamentos de los sistemas de gestión de bases de datos de grafos (GDBMS).
Entender los modelos de datos en los que se basan, su implementación, y su uso en el contexto actual de “Big
Data”. Distinguir los problemas para los cuales utilizar grafos es más eficiente que utilizar los sistemas tradicionales.
(2) Presentar y discutir los temas de investigación y problemas abiertos. (3) Interesar a los participantes a integrar
proyectos de investigación en el tema. Se discutirán los dos tipos de grafos utilizados actualmente: property graphs
y RDF triple stores. Se caracterizarán y estudiarán diferentes tipos de consultas sobre BD de grafos. Luego se
profundizará sobre property graphs, y su implementación más difundida, Neo4j.
 

Público objetivo
Estudiantes de posgrado interesados en el área de Manejo de Datos e Información.
Temario

1. Contexto. Conceptos de Big Data. El paradigma NoSQL.
2. Modelos de datos. Historia. El modelo de grafos: Modelo de grafos como alternativa al modelo
relacional. Property graphs vs RDF triple stores.
3. El modelo de datos Neo4j. El lenguaje de consulta Cypher. Consultas básicas
4. Consultas avanzadas en Cypher.
5. Ciencia de datos en Neo4j. Content y collaborative-based recommendation.
6. Ciencia de datos en Neo4j. Ejemplos: Twitter, Twitch, IMDB
7. El modelo de grafos edge-labeled: RDF
8. Consultando RDF: SPARQL.
9. Implementaciones del modelo RDF - triple stores.

Conocimientos exigidos
Conocimientos de Bases de Datos y SQL
Metodología de evaluación

- Realización de dos proyectos, uno individual y otro grupal.

Detalles
Créditos
3
Arancel
15000
Inicio de curso
Fin de curso
Horario
A definir
Docentes
Dr. Alejandro A. Vaisman, Instituto Tecnológico de Buenos Aires
Dra. Adriana Marotta, grado 4, Instituto de Computación