Los objetivos del curso son (1) Presentar los fundamentos de los sistemas de gestión de bases de datos de grafos (GDBMS).
Entender los modelos de datos en los que se basan, su implementación, y su uso en el contexto actual de “Big
Data”. Distinguir los problemas para los cuales utilizar grafos es más eficiente que utilizar los sistemas tradicionales.
(2) Presentar y discutir los temas de investigación y problemas abiertos. (3) Interesar a los participantes a integrar
proyectos de investigación en el tema. Se discutirán los dos tipos de grafos utilizados actualmente: property graphs
y RDF triple stores. Se caracterizarán y estudiarán diferentes tipos de consultas sobre BD de grafos. Luego se
profundizará sobre property graphs, y su implementación más difundida, Neo4j.
(1) Presentar los fundamentos de los sistemas de gestión de bases de datos de grafos (GDBMS).
Entender los modelos de datos en los que se basan, su implementación, y su uso en el contexto actual de “Big
Data”. Distinguir los problemas para los cuales utilizar grafos es más eficiente que utilizar los sistemas tradicionales.
(2) Presentar y discutir los temas de investigación y problemas abiertos. (3) Interesar a los participantes a integrar
proyectos de investigación en el tema. Se discutirán los dos tipos de grafos utilizados actualmente: property graphs
y RDF triple stores. Se caracterizarán y estudiarán diferentes tipos de consultas sobre BD de grafos. Luego se
profundizará sobre property graphs, y su implementación más difundida, Neo4j.
1. Contexto. Conceptos de Big Data. El paradigma NoSQL.
2. Modelos de datos. Historia. El modelo de grafos: Modelo de grafos como alternativa al modelo
relacional. Property graphs vs RDF triple stores.
3. El modelo de datos Neo4j. El lenguaje de consulta Cypher. Consultas básicas
4. Consultas avanzadas en Cypher.
5. Ciencia de datos en Neo4j. Content y collaborative-based recommendation.
6. Ciencia de datos en Neo4j. Ejemplos: Twitter, Twitch, IMDB
7. El modelo de grafos edge-labeled: RDF
8. Consultando RDF: SPARQL.
9. Implementaciones del modelo RDF - triple stores.
- Realización de dos proyectos, uno individual y otro grupal.