Περιεχόμενο μαθήματος (Syllabus)



Η εξέλιξη της τεχνολογίας σε συνδυασμό με την καθολική χρήση του διαδικτύου έχει συμβάλλει σημαντικά στη συσσώρευση τεράστιων όγκων δεδομένων. Τα πεδία των εφαρμογών που απαιτούν εντατική επεξεργασία/ανάλυση δεδομένων είναι ποικίλα όπως εφαρμογές ιατρικής, βιοπληροφορικής, ανάλυση κοινωνικών δικτύων, ανάλυση πωλήσεων, επεξεργασία και  ανάλυση επιχειρησιακών δεδομένων (δίκτυο πωλήσεων και πελατών, δεδομένων ERP),  επεξεργασία και ανάλυση ροών δεδομένων από δίκτυα αισθητήρων κλπ.   Στόχος του μαθήματος είναι η κατανόηση σύγχρονων «συστημάτων διαχείρισης βάσεων δεδομένων» (ΣΔΒΔ) και τεχνολογιών που επιτρέπουν την διαχείριση και ανάλυση μεγάλου όγκου δεδομένων.

Τα θέματα που θα καλύψει το μάθημα πιο αναλυτικά είναι:

  • Βασικές έννοιες Συστημάτων Διαχείρισης Βάσεων Δεδομένων , Σχεσιακών ΣΔΒΔ, Ευρετηρίων.
  • Σύγχρονες Τεχνολογίες:
    1. ΝοSQL/NewSQL (Column, Document/XML, Object/Relational, Graph/RDF, Key-Value, In-Memory) ΣΔΒΔ
    2. Χωρικών και Χρονικών ΣΔΒΔ
    3. Πολυμεσικών ΣΔΒΔ
    4. Data Warehousing και OLAP Συστημάτων
    5. Κατανεμημένων Συστημάτων διαχείρισης βάσεων δεδομένων (ΣΔΒΔ),
    6. Συστημάτων Εντατικής Επεξεργασίας Δεδομένων (Hadoop/Map Reduce, Streaming)
  • Παρουσίαση θεμάτων ανάλυσης και εξόρυξης μεγάλου όγκου δεδομένων με στόχο την κατανόηση προτύπων, την εύρεση ομοιοτήτων, τον προσδιορισμό συσχετίσεων, τον εντοπισμό ομαλοτήτων ή ανωμαλιών  (Data Analytics και Data Mining μέθοδοι).
  • Θέματα Βελτιστοποίησης σε ΣΔΒΔ  και Δομές Ευρετηρίων
    • Βελτιστοποίηση Ερωτημάτων
    • Χωρικά Ευρετήρια
    • Ευρετήρια Κειμένων
    • Χρονικά Ευρετήρια
    • Δεικτοδότηση στην δευτερεύουσα μνήμη
    • Κατανεμημένα Ευρετήρια

Αναλυτικές Πληροφορίες(PDF)

Συνιστώμενη Βιβλιογραφία



  1. Database Management Systems (3 ed.). Raghu Ramakrishnan and Johannes Gehrke. 2002. McGraw-Hill, Inc., New York, NY, USA.
  2. Database Systems Concepts (5 ed.). Abraham Silberschatz, Henry Korth, and S. Sudarshan. 2005. McGraw-Hill, Inc., New York, NY, USA.
  3. Introduction to Data Mining. Pang-Ning Tan, Michael Steinbach, and Vipin Kumar. Addison-Wesley, April 2005. ISBN: 0-321-32136-7.
  4. Data Mining: Concepts and Techniques. J. Han and M. Kamber,  Morgan Kaufmann Publishers, Second Edition, 2006.
  5. Modern Information Retrieval. Ricardo A. Baeza-Yates and Berthier Ribeiro-Neto. 1999. Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA.
  6. Introduction to Information Retrieval. Christopher D. Manning, Prabhakar Raghavan, and Hinrich Schütze. 2008. Cambridge University Press, New York, NY, USA.
  7. Handbook of Massive Data Sets. James Abello, Panos M. Pardalos, and Mauricio G. C. Resende (Eds.). 2002. Kluwer Academic Publishers, Norwell, MA, USA.
  8. Foundations of Multidimensional and Metric Data Structures. Hanan Samet. 2005.  Morgan Kaufmann Publishers Inc., San Francisco, CA, USA

Μέθοδοι αξιολόγησης / βαθμολόγησης



  • Εκπόνηση Προγραμματιστικής Εργασίας [60%]
  • Παρουσίαση Θεωρητικού Θέματος [40%]

Προαπαιτήσεις



  • Βάσεις Δεδομένων
  • Δομές Δεδομένων και Αλγόριθμοι
  • Ανάκτηση Πληροφορίας
  • Εξόρυξη Γνώσης