Program studiów

Program studiów podyplomowych na kierunku Inżynieria danych. Big Data.

Liczba miesięcy nauki: 9
Liczba godzin: 192
Liczba zjazdów: 10
Liczba semestrów: 2
Analiza danych w języku R
(18 godz.)

Środowisko R i RStudio, typy atomowe, wektory, listy, funkcje, data cleaning, tworzenie wykresów, markdown (18 godz.)

SYSTEMY BAZ DANYCH. PODSTAWY SQLA
(24 godz.)
  • Diagramy ERD, Normalizacja, MS SQL, DDL, SQL DML (24 godz.) 
Programowanie w języku Python
(24 godz.)
  • Składnia, tablice, funkcje,Pandas, Statystyka w Pythonie  (24 godz.) 
ANALIZA DANYCH W JĘZYKU JAVA
(32 godz.)
  • Podstawowe pojęcia programowania obiektowego, środowisko, narzędzia, co to jest analiza danych, data science a analiza danych, dlaczego Java, struktury danych – Java Collections Framework, ETL – pobieranie, przetwarzanie, ładowanie danych (16 godz.) 

  • Sposoby integracji z relacyjnymi bazami danych, przetwarzanie danych w podejściu funkcyjnym (16 godz.)

NOSQL (MICROSOFT AZURE)
(20 godz.)
  • Podstawowe koncepcje baz NoSQL - HBase, Cassandra, Impala, Neo4j (20 godz.)
PROGRAMOWANIE OBIEKTOWE W JĘZYKU PYTHON
(12 godz.)
  • Atrybuty, klasy, konstruktor, metody, dziedziczenie, „metody magiczne”  (12 godz.)
APACHE KAFKA
(6 godz.)

Interfejs Apache Kafka  - szybki start do strumieniowego przetwarzania danych (6 godz.)

ZAAWANSOWANE BAZY DANYCH I HURTOWANIE DANYCH
(24 godz.)
  • Zawansowane aspekty języka SQL i TSQL; Koncepcje modelowania hurtowni danych (ROLAP, MOLAP, HOLAP); Technologie ETL/ELT; Elementy prezentacji danych np. Power BI (24 godz.)
NARZĘDZIA BIG DATA (MICROSOFT AZURE)
(24 godz.)

Apache Hadoop & Apache Spark  (24 godz.)

PROJEKT
(8 godz.)
  • Seminarian projektowe (8 godz.) 
FORMA ZALICZENIA

testy semestralne i egzamin końcowy polegający na obronie projektu.