Program studiów

Program studiów podyplomowych na kierunku Big Data. Inżynieria danych

Liczba miesięcy nauki: 9
Liczba godzin: 192
Liczba zjazdów: 10
Liczba semestrów: 2
ANALIZA DANYCH W JĘZYKU R
(24 godz.)
  • Środowisko R i RStudio, typy atomowe, wektory, listy, funkcje, data cleaning, tworzenie wykresów, markdown (18 godz.) 
SYSTEMY BAZ DANYCH. PODSTAWY SQLA
(24 godz.)
  • Diagramy ERD, Normalizacja, MS SQL, DDL, SQL DML (24 godz.) 
PROGRAMOWANIE W JĘZYKU PYTHON
(24 godz.)
  • Składnia, tablice, funkcje, Pandas, Statystyka w Pythonie  (24 godz.) 
PROGRAMOWANIE OBIEKTOWE W JĘZYKU PYTHON
(12 godz.)
  • Atrybuty, klasy, konstruktor, metody, dziedziczenie, „metody magiczne” (12 godz.) 
ANALIZA DANYCH W JĘZYKU JAVA
(32 godz.)
  • Podstawowe pojęcia programowania obiektowego, środowisko, narzędzia, co to jest analiza danych, data science a analiza danych, dlaczego Java, struktury danych – Java Collections Framework, ETL – pobieranie, przetwarzanie, ładowanie danych (16 godz.) 

  • Sposoby integracji z relacyjnymi bazami danych, przetwarzanie danych w podejściu funkcyjnym (16 godz.) 
     

APACHE KAFKA
(6 godz.)
  • Interfejs Apache Kafka  - szybki start do strumieniowego przetwarzania danych (6 godz.) 

 

NOSQL (MICROSOFT AZURE)
(20 godz.)
  • Podstawowe koncepcje baz NoSQL - HBase, Cassandra, Impala, Neo4j (20 godz.)
ZAAWANSOWANE BAZY DANYCH I HURTOWANIE DANYCH
(24 godz.)
  • Zaawansowane aspekty języka SQL i TSQL; Koncepcje modelowania hurtowni danych (ROLAP, MOLAP, HOLAP); Technologie ETL/ELT; Elementy prezentacji danych np. Power BI (24 godz.)
NARZĘDZIA BIG DATA (MICROSOFT AZURE)
(24 godz.)
  • Apache Hadoop & Apache Spark  (24 godz.)
PROJEKT
(8 godz.)
  • Seminarian projektowe (8 godz.) 
Forma zaliczenia

 testy semestralne i egzamin końcowy polegający na obronie projektu.