Podatkovno rudarjenje in analiza ogromnih podatkovnih množic

Poudarek je na praktičnem delu, kjer udeleženci uporabljajo osnovne algoritme podatkovnega rudarjenja na realnih primerih. Podrobneje so predstavljene metode shranjevanja podatkov in algoritmi podatkovnega rudarjenja.

Vsebina:

  • Kaj je podatkovno rudarjenje
    • Statistično modeliranje, strojno učenje, programerski pristopi k modeliranju, povzemanje
  • Statistične omejitve podatkovnega rudarjenja
    • Princip Bonferoni in ostale omejitve
  • MapReduce
    • primer Google, arhitektura MapReduce sistema, distribuiran datotečni sistem, preprost primer MapReduce algoritma: štetje besed
  • Pomembnost besed v dokumentih
    • Frequenca besede, mera za pomembnost
  • Uporaba Hadoop-a
  • Implementacija primera štetja besed
  • Nadgradnja algoritma za štetje besed z algoritmom za iskanje pomembnih besed na primeru Wikipedije

Ciljna skupina:

  • Načrtovalci IoT in Big Data storitev
  • R&D specialisti

Cilji:

  • Namen delavnice je poznati osnove podatkovnega rudarjenja, njegove omejitve in težave.
  • Uporaba sistema MapReduce ter reševanje realnih problemov z uporabo Hadoop-a.
Težavnost:
Tip dogodka:PredavanjeDemonstracije
Trajanje:1 dan
Predavatelji:Matej Kren
Kraj: Fakulteta za elektrotehniko
Tržaška 25
1000 Ljubljana
Povpraševanje
Prijavi se kot
Posameznik
Pravna oseba
Študent
Status prijav: Prijave niso možne

Prijava na e-novice