62T22 Anvendt machine learning og big data

2021/2022

DTU Engineering Technology efteruddannelse
Valgmodul (Vf15), IT-Diplomuddannelsen
Software
Kursusinformation
Applied Machine Learning and Big Data
Dansk
10
Deltidsdiplom
Kurset udbydes som enkeltfag
Undervisning én aften om ugen kl. 17.00-20.30 over 14 uger. Opstart ultimo januar/primo feb. Efterår mandage 17-20.30. Forår torsdage 17-20.30.
Campus Ballerup
Forelæsning, gruppeøvelser og -diskussioner, egne cases, eksperimenter og kobling til egen ledelsespraksis.
[Kurset følger ikke DTUs normale skemastruktur]
Aftales med underviser, Eksamen planlægges af sekretariatet på DTU Learn for Life.
Mundtlig eksamen og bedømmelse af rapport(er)
7-trins skala , ekstern censur
62T33
62527. 62533
Optagelse på IT-Diplomuddannelsen forudsætter: - At ansøger har gennemført en relevant adgangsgivende uddannelse min. på niveau med en erhvervsakademiuddannelse eller en relevant videregående voksenuddannelse. - At ansøger har mindst to års erhvervserfaring efter gennemført adgangsgivende uddannelse.
John Aasted Sørensen
Lynn Eriksen , Ballerup Campus, Bygning Ballerup , lyka@dtu.dk
Roger Charles Munck-Fairwood , Ballerup Campus, Bygning Ballerup , romu@dtu.dk
62 Institut for Ingeniørteknologi og -didaktik
https://www.dtu.dk/uddannelse/efteruddannelse
På instituttet
Ca. 3 uger før kursusstart
Overordnede kursusmål
At sætte deltagerne i stand til at anvende machine learning værktøjer og metoder til dataanalyse og håndtering af store datamængder - og kunne reflektere over grundlaget
for etablering af et Big Data distribueret analysemiljø i egen organisation.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Have viden om og forståelse af terminologien inden for machine learning og Big Data.
  • Have viden om relevante open source programmeringssprog og statistikprogrammer og kunne reflektere over implikationerne af valg af disse.
  • Have viden om grundlaget for machine learning, distribueret lagring og analyse af store heterogene datasæt.
  • Have forståelse af dataselektering og funktionsberegning.
  • Reflektere over grundlaget for etablering af et Big Data distribueret analysemiljø.
  • Begrunde, vælge, konfigurere og validere et eller flere machine learning værktøjer til analyse og visualisering.
  • Anvende relevant open source programmeringssprog til analyse og visualisering af enorme mængder af data.
  • Foretage systematisk indsamling, oprensning, lagring, analyse og rapportering af en virksomheds store heterogene datamængder herunder ikke komplette data-frames.
  • På et begrundet valg anvende en dataselekterings- og funktionsmodel og tilhørende værktøjer på egne data.
  • Viden om konfigurering af eget miljø til distribueret analyse af store datamængder.
  • På en reflekteret måde bidrage til at transformere egen virksomheds forretning på baggrund af en systematisk indsamling, oprensning, lagring, analyse og rapportering af en virksomheds data.
Kursusindhold
- Matematik til mangedimensionale data.
- Machine learning, visualisering, clustering og klassifikation.
- Opsamling, konvertering, scripting og oprensning af heterogene datasæt.
- Introduktion til administration og vedligeholdelse af et cluster, f.eks. Linux med Hadoop eller Spark.
- Visualisering af analyseresultater.
- Distribuering og beregning af enorme mængder af heterogene data.
Litteraturhenvisninger
https:/​/​www.polyteknisk.dk/​home/​akademi/​cv
Sidst opdateret
03. august, 2021