02450 Introduktion til machine learning og data mining

2024/2025

Kursusinformation
Introduction to Machine Learning and Data Mining
Engelsk
5
Bachelor
Kandidat
Kurset udbydes som enkeltfag
Generel retningskompetence (MSc), se flere
Generel retningskompetence (MSc), Architectural Engineering
Generel retningskompetence (MSc), Environmental Engineering
Generel retningskompetence (MSc), Civil Engineering
Generel retningskompetence (MSc), Wind Energy
Polyteknisk grundlag (MSc), Technology Entreneurship
Retningsspecifikt kursus (BSc), Kunstig Intelligens og data
Retningsspecifikt kursus (BSc), Data Science og Management
Retningsspecifikt kursus (BSc), Cyberteknologi
Retningsspecifikt kursus (MSc), se flere
Retningsspecifikt kursus (MSc), Applied Chemistry
Retningsspecifikt kursus (MSc), Quantitative Biology and Disease Modelling
Retningsspecifikt kursus (MSc), Architectural Engineering
Retningsspecifikt kursus (MSc), Wind Energy
Retningsspecifikt kursus (MSc), Human-Centered Artificial Intelligence
Retningsspecifikt kursus (MSc), Autonomous Systems
Retningsspecifikt kursus (MSc), Communication Technologies and System Design
Retningsspecifikt kursus (MSc), Environmental Engineering
Naturvidenskabelige grundfag, Kunstig Intelligens og Data
Teknologisk specialisering (MSc), se flere
Teknologisk specialisering (MSc), Bioinformatics and Systems Biology
Teknologisk specialisering (MSc), Petroleum Engineering
Teknologisk specialisering (MSc), Technology Entrepreneurship
Teknologisk specialisering (MSc), Autonomous Systems
Teknologisk specialisering (MSc), Wind Energy
Teknologisk specialisering (MSc), Applied Chemistry
Teknologisk specialisering (MSc), Communication Technologies and System Design
Teknologisk specialisering (MSc), Environmental Engineering
Teknologisk specialisering (MSc), Design and Innovation
Teknologisk specialisering (MSc), Quantitative Biology and Disease Modelling
Tilvalgskursus (B Eng), se flere
Tilvalgskursus (B Eng), Mobilitet, transport og logistik
Tilvalgskursus (B Eng), Produktion
Tilvalgskursus (B Eng), IT-elektronik
Tilvalgskursus (B Eng), Kemi og bioteknik
Tilvalgskursus (B Eng), Kemiteknik og International Business
Tilvalgskursus (B Eng), Elektroteknologi
Tilvalgskursus (B Eng), Softwareteknologi
Tilvalgskursus (B Eng), Global Business og Engineering
Tilvalgskursus (B Eng), Proces og innovation
Tilvalgskursus (B Eng), Sundhedsteknologi
Tilvalgskurser, Diplomingeniørretning, Maskinteknik
Teknologiske linjefag, Data Science og Management
Teknologiske linjefag, Cyberteknologi
Teknologiske linjefag, Kvantitativ Biologi og Sygdomsmodellering
F4A (tirs 13-17)
E4A (tirs 13-17)
Campus Lyngby
Aktiviteterne skifter mellem forelæsninger, opgaveregning og øvelser i Matlab, R eller Python (den studerende vælger selv mellem disse programmeringssprog). Øvelserne udføres i hold med 2-3 studerende.
13-uger
Eksamen afholdes på en særlig dag: klik på Eksamensplacering til venstre for at se dato
Skriftlig eksamen og bedømmelse af rapport(er)
Godkendelse af rapporter er en forudsætning for deltagelse i eksamen
Skriftlig eksamen: 4 timer
Ingen hjælpemidler :

Multiple choice
Det er tilladt at medbringe to A4-ark håndskrevne noter.

7-trins skala , ekstern censur
(01001/01002/01003/01004/01005).­(02402/02403).­(02002/02101/02102/02525/02631/02632/02633/02692) , Grundkursus i Lineær algebra og matematisk analyse, kendskab til sandsynlighedsregning eller statistik, kendskab til Matlab, Python eller R.
Morten Mørup , Tlf. (+45) 4525 3900 , mmor@dtu.dk
Bjørn Sand Jensen (Primær kontaktperson) , bjje@dtu.dk
Jes Frellsen , Lyngby Campus, Bygning 321, Tlf. (+45) 4525 3923 , jefr@dtu.dk
Mikkel N. Schmidt , Tlf. (+45) 4525 5270 , mnsc@dtu.dk
Tue Herlau , Lyngby Campus, Bygning 321, Tlf. (+45) 4525 5254 , tuhe@dtu.dk
Georgios Arvanitidis , Lyngby Campus, Bygning 321, Tlf. (+45) 4525 5241 , gear@dtu.dk
01 Institut for Matematik og Computer Science
http://www.compute.dtu.dk/courses/02450
I studieplanlæggeren
Kontakt underviseren for information om hvorvidt dette kursus giver den studerende mulighed for at lave eller forberede et projekt som kan deltage i DTUs studenterkonference om bæredygtighed, klimateknologi og miljø (GRØN DYST). Se mere på http://www.groendyst.dtu.dk
Overordnede kursusmål
At give deltagerne kendskab til:
* en række grundlæggende og bredt anvendte metoder til data modellering v.h.a. machine learning,
* en generel struktur til datamodellering,
* Matlab, R eller Python som værktøj til dataanalyse (deltagerne kan frit vælge mellem disse programmeringssprog).

Kurset sætter således deltagerne i stand til at benytte machine learning til modellering af real-world data.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Beskrive de vigtigste trin der er involveret i datamodellering fra forberedelse af data, modellering af data til evaluering og formidling af resultaterne.
  • Diskutere centrale machine learning begreber som featureudtrækning, kryds-validering, generalisering og overindlæring, prædiktion og curse of dimensionality.
  • Skitsere hvordan datamodelleringsmetoder virker og beskrive deres forudsætninger og begrænsninger.
  • Matche praktiske problemer til standard datamodelleringsproblemer såsom regression, klassifikation, tæthedsestimering, gruppering (clustering) og association mining.
  • Anvende struktureret datamodellering indenfor en bred vifte af anvendelsesområder såsom medicoteknik, bio-informatik, kemi, elektronik og computer science.
  • Beregne resultaterne af datamodelleringen ved brug af Matlab, R eller Python.
  • Bruge visualiseringsteknikker og statistik til at evaluere modelpræstationer, identificere mønstre og problemer med data.
  • Kombinere og modificere datamodelleringsværktøjer med henblik på at analysere eget datasæt samt formidle resultaterne af analysen.
Kursusindhold
Struktureret datamodellering. Dataforbedredelse. Featureudtrækning og dimensionalitetsreduktion, herunder principal komponent analyse. Similaritetsmål og beskrivende statistikker. Visualisering og fortolkning af modeller. Overindlæring og generalisering. Klassifikation (beslutningstræer, nærmeste nabo, naiv Bayes, neurale netværk og ensemblemetoder). Lineær regression. Gruppering (k-means, hierarkisk gruppering og mixturmodeller). Associeringsregler. Tæthedsestimering og outlierdetektion. Anvendelser indenfor et bredt spektrum af ingeniørvidenskab.
Litteraturhenvisninger
Kursusnoter
Bemærkninger
Kurset er et grundlæggende machine learning kursus som er relevant for alle tekniske diplom-, bachelor- og masterretninger. Kurset giver en indføring i grundlæggende machine learning, matematikken bag metoderne samt hands-on erfaring i metodernes anvendelser. Kurset kan således stå alene.
Sidst opdateret
31. juli, 2024