Overordnede kursusmål
Maskinlæring fra naturlige signaler er forbedret betydeligt i de
seneste år takket være dyb læring (DL). DL er den primære teknologi
bag generativ AI for billeder og tekst. Forbedret billedgenkendelse
fører til mere nøjagtig billedbaseret medicinsk diagnose. Forbedret
talegenkendelse og behandling af naturligt sprog med DL vil føre
til mange nye intelligente applikationer inden for sundhedspleje og
IT. Mønstergenkendelse med DL i store datasæt vil give nye
værktøjer til lægemiddelopdagelse, tilstandsmonitorering og mange
andre databaserede applikationer.
Dette kursus give den studerende en detaljeret forståelse af dybe
kunstige neurale netværk, deres træning, deres implementering på
hurtige grafiske behandlingsenheder, deres begrænsninger og hvordan
man formulerer læring i et bredt spektrum af scenerier. Disse
inkluderer klassificering, regression, sekvenser og andre typer af
struktureret input og output, samt ræsonnement i komplekse miljøer.
Læringsmål
En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
- Demonstrere viden om maskinlæringsterminologi såsom likelihood
funktion, maksimum likelihood, Bayesiansk inferens,
fuldt-forbundne, foldnings-baserede, sekvens og Transformer neurale
netværk, og error back propagation.
- Forstå og forklar valg og begrænsninger af model for en given
anvendelse.
- Anvende og analysere resultater fra dybe neural netværk anvendt
i øvelser og eget projektarbejde.
- Planlægge, afgrænse og udførelse et anvendt eller
metodeorienteret projekt i samarbejde med medstuderende og
vejleder*.
- Vurdere og opsummere projektresultater i relation til formål,
metode og anvendt data*.
- Udføre projektet og fortolke resultater ved brug af GPU
beregningsværtøjer såsom PyTorch*.
- Strukturere og skrive en endelig kort teknisk rapport
indeholdende problemformulering, beskrivelse af metoder,
eksperimenter, evaluering og konklusion*.
- Organisere og præsentere projektresultater ved
projektfremlæggelsen og i rapporten*.
- Læse, vurdere og give feedback til arbejde af andre
studerende.
- * Hvis generativ AI anvendes i disse faser, skal det
dokumenteres og kritisk vurderes. En tjekliste vil blive udleveret
og skal afleveres som en del af rapporten.
Kursusindhold
Kursusplan uge 1-8:
1. Introduktion til statistisk maskinlæring, fuldt-forbundne
neurale netværk (FFNN) og back-propagation. Del I gør det selv med
papir og blyant.
2. Introduktion til statistisk maskinlæring, fuldt-forbundne
neurael netværk (FFNN) og back-propagation. Del II gør det selv med
NumPy.
3. Introduktion til statistisk maskinlæring, fuldt-forbundne
neurale netværk (FFNN) og back-propagation. Del III PyTorch.
4. Foldnings-baseret neurale netværk (CNN).
5. Sekvensmodellering for tekstdata med Transformere.
6. Praktisk indføring i at få det til at virke på en data science
case og værktøjer til beregning på grafiske beregning enheder
(GPU).
7. Variationelle metoder til ikke-superviseret og semi-superviseret
læring.
8. En introduktion til reinforcement læring.
Fra uge 6 og på fuld tid fra uge 9 vil resten af semesteret blive
brugt på vejledt projektarbejde.
Litteraturhenvisninger
Ian Goodfellow, Yoshua Bengio and Aaron Courville. Deep learning.
MIT Press, 2016.
https://www.deeplearningbook.org
Michael Nielsen. Neural networks and deep learning.
http://neuralnetworksanddeeplearning.comBemærkninger
Maskinlæring baseret på dyb læring står bag mange nylige fremskridt
inden for generativ AI, talegenkendelse, billedklassificering og
reinforcement learning. Disse udviklinger er primært drevet af
tilgængeligheden af hurtige computere, en overflod af data og
algoritmiske forbedringer i træning af neurale netværk. Man vil i
de kommende år kunne forvente at disse metoder vil føre til
tekniske fremskridt indenfor mange datadrevne områder.
Dyb læring og maskinlæring generelt oplever stor aktivitet både
inden for akademiske kredse og industrien. Dette kursus vil give
den studerende fundamentet til at anvende dyb læring i forskning og
industri.
Dette er et kursus i maskinlæring med fokus på beregning og
anvendelse. Projektet vil blive gennemført i samarbejde med
forskere på DTU eller i en virksomhed, der baserer sig på
maskinlæring.
Kurset er en del af fokusområdet Maskinlæring og Signalbehandling i
masterprogrammet i Matematisk Modellering og Computing.
Sidst opdateret
02. maj, 2024