2015/2016

62500 Lineær algebra og data mining

Elteknologi (100)
IT, Ballerup: 4. semester

Engelsk titel:

Linear Algebra and Data Mining

Sprog:

Point( ECTS )

10

Kursustype:

Diplomingeniør
Kurset udbydes under tompladsordningen
 

Skemaplacering:

E1A (man 8-12) og E5A (ons 8-12)
F1A (man 8-12) og F5A (ons 8-12)

Undervisningens placering:

Campus Ballerup

Undervisningsform:

Forelæsninger, som er støttet og suppleret af projektarbejde.
Undervisningstiden er to ugentlige lektioner, hver på 4 timer i 13 uger. Tiden deles mellem introduktion af nyt stof og projektbaseret gruppearbejde med omfattende brug af computere – dels til udvikling, test og dokumentation af egen software dels til anvendelse af eksisterende software.

Kursets varighed:

13-uger

Eksamensplacering:

F1A, F5A, Eksamensdato annonceres på CampusNet mindst en måned før eksamen

Evalueringsform:

Eksamens varighed:

Hjælpemidler:

Bedømmelsesform:

Tidligere kursus:

ILADM4-U1,

Anbefalede forudsætninger:

Overordnede kursusmål:

Introduktion til lineær algebra. Fokus er på begreber, metoder og praktiske anvendelser med relevans for IT-ingeniører.
Kurset sigter mod en balance mellem en solid behandling af teorien og en tydelig prioritering af praktiske anvendelser, der præsenteres i tre CDIO-organiserede obligatoriske projekter.

Læringsmål:

En studerende, der fuldt ud har opfyldt kursets mål, vil kunne:
  • Forklare følgende begreber vedrørende vektorer: Linearkombination, basis, vektorrum, lineær afhængighed og lineær uafhængighed, proportionalitet, ortogonalitet. Fremstille en given vektor i en given basis. Beregne indre og ydre produkt og projektion af en vektor på en vektor.
  • Forklare følgende begreber vedrørende matricer: Rang samt søjlerum, rækkerum og de to nulrum for en matrix. Udføre matrixmultiplikation ved anvendelse af hhv. indre og ydre vektorprodukter samt søjlevis hhv. rækkevis fremstilling af produktmatricen. Fremstille rotationsmatricer og projektionsmatricer.
  • Udføre Gauss-elimination med følgende formål: Løsning af et ligningssystem, bestemmelse af rangen, konstatering af lineær afhængighed/​uafhængighed, identifikation af basis for de fire vektorrum for en matrix. Frembringe og anvende faktoriseringerne LU, LDU, PLU.
  • Definere mindste kvadraters løsning af et overbestemt ligningssystem. Opstille og løse normalligningerne.
  • Beskrive struktur og indhold af faktorerne i en SVD-faktorisering af en given matrix og dens pseudoinverse.
  • Anvende SVD-faktorisering og den pseudoinverse til løsning af ligningssystemer. Anvende SVD-faktorisering i praktiske projekter til datakompression, billedbehandling og mønstergenkendelse.
  • Definere egenløsningerne for en matrix. Anvende egenløsningerne til matrixdiagonalisering. Forklare og anvende algoritmer til implementering af potensmetoden og invers iteration til numerisk bestemmelse af egenløsninger.
  • Definere en Markov-proces og simulere den på en computer. Identificere ligevægtstilstanden for en Markovproces.
  • Gennemføre og dokumentere et CDIO-organiseret projektforløb.

Kursusindhold:

Vektorer: Linearkombinationer, vektorrum, baser, lineær afhængighed og uafhæn-
gighed, indre og ydre produkter, ortogonalitet, projektioner, normer.

Matricer: De fire tilknyttede vektorrum. Rang, normer, konditionstal. Ortogonale matricer.
Rotationsmatricer, permutationsmatricer, projektionsmatricer. Inverse og
pseudoinverse matricer. Faktoriseringerne LU, LDU, PLU, Cholesky og SVD.

Løsning af ligningssystemer: Gauss-elimination, pivotering, backwards substitution.
Regulære, singulære og nær-singulære systemer. Overbestemte systemer, normalligninger og mindste kvadraters løsning.
Brug af matrixfaktoriseringer i løsningsprocessen.

Indgående studium af SVD-faktoriseringen. Faktorernes struktur og egenskaber. Reduceret rang approksimation.
Pseudoinvers. Anvendelser.

Egenværdier og egenvektorer. Diagonalisering, transformation af egenværdispektret.
Numerisk bestemmelse af egenløsninger ved potensmetoden og invers iteration. Markov-processer.

Anvendelser introduceres i projektorienteret sammenhæng. Kursets aktuelle tre obligatoriske projekter omfatter:
• Billedbehandling, datakompression og approksimation af
billedmatricer ved hjælp af SVD-faktorisering.
Behandling af gråskala fotos og farvefotos.
• Klassifikation af håndskrevne cifre ved hjælp af centroid-baserede algoritmer og SVD-baserede algoritmer.
• Bestemmelse af egenløsninger. Analyse og simulering af Markov-processer.

Mulige valgbare projektemner: Principal komponentanalyse, clusteranalyse, data-mining.

Softwareplatform: Matlab

Litteraturhenvisninger:

Lars Elden, “Matrix Methods in Data Mining and Pattern Recognition”, SIAM, 2007. Forelaesningsnoter som er skrevet til kurset og tilpasset efter laerebogen.

Bemærkninger:

Indstilling til eksamen kræver aflevering og godkendelse af tre obligatoriske semesterprojekter. Alle projekter kræver
en teoretisk funderet problemanalyse og metodeudvikling med efterfølgende design af algoritmer, samt implementering, test og anvendelse af et Matlabprogram. Projektarbejdet skal dokumenteres i en rapport.

Kursusansvarlig:

Hans Christian Pedersen , Ballerup Campus, Bygning Ballerup, Tlf. (+45) 3588 5169 , hchpe@dtu.dk

Institut:

62 DTU Diplom

Tilmelding:

I CampusNet
Sidst opdateret: 23. juli, 2015