USPS adatbázis (United States Postal Services) rövidített változata az usps.mat állományban található. Az eredeti adatbázis mintegy 7200 tanulási és 2000 teszt-adatot tartalmaz. Egy adat - pont - egy kézzel írott számjegy 16x16-os bit-térképe (lásd a PDF dokumentumot)
A nagy adatbázisból csak a négyesek és hetesek kerültek bele a kisebb adatbázisba.
Bináris osztályozás: válasszuk el a négyeseket (4) a hetesektől (7).
Az értékelésnél a programot többször futtassuk: különböző kezdőértékeket vegyünk az általnuk választott modell paramétereinek (ha a végeredmény függ a kezdőértéktől) illetve az adatok sorrendjének (szintén csak akkor, ha ettől változik az eredmény).
Feladat értékelése: Program + dokumentáció
test_data | 256x290 | double array |
test_label | 1x290 | double array |
train_data | 256x400 | double array |
train_label | 1x400 | double array |
A program írásánál használhatunk létező programkódot illetve programozási környezetet.
Javasolt a Matlab használata és a NETLAB programcsomagé.