Gentili studentesse, gentili studenti,
coloro che, tra voi, hanno consegnato il compito al primo appello di Metodi Statistici (ovviamente, canale B) dovrebbero aver ricevuto da UNIWEB un'email con la notifica del voto.
Vi comunico che la visione (individuale, alla cattedra) dei compiti avrà luogo mercoledì 04/02 alle ore 11:15 in aula Le.
Visto l'elevato numero di consegne e il relativamente poco tempo a disposizione (sia per la visione, sia nell'economia della sessione d'esami), colgo l'occasione per dare qualche feedback di carattere generale sui risultati, in particolare, della parte di MATLAB, che magari può essere sufficiente, per qualcuna/o di voi, a giustificarsi l'esito della prova.
Le penalizzazioni derivano, in larghissima parte, da due errori concettuali piuttosto gravi
- Esercizio 2 sul test statistico: l'esercizio chiedeva, in entrambi i turni, di eseguire un t-test appaiato a una coda su una popolazione in cui si riscontra una significativa diminuzione del peso, ben evidente già dalle medie. Il risultato atteso era, dunque, senza trabocchetti, che l'aumento di peso fosse non significativo, la diminuzione sì. Di conseguenza, chi tra voi ha affermato che, a fronte di 13 kg (!) in media di peso in meno alla fine dell'ipotetico studio, ci sia stato un significativo aumento o una non significativa diminuzione ha commesso un errore grave: bastava fare un sanity check sulle medie (o, meglio ancora, sugli istogrammi) per avere enormi indicazioni su come impostare l'analisi.
- Esercizio 3 sul clustering: i dati erano stati simulati per essere facilmente divisibili in tre cluster; in entrambi i turni si chiedeva se potesse essere buona una suddivisione in circa il doppio di cluster. Tantissime/i di voi si sono fatte/i ingannare da un valore di silhouette medio anche accettabile, ma hanno ignorato il fatto (a cui pur si alludeva nel testo dell'esercizio, che chiedeva di considerare tutti gli elementi, incluso il grafico dei centroidi) che ci fossero delle coppie di centroidi sostanzialmente sovrapposte. Si tratta, in questo senso, di un errore molto grave: com'è possibile definire buona una divisione in cluster i cui prototipi sono sovrapposti? Evidentemente, il numero di cluster ottimo, se esiste, non potrà che essere minore.
Colgo inoltre l'occasione anche per invitarvi a iscrivervi al o disiscrivervi dal secondo appello quanto prima e comunque non oltre il 5 febbraio.
Ancora una volta, per ovvie questione logistiche (siete, ad oggi, in 182 a fronte di 160 postazioni MATLAB), non si accetteranno iscrizioni fuori tempo massimo via email. Sono incoraggiate, invece, eventuali comunicazioni di assenza anche dopo la chiusura delle liste.
Un cordiale saluto,
EL