# Python: Contenitori intrinseci (*built-in containers*)

### Rights & Credits

Il notebook è stato variamente trasformato, anche con l'aggiunta di contenuti, da Agostino Migliore, a partire dall'originale di:

- Simone Campagna (CINECA)
- Mirko Cestari (CINECA)
- Nicola Spallanzani (CNR-NANO)

# Contenitori

## Contenitori

Un contenitore è un oggetto (si noti che ogni cosa è definita come un oggetto in un object-oriented programming language come Python) che raccoglie più oggetti: variabili, interi e così via. Gli elementi di un contenitore possono essere anch'essi contenitori. I contenitori di Python sono molto facili da usare, versatili ed efficienti. I principali tipi di contenitori predefiniti sono

* tuple ()
* list []
* dict {}
* set {}, frozenset

## tupla

Una tupla è un elenco o collezione __ordinata__ (quindi una sequenza) e __immutabile__ di valori tipo arbitrario. Anche il numero di valori contenuti nella tupla è arbitrario. Il concetto di *ennupla* usato in matematica è molto simile, anche se usualmente riferito a oggetti dello stesso tipo. Definiamo una tupla di nome `a` come segue:

In [1]:
a = (3, 4, 5)
a

(3, 4, 5)

Le operazioni di *slicing* viste nella lezione precedente si possono effettuare anche sulle tuple.

In [2]:
a[1], a[1:], a[2:], a[:2], a[1:2], a[:2][0]

(4, (4, 5), (5,), (3, 4), (4,), 3)

In [3]:
b = 2,3  # Si può definire la lista anche senza usare le parentesi!
b

(2, 3)

Come abbiamo visto, gli elementi di una tupla possono essere di qualsiasi tipo, il che significa che una tupla non è necessariamente omogenea:

In [4]:
z = 3 + 1j
c = (4, z, "beta", b)
c

(4, (3+1j), 'beta', (2, 3))

In [5]:
r, i = z.real, z.imag
u = (r, i)
u

(3.0, 1.0)

In [6]:
d, m = divmod(100, 3)
d, m

(33, 1)

### Operazioni con le tuple

In [7]:
A = (1, 2, 3)
B = (4, 5, 6)

<span style="color:blue">Concatenazione</span>

In [8]:
A + B

(1, 2, 3, 4, 5, 6)

In [9]:
A + 2*B

(1, 2, 3, 4, 5, 6, 4, 5, 6)

<span style="color:blue">Reiterazione</span>

In [10]:
A*4

(1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3)

### Circa la sintassi delle tuple

Come abbiamo visto, non è necessario usare le parentesi per definire una tupla (esse sono comunque assegnate all'atto della creazione della tupla). La virgola è, invece, importante per definire l'oggetto come tupla.

In [11]:
x = 1
type(x)

int

In [12]:
y = 1,
type(y)

tuple

In [13]:
y

(1,)

Le parentesi sono necessarie solo per definire la tupla vuota:

In [14]:
V = ()
V

()

In [15]:
t = (1, 2, 3)

In [16]:
t[0] = 17

TypeError: 'tuple' object does not support item assignment

In [17]:
T = (10, 5, 7, 19)

In [18]:
T[3:]

(19,)

In [19]:
T[3]

19

In [20]:
t + T[3:]

(1, 2, 3, 19)

In [21]:
t + T[3]

TypeError: can only concatenate tuple (not "int") to tuple

## lista
Una lista e' una sequenza __ordinata__, __mutabile__ e di lunghezza arbitraria di oggetti. Le liste sono, in pratica, tuple mutabili e sono definite con parentesi quadre.

In [22]:
R = [1,2,3]
R

[1, 2, 3]

### Operazioni semplici con le liste

In [23]:
2*R
R

[1, 2, 3]

In [24]:
R *= 3
R

[1, 2, 3, 1, 2, 3, 1, 2, 3]

In [25]:
S = 2*R
S

[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]

In [26]:
R += [4]
R

[1, 2, 3, 1, 2, 3, 1, 2, 3, 4]

Possiamo assegnare elementi ad una lista:

In [27]:
R[1:4] = ["x","y","z"]
R

[1, 'x', 'y', 'z', 2, 3, 1, 2, 3, 4]

In [28]:
R[5:12] = [7, 8, 9]
R

[1, 'x', 'y', 'z', 2, 7, 8, 9]

In [29]:
R[3:5] = [10, 11, 12, 13]
R

[1, 'x', 'y', 10, 11, 12, 13, 7, 8, 9]

### Metodi per manipolare le liste
Si può aggiungere un elemento alla fine di una lista (appendere, in inglese *append*) tramite il metodo <span style="color:blue">append()</span> della classe lista (cioè, una funzione definita come attributo di tale classe). Tale funzione prende un solo argomento in ingresso ed è appunto l'oggetto da aggiungere alla lista:

In [30]:
l = [1, 2, 3]
l

[1, 2, 3]

In [31]:
l.append(12)
l

[1, 2, 3, 12]

Si noti che la lista è mutabile; quindi essa è cambiata. Di conseguenza, ripetendo l'operazione di sopra, cambieremo la lista ulteriormente:

In [32]:
l.append(12)

In [33]:
print(l)

[1, 2, 3, 12, 12]


In [34]:
l.append([21, 17])
l

[1, 2, 3, 12, 12, [21, 17]]

Se vogliamo aggiungere due o più elementi separati, usiamo il metodo <span style="color:blue">extend()</span>:

In [35]:
l.extend([11, 13, 10, 20])
l

[1, 2, 3, 12, 12, [21, 17], 11, 13, 10, 20]

Il metodo <span style="color:blue">insert(A, p)</span> inserisce l'oggetto specificato come primo argomento (A) alla posizione passata come secondo argomento (p):

In [36]:
l.insert(4, "XYZ")
l

[1, 2, 3, 12, 'XYZ', 12, [21, 17], 11, 13, 10, 20]

Il metodo <span style="color:blue">pop()</span> rimuove l'ultimo elemento di una lista e lo riporta:

In [37]:
l.pop()

20

In [38]:
l.pop()

10

In [39]:
l

[1, 2, 3, 12, 'XYZ', 12, [21, 17], 11, 13]

Il metodo <span style="color:blue">remove()</span> elimina il primo elemento uguale a quello passato come suo argomento:

In [40]:
l.remove(12)
l

[1, 2, 3, 'XYZ', 12, [21, 17], 11, 13]

L'istruzione, o comando, <span style="color:blue">del</span> può rimuovere un elemento o una fetta della lista e persino l'intero contenuto di una lista.

In [41]:
del l[3]
l

[1, 2, 3, 12, [21, 17], 11, 13]

In [42]:
del l[4]
l

[1, 2, 3, 12, 11, 13]

In [43]:
del l[:]
l

[]

In [44]:
len(l)

0

In [45]:
l = [3, 1, 4, 7, 21, 12, 17]
l

[3, 1, 4, 7, 21, 12, 17]

In [46]:
len(l)

7

### Slicing di liste

Le liste, come le tuple, possono essere affettate.

In [47]:
l[0] # Si noti che il risultato di questa operazione non è un contenitore.

3

In [48]:
l[-2]

12

In [49]:
l

[3, 1, 4, 7, 21, 12, 17]

In [50]:
l[-2:]

[12, 17]

In [51]:
l[4] = 1, 2, 3
l

[3, 1, 4, 7, (1, 2, 3), 12, 17]

Le operazioni di *slicing* possono anche essere effettuate con un certo passo (*stride*), che può essere anche negativo (*extended slicing*). In tal caso, le parentesi quadre devono contenere informazioni sul range da cui pescare gli elementi e sulla lunghezza del passo.

In [52]:
l[0:6:2]

[3, 4, (1, 2, 3)]

In [53]:
L = [1,2,3,4,5,6,7,8,9]
L[7:0:-2]

[8, 6, 4, 2]

In [54]:
M = [1, 2, 4, 7, 3, 8, 5, 6, 17, 10, 12]
M[:8:3]

[1, 7, 5]

In [55]:
M.count(10)

1

### Altri metodi per manipolare le liste
Il metodo <span style="color:blue">sort()</span> consente di ordinare una lista omogenea (come impostazione predefinita, cioè *by default*, in ordine crescente). 

In [56]:
l.sort()
l

TypeError: '<' not supported between instances of 'tuple' and 'int'

In [57]:
del l[4]

In [58]:
l.sort()
print(l)

[1, 3, 4, 7, 12, 17]


In [59]:
Q = ['a','d','h','k','s', "a", "b", 'r','v','t','u']
Q.sort()
Q

['a', 'a', 'b', 'd', 'h', 'k', 'r', 's', 't', 'u', 'v']

Per ordinare la lista in modo decrescente, specifichiamo l'argomento di `sort()` come segue

In [60]:
l.sort(reverse=True)
Q.sort(reverse=True)
l, Q

([17, 12, 7, 4, 3, 1], ['v', 'u', 't', 's', 'r', 'k', 'h', 'd', 'b', 'a', 'a'])

Si noti, da sopra, che il metodo `sort()` accetta il parametro `reverse` con un valore booleano (valore di tipo `bool`) e che l'argomento viene passato al metodo "chiamando per nome" il parametro di input e assegnandogli il valore. Questa si chiama <span style="color:blue">assegnazione via nome</span> o via <span style="color:blue">keyword</span>.

L'ordine degli elementi in una lista può essere invertito usando il metodo <span style="color:blue">reverse()</span>:

In [61]:
Q.reverse()
Q

['a', 'a', 'b', 'd', 'h', 'k', 'r', 's', 't', 'u', 'v']

Qual'è, allora, la differenza con `l.sort(reverse=True)`?

### Introspezione di liste
L'<span style="color:blue">Introspezione</span> consiste nella capacità di Python di esaminare il tipo o le proprietà di un oggetto, in questo caso una lista, all'esecuzione (*at runtime*). Ci sono dei metodi che interrogano le proprietà di una lista e li riportano all'utente. Facciamo pochi esempi. Conosciamo già l'uso della funzione intrinseca `len()`.

In [62]:
len(Q)

11

Il metodo <span style="color:blue">count</span> prende un argomento e conta il numero di volte che il valore dell'argomento compare tra gli elementi della lista.

In [63]:
Q.count('a')

2

In [64]:
Q.count('b')

1

Il metodo <span style="color:blue">index</span> fornisce la posizione della prima volta che un elemento si presenta in una lista. Tale metodo, ma anche `count()` per esempio, funziona pure con le tuple.

In [65]:
Q.index("a")

0

In [66]:
Q.index('c')

ValueError: 'c' is not in list

## Esercizio
Provate

In [67]:
P = [1, 2, 4, 7, 3, 8, 5, 6, 17, 10, 12]
P[1::3]
P[:5:3]
P[8::-3]

[17, 8, 4]

e spiegate i risultati.

## range

La funzione <span style="color:blue">range</span> può essere usata per costruire una sequenza di interi:

In [68]:
range(4)

range(0, 4)

In [69]:
l = list(range(4))
t = tuple(range(7))
print(l,t,sep="    ")

[0, 1, 2, 3]    (0, 1, 2, 3, 4, 5, 6)


In [70]:
list(range(3, 9))

[3, 4, 5, 6, 7, 8]

In [71]:
list(range(3, 12, 2))

[3, 5, 7, 9, 11]

Si noti che la funzione built-in <span style="color:blue">range</span> non costruisce una lista o una tupla. Esso genera una sequenza, che è un oggetto <span style="color:blue">iterabile</span> in una certa direzione, senza immagazzinarla in memoria o riportarla. Tuttavia, al momento della creazione, la sequenza può essere utilizzata da altre funzioni e, in particolare, sopra è usata per creare una lista. A tal fine, abbiamo usato la funzione <span style="color:blue">list</span>, che può convertire `iterabili` in liste.

## set e frozenset

Un <span style="color:blue">set</span> è una sequenza __non ordinata__ e __mutabile__ di valori di tipo e numero arbitrari, senza doppioni. <span style="color:blue">Frozenset</span> è un set __immutabile__.
La mancanza di ordine comporta per esempio che, quando inseriamo elementi nel set, l'interprete di Python può cambiarne l'ordine in un modo che poi ne favorisce la ricerca.

In [72]:
S1 = {1, 3, 4}
S1

{1, 3, 4}

In [73]:
S2 = set((1, 2, 1, 3))
S2

{1, 2, 3}

In [74]:
S3 = set([2, 4, 8])
S3

{2, 4, 8}

In [75]:
S4 = set(range(0,10))
S4

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}

In [76]:
S5 = set()
S5.add(10)
S5.add(12)
S5.add(17)
S5

{10, 12, 17}

In [77]:
S5.discard(12)
S5

{10, 17}

In [78]:
S5.clear()
S5

set()

### Operazioni tra sets

In [79]:
s = {0, 1, 2, 3, 4, 5, 6}; t = {4, 5, 6, 7, 8, 9, 10}

In [80]:
u = s.union(t)
u

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

In [81]:
s.intersection(t)

{4, 5, 6}

In [82]:
s.difference(t)

{0, 1, 2, 3}

In [83]:
t.difference(s)

{7, 8, 9, 10}

In [84]:
s.symmetric_difference(t)

{0, 1, 2, 3, 7, 8, 9, 10}

## dict
Il nome di tale contenitore, <span style="color:blue">dict</span>, deriva dall'inglese *dictionary* (*dizionario*). Esso associa un nome chiave (o semplicemente __chiave__) a ciascun __valore__ di interesse. Ogni key (arbitrariamente scelta, ma poi unica e immutabile) è associata a un valore arbitrario e generalmente mutabile.

In [85]:
atomic_number = {'H': 1, 'He': 2, 'C': 6, 'Fe': 26}
atomic_number

{'H': 1, 'He': 2, 'C': 6, 'Fe': 26}

In [86]:
D = dict(a=1, b=2, c=3, d=4)
D

{'a': 1, 'b': 2, 'c': 3, 'd': 4}

Adesso cerchiamo il numero atomico dell'atomo di carbonio nel dizionario:

In [87]:
atomic_number['C']

6

Tra gli attributi di `dict`, i metodi <span style="color:blue">keys()</span> e <span style="color:blue">values()</span> forniscono (ovvero restituiscono, in inglese *return*), rispettivamente, le chiavi e i valori di un dizionario.

In [88]:
list(atomic_number.keys())

['H', 'He', 'C', 'Fe']

In [89]:
list(atomic_number.values())

[1, 2, 6, 26]

In [90]:
list(atomic_number.items())

[('H', 1), ('He', 2), ('C', 6), ('Fe', 26)]

L'operatore <span style="color:blue">in</span> consente di verificare se una key è contenuta in un dizionario:

In [91]:
'He' in atomic_number

True

In [92]:
'Au' in atomic_number

False

Aggiorniamo un dizionario:

In [93]:
D_new = {'e': 5, 'f': 6}
D.update(D_new)
D

{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6}

In [94]:
D.clear()
D

{}