Kollektioner

När man programmerar arbetar man ofta med kollektioner av data. Ponera att du som student vill hålla reda på alla kurser du planerar att läsa under en termin. Vi skulle tekniskt sett kunna lösa detta genom att skapa en separat variabel per kurs enligt:

course1 = "OOP I"
course2 = "Datastrukturer"
course3 = "Databaser"
# And so on for each course

Men detta tillvägagångssätt skulle snabbt bli ohållbart (eller åtminstone väldigt opraktiskt). Tänk om vi vill lägga till en kurs, Programmering i Python som löper samtidigt som Datastrukturer (nuvarande course2) men långt innan Databaser (nuvarande course3), ska den då läggas till som course4 eller behöver vi ändra namnet på våra existerande variabler för att upprätthålla någon form av struktur? Detsamma gäller om vi skulle vilja ta bort en kurs, lista namnet på alla kurser i alfabetisk ordning eller dylikt. Det skulle kräva mycket repeterad och omfattande kod samt att vi eventuellt modifierar existerande kod - vilket vi självfallet vill undvika.

Collections in Python

Låt oss därför introducera konceptet kollektioner, mer specifikt listor, vilket är en typ av kollektion i Python. Vi kan då enkelt gruppera våra deltagare baserat på vilken sträcka de registrerat sig för enligt:

coursesT1 = ["OOP I", "Datastrukturer", "Programmering i Python"]
coursesT2 = ["Databaser", "Webbapplikationer"]
# And so on for each term

Vi har nu organiserat vår data i kollektioner där resp. lista representerar en grupp av kurser per termin. Detta tillåter oss dels att organisera vår data, men även att utföra operationer på listorna, t.ex. som att skriva ut namnet på alla kurser för en termin genom att tillämpa iteration:

coursesT1 = ["OOP I", "Datastrukturer", "Programmering i Python"]

for course in coursesT1:
    print(course)

OOP I
Datastrukturer
Programmering i Python

Det är möjligt att skriva ut innehållet i listan utan att tillämpa iteration, exempelvis enligt: print(coursesT1). Detta kommer dock att resultera i en något annorlunda utskrift eftersom att vi skriver ut hela listan snarare än resp. element i listan. I detta fall skulle vi alltså få utskriften ['Objektorienterad programmering I', 'Datastrukturer', 'Programmering i Python']. Nämnvärt är även att detta tillvägagångssätt är något säreget för Python. Om vi skulle försöka utföra motsvarigheten till print(coursesT1) i C# eller Java så skulle vi exempelvis istället bara få ut vilken datatyp variabeln avser snarare än dess innehåll. Utgångspunkten bör således vara att tillämpa iteration vid utskrift av element i kollektioner.

Python erbjuder flera inbyggda kollektioner som är designade för att hantera grupper av objekt på olika sätt där de mest använda kollektionerna är listor, tupler, dictionaries och mängder.

Fördelar med kollektioner

Kollektioner i Python, såsom listor, tupler, dictionaries och mängder (sets), erbjuder flera fördelar som gör dem oumbärliga i programmering:

Organisering av data:
Kollektioner tillåter organisering av relaterad data på ett strukturerat sätt. Detta förenklar hanteringen av data och gör det lättare att utföra operationer på datauppsättningar.
Flexibilitet:
Kollektioner kan dynamiskt ändras under körning av programmet, med undantag för tupler som är oföränderliga. Du kan lägga till, ta bort och ändra element, vilket gör dem mycket anpassningsbara till programmets behov.
Effektivitet i dataåtkomst:
Dictionaries erbjuder snabb åtkomst till data via nycklar, vilket gör det enkelt att hämta och uppdatera värden utan att behöva genomgå hela samlingen.
Stöd för iteration:
Kollektioner kan enkelt itereras över, vilket möjliggör genomgång och manipulation av varje element i samlingen.
Inbyggda operationer:
Python erbjuder en mängd inbyggda funktioner och metoder för att arbeta med kollektioner, vilket inkluderar filtrering, sortering, och aggregering av data.

Användning av iteration med kollektioner

Iteration är en central aspekt när det kommer till arbete med kollektioner i Python. Genom att använda loop:ar, såsom for-loop:ar, kan du utföra operationer på varje element i en samling. Exempelvis med listor enligt:

vegetables = ["onion", "potato", "carrot"]
for veggie in vegetables:
    print(veggie)

onion
potato
carrot

Och med dictionaries enligt:

person = {"name": "Eric", "age": 30}
for key, value in person.items():
    print(f"{key}: {value}")

name: Eric
age: 30

Funktionen items() kan nyttjas för att hämta alla nyckel-värde-par (key-value pairs) som lagrats i en dictionary. I ovan exempel itererar vi sedan över resp. par och skriver ut dem enligt formatet: nyckel: värde.

Dynamiskt typat språk (Dynamically typed language)

Den dynamiska typningen i Python tillåter variabler att referera till objekt av olika datatyper under programmets körning, vilket ger en stor flexibilitet i hur data kan hanteras och lagras.

När vi pratar om kollektioner i Python, såsom listor, tupler, dictionaries och mängder, innebär flexibiliteten som följer av att vara ett dynamiskt typat språk att dessa kollektioner kan innehålla element av olika datatyper inom samma kollektion. Detta är möjligt eftersom kollektionerna i själva verket lagrar referenser till objekten de innehåller, snarare än de faktiska objekten. Varje element i en kollektion pekar på ett objekt någonstans i minnet, och detta objekt kan vara av vilken datatyp som helst.

Föreställ dig att du har en låda där du kan förvara olika saker - en bok, några mynt och en lapp med en anteckning. I detta scenario representerar lådan en kollektion i Python, och de olika föremålen representerar data av olika datatyper (boken kan representera en sträng, mynten en lista med heltal och lappen en sträng med anteckningen).

Varför är detta viktigt?

Denna möjlighet att förvara olika datatyper i samma kollektion gör Python mycket kraftfullt och flexibelt:

Datarepresentation:
Du kan skapa kollektioner som mer exakt representerar verklig data. Till exempel kan en lista som representerar en person innehålla en sträng för namnet, ett heltal för åldern och kanske en annan lista för personens intressen.
```
  person_info = ["Max Power", 25, ["Walks in the park", "F1"]]
  print(person_info)
```
```
['Max Power', 25, ['Walks in the park', 'F1']]
```
Förenklad hantering:
Istället för att hantera flera separata kollektioner för varje datatyp, kan du gruppera relaterad information i en enda kollektion, vilket förenklar datahanteringen. Givet vårt föregående exempel så skulle vi exempelvis behöva separera datan i olika variabler och kollektioner och sedan själva etablera en koppling mellan dem.
```
  name = "Max Power"
  age = 25
  interests = ["Walks in the park", "F1"]
  print(f'{name}, {age}, {interests}')
```
```
Max Power, 25, ['Walks in the park', 'F1']
```
I detta fall var en sådan koppling förhållandevis enkel att etablera, men i andra fall kan vi först behöva utvinna informationen från andra kollektioner och därefter försöka kombinera datan - vilket kan utgöra problem.
Flexibilitet i datastrukturer:
Du kan skapa komplexa datastrukturer, som nästlade kollektioner (listor i listor, listor i dictionaries, etc.), som kan representera mer komplexa relationer och hierarkier mellan data.

Kollektioner i kollektioner

Python är ett flexibelt språk som tillåter att olika datatyper lagras i samma kollektion, men vi kan även lagra kollektioner inuti andra kollektioner såsom listor i listor eller listor i dictionaries. Detta ger en enorm flexibilitet i hanteringen av datastrukturer och är mycket nyttosamt i kontexten av mer komplexa datastrukturer.

Exempelvis kan vi skapa en matris med listor i listor enligt:

matris = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]

#[1] refers to the index of the list we wish to look at and 
#[2] refers to the index of an element in that list
print(matris[1][2]) 

Vi skulle även kunna lagra listor i en dictionary, exempelvis enligt:

person = {
    "namn": "Alice",
    "ålder": 30,
    "intressen": ["programmering", "cykling", "konst"]
}

print(person["intressen"][1])

cykling

Sammanfattning

Kollektioner är ett kraftfullt verktyg i Python som möjliggör effektiv hantering och organisation av data. Genom att använda listor, tuples, dictionaries och mängder (sets) kan utvecklare skapa komplexa datastrukturer som speglar de verkliga datamodellerna mer exakt.

Dynamisk typning i Python tillför ytterligare en nivå av flexibilitet, vilket gör det möjligt att inkludera olika datatyper i samma kollektion. Denna flexibilitet, tillsammans med förmågan att iterera över kollektioner, gör Python till ett kraftfullt språk för datahantering och manipulation.