Modulo Data
I dati censuari risultano essere differenti tra anno ed anno non solo per il loro contenuto ma anche per la struttura dati con cui sono stati condivisi.
In particolare gli anni 1991 e 2001 risultano avere una struttura dati uguale, mentre nel 2011 si ha una struttura totalmente differente.
Si è scelto dunque di normalizzare i dati 1991-2001 secondo la struttura dati del 2011 perchè per questo anno abbiamo i dati censuari pubblicati come csv
,
formato file più adatto alla condivisione dei dati rispetto a xls
.
Anni 1991-2001
census_trace(file_path, year, output_path)
Creazione del file di tracciato per gli anni 1991 e 2001.
PARAMETER | DESCRIPTION |
---|---|
file_path |
Path
TYPE:
|
year |
int
TYPE:
|
output_path |
Path
TYPE:
|
RETURNS | DESCRIPTION |
---|---|
Path
|
Path |
compare_dataframe(data)
Comparazione dell'intestazione dei dati censuari per definirne le differenze.
PARAMETER | DESCRIPTION |
---|---|
data |
list
TYPE:
|
RETURNS | DESCRIPTION |
---|---|
DataFrame
|
DataFrame |
merge_data_1991_2001(csv_path, year, separator=';', output_path=None, region_list=[])
Generazione di un unico file con tutti i dati censuari dell'anno selezionato.
PARAMETER | DESCRIPTION |
---|---|
csv_path |
Path
TYPE:
|
year |
int
TYPE:
|
separator |
str
TYPE:
|
output_path |
Path
TYPE:
|
region_list |
List
TYPE:
|
RETURNS | DESCRIPTION |
---|---|
Union[Path, DataFrame]
|
Union[Path, DataFrame] |
preprocess_csv_1991_2001(census_year, output_path, census_data_folder)
Processamento dei dati censuari per gli anni 1991 e 2001.
PARAMETER | DESCRIPTION |
---|---|
census_year |
int
TYPE:
|
output_path |
Path
TYPE:
|
census_data_folder |
Path
TYPE:
|
RETURNS | DESCRIPTION |
---|---|
Path
|
Path |
read_xls(file_path, census_code='sez1991', output_path=None, metadata=False)
Lettura dei dati censuari relativi agli anni 1991 e 2011 e costruzione di un DataFrame.
PARAMETER | DESCRIPTION |
---|---|
file_path |
Path
TYPE:
|
census_code |
str
TYPE:
|
output_path |
Path
TYPE:
|
metadata |
bool
TYPE:
|
RETURNS | DESCRIPTION |
---|---|
Union[DataFrame, Path]
|
Union[DataFrame, Path] |
remove_xls(folder_path, census_code, output_path)
Eliminiazione di tutti i file Excel.
PARAMETER | DESCRIPTION |
---|---|
folder_path |
Path
TYPE:
|
census_code |
str
TYPE:
|
output_path |
Path
TYPE:
|
Anno 2011
list_shared_columns()
Generazione della lista di tutti i dati condivisi.
RETURNS | DESCRIPTION |
---|---|
list
|
list |
merge_data(csv_path, year, separator=';', output_path=None, region_list=[])
Unione di tutti i dati censuari per l'anno selezionato in un unico DataFrame.
PARAMETER | DESCRIPTION |
---|---|
csv_path |
Union[Path, PosixPath]
TYPE:
|
year |
int
TYPE:
|
separator |
str
TYPE:
|
output_path |
Union[Path, PosixPath]
TYPE:
|
region_list |
List
TYPE:
|
RETURNS | DESCRIPTION |
---|---|
Union[Path, PosixPath, DataFrame]
|
Union[Path, PosixPath, DataFrame] |
read_csv(csv_path, separator=';')
Lettura di un csv e conversione in DataFrame.
PARAMETER | DESCRIPTION |
---|---|
csv_path |
Union[Path, PosixPath]
TYPE:
|
separator |
str
TYPE:
|
RETURNS | DESCRIPTION |
---|---|
DataFrame
|
DataFrame |