Skip to content

Modulo Data

I dati censuari risultano essere differenti tra anno ed anno non solo per il loro contenuto ma anche per la struttura dati con cui sono stati condivisi. In particolare gli anni 1991 e 2001 risultano avere una struttura dati uguale, mentre nel 2011 si ha una struttura totalmente differente. Si è scelto dunque di normalizzare i dati 1991-2001 secondo la struttura dati del 2011 perchè per questo anno abbiamo i dati censuari pubblicati come csv, formato file più adatto alla condivisione dei dati rispetto a xls.

Anni 1991-2001

census_trace(file_path, year, output_path)

Creazione del file di tracciato per gli anni 1991 e 2001.

PARAMETER DESCRIPTION
file_path

Path

TYPE: Path

year

int

TYPE: int

output_path

Path

TYPE: Path

RETURNS DESCRIPTION
Path

Path

compare_dataframe(data)

Comparazione dell'intestazione dei dati censuari per definirne le differenze.

PARAMETER DESCRIPTION
data

list

TYPE: list

RETURNS DESCRIPTION
DataFrame

DataFrame

merge_data_1991_2001(csv_path, year, separator=';', output_path=None, region_list=[])

Generazione di un unico file con tutti i dati censuari dell'anno selezionato.

PARAMETER DESCRIPTION
csv_path

Path

TYPE: Path

year

int

TYPE: int

separator

str

TYPE: str DEFAULT: ';'

output_path

Path

TYPE: Path DEFAULT: None

region_list

List

TYPE: List DEFAULT: []

RETURNS DESCRIPTION
Union[Path, DataFrame]

Union[Path, DataFrame]

preprocess_csv_1991_2001(census_year, output_path, census_data_folder)

Processamento dei dati censuari per gli anni 1991 e 2001.

PARAMETER DESCRIPTION
census_year

int

TYPE: int

output_path

Path

TYPE: Path

census_data_folder

Path

TYPE: Path

RETURNS DESCRIPTION
Path

Path

read_xls(file_path, census_code='sez1991', output_path=None, metadata=False)

Lettura dei dati censuari relativi agli anni 1991 e 2011 e costruzione di un DataFrame.

PARAMETER DESCRIPTION
file_path

Path

TYPE: Path

census_code

str

TYPE: str DEFAULT: 'sez1991'

output_path

Path

TYPE: Path DEFAULT: None

metadata

bool

TYPE: bool DEFAULT: False

RETURNS DESCRIPTION
Union[DataFrame, Path]

Union[DataFrame, Path]

remove_xls(folder_path, census_code, output_path)

Eliminiazione di tutti i file Excel.

PARAMETER DESCRIPTION
folder_path

Path

TYPE: Path

census_code

str

TYPE: str

output_path

Path

TYPE: Path

Anno 2011

list_shared_columns()

Generazione della lista di tutti i dati condivisi.

RETURNS DESCRIPTION
list

list

merge_data(csv_path, year, separator=';', output_path=None, region_list=[])

Unione di tutti i dati censuari per l'anno selezionato in un unico DataFrame.

PARAMETER DESCRIPTION
csv_path

Union[Path, PosixPath]

TYPE: Union[Path, PosixPath]

year

int

TYPE: int

separator

str

TYPE: str DEFAULT: ';'

output_path

Union[Path, PosixPath]

TYPE: Union[Path, PosixPath] DEFAULT: None

region_list

List

TYPE: List DEFAULT: []

RETURNS DESCRIPTION
Union[Path, PosixPath, DataFrame]

Union[Path, PosixPath, DataFrame]

read_csv(csv_path, separator=';')

Lettura di un csv e conversione in DataFrame.

PARAMETER DESCRIPTION
csv_path

Union[Path, PosixPath]

TYPE: Union[Path, PosixPath]

separator

str

TYPE: str DEFAULT: ';'

RETURNS DESCRIPTION
DataFrame

DataFrame