Scopri come unire i frame di dati in Python

Scopri come unire i frame di dati in Python

Se usi Python, anche per le attività più semplici, probabilmente sei consapevole dell'importanza delle sue librerie di terze parti. La libreria Pandas, con il suo eccellente supporto per DataFrames, è una di queste librerie.





Puoi importare più tipi di file in Python DataFrames e creare varie versioni per archiviare diversi set di dati. Dopo aver importato i dati utilizzando DataFrames, è possibile unirli per eseguire analisi dettagliate.





Affrontare le basi

Prima di iniziare a unire, è necessario disporre di DataFrames da unire. Per scopi di sviluppo, puoi creare alcuni dati fittizi con cui sperimentare.





Crea i DataFrame in Python

Come primo passo, importa la libreria Pandas nel tuo file Python. Pandas è una libreria di terze parti che gestisce DataFrames in Python. Puoi usare il importare dichiarazione per utilizzare la libreria, come segue:

import pandas as pd

Puoi assegnare un alias al nome della libreria per abbreviare i riferimenti al codice.



Devi creare dizionari, che puoi convertire in DataFrames. Per ottenere i migliori risultati, crea due variabili del dizionario: dict1 e dict2— per memorizzare informazioni specifiche:

come visualizzare i messaggi di instagram sul pc
D3EE139187777447D44960E4CBF47606E89454F73

Ricorda, devi avere un elemento comune in entrambi i valori del dizionario, che funga da chiave primaria per combinare i tuoi DataFrame in un secondo momento.





Converti i tuoi dizionari in DataFrames

Per convertire i valori del dizionario in DataFrames, puoi utilizzare il metodo seguente:

df1 = pd.DataFrame(dict1) 
df2 = pd.DataFrame(dict2)

Alcuni IDE consentono di controllare i valori all'interno di DataFrame facendo riferimento alla funzione DataFrame e premendo Esegui/Esegui . Ci sono molti IDE compatibili con Python , così puoi scegliere quello che è il più facile da imparare.





  Frammento di codice di Jupyter Notebook

Una volta che sei soddisfatto del contenuto dei tuoi DataFrames, puoi passare alla fase di fusione.

Combinazione di frame con la funzione Unisci

La funzione di unione è la prima funzione Python che puoi utilizzare per combinare due DataFrame. Questa funzione accetta i seguenti argomenti predefiniti:

Android 7.0 sposta le app sulla scheda SD
pd.merge(DataFrame1, DataFrame2, how= type of merge)

Dove:

  • pd è un alias per la libreria Pandas.
  • unire è la funzione che unisce DataFrames.
  • DataFrame1 e DataFrame2 sono i due DataFrame da unire.
  • come definisce il tipo di unione.

Sono disponibili alcuni argomenti opzionali aggiuntivi, che puoi utilizzare quando hai una struttura dati complessa.

È possibile utilizzare valori diversi per il parametro how per definire il tipo di unione da eseguire. Se lo hai fatto, questi tipi di unione ti risulteranno familiari utilizzato SQL per unire le tabelle del database .

Unisci a sinistra

Il tipo di unione a sinistra mantiene intatti i valori del primo DataFrame ed estrae i valori corrispondenti dal secondo DataFrame.

  Frammento di codice di Jupyter Notebook

Unione giusta

Il tipo di unione corretto mantiene intatti i valori del secondo DataFrame ed estrae i valori corrispondenti dal primo DataFrame.

  Frammento di codice di Jupyter Notebook

Fusione interiore

Il tipo di unione interna conserva i valori corrispondenti da entrambi i DataFrames e rimuove i valori non corrispondenti.

  Frammento di codice di Jupyter Notebook

Fusione esterna

Il tipo di unione esterno conserva tutti i valori corrispondenti e non corrispondenti e consolida insieme i DataFrame.

  Frammento di codice di Jupyter Notebook

Come utilizzare la funzione Concat

Il concat function è un'opzione flessibile rispetto ad alcune delle altre funzioni di unione di Python. Con la funzione concat, puoi combinare DataFrames verticalmente e orizzontalmente.

Tuttavia, lo svantaggio dell'utilizzo di questa funzione è che per impostazione predefinita elimina tutti i valori non corrispondenti. Come alcune altre funzioni correlate, questa funzione ha alcuni argomenti, di cui solo alcuni sono essenziali per una concatenazione di successo.

concat(dataframes, axis=0, join='outer'/inner)

Dove:

  • concat è la funzione che unisce DataFrames.
  • frame di dati è una sequenza di DataFrames da concatenare.
  • asse rappresenta la direzione di concatenazione, 0 essendo orizzontale, 1 essendo verticale.
  • giuntura specifica un join esterno o interno.

Usando i due DataFrame sopra, puoi provare la funzione concat come segue:

# define the dataframes in a list format 
df_merged_concat = pd.concat([df1, df2])

# print the results of the Concat function
print(df_merged_concat)

L'assenza dell'asse e degli argomenti join nel codice precedente combina i due set di dati. L'output risultante contiene tutte le voci, indipendentemente dallo stato della corrispondenza.

Allo stesso modo, puoi usare argomenti aggiuntivi per controllare la direzione e l'output della funzione concat.

Per controllare l'output con tutte le voci corrispondenti:

# Concatenating all matching values between the two dataframes based on their columns 
df_merged_concat = pd.concat([df1, df2], axis=1, join = 'inner')

print(df_merged_concat)

Il risultato contiene tutti i valori corrispondenti solo tra i due DataFrame.

  Frammento di codice di Jupyter Notebook

Unione di frame di dati con Python

I DataFrame sono parte integrante di Python, considerando la loro flessibilità e funzionalità. Dati i loro molteplici usi, puoi usarli ampiamente per eseguire una varietà di attività con la massima facilità.

come avviare il bios di Windows 10

Se stai ancora imparando Python DataFrames, prova a importare alcuni file Excel, quindi combinali con approcci diversi.