Pandas Reindex

Pandas Reindex



'A 'pandas', podem emmagatzemar molta informació en forma tabular, que també es coneix com DataFrame. El 'pandas' ens facilita amb el mètode 'DataFrame()' per construir el DataFrame. El DataFrame conté índexs i també podem canviar els índexs del DataFrame utilitzant les funcions 'pandas'. El mètode que utilitzem per reindexar el DataFrame és el mètode 'reindex()'. Aquest mètode ajuda a canviar els valors de l'índex de la fila, així com els valors de l'índex de les columnes. Mitjançant aquest mètode, podem canviar l'índex predeterminat del DataFrame i també podem canviar l'índex que establim mentre creem el DataFrame. Utilitzarem el mètode 'reindex()' als nostres exemples de 'pandes' d'aquest tutorial i explicarem aquest concepte en profunditat aquí'.

Exemple # 01

L'eina 'Spyder' ens ajuda a desenvolupar el codi 'pandes' aquí en aquest tutorial, i comencem el nostre codi amb la paraula clau 'import', que ajudarà a importar la funció 'pandes'. Col·loquem 'pandas com a pd' després d'escriure 'importar'. Després d'això, creem el DataFrame escrivint 'pd.DataFrame()'. Escrivim aquest 'pd' aquí perquè el 'DataFrame()' és el mètode de 'pandas'. El 'value_df' és el nom de la variable en què es desa el DataFrame. Afegim 'RandomName', que és el nom de la columna, i el 'RandomName' conté 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander i Samuel'.







Aleshores, tenim 'Valor_1', en el qual hem inserit '16, 29, 24, 35, 44, 50, 69, 74 i 88'. Després ve 'Valor_2' i hem afegit '25, 38, 42, 56, 54, 65, 78, 89 i 99'. Ara, el 'Valor_3' ve a continuació, i hi col·loquem '36, 48, 52, 69, 74, 75, 87, 91 i 69'. La columna 'Valor_4' apareix després d'això, on hem inserit '52, 64, 72, 88, 82, 95, 97, 21 i 39'. L'última columna és la columna 'Valor_5' aquí, i en aquesta columna, els valors que hem afegit són '66, 78, 82, 99, 34, 45, 57, 61 i 89'. Després d'això, utilitzem la funció 'print()' en la qual s'afegeix 'Values_df'. S'imprimirà al terminal.




Després de prémer 'Maj+Enter', podem obtenir fàcilment el resultat dels nostres codis a l'aplicació 'Spyder'. Aquí, aquest codi retorna el DataFrame amb l'índex predeterminat. Ara, aplicarem el mètode 'reindex()' per reindexar aquest DataFrame en 'pandas'.




La funció 'reindex()' s'utilitza aquí per reindexar el valor de l'índex de la fila. Al DataFrame anterior, podeu veure que es mostren els valors d'índex per defecte de la fila, i ara, estem aplicant el mètode 'reindex()' per reindexar aquests índexs de fila. Col·loquem el nom del DataFrame i després el mètode 'reindex()' en el qual col·loquem els valors d'índex que volem afegir al DataFrame anterior. Posem 'ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H i ind_I' a la funció 'reindex()'. Per tant, els índexs d'aquestes files s'actualitzaran al DataFrame quan executem aquest codi.






Els valors de l'índex de la fila es mostren en aquest resultat, i podeu observar que els valors del DataFrame no es mostren aquí i que han aparegut els valors 'NaN'. Això es deu al fet que els valors d'índex nous no coincideixen amb els valors d'índex anteriors del DataFrame. Quan l'índex nou i l'índex antic no coincideixen, allà es mostra 'Nan'. Aquests valors 'NaN' apareixen per defecte quan canviem l'índex, i no coincideix amb l'índex anterior.



Exemple #02

Ara estem canviant els valors de l'índex de columna del “Value_df”, que hem creat prèviament a l'exemple 1. Després d'imprimir el “Value_df”, posem la variable “columna” i hi afegim alguns valors. Afegim 'a_1, b_1, c_1, d_1 i e_1'. Ara, volem ajustar aquests valors com a índex de les columnes, de manera que, per a això, estem utilitzant el mètode 'reindex()' i col·loquem el nom de la variable 'columna' en la qual s'emmagatzemen els nous valors d'índex de columna i també establiu l''eix' a 'columnes', de manera que actualitzarà l'índex de l'eix de la columna. Posem el mètode 'reindex()' a 'print()', de manera que també es renderitzarà al terminal.


Com que hem utilitzat el mètode 'reindex()', s'actualitzen els valors d'índex de columna que hi ha al primer DataFrame i s'afegeixen nous valors al DataFrame actualitzat. També podeu observar que tots els valors del DataFrame es converteixen a 'NaN' perquè els dos valors d'índex de les columnes són diferents.

Exemple #03

El 'Programming_data' d'aquest codi conté 'P_Languages', on hem afegit 'JavaScript, CSS, Web Engineering, OOP, C#, AI, Java i JavaScript'. A continuació, tenim 'Hores' en què col·loquem '4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs i 6_hrs'. Després d'això, s'introdueix el 'P_Code' i inserim '11523, 12423, 12321, 11456, 11454, 12267, 13106 i 14123'. Afegim la variable 'p_index' i posem 'Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G i Pro_H'.

Aquests valors s'utilitzaran com a valors d'índex de les files. Canviem 'Programming_data' al DataFrame 'Programming_df'. També afegim el 'p_index' a aquest DataFrame mitjançant el mètode 'index'. Posem 'Programming_df' i després el mètode 'index' i assignem el 'p_index' a aquest. Ara, els valors d'índex anteriors s'afegeixen com a valors d'índex de files al DataFrame. També imprimim el 'Programming_df'.

Després d'això, afegim uns nous valors d'índex a la variable 'new_index', i aquests són 'P_1, P_2, P_3, P_4, P_5, P_6, P_7 i P_8'. Com que volem actualitzar els valors de l'índex de les files, utilitzem el mètode 'reindex()' i posem 'new_index' com a paràmetre d'aquesta funció i també emmagatzemem el DataFrame actualitzat al 'newProgramming_df' i col·loquem el 'newProgramming_df' a ' print()” per mostrar.


Els valors de l'índex s'actualitzen, i també podem dir que hem reindexat el DataFrame que hem creat. Tots els valors del DataFrame també es converteixen a 'NaN' perquè els dos valors d'índex són diferents.

Exemple #04

Actualment estem alterant els valors de l'índex 'Programming_df' de les columnes, que hem desenvolupat prèviament a l'exemple 3. Col·loquem la variable 'columna' i hi inserim nous valors. El 'P_Code, P_Languages, Hours i New' s'afegeix a la variable 'columna'. A continuació, tornem a utilitzar el mètode 'reindex()' en què establim la variable 'column', que actualitzarà els valors de l'índex de columna anterior i afegirà aquests nous valors d'índex de columna al DataFrame.

Aquí, podeu observar que els nous valors que hem afegit a 'columna' són els mateixos que hem afegit al DataFrame anterior, però la seqüència és diferent, de manera que canviarà la seqüència de les columnes i ajustarà totes les columnes a mesura que anem. esmentat a la variable 'columna'. A més, afegim un valor d'índex més que no està present al DataFrame anterior, que és 'Nou' aquí, de manera que els valors 'NaN' apareixeran en aquesta columna.


La seqüència de les columnes es canvia aquí i tots els valors apareixen tal com estan presents a les columnes del DataFrame original i la columna 'Nova' del DataFrame actualitzat conté tots els valors 'NaN' perquè aquesta columna no està present al DataFrame original.

Conclusió

Hem presentat aquest tutorial que ens ajuda a entendre amb detall la noció de 'reindexar pandas'. Hem parlat de com podem reindexar la columna d'un DataFrame, així com els valors d'índex de la fila. Hem explicat que la funció 'reindex()' de 'pandas' s'utilitza per fer-ho. Hem fet diferents exemples en els quals hem canviat els valors d'índex de les files del DataFrame i també els valors d'índex de l'índex de columna del DataFrame. Hem presentat els resultats de tots els codis que hem fet aquí en aquest tutorial i també els hem explicat en profunditat.