Pandas Dataframe únic

Pandas Dataframe Unic



La biblioteca Python més popular que s'utilitza en ciència de dades s'anomena Pandas. Ofereix als programadors Python eines d'anàlisi de dades d'alt rendiment, fàcils d'utilitzar. Un cop entengueu les funcions fonamentals i com utilitzar-les, Pandas és una eina potent per alterar les dades. A 'pandas' els mètodes estàndard per emmagatzemar dades en forma tabular són els DataFrames. Podem utilitzar alguns mètodes 'pandas' per obtenir els valors únics a la columna de DataFrame 'pandas'. Quan necessitem obtenir valors únics a les columnes del DataFrame i no volem la duplicació de valors a la columna del DataFrame 'pandas', podem utilitzar els mètodes que proporciona 'pandas' per fer-ho. Vegem aquests mètodes en aquesta guia, juntament amb alguns exemples i resultats per obtenir valors únics a la columna de 'pandes' de DataFrame.

Mètodes per obtenir valors únics a les columnes de DataFrame 'pandas'.

Podem utilitzar dos mètodes per obtenir els valors únics a les columnes del DataFrame 'pandas'. Deixem els valors duplicats i només obtenim els valors únics a les columnes de DataFrames. Els mètodes que ofereixen els 'pandes' per fer aquesta tasca són:







  • Mitjançant l'ús del mètode unique().
  • Utilitzant el mètode drop_dupliactes().

Ara, utilitzarem els dos mètodes als codis 'pandas' per obtenir els valors únics a les columnes del DataFrame 'pandas'.



Exemple # 01

L'aplicació 'Spyder' s'utilitza aquí per generar aquests codis 'pandas' per utilitzar els mètodes que ens ajuden a obtenir els valors únics a les columnes de DataFrame 'pandes'. Hem d'importar els mòduls “pandas”, que són necessaris per al codi “pandas”, abans de crear el DataFrame. Utilitzant el terme 'importació' i col·locant 'pandes com a pd', importem aquests mòduls.



Ara, amb l'ajuda de 'pd', podem obtenir ràpidament les funcions o mètodes 'pandas'. A continuació, posem les 'Subject_data' en què afegim 'Nom' i al 'Nom', estem afegint les dades del nom que són 'Roman, William, Peter, Smith, John, Milli, Thomas, and James'. A continuació, afegim les dades de l'assignatura a la 'Subj' que són 'Matemàtiques, Economia, Ciències, Matemàtiques, Estadístiques, Estadístiques, Estadístiques i Informàtica'. A continuació, convertim aquest 'Subject_data' al DataFrame 'Subject_df' mitjançant el mètode 'pd.DataFrame()'. Col·loquem 'Subject_df' al mètode 'print()' perquè es mostri al terminal.





Ara, volem obtenir els valors únics a la columna 'Subj' del DataFrame 'pandas'. Amb aquesta finalitat, estem utilitzant el mètode 'únic ()' aquí i afegim el nom de la columna i també el nom del DataFrame com es mostra a continuació. Afegim aquest mètode a 'print()' de manera que el resultat també es mostrarà al terminal.



Ara, estem prement 'Maj + Retorn' per obtenir el resultat d'aquest codi i es mostra al terminal i també es mostra aquí, que conté el DataFrame amb tots els valors. Aquest és el DataFrame original que hem afegit al codi i a continuació es mostren els valors únics de la columna 'Subj'. Elimina els valors duplicats i mostra els valors únics de la columna 'Subj' del DataFrame.

Exemple #02

Creem la 'Sample_list' que conté informació. Inserim 'Layla, 21, 28, 31, 14 i 39' que apareixerà com a primera columna quan convertim aquesta llista al DataFrame. A continuació, afegim 'Lusy, 31, 25, 34, 26 i 21' com a segona fila del DataFrame. Després d'això, tenim 'Peter, 38, 20, 20, 35 i 24' i 'Layla 38, 23, 39 24, 23', que seran la tercera i quarta fila del DataFrame. També inserim tres dades més que són 'Stella, 21, 24, 24, 28, 31', 'Layla, 33, 32, 26, 30, 25' i també 'Peter, 21, 21, 31, 21, 29' .

Ara, estem convertint la 'Sample_list' a la 'DF_Sample', que és el nom del DataFrame aquí posant la funció 'pd.DataFrame()'. A més, establim el nom de les columnes d'aquest DataFrame i aquests noms són 'Nom, Ass_1, Ass_2, Ass_3, Ass_4 i Ass_5'. A continuació, utilitzem 'print()' que ajuda a mostrar el DataFrame 'DF_Sample'. Ara, estem utilitzant un altre mètode en aquest exemple per obtenir els valors únics a la columna del DataFrame. Aquest mètode és el mètode 'drop_duplicates()' de 'pandas'.

En el mètode 'drop_duplicates()', establim el nom de la columna on volem obtenir els valors únics a la columna del DataFrame. Estem obtenint valors únics de la columna 'Nom' deixant anar els valors duplicats d'aquesta columna amb l'ajuda del mètode 'drop_duplicates()' i també representar aquests valors únics mitjançant la funció 'print()' aquí.

Els noms duplicats s'eliminen i els valors únics es representen després d'aplicar el mètode 'drop_duplicates()'. Podeu observar que el nom 'Layla' apareix a tres cel·les de la columna 'Nom'. Però quan s'aplica el mètode 'drop_duplicates()' a aquesta columna, tots els valors duplicats s'eliminen i un nom 'Layla' apareix a la pantalla. Després de deixar caure els valors duplicats, va aparèixer el nou DataFrame que conté els valors únics en aquesta columna 'Nom'. D'aquesta manera, podem deixar anar els valors duplicats i obtenir el valor únic a la columna del DataFrame amb l'ajuda del mètode 'drop_duplicates()'.

Exemple #03

Es torna a utilitzar el mateix DataFrame i ara estem aplicant el mètode 'únic ()'. Amb el mètode 'únic()' col·loquem el nom de la columna així com el nom del DataFrame al qual volem aplicar aquest mètode 'únic ()' per obtenir els valors únics. Això només mostrarà els valors únics d'aquesta columna i no mostrarà aquests valors en forma de DataFrame.

Aquí, el DataFrame conté set valors a la columna 'Nom', però quan apliquem el mètode 'únic ()' a aquesta columna, només han aparegut quatre valors i aquests són els valors únics d'aquesta columna. No mostra valors duplicats.

Exemple #04

El DataFrame que creem en aquest exemple és el 'F_G_df'. Inseriu 'My_fruits' i 'my_Vegs' en aquest DataFrame. La columna 'My_fruits' conté 'Poma, Taronja, Poma, Pera, Litxi, Poma, Poma, Pera i Poma'. A continuació, tenim el 'My_Vegs' que conté els noms de les verdures que són 'Chilli, Bringle, Carrot, Potato, Potato, Carrot, Ceba, All i Ginger'. Aquest DataFrame només conté dues columnes.

Ara, estem obtenint els valors únics de les dues columnes amb l'ajuda del mètode 'únic()'. Esmentem el nom del DataFrame. A continuació, poseu el nom de la primera columna de la columna. Després d'això, utilitzem el mètode append(). En aquest adjunt, tornem a col·locar el nom del DataFrame i el nom de la segona columna i col·loquem el mètode 'únic ()'. Això obtindrà els valors únics de les dues columnes i després afegirà els valors únics d'ambdues columnes i els apareixeran a la pantalla.

El DataFrame es representa primer amb tots els valors. Després d'això, s'aplica el mètode 'únic ()' i els valors únics d'ambdues columnes es mostren a continuació. En aquest codi, obtenim els valors únics a les múltiples columnes del DataFrame mitjançant el mètode 'únic ()'.

Conclusió

L'explicació completa per obtenir els valors únics a la columna del DataFrame es troba en aquesta guia. Hem parlat dels mètodes 'unique()' i 'drop_duplicates()' que ens ajuden a obtenir els valors únics de la columna del DataFrame. Hem explorat com utilitzar aquests mètodes al codi 'pandas' fent servir aquests mètodes aquí als nostres codis. Hem il·lustrat diferents exemples en aquesta guia i us hem mostrat com obtenir els valors únics d'una columna mitjançant el mètode 'unique()' així com el mètode 'drop_duplicates()'. També hem explorat com obtenir els valors únics en diverses columnes utilitzant el mètode 'únic ()' d'aquesta guia.