Pandas Desviació estàndard

Pandas Desviacio Estandard



'Els 'Pandas' és un gran llenguatge per realitzar l'anàlisi de dades a causa del seu gran ecosistema de paquets Python centrats en dades. Això facilita l'anàlisi i la importació d'ambdós factors. La desviació estàndard és una desviació 'típica' derivada de la mitjana. S'utilitza molt, ja que retorna les unitats de mesura originals del dataframe. Els pandas van utilitzar std() per al càlcul de la desviació estàndard. La desviació estàndard es pot calcular a partir dels valors donats que es poden trobar al marc de dades en forma de fila o columna. Implementarem totes les maneres possibles en què s'utilitza la desviació estàndard dels pandas. Per a la implementació del codi, utilitzarem l'eina 'spyder', ja que està escrita en un entorn amigable amb Python'.

Sintaxi







“df.std ( )


La sintaxi següent s'utilitza per calcular la desviació estàndard en el marc de dades. El 'df' del dataframe és l'abreviatura del 'dataframe'. Què fa la desviació estàndard? Mesura l'extensió de les dades requerides. Com més s'expandeixin els valors alts, més gran hauria de produir-se la desviació estàndard.



Tornar

La desviació estàndard pandas retorna el marc de dades si el nivell s'especifica en funció del requisit.



Tingueu en compte que la funció 'std()' ignorarà automàticament els valors 'NaN' del 'df' mentre calcula la desviació estàndard dels pandas. 'NaN' es pot explicar com 'no és un nombre', el que significa que no hi ha cap valor assignat a un determinat.





A continuació es mostren els mètodes que s'executaran amb exemples de la desviació estàndard dels pandes:

    • Càlcul de la desviació estàndard Pandas en una sola columna.
    • Càlcul de la desviació estàndard Pandas en diverses columnes.
    • Càlcul de la desviació estàndard Pandas de totes les columnes numèriques.
    • desviació estàndard pandas utilitzant l'eix = 1.
    • desviació estàndard pandas utilitzant l'eix = 0.

Creació del Dataframe per al càlcul de la desviació estàndard en Pandas

Primer, obriu el programari 'spyder'. Ara importeu la biblioteca pandas com a pd. Crearem un marc de dades que consisteix en un marcador amb termes com 'x', 'y' i 'z' amb els seus punts com '22', '10', '11', '16', '12', '45'. ”, “36” i “40”. Tenim els seus valors d'assistència com '8', '9', '13', '7', '22', '24', '4' i '6', amb el valor dels rebots com '17', ' 14”, “3”, 5”, “9”, “8”, “7” i “4”.




Les pantalles mostren el marc de dades creat segons els valors assignats al codi:

Exemple # 01: càlcul de la desviació estàndard dels pandas en una sola columna

En aquest exemple, calcularem la desviació estàndard d'una sola columna al marc de dades pandas. El marc de dades té els valors de l'equip com 'u', 'v' i 'b' amb els seus punts com '44', '33', '22', '44', '45', '88', '96'. ” i “78”. Els valors de les assistències són '7', '8', '9', '10', '11', '14', '18' i '17' amb els valors de rebots com '11', ' 9', '8', '7', '6', '5', '4' i '3'. La columna 'punts' es selecciona del marc de dades per calcular la desviació estàndard de columna única.


La sortida mostra la desviació estàndard calculada de la columna 'punts':

Exemple # 02: Càlcul de la desviació estàndard Pandas en diverses columnes

En aquest exemple, executarem els càlculs de desviació estàndard pandas en diverses columnes. En aquest marc de dades, les dades són de nou del marcador esportiu amb els valors de l'equip com 'n', 'w' i 't' amb la puntuació com '33', '22', '66', '55'. '44', '88', '99' i '77'. Les assistències com '9', '7', '8', '11', '16', '14', '12' i '13' i rebots com '5', '8', '1', ' 2”, “3”, “4”, “6” i “7”. Aquí calcularem la desviació estàndard de les dues columnes 'punts' i 'rebots' mitjançant la funció std() aplicada al marc de dades.


Com veiem, la sortida mostra que la desviació estàndard va ser de 26,944387 a la columna de punts i 2,449490 a la columna de rebot, respectivament.

Exemple # 03: Càlcul de la desviació estàndard Pandas de totes les columnes numèriques

Ara hem après a calcular la desviació estàndard de files simples i múltiples. Què passa si no volem especificar tots els noms de columnes del marc de dades i calcular tot el marc de dades? Això és possible amb només una implementació senzilla de la funció de la desviació estàndard de pandas per al càlcul del marc de dades complet en els resultats. El marc de dades aquí consta de 'l', 'm' i 'o' amb els valors de puntuació '33', '36', '79', '78', '58', '55' i dos equips puntuen el mateix. és a dir '25'. Les assistències són '1', '2', '3', '4', '6', '9', '5' i '7' i els seus rebots com '14', '10', '2' , '5', '8', '3', '6' i '9'. Podem calcular totes les desviacions estàndard de les columnes per pandas al marc de dades mitjançant la funció pandas 'std()'.


La pantalla té la desviació estàndard calculada de tot el 'df' que es mostra a continuació; també podem observar que els pandes no han calculat la desviació estàndard de la primera columna, que és “equip”, perquè no és una columna numèrica.

Exemple # 04: Desviació estàndard Pandas utilitzant l'eix = 0

En aquest exemple, els marcs de dades tenen els equips dels esports com 'g', 'h' i 'k' amb més dades. Aquí, calcularem la desviació estàndard utilitzant l'eix com a '0', un paràmetre utilitzat en la desviació estàndard dels pandas. Aquest argument calcula la desviació estàndard per columna del marc de dades.


La sortida següent mostra els resultats en columnes de la desviació estàndard calculada. La columna de punts té la desviació estàndard calculada com a '24,0313062', la columna d'assistència té la desviació estàndard calculada com a '2,669270' i la desviació estàndard calculada de la columna de rebot es mostra com a '3,943802'.

Exemple # 05: Desviació estàndard Pandas utilitzant l'eix = 1

Aquí utilitzarem el paràmetre de l'eix assignat com a '1' per calcular la desviació estàndard en pandes. Quina diferència pot fer l'eix '1'? L'argument de l'eix '1' calcula la desviació estàndard per fila dels valors numèrics del marc de dades. El dataframe té els tres equips com 's', 'd' i 'e', amb l'addició de columnes de dades creades com a punts de l'equip, assistències de l'equip i rebots de l'equip. Totes les direccions s'assignen amb valors diferents al marc de dades. Aquest paràmetre de l'eix és un canvi de joc, ja que, de moment, hem de treballar les dades on volem que estiguin en una columna més el punt calculat de la desviació estàndard realitzada.


La sortida següent mostra la desviació estàndard calculada en una fila del marc de dades:

Conclusió

La desviació estàndard dels pandes és una funció molt tècnica, que és una funció molt beneficiosa, ja que troba la desviació estàndard del pacte d'entusiasme dels marcs de dades pandas. En aquest editorial, hem estudiat els mètodes de càlcul de la desviació estàndard en pandes. Hem fet càlculs d'una sola columna de desviació estàndard i múltiples columnes i també hem calculat la desviació estàndard de tot el marc de dades junts. Totes les estratègies funcionen bé sempre que s'utilitzin de manera coherent i amb els resultats desitjats.