Obteniu un nombre de columnes a R DataFrame

Obteniu Un Nombre De Columnes A R Dataframe



A R, obtenir el nombre de columnes és una operació bàsica que es requereix en moltes situacions quan es treballa amb DataFrames. En subconjuntar, analitzar, manipular, publicar i visualitzar les dades, el recompte de columnes és una informació crucial a conèixer. Per tant, R proporciona diferents enfocaments per obtenir el total de les columnes del DataFrame especificat. En aquest article, parlarem d'alguns dels enfocaments que ens ajuden a obtenir el recompte de columnes del DataFrame.

Exemple 1: Ús de la funció Ncol().

La ncol() és la funció més freqüent per obtenir el total de les columnes dels DataFrames.







df <- data.frame('y1' = c(10, 12, 14, 19),

'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))


n <- ncol(df)

cat('-----Nombre de columnes al marc de dades :', n)

En aquest exemple, primer creem un DataFrame 'df' amb tres columnes que s'etiqueten com 'y1', 'y2' i 'y3' mitjançant la funció data.frame() a R. Els elements de cada columna s'especifiquen mitjançant la funció c() que crea un vector d'elements. A continuació, utilitzant la variable 'n', s'utilitza la funció ncol() per determinar el total de columnes del DataFrame 'df'. Finalment, amb el missatge descriptiu i la variable “n”, la funció cat() proporcionada imprimeix els resultats a la consola.



Com era d'esperar, la sortida recuperada indica que el DataFrame especificat té tres columnes:







Exemple 2: Compteu el total de columnes per al DataFrame buit

A continuació, apliquem la funció ncol() al DataFrame buit que també obté els valors de les columnes totals, però aquest valor és zero.

empty_df <- data.frame()

n <- ncol(empty_df)

cat('---Columnes al marc de dades :', n)

En aquest exemple, generem el DataFrame buit, 'empty_df', cridant a data.frame() sense especificar cap columna o fila. A continuació, utilitzem la funció ncol() que s'utilitza per trobar el recompte de columnes al DataFrame. La funció ncol() s'estableix aquí amb el DataFrame 'empty_df' per obtenir el total de columnes. Com que el DataFrame 'empty_df' està buit, no té cap columna. Per tant, la sortida de ncol(empty_df) és 0. Els resultats es mostren mitjançant la funció cat() que es desplega aquí.



La sortida mostra el valor '0' com s'esperava perquè el DataFrame està buit.

Exemple 3: ús de la funció Select_If() amb la funció Length().

Si volem recuperar el nombre de columnes de qualsevol tipus concret, hauríem d'utilitzar la funció select_if() juntament amb la funció length() de R. S'utilitzen aquestes funcions que es combinen per obtenir el total de les columnes de cada tipus. . El codi per utilitzar aquestes funcions s'implementa a la següent manera:

biblioteca (dplyr)

x1<-LETRES[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-mostra(c('Estiu','Hivern'),10,reemplaça=TRUE)

df1<-data.frame(x1,x2,x3,x4)

df1

longitud(selecciona_si(df1, és.numèric))

En aquest exemple, primer carreguem el paquet dplyr perquè puguem accedir a la funció select_if() i a la funció length(). Aleshores, creem les quatre variables: 'x1', 'x2', 'x3' i 'x4', respectivament. Aquí, 'x1' conté les 10 primeres lletres majúscules de l'alfabet anglès. Les variables 'x2' i 'x3' es generen mitjançant la funció rpois() per crear dos vectors separats de 10 nombres aleatoris amb els paràmetres 2 i 5, respectivament. La variable 'x4' és un vector factor amb 10 elements que es mostren aleatòriament del vector c ('Estiu', 'Hivern').

Aleshores, intentem crear el DataFrame 'df1' on es passen totes les variables a la funció data.frame(). Finalment, invoquem la funció length() per determinar la longitud del DataFrame 'df1' que es crea mitjançant la funció select_if() del paquet dplyr. La funció select_if() selecciona les columnes d'un DataFrame 'df1' com a argument i la funció is.numeric() selecciona només les columnes que contenen valors numèrics. Aleshores, la funció length() obté el total de columnes seleccionades per select_if(), que és la sortida de tot el codi.

La longitud de la columna es mostra a la sortida següent, que indica el total de columnes del DataFrame:

Exemple 4: Ús de la funció Sapply().

Per contra, si només volem comptar els valors que falten de les columnes, tenim la funció sapply(). La funció sapply() itera sobre cada columna del DataFrame per funcionar específicament. La funció sapply() es passa primer amb el DataFrame com a argument. Aleshores, es necessita l'operació a realitzar en aquest DataFrame. La implementació de la funció sapply() per obtenir el recompte de valors NA a les columnes DataFrame es proporciona de la següent manera:

new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))

sapply(new_df, function(x) sum(is.na(x)))

En aquest exemple, generem el DataFrame 'new_df' amb tres columnes: 'c1', 'c2' i 'c3'. Les primeres columnes, 'c1' i 'c3', contenen els valors numèrics, inclosos alguns valors que falten que es representen per NA. La segona columna, 'c2', conté els caràcters que inclouen alguns valors que falten que també es representa amb NA. A continuació, apliquem la funció sapply() al DataFrame 'new_df' i calculem el nombre de valors que falten a cada columna mitjançant l'expressió sum() dins de la funció sapply().

La funció is.na() és l'expressió que s'especifica a la funció sum() que retorna un vector lògic que indica si falta cada element de la columna o no. La funció sum() suma els valors VERDADERS per comptar el nombre de valors que falten a cada columna.

Per tant, la sortida mostra els valors totals de NA a cadascuna de les columnes:

Exemple 5: Ús de la funció Dim().

A més, volem obtenir el total de columnes juntament amb les files del DataFrame. Aleshores, la funció dim() proporciona les dimensions del DataFrame. La funció dim() pren l'objecte com un argument les dimensions del qual volem recuperar. Aquí teniu el codi per utilitzar la funció dim():

d1 <- data.frame(team=c('t1', 't2', 't3', 't4'),

punts=c(8, 10, 7, 4))

dim (d1)

En aquest exemple, primer definim el DataFrame 'd1' que es genera mitjançant la funció data.frame() on s'estableixen dues columnes 'equip' i 'punts'. Després d'això, invoquem la funció dim() sobre el DataFrame 'd1'. La funció dim() retorna el nombre de files i columnes del DataFrame. Per tant, quan executem el dim(d1), retorna un vector amb dos elements, el primer dels quals reflecteix el nombre de files del DataFrame 'd1' i el segon representa el nombre de columnes.

La sortida representa les dimensions del DataFrame on el valor '4' indica el total de columnes i el valor '2' representa les files:

Conclusió

Ara hem après que comptar el nombre de columnes a R és una operació senzilla i important que es pot realitzar al DataFrame. Entre totes les funcions, la funció ncol() és la forma més convenient. Ara, estem familiaritzats amb les diferents maneres d'obtenir el nombre de columnes del DataFrame donat.