dataframes en R.
recordar: dataframe[filas,columnas]
sustituir elementos de un vector replace()
para sustituir en un vector algo por otra cosa usamos replace.
Pero si es un factor y intentamos reemplazar por algo que no es uno de
los niveles del factor nos hace perla, lo que hay que hacer es
convertir el vector en un vector de character hacer el replace y volver
a hacerlo factor.
#lo hacemos caracter para poder hacer replace
sincod$familia<-as.character(sincod$familia)
#reemplazamos
sincod$familia<-replace(sincod$familia
,is.na(sincod$familia)
,"nose"
)
#de nuevo factor
sincod$familia<-as.factor(sincod$familia)
Eliminar filas con NA en un df.
df.nuevo<-df.viejo[!is.na(df.viejo[,numerocolumna]),]
df.nuevo<-df.viejo[!is.na(df.viejo$nombrevariable),]
Eliminar columnas de un dataframe (ver en acerca de...):
dataframe[,-numero_columna]
dataframe$nombrecolumna<-NULL
Eliminar niveles no usados de un factor:
Modo sencillo:
problem.factor <- problem.factor[, drop = TRUE]
Para más información:
de momento un link: http://wiki.r-project.org/rwiki/doku.php?id=tips:data-manip:drop_unused_levels