dataframes en R.


recordar: dataframe[filas,columnas]

sustituir elementos de un vector replace()

para sustituir en un vector algo por otra cosa usamos replace.
Pero si es un factor y intentamos reemplazar por algo que no es uno de los niveles del factor nos hace perla, lo que hay que hacer es convertir el vector en un vector de character hacer el replace y volver a hacerlo factor.
#lo hacemos caracter para poder hacer replace
    sincod$familia<-as.character(sincod$familia)
#reemplazamos
    sincod$familia<-replace(sincod$familia
                                      ,is.na(sincod$familia)
                                      ,"nose"
                                      )
#de nuevo factor
    sincod$familia<-as.factor(sincod$familia)

Eliminar filas con NA en un df.

df.nuevo<-df.viejo[!is.na(df.viejo[,numerocolumna]),]
df.nuevo<-df.viejo[!is.na(df.viejo$nombrevariable),]


Eliminar columnas de un dataframe (ver en acerca de...):

dataframe[,-numero_columna]
dataframe$nombrecolumna<-NULL

Eliminar niveles no usados de un factor:

Modo sencillo:

problem
.factor <- problem.factor[, drop = TRUE]


Para más información:

de momento un link: http://wiki.r-project.org/rwiki/doku.php?id=tips:data-manip:drop_unused_levels