Formato
El formato de género para la columna Sexo tendrá un valor de M
para el sexo Masculino, y F
para el sexo femenino.
Inconsistencias de formato de la columna Sexo
Al parecer las columnas de Sexo no son consistentes, al tener diferentes valores:
> table(rows$Sexo)
F M FEMENINO MASCULINO
32830 32347 22507 22453
La columna Sexo_Normalizado
tiene el sexo normalizado a F
y M
:
> table(rows$Sexo_Normalizado)
F M
55337 54800
Podemos comprobar que esta inconsistencia empezó a partir del 6 de Abril tanto en las tablas de positivos como en las de sospechosos:
rows %>%
+ dplyr::filter(Sexo %in% c("MASCULINO", "FEMENINO")) %>%
+ dplyr::pull(File_Id) %>%
+ unique()
[1] "positivos_2020_04_06" "positivos_2020_04_07" "positivos_2020_04_08"
[4] "positivos_2020_04_09" "sospechosos_2020_04_06" "sospechosos_2020_04_07"
[7] "sospechosos_2020_04_08" "sospechosos_2020_04_09"