Identifica las posibles filas duplicadas y ayuda a estandarizar los datos mediante la selección de reemplazos canónicos. ...

Identifica las posibles filas duplicadas y ayuda a estandarizar los datos mediante la selección de reemplazos canónicos. Por ejemplo, se reduce el número de erratas en una columna  'nombre de compañía' haciendo referencia a una lista aprobada de nombres de compañía.