Le suréchantillonnage crée un jeu de données qui contient une proportion spécifique d'un élément de données sélectionné. ...

Le suréchantillonnage crée un jeu de données qui contient une proportion spécifique d'un élément de données sélectionné. Par exemple, il peut servir à s'assurer que vous disposez d'un nombre équivalent de femmes et d'hommes dans vos données, même en cas de différence importante dans les proportions des données sources. Pour cette méthode, vous spécifiez l'élément de données que vous voulez équilibrer, la proportion souhaitée pour cet élément dans le jeu de données résultant et le nombre maximum de lignes que le jeu résultant contiendra. Les lignes ne contenant pas l'élément de données spécifié sont sélectionnées aléatoirement pour remplir les données définies à la taille que vous spécifiez, si suffisamment de lignes le permettent. Le jeu de résultats est placé dans une nouvelle feuille de calcul.{0}Cette méthode est généralement utilisée lorsque l'élément de données présentant un intérêt se présente très rarement dans les données sources. L'augmentation de la distribution d'un tel état peut souvent améliorer les résultats de l'exploration de données. Les tests doivent être effectués à partir d'un jeu de données qui n'a pas été équilibré au moyen de cette méthode.