Il sovracampionamento consente di creare un set di dati contenente un rapporto specifico per un elemento di dati selezionato. ...

Il sovracampionamento consente di creare un set di dati contenente un rapporto specifico per un elemento di dati selezionato. Questo metodo può essere utilizzato, ad esempio, per garantire la presenza di un numero uguale di soggetti femminili e maschili nei dati, anche se il rapporto presenta differenze notevoli nei dati di origine. Per utilizzare questo metodo, è necessario specificare l'elemento dei dati da bilanciare, il rapporto desiderato per l'elemento nel set di dati risultante e il numero massimo di righe da includere nel set risultante. Le righe che non contengono l'elemento di dati specificato vengono selezionate casualmente per riempire il set di dati fino alle dimensioni specificate, se il numero di righe disponibile è sufficiente. Il set di risultati viene inserito in un nuovo foglio di lavoro.{0}Questo metodo viene generalmente utilizzato quando l'elemento dei dati di interesse è presente solo raramente nei dati di origine. L'incremento della distribuzione di questo tipo di stato consente spesso di ottenere risultati di data mining migliori. È consigliabile eseguire test sui set di dati non bilanciati con questo metodo.