A sobreamostragem cria um conjunto de dados que contém uma razão específica de um item de dados selecionado. Por exemplo, ...

A sobreamostragem cria um conjunto de dados que contém uma razão específica de um item de dados selecionado. Por exemplo, ele pode ser usado para garantir que você tenha um número igual de machos e fêmeas nos seus dados, mesmo que haja uma grande diferença na razão nos dados de origem. Para este método, você especifica o item de dados que deseja balancear, a razão desejada para esse item no conjunto de dados resultante e o número máximo de linhas que o conjunto resultante conterá. As linhas que não contiverem o item de dados especificado serão selecionadas aleatoriamente para preencher o conjunto de dados com o tamanho especificado, se houver linhas suficientes para isso. O conjunto de resultados é colocado em uma nova planilha. {0}Em geral, esse método é usado quando o item de dados de interesse ocorre muito raramente na fonte de dados. Aumentar a distribuição desse estado pode, com freqüência, melhorar os resultados da mineração. O teste deverá ser executado em um conjunto de dados que não tenha sido balanceado com esse método.
A sobreamostragem cria um conjunto de dados que contém uma razão específica de um item de dados selecionado. Por exemplo, ele pode ser usado para garantir que você tenha um número igual de machos e fêmeas nos seus dados, mesmo que haja uma grande diferença na razão nos dados de origem. Para este método, você especifica o item de dados que deseja balancear, a razão desejada para esse item no conjunto de dados resultante e o número máximo de linhas que o conjunto resultante conterá. As linhas que não contiverem o item de dados especificado serão selecionadas aleatoriamente para preencher o conjunto de dados com o tamanho especificado, se houver linhas suficientes para isso. O conjunto de resultados é colocado em uma nova planilha. {0}Em geral, esse método é usado quando o item de dados de interesse ocorre muito raramente na fonte de dados. Aumentar a distribuição desse estado pode, com frequência, melhorar os resultados da mineração. O teste deverá ser executado em um conjunto de dados que não tenha sido balanceado com esse método.