Skip to main content

Table 2 Correlation between expected and actual values of the dependent variable Y as calculated from equation [1], average of 500 samples of n = 400, k = 5, 15 % or 30 % of missing data

From: Nearest neighbor imputation algorithms: a critical evaluation

   Estimated vs actual Y
  Missing 15 % 30 %
Framework Method Bias Var MSE Bias Var MSE
Plain 1NN 0.16957 0.00072 0.02947 0.30959 0.00114 0.09698
  kNN 0.10961 0.00035 0.01236 0.21987 0.00068 0.04902
  wkNN 0.10947 0.00035 0.01233 0.21958 0.00068 0.04890
RReliefF10 1NN 0.15170 0.00075 0.02377 0.29608 0.00163 0.08928
  kNN 0.10036 0.00042 0.01049 0.20963 0.00104 0.04498
  wkNN 0.10023 0.00041 0.01046 0.20947 0.00104 0.04492
RReliefF20 1NN 0.15246 0.00063 0.02387 0.29331 0.00136 0.08738
  kNN 0.09850 0.00035 0.01005 0.20607 0.00087 0.04333
  wkNN 0.09839 0.00035 0.01002 0.20580 0.00087 0.04322
RReliefF30 1NN 0.15202 0.00068 0.02379 0.29081 0.00122 0.08579
  kNN 0.09893 0.00033 0.01012 0.20508 0.00079 0.04285
  wkNN 0.09877 0.00033 0.01008 0.20474 0.00079 0.04271
Bagging 1NN 0.10287 0.00030 0.01088 0.20756 0.00063 0.04370
  kNN 0.10608 0.00030 0.01156 0.21240 0.00061 0.04572
  wkNN 0.10544 0.00030 0.01142 0.21078 0.00061 0.04503
Random 1NN 0.10629 0.00030 0.01160 0.20738 0.00059 0.04359
  kNN 0.10626 0.00030 0.01159 0.20638 0.00058 0.04317
  wkNN 0.10622 0.00030 0.01158 0.20631 0.00058 0.04314
Bagging + Random 1NN 0.11010 0.00031 0.01243 0.21258 0.00060 0.04579
  kNN 0.11101 0.00032 0.01264 0.21422 0.00060 0.04649
  wkNN 0.11083 0.00032 0.01260 0.21386 0.00060 0.04633
Mean Imputation   0.11857 0.00035 0.01441 0.22512 0.00063 0.05130