Skip to main content

Table 2 Correlation between expected and actual values of the dependent variable Y as calculated from equation [1], average of 500 samples of n = 400, k = 5, 15 % or 30 % of missing data

From: Nearest neighbor imputation algorithms: a critical evaluation

  

Estimated vs actual Y

 

Missing

15 %

30 %

Framework

Method

Bias

Var

MSE

Bias

Var

MSE

Plain

1NN

0.16957

0.00072

0.02947

0.30959

0.00114

0.09698

 

kNN

0.10961

0.00035

0.01236

0.21987

0.00068

0.04902

 

wkNN

0.10947

0.00035

0.01233

0.21958

0.00068

0.04890

RReliefF10

1NN

0.15170

0.00075

0.02377

0.29608

0.00163

0.08928

 

kNN

0.10036

0.00042

0.01049

0.20963

0.00104

0.04498

 

wkNN

0.10023

0.00041

0.01046

0.20947

0.00104

0.04492

RReliefF20

1NN

0.15246

0.00063

0.02387

0.29331

0.00136

0.08738

 

kNN

0.09850

0.00035

0.01005

0.20607

0.00087

0.04333

 

wkNN

0.09839

0.00035

0.01002

0.20580

0.00087

0.04322

RReliefF30

1NN

0.15202

0.00068

0.02379

0.29081

0.00122

0.08579

 

kNN

0.09893

0.00033

0.01012

0.20508

0.00079

0.04285

 

wkNN

0.09877

0.00033

0.01008

0.20474

0.00079

0.04271

Bagging

1NN

0.10287

0.00030

0.01088

0.20756

0.00063

0.04370

 

kNN

0.10608

0.00030

0.01156

0.21240

0.00061

0.04572

 

wkNN

0.10544

0.00030

0.01142

0.21078

0.00061

0.04503

Random

1NN

0.10629

0.00030

0.01160

0.20738

0.00059

0.04359

 

kNN

0.10626

0.00030

0.01159

0.20638

0.00058

0.04317

 

wkNN

0.10622

0.00030

0.01158

0.20631

0.00058

0.04314

Bagging + Random

1NN

0.11010

0.00031

0.01243

0.21258

0.00060

0.04579

 

kNN

0.11101

0.00032

0.01264

0.21422

0.00060

0.04649

 

wkNN

0.11083

0.00032

0.01260

0.21386

0.00060

0.04633

Mean Imputation

 

0.11857

0.00035

0.01441

0.22512

0.00063

0.05130