ЭНТРОПИЙНЫЙ КРИТЕРИЙ ДУДЕВИЧА-ВАН ДЕР МЮЛЕНА

Для случайной величины X с функцией плотности /(л) энтропия //(/) этой величины, предложенная Шенноном [37], определяется соотношением

Используя то, что выражение для энтропии можно записать как

в [44] была получена оценка энтропии следующего вида

которую было предложено использовать в качестве статистики критерия, предназначенного для проверки нормальности.

В качестве статистики критерия проверки равномерности оценка (2.25) была предложена в работе [11]. При вычислении оценки энтропии (2.25) в

качестве размера окна т выбирается целое число т < , при этом, если

/ + т > п, то Uj+m = Un, а если i - т < 1, то Ut_m = Ux.

Критерий правосторонний. Проверяемая гипотеза отклоняется при значениях статистики (2.25) Н(т,п) > На(т,п).

Критические значения статистики (2.25) представлены в таблице 2.58. Они несколько уточняют соответствующие значения, приведенные в работе [11].

Зависимость распределений статистики от выбора т при объёме выборок п = 50 демонстрирует рис. 2.17.

Таблица 2.58

Критические значения статистики Н(т,п)

критерия Дудевича-ван дер Мюлена

п

т

1

0.8

0.85

0.9

0.95

0.99

10

1

0.700

0.758

0.835

0.960

1.225

2

0.547

0.592

0.653

0.754

0.971

п

т

1-«

0.8

0.85

0.9

0.95

0.99

3

0.542

0.584

0.642

0.735

0.942

4

0.575

0.617

0.673

0.765

0.969

20

1

0.505

0.538

0.582

0.651

0.795

2

0.350

0.375

0.409

0.463

0.579

3

0.322

0.345

0.376

0.426

0.532

4

0.325

0.346

0.376

0.423

0.525

5

0.339

0.360

0.388

0.435

0.535

6

0.359

0.380

0.408

0.454

0.554

7

0.383

0.404

0.432

0.477

0.576

8

0.410

0.431

0.459

0.504

0.603

9

0.439

0.459

0.487

0.532

0.631

30

1

0.437

0.462

0.494

0.544

0.648

2

0.283

0.301

0.326

0.364

0.445

3

0.248

0.264

0.286

0.321

0.395

4

0.242

0.257

0.277

0.310

0.381

5

0.246

0.261

0.281

0.313

0.381

6

0.256

0.271

0.290

0.321

0.389

7

0.269

0.283

0.303

0.333

0.401

8

0.285

0.299

0.317

0.348

0.415

9

0.301

0.315

0.334

0.364

0.431

10

0.319

0.333

0.351

0.382

0.448

40

1

0.403

0.423

0.449

0.490

0.573

2

0.249

0.264

0.283

0.314

0.378

3

0.211

0.224

0.241

0.268

0.327

4

0.200

0.212

0.228

0.254

0.309

5

0.200

0.211

0.226

0.251

0.305

6

0.205

0.216

0.231

0.255

0.307

7

0.213

0.224

0.238

0.262

0.314

п

т

1

0.8

0.85

0.9

0.95

0.99

8

0.223

0.234

0.248

0.272

0.322

9

0.234

0.245

0.259

0.282

0.333

10

0.246

0.257

0.271

0.294

0.345

15

0.316

0.326

0.341

0.364

0.413

50

1

0.382

0.399

0.421

0.456

0.526

2

0.229

0.241

0.258

0.283

0.337

3

0.188

0.199

0.214

0.236

0.284

4

0.175

0.185

0.198

0.219

0.265

5

0.172

0.181

0.194

0.214

0.258

6

0.174

0.183

0.195

0.215

0.258

7

0.179

0.188

0.200

0.219

0.261

50

8

0.186

0.195

0.206

0.226

0.267

9

0.194

0.203

0.214

0.234

0.274

10

0.203

0.212

0.223

0.242

0.283

15

0.256

0.264

0.276

0.294

0.335

20

0.315

0.324

0.335

0.354

0.394

100

1

0.337

0.348

0.362

0.384

0.427

2

0.186

0.194

0.204

0.220

0.251

3

0.142

0.149

0.157

0.171

0.199

4

0.123

0.129

0.137

0.150

0.175

5

0.115

0.120

0.128

0.139

0.164

6

0.111

0.116

0.123

0.135

0.158

7

0.110

0.115

0.122

0.134

0.156

8

0.111

0.116

0.123

0.133

0.156

9

0.113

0.118

0.125

0.135

0.157

10

0.116

0.121

0.127

0.138

0.159

15

0.138

0.142

0.148

0.158

0.179

20

0.164

0.169

0.175

0.184

0.205

п

т

1

0.8

0.85

0.9

0.95

0.99

30

0.222

0.227

0.233

0.242

0.263

40

0.283

0.288

0.295

0.305

0.325

В работе [49], для аналогичного критерия (с несколько другими оценками энтропии) в зависимости от объёмов п анализируемых выборок предложены оптимальные значения т для размера окна т, которые приведены в таблице 2.59.

Полученные в результате статистического моделирования оценки мощности критерия Дудевича-ван дер Мюлена при проверке равномерности по отношению к конкурирующим гипотезам Я,, Я2 и Я3 при таких

оптимальных значениях т представлены в таблицах 2.60, 2.61 и 2.62 соответственно.

Зависимость распределений статистики Дудевича-ван дер Мюлена от выбора т при п = 50

Рис. 2.17. Зависимость распределений статистики Дудевича-ван дер Мюлена от выбора т при п = 50

Оптимальные значения т*

я

т*

я

т*

я < 5

1

40 < я < 100

6

6 < п < 8

2

101 < я < 150

7

9< я < 18

3

151 < я < 200

8

19 < я < 29

4

я >200

9

30<я<39

5

Выбор оптимального размера окна т для критериев, в качестве статистик которых используются различные оценки энтропии, представляет собой актуальную проблему. Большинство авторов предлагают использовать такие т, при которых значения соответствующих непараметрических оценок энтропии ближе к её теоретическому значению.

Мощность критерия Дудевича-ван дер Мюлена Н(т*,п) относительно гипотезы Нх

Таблица 2.60

я

а

0.15

0.1

0.05

0.025

0.01

10

0.347

0.254

0.145

0.080

0.035

20

0.464

0.361

0.228

0.140

0.071

30

0.562

0.459

0.311

0.204

0.112

40

0.648

0.548

0.395

0.273

0.160

50

0.696

0.601

0.449

0.324

0.199

100

0.853

0.790

0.669

0.546

0.399

150

0.942

0.909

0.835

0.746

0.615

200

0.980

0.965

0.928

0.874

0.783

300

0.997

0.995

0.987

0.973

0.941

Мощность критерия Дудевича-ван дер Мюлена Н(т*,п) относительно гипотезы Нг

п

а

0.15

0.1

0.05

0.025

0.01

10

0.144

0.097

0.050

0.026

0.011

20

0.166

0.115

0.062

0.033

0.015

30

0.192

0.136

0.076

0.042

0.020

40

0.217

0.158

0.092

0.053

0.026

50

0.252

0.188

0.113

0.069

0.035

100

0.407

0.327

0.224

0.151

0.088

150

0.531

0.449

0.332

0.242

0.156

200

0.637

0.560

0.440

0.339

0.235

300

0.790

0.729

0.623

0.522

0.401

Следует отметить, что относительно гипотезы Н2 при малых п наблюдается небольшое смещение (см. таблицу 2.64).

Таблица 2.62

Мощность критерия Дудевича-ван дер Мюлена Н(т*,п) относительно гипотезы Нъ

п

а

0.15

0.1

0.05

0.025

0.01

10

0.169

0.115

0.060

0.031

0.013

20

0.192

0.134

0.071

0.038

0.017

30

0.215

0.152

0.084

0.046

0.021

40

0.237

0.172

0.098

0.055

0.026

50

0.260

0.191

0.111

0.064

0.031

100

0.355

0.275

0.175

0.110

0.058

150

0.442

0.356

0.242

0.162

0.093

200

0.522

0.435

0.313

0.219

0.135

300

0.650

0.568

0.440

0.334

0.224

Но размер окна т влияет также на мощность критериев. Причём оптимальное т зависит и от конкурирующей гипотезы. В данном случае нами были получены оптимальные значения т, при которых критерий Дудевича-ван дер Мюлена (2.25) показывает наибольшую мощность относительно конкурирующих гипотез Я,, Я2 и Я3. Полученные результаты относительно гипотез Н2 и Я3 представлены в таблицах 2.63 и 2.64. А относительно гипотезы Я, мощность всегда возрастает при увеличении т, другими словами максимальная мощность в этом случае всегда будет п -1

при т = .

Критерии, базирующиеся на оценках энтропии, представляют собой достаточно эффективные критерии проверки гипотез о принадлежности наблюдений равномерному закону. В частности они, как правило, существенно превосходят критерии равномерности, в которых используются разности последовательных порядковых статистик (например, критерии Шермана, Кимбелла, Морана, Янга).

Таблица 2.63

Оптимальные значения т относительно гипотезы Я2

п

т

п

т

л <17

1

55<п< 68

4

17 < п < 34

2

69 < п < 89

5

35 < п < 54

3

89 < п <100

6

Таблица 2.64

Оптимальные значения т относительно гипотезы Я3

п

т

п

т

5 < п < 10

2

51 < п < 60

7

11 < я < 21

3

61 < я < 72

8

22 < п < 30

4

73 < я < 82

9

31 < п <38

5

83 < я < 97

10

39 < п < 50

6

98-100

11

Относительно конкурирующих гипотез вида Н2 или Н3 эти критерии несколько уступают в мощности критериям типа Хегази-Грина, Фросини, Неймана-Бартона, но у них отсутствует смещённость относительно конкурирующих гипотез вида //, и, даже более того, относительно такого рода гипотез они имеют преимущество в мощности перед большинством критериев, включая непараметрические критерии согласия, особенно при больших размерах окна т .

Недостатками при использовании критерия Дудевича-ван дер Мюлена является зависимость распределения статистики от объема выборки п и необходимость использования таблицы процентных точек, а также некоторая неопределенность с выбором т. В то же время критерий обладает достаточно высокой мощностью относительно конкурирующих гипотез вида Н] и неплохой мощностью относительно других конкурирующих гипотез.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >