ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ ПО ИССЛЕДОВАНИЮ МОДЕЛЕЙ

Ввод в ЭВМ и обработка полного объема данных из «Ведомости дефектов» показала на гистограмме трехмодальное распределение, что подтвердило предположение о неоднородности статистической структуры дефектов. С целью устранения неоднородности в соответствии с моделью проведен кластер-анализ статистической структуры дефектов. Классификация дефектов выполнялась посредством программы кластер-анализа данных. В результате получены обширные распечатки пятистолбцовой таблицы, описывающей пошаговый процесс объединения кластеров, и дендрограммы классификации дефектов [84,140], редуцированный вариант которой представлен ниже (рис. 4.1).

В каждой строке таблицы ее элементы означают: 1-й — порядковый номер шага объединения, 2-й — значения отклонения между объединяемыми на данном шаге кластерами (евклидово расстояние), 3-й и 4-й — соответственно разность между средним значением каждой переменной по времени и стоимости и средневзвешенным значением образованного на данном шаге кластера, 5-й — суммарный вес реализаций в кластере, полученном на данном шаге. Дендрограмма отображена в соответствии с машинной распечаткой в виде древовидной горизонтальной схемы. Она содержит определенные сведения таблицы.

Слева от схемы помещены три столбца цифр. 1-й столбец указывает номера строк (реализаций) вводимых данных в ЭВМ из «Ведомости дефектов», 2-й — содержит коды дефектов, участвующих в кластеризации, 3-й — указывает последовательность объединения кластеров (дефектов) на каждом шаге.

Дендрограмма показывает, что на 497-м шаге завершено объединение дефектов в классе по достоверности — дефекты с кодами 72, 74, 77, 85, 86 и др. На шаге 504 сформировался класс дефектов по полноте — коды 12, 22, на шаге 514 сформировался класс дефектов по своевременности — код 3.

Редуцированный вариант дендрограммы кластеризации дефектов автоматизированной обработки УБ

Рис. 4.1. Редуцированный вариант дендрограммы кластеризации дефектов автоматизированной обработки УБ

Анализ классификации позволяет установить, что внутри классов дефектов распределение модификаций дефектов равномерно. Можно предположить, что на уровне отдельного класса дефектов отсутствует какая-либо содержательная закономерность в распределении модификаций дефектов. Вместе с тем, очередность и характер объединения классов дефектов свидетельствуют о том, что сначала объединяются дефекты по достоверности, затем по полноте и, наконец, дефекты по своевременности, что подтверждает выдвинутые ранее предположения. Более конкретное представление о значимости каждого класса дефектов можно получить путем дальнейшей обработки статистической структуры по каждому классу дефектов в отдельности и в комплексе.

Оценка параметров ИС выполняется посредством реализации соответствующей программы статистического анализа данных. На машинном уровне исходные данные могут быть представлены массивами: массив А — данные по дефектам достоверности, массив В — по полноте, массив DE — по своевременности (табл. 4.17).

Для удобства анализа и оценки уровня качества полученные на ЭВМ основные статистические данные представляются по разработанной унифицированной форме в виде «Карты данных распределения дефектов» (КДРД) (таблицы 4.1—4.6). Под каждой таблицей приведены статистические характеристики. Эти характеристики получены путем расчета на ЭВМ оценок описательной статистики, а также оценок по формулам моделей измерения и оценки качества ИС (см. гл. 3).

Таблица 4.7

Карта данных распределения дефектов достоверности по времени

Границы интервалов (мин.)

Абсолютная частота (символ)

Относительная

частота

Относительная накопленная частота

1-2

12

0,08

0,08

2-3

38

0,25

0,33

3-4

52

0,34

0,67

4-5

34

0,22

0,89

5-6

13

0,08

0,97

6-7

5

0,03

1

Объем выборки: документов — 200, символов — 100 000.

Среднее выборочное: х = 3,084 .

Среднее квадратическое отклонение: 8 = 1,188.

Границы доверительного интервала среднего выборочного: нижняя — 2,895, верхняя — 3,274.

Вероятность дефекта р = 154/100 000 = 0,00154.

Показатель достоверности р = 1 — 0,00154 = 0,99846.

Оценка математического ожидания дефекта

145

Таблица 4.2

Карта данных распределения дефектов полноты по времени

Границы интервалов (мин.)

Абсолютная частота (показатели)

Относительная частота

Относительная накопленная частота

6-Т

5

0,03

0,03

7-8

7

0,04

0,07

8-9

10

0,06

0,13

9-10

16

0,1

0,23

10-11

20

0,12

0,35

11-12

25

0,16

0,51

12-13

24

0,14

0,65

13-14

21

0,13

0,78

14-15

15

0,09

0,87

15-16

9

0,05

0,92

16-17

7

0,04

0,96

17-18

7

0,04

1

Объем выборки: документов — 250, показателей — 6250.

Среднее выборочное: х = 11,536.

Среднее квадратическое отклонение о = 2,671.

Границы доверительного интервала среднего выборочного: нижняя — 10,177, верхняя — 13,014.

Вероятность дефекта р = 166/6250 = 0,02656.

Показатель полноты р = 1 - 0,02656 = 0,973444.

Оценка математического ожидания дефекта:

X = х ? р = 11,536 • 0,02656 = 0,3063961 мин.

Таблица 4.3

Карта данных распределения дефектов по своевременности на этапах 1 и 3

Границы

интервалов (мин.)

Абсолютная частота (пачка)

Относительная

частота

Накопленная

частота

492-984

8

0,04

0,04

984-1476

13

0,07

0,11

1476-1968

19

0,1

0,21

1968-2460

29

0,15

0,36

Границы

интервалов (мин.)

Абсолютная частота (пачка)

Относительная

частота

Накопленная

частота

2460-2952

44

0,23

0,59

2952-3444

30

0,15

0,74

3444-3936

26

0,13

0,87

3936-4428

15

0,08

0,95

4428-4920

9

0,04

0,99

4920-5412

2

0,01

1

Объем выборки: пачек документов — 269, среднее количество документов в пачке — 46, всего документов — 12 374.

Среднее выборочное пачки: х = 2548,30769.

Среднее квадратичное отклонение о = 1003,28.

Границы доверительного интервала среднего выборочного: нижняя — 27,11, верхняя — 3016,32.

Вероятность дефекта (пачки документов): р = 195/269 = 0,724907. Показатель своевременности р = 1 - 0,724907 = 0,275093. Оценка математического ожидания дефекта Х = х • р = 2548,30769 • 0,724907 = 1847,286 мин.

Оценка по документу — 40,158391 мин.

Таблица 4.4

Карта данных распределения дефектов достоверности по стоимости

Границы интервалов (коп.)

Абсолютная частота (символы)

Относительная

частота

Относительная накопленная частота

13-26

12

0,08

0,08

26-39

38

0,25

0,33

39-52

52

0,34

0,67

52-65

34

0,22

0,89

65-78

13

0,08

0,97

78-81

5

0,03

1

Объем выборки: документов — 200, показателей — 100 000. Среднее выборочное: х = 40,175.

Среднее квадратическое отклонение а = 15,494.

Границы доверительного интервала среднего выборочного: нижняя — 37,708, верхняя — 42,642.

Вероятность дефекта р = 154/100 000 = 0,00154.

Показатель достоверности pd= 1 - 0,00154 = 0,99846.

Оценка математического ожидания дефекта Х= Зс-р = 40,175 0,00154 = 0,0618695 коп.

Таблица 4.5

Карта данных распределения дефектов полноты по стоимости

Г раницы интервалов (коп.)

Абсолютная

частота

(показатель)

Относительная частота

Накопленная относительная частота

168-196

5

0,03

0,03

196-224

7

0,04

0,07

224-252

10

0,06

0,13

252-280

11

0,1

0,23

280-308

20

0,12

0,35

308-336

25

0,16

0,51

336-364

24

0,14

0,65

364-392

21

0,13

0,78

392-420

15

0,09

0,87

420-448

9

0,05

0,92

448-476

7

0,04

0,96

476-504

7

0,04

1

Объем выборки: пачек документов — 250, показателей — 6250. Среднее выборочное: х = 323,009.

Среднее квадратическое отклонение а = 74,792.

Границы доверительного интервала среднего выборочного: нижняя —321,545, верхняя —334,473.

Вероятность дефекта: р = 166/6250 = 0,02656.

Показатель полноты р = 1 - 0,02656 = 0,97344.

Оценка математического ожидания дефекта А' = 5с • р = 323,009 • 0,02656 = 8,5791 19 коп.

Таблица 4.6

Карта данных распределения дефектов своевременности по стоимости

на этапах 1 и 3

Границы

интервалов

(коп.)

Абсолютная

частота

(пачка)

Относительная

частота

Накопленная

относительная

частота

6396-12 792

8

0,04

0,04

12 792-19 188

13

0,07

0,11

Границы

интервалов

(коп.)

Абсолютная

частота

(пачка)

Относительная

частота

Накопленная

относительная

частота

19 188-25 584

19

0,1

0,21

25 584-31 980

29

0,15

0,36

31 980-38 376

44

0,23

0,59

38 376-44 772

32

0,15

0,74

44 772-51 168

26

0,13

0,87

51 168-57 564

15

0,08

0,95

57 564-63 960

9

0,04

0,99

63 960-70 356

2

0,01

1

Объем выборки: пачек документов — 269, среднее количество документов в пачке — 46, документов — 12 374.

Среднее выборочное пачки: х = 33126,0.

Среднее квадратическое отклонение о = 13044,0.

Границы доверительного интервала среднего выборочного: нижняя —13206,0, верхняя — 78366,0.

Вероятность дефекта: р = 195/269 = 0,724907.

Показатель своевременности ps= 1 - 0,724907 = 0,275093.

Оценка математического ожидания дефекта

Х= х ? р = 33126,0 • 0,724907 = 24013,269.

Оценка по документу — 522,02758 коп.

Графики распределения дефектов по времени отображены на рис. 4.2—4.4. По оси абсцисс отмечена ширина интервалов по времени. На рис. 4.4 время выражено в часах, на остальных графиках — в минутах. По оси ординат указано слева от оси количество дефектов, а справа — относительная частота попадания дефектов в соответствующий интервал. Карты данных распределения дефектов достаточно наглядно отображают результаты сбора и обработки экспериментальных данных, необходимых для расчета значений показателей комплексной оценки качества. При первом приближении видно, что такие параметры, как средние квадратические отклонения, довольно существенно отличаются по достоверности, полноте и своевременности относительно как параметров времени, так и параметров стоимости. Если среднее выборочное по достоверности равно 3,084 мин., по полноте — 11,536 мин., то по своевременности это значение равно 2548,30 мин. Отсюда видно, что факторы-дефекты по своевременности являются доминирующими в общей структуре факторов-дефектов, снижающих качество обработки УБ.

Гистограмма распределения дефектов достоверности по времени

Рис. 4.2. Гистограмма распределения дефектов достоверности по времени

Гистограмма распределения дефектов полноты по времени

Рис. 4.3. Гистограмма распределения дефектов полноты по времени

Гистограмма распределения дефектов своевременности по времени

Рис. 4.4. Гистограмма распределения дефектов своевременности по времени

В соответствии с моделями регрессии обобщенных показателей на основе полученных оценок могут быть составлены две матрицы фиксированных данных соответственно по производительности и себестоимости обработки УБ. Обработка матриц выполняется посредством программы регрессионного анализа. Регрессионный анализ зависимости обобщенных показателей от факторов-дефектов обработки выполняется путем применения соответствующей программы статистического анализа данных. В результате реализации регрессионной модели определяются коэффициенты весомости по факторам- дефектам. На основе полученных оценок по достоверности, полноте и своевременности производится расчет значений матриц фиксированных данных соответственно по производительности и себестоимости (таблицы 4.7, 4.8). В этих таблицах в первых графах указаны значения процентов снижения значений переменных, указанные в графах 2—4 и значения прогнозируемых переменных в графах 5 таблиц. В табл. 4.7 предсказывающие переменные измеряются в человеко-днях, прогнозируемая переменная — в документо/днях, а в табл. 4.8, соответственно, — рублях и рублях/документ.

В результате обработки данных матриц построены соответствующие графики зависимости обобщенных показателей по производительности и себестоимости от дефектов обработки (рис. 4.5, 4.6). По оси абсцисс отмечены значения процентов снижения дефектов, а по оси ординат — соответствующие значения прогнозируемых переменных. Путем нанесения точек, указанных значений (см. табл. 4.7, 4.8) и соответствующей линии регрессии получены графические модели прогнозирования обобщенных показателей от снижения дефектов по соответствующим значениям процентов.

В практической работе оперативного управления качеством ИС на основе графиков можно получать экспресс-оценки прогнозируемой величины снижения (увеличения) соответственно по производительности и (или) себестоимости. Если необходимо определить, например, прогнозируемое значение обобщенного показателя по производительности ИС при условии снижения дефектов до 10%, то это значение будет равно ориентировочно 215 документов в день (см. рис. 4.5), что вполне согласуется с данными табл. 4.7. Определяется путем нанесения линий параллельно осям координат до пересечения с линией регрессии. Подобным образом можно определить экспресс-оценки по графику регрессии себестоимости обработки документов (см. рис. 4.6).

Таблица 4.7

Матрица фиксированных данных по производительности

Значение

(%)

Достоверность

(дни)

Полнота

(дни)

Своевременность (дни)

Производительность (док. в день)

1

2

3

4

5

0

246,14

794,01

4162,76

200,79

1

243,68

786,07

4121,14

202,05

2

241,22

778,13

4079,52

203,37

3

238,76

770,19

4037,90

204,72

4

236,30

762,25

3996,28

206,07

5

233,84

754,31

3954,66

207,45

6

231,38

746,37

3913,04

208,84

7

228,92

738,43

3871,42

210,26

8

226,46

730,49

3829,80

211,69

9

224,00

722,55

3788,18

213,14

10

221,54

714,61

3746,56

214,61

11

219,08

706,67

3704,94

216,10

12

216,62

698,73

3663,32

217,61

13

214,16

690,79

3621,70

219,16

14

211,70

682,85

3580,08

220,71

15

209,24

674,91

3538,46

222,29

16

206,78

666,97

3496,84

223,89

17

204,32

659,03

3455,22

225,51

18

201,86

651,09

3413,60

227,16

График зависимости производительности ИС от снижения трудоемкости устранения дефектов обработки

Рис. 4.5. График зависимости производительности ИС от снижения трудоемкости устранения дефектов обработки

График зависимости себестоимости обработки документов от снижения трудоемкости устранения дефектов обработки

Рис. 4.6. График зависимости себестоимости обработки документов от снижения трудоемкости устранения дефектов обработки

Значение

(%)

Достоверность

(дни)

Полнота

(дни)

Своевременность (дни)

Производительность (док. в день)

19

199,40

643,15

3371,98

228,81

20

196,94

635,21

3330,36

230,53

Таблица 4.8

Матрица фиксированных данных по себестоимости

Значение

(%)

Достоверность (руб.)

Полнота

(руб.)

Своевременность (руб.)

Себестоимость (руб.на док.)

1

2

3

4

5

0

15 776,72

109 383,76

266 067,02

11,24

1

15 618,95

108 289,93

263 406,06

11,17

2

15 461,18

107 196,10

260 745,68

11,00

3

15 303,42

106 102,27

258 085,01

11,02

4

15 145,65

105 008,44

255 424,34

10,94

5

14 987,88

103 914,61

252 763,67

10,86

6

14 830,12

102 820,78

250 103,00

10,79

7

14 672,35

101 762,95

247 442,33

10,71

8

14 514,58

100 633,12

244 781,66

10,63

9

14 356,81

99 537,29

242 120,99

10,56

10

14 199,05

98 445,45

239 460,32

10,48

11

14 041,28

97 351,61

236 799,65

10,40

12

13 883,51

96 257,77

234 138,98

10,33

13

13 725,75

95 163,94

231 478,31

10,25

14

13 567,98

94 070,10

228 817,64

10,17

15

13 410,21

92 976,26

226 156,97

10,09

16

13 252,45

91 882,43

223 496,30

10,02

17

13 094,68

90 788,59

220 835,63

9,94

18

12 936,91

89 694,75

218 174,96

9,87

19

12 779,14

88 600,92

215 514,29

9,79

20

12 621,38

87 507,08

212 853,62

9,71

Для получения значений обобщенных показателей качества в результате реализации программы регрессионного анализа были получены коэффициенты регрессии и оценочные величины соответственно по производительности и себестоимости (табл. 4.9 и 4.10). По этим данным составлены уравнения множественной линейной регрессии по производительности и по себестоимости:

В правой части уравнений расположены слева направо соответствующие свободные члены регрессии (нулевые коэффициенты), затем коэффициенты регрессии. Они обозначают соответственно значения базовых показателей производительности и себестоимости и коэффициентов весомости по достоверности, полноте и своевременности. Подставляя значения показателей по достоверности, полноте и своевременности, можно определить фактические или прогнозируемые значения показателей по производительности и себестоимости.

Таблица 4.9

Коэффициенты регрессии по производительности и данные их оценки

Вид коэффициента

Значение коэффициента рег- ресссии

Стандартная ошибка коэффициента

Уровень значимости

нулевой гипотезы (Р-значение)

Нулевой

348,9

27

5,95?-7

Достоверность

-1,452

271,7

0,9915

Полнота

-0,1119

81,56

0,9941

Своевременность

0,07146

23,47

0,993

Коэффициент множественной корреляции — 0,9993.

Коэффициент детерминации — 0,99859.

Приведенная (несмещенная) оценка коэффициента детерминации — 0,99834.

Стандартная ошибка вычислений — 0,37546.

F — значение статистики Фишера для проверки нулевой гипотезы — 4020.

Уровень значимости (Р-значение) нулевой гипотезы — 0,0000.

Гипотеза 1: < Регрессионная модель адекватна экспериментальным данным>.

Таблица 4.10

Коэффициенты регрессии по себестоимости и данные их оценки

Вид коэффициента

Значение коэффициента регресссии

Стандартная

ошибка

коэффициента

Уровень значимости нулевой гипотезы (/-значение)

Нулевой

3,663

0,06802

13037/—8

Достоверность

0,3924

0,5402

0,5162

Полнота

000002067

0,0005942

0,7315

Своевременность

-0,02332

0,03202

0,5174

Коэффициент множественной корреляции — 0,99917.

Коэффициент детерминации — 0,99833.

Приведенная (несмещенная) оценка коэффициента детерминации - 0,99804.

Стандартная ошибка вычислений — 0,020831.

/’-значение статистики Фишера для проверки нулевой гипотезы — 3392.

Уровень значимости (/-значение) нулевой гипотезы — 0,0000.

Гипотеза 1: < Регрессионная модель адекватна экспериментальным данным>.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >