Условие Имеются следующие данные об уровне механизации работ X(%) и производительности труда Y (т

Условие.
Имеются следующие данные об уровне механизации работ X(%) и производительности труда Y (т/ч) для однотипных предприятий (табл.):
Необходимо: а) оценить тесноту и направление связи между переменными с помощью коэффициента корреляции; б) найти уравнение регрессии по , в) оценить среднюю производительность труда на предприятиях с уровнем механизации работ 60% и построить для нее 95%-ный доверительный интервал; г) аналогичный доверительный интервал найти для индивидуальных значений производительности труда на тех же предприятиях.
х
10 10 11 9 9 8 7 7
у 7 9 10 8 8 6 6 5

Решение.

На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.Оценочное уравнение регрессии (a•n + b∑x = ∑ya∑x + b∑x2 = ∑y•xДля наших данных система уравнений имеет вид8a + 71 b = 5971 a + 645 b = 539-71a -630.48 b = -523.9271 a + 645 b = 53914.52 b = 15.08b = 1.03368a + 71 b = 598a + 71 • 1.0336 = 598a = -14.39a = -1.7983
Уравнение регрессии (эмпирическое уравнение регрессии):y = 1.0336 x -1.7983Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
x y x2 y2 x • y
10 7 100 49 70
10 9 100 81 90
11 10 121 100 110
9 8 81 64 72
9 8 81 64 72
8 6 64 36 48
7 6 49 36 42
7 5 49 25 35
71 59 645 455 539
Параметры уравнения регрессии.Выборочные средние.Выборочные дисперсии:Среднеквадратическое отклонениеКоэффициент корреляции b можно находить по формуле, не решая систему непосредственно:Коэффициент корреляцииКовариация.Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:Линейный коэффициент корреляции принимает значения от –1 до +1.Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:0.1 < rxy < 0.3: слабая;0.3 < rxy < 0.5: умеренная;0.5 < rxy < 0.7: заметная;0.7 < rxy < 0.9: высокая;0.9 < rxy < 1: весьма высокая;В нашем примере связь между признаком Y фактором X высокая и прямая.Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:Уравнение регрессии (оценка уравнения регрессии).Линейное уравнение регрессии имеет вид y = 1.03 x -1.8Коэффициентам уравнения линейной регрессии можно придать экономический смысл.Коэффициент регрессии b = 1.03 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 1.03.Коэффициент a = -1.8 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.Связь между у и х определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе — обратная). В нашем примере связь прямая.Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
x y y(x) (yi-ycp)2 (y-y(x))2 (xi-xcp)2
10 7 8.54 0.14 2.36 1.27
10 9 8.54 2.64 0.21 1.27
11 10 9.57 6.89 0.18 4.52
9 8 7.5 0.39 0.25 0.0156
9 8 7.5 0.39 0.25 0.0156
8 6 6.47 1.89 0.22 0.77
7 6 5.44 1.89 0.32 3.52
7 5 5.44 5.64 0.19 3.52
71 59 59 19.88 3.98 14.88
Доверительные интервалы для зависимой переменной.Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения. Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов.Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя.(a + bxp ± ε)гдеtкрит (n-m-1;α/2) = (6;0.025) = 2.447Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 60Вычислим ошибку прогноза для уравнения y = bx + ay(60) = 1.034*60 -1.798 = 60.21860.218 ± 26.438(33.78;86.66)С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.Вычислим ошибку прогноза для уравнения y = bx + a + ε(33.71;86.73)Индивидуальные доверительные интервалы для Y при данном значении X.(a + bxi ± ε)гдеtкрит (n-m-1;α/2) = (6;0.025) = 2.447
xi
y = -1.8 + 1.03xi εi
ymin = y — εi
ymax = y + εi
10 8.54 2.19 6.34 10.73
10 8.54 2.19 6.34 10.73
11 9.57 2.38 7.19 11.95
9 7.5 2.12 5.39 9.62
9 7.5 2.12 5.39 9.62
8 6.47 2.16 4.31 8.63
7 5.44 2.33 3.11 7.76
С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

шесть + три =

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.

Adblock detector