Решить нужно линейной и гиперболической моделью и сделать вывод какая модель лучше подходит Туристическая фирма крупного курортного города интересует

Решить нужно линейной и гиперболической моделью и сделать вывод какая модель лучше подходит
Туристическая фирма крупного курортного города интересует связь между числом отпускников (y), останавливающихся в отелях расходами на рекламу отелей (x). Взято случайное число отелей – 7, сходных по размеру. Была собрана следующая информация за текущий сезон:
Таблица 1. Исходные данные
Отель 1 2 3 4 5 6 7
Реклама, тыс.руб. 9 6 10 8 7 4 5
Число гостей, чел. 140 100 160 130 110 80 90

Построим поле корреляции и сформулируем гипотезу о форме связи:

Рис. 1. Поле корреляции

Из рис. 1 видно, что между расходами на рекламу и числом гостей существует линейная положительная зависимость.

Рассчитаем параметры линейной регрессии.
.
Таблица 2. Расчетная таблица
i
х y x2 xy
y2
1 9 140 81 1260 19600 142,14 -2,14 4,59 0,015
2 6 100 36 600 10000 102,50 -2,50 6,25 0,025
3 10 160 100 1600 25600 155,36 4,64 21,56 0,029
4 8 130 64 1040 16900 128,93 1,07 1,15 0,008
5 7 110 49 770 12100 115,71 -5,71 32,65 0,052
6 4 80 16 320 6400 76,07 3,93 15,43 0,049
7 5 90 25 450 8100 89,29 0,71 0,51 0,008
Сумма 49 810 371 6040 98700 810,00 0,00 82,14 0,187

Значения параметров а и b линейной модели определим, используя данные таблицы

Уравнение линейной регрессии имеет вид:

С увеличением расходом на рекламу на 1 тыс. руб. число гостей увеличивается в среднем на 13,214 чел.

Оценим тесноту связи с помощью показателей корреляции и детерминации.
Рассчитаем линейный коэффициент парной корреляции по следующей формуле:

Можно сказать, что связь между расходами на рекламу Х и числом гостей У прямая и тесная.
Рассчитаем коэффициент детерминации: R2yx=ryx 2= 0,983.

Вариация результата У (число гостей) на 98,3% объясняется вариацией фактора Х (расходы на рекламу). На остальные факторы, неучтенные в модели, приходится 1,7%.

Оценим с помощью среднеквадратической ошибки и средней ошибки аппроксимации качество уравнения:
Среднеквадратическая ошибка:

Определим среднюю относительную ошибку аппроксимации:

В среднем расчетные значения для линейной модели отличаются от фактических значений на 2,67%, что не выходит из пределов нормы, то есть качество модели хорошее.

Дадим с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результатом:
Коэффициент эластичности для линейной парной регрессии:

Следовательно, при изменении расходов на рекламу на 1%, число гостей изменится на 0,799%.

Оценим с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. Fкр=6,61.
Статистика Фишера

Поскольку , то уравнение линейной регрессии статистически надежно.

Оценим статистическую значимость коэффициента регрессии и коэффициента корреляции. tкр=2,57.
Выдвигаем гипотезы:
H0: rxy = 0;
H1: rxy ≠ 0.

Поскольку |tr| > tкр=2,57, то коэффициент корреляции статистически значим

Выдвигаем гипотезы:
H0: b= 0;
H1: b ≠ 0.

Sb — стандартное отклонение случайной величины b:

Поскольку |tb| > tкр=2,57, то коэффициент регрессии b статистически значим

Выполним пункты 2-7 для гиперболической модели
Рассчитаем параметры гиперболической регрессии.
.
Произведем линеаризацию модели путем замены . В результате получим линейное уравнение
Рассчитаем его параметры по данным следующей рабочей таблицы.

Таблица 3. Расчетная таблица
№ x у z yz
   
1 9 140 0,111 15,556 0,012 19600,000 138,444 1,556 2,420 0,011 589,796
2 6 100 0,167 16,667 0,028 10000,000 110,635 -10,635 113,099 0,106 246,939
3 10 160 0,100 16,000 0,010 25600,000 144,006 15,994 255,804 0,100 1961,224
4 8 130 0,125 16,250 0,016 16900,000 131,492 -1,492 2,226 0,011 204,082
5 7 110 0,143 15,714 0,020 12100,000 122,553 -12,553 157,581 0,114 32,653
6 4 80 0,250 20,000 0,063 6400,000 68,921 11,079 122,752 0,138 1275,510
7 5 90 0,200 18,000 0,040 8100,000 93,949 -3,949 15,596 0,044 661,224
∑ 49 810 1,096 118,187 0,189 98700,000 810,000 0,000 669,478 0,525 4971,429

Уравнение гиперболической регрессии имеет вид:

Оценим тесноту связи с помощью показателей корреляции и детерминации.
Индекс корреляции

Связь между показателем у и фактором х можно считать достаточно сильной, так как R>0,7
Индекс детерминации: детерминации
Вариация результата У (число гостей) на 86,5% объясняется вариацией фактора Х (расходы на рекламу). На остальные факторы, неучтенные в модели, приходится 13,5%.

Оценим с помощью среднеквадратической ошибки и средней ошибки аппроксимации качество уравнения:
Среднеквадратическая ошибка:

Определим среднюю относительную ошибку аппроксимации:

В среднем расчетные значения для гиперболической модели отличаются от фактических значений на 7,51%, что не выходит из пределов нормы, то есть качество модели хорошее.

Дадим с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результатом:
Коэффициент эластичности для гиперболической парной регрессии:

Следовательно, при изменении расходов на рекламу на 1%, число гостей изменится на 0,618%.

Оценим с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. Fкр=6,61.
Статистика Фишера

Поскольку , то уравнение гиперболической регрессии статистически надежно.

Оценим статистическую значимость коэффициента регрессии и коэффициента корреляции. tкр=2,57.
Выдвигаем гипотезы:
H0: rxy = 0;
H1: rxy ≠ 0.

Поскольку |tr| > tкр=2,57, то коэффициент корреляции статистически значим

Выдвигаем гипотезы:
H0: b= 0;
H1: b ≠ 0.

Sb — стандартное отклонение случайной величины b:

Поскольку |tb| > tкр=2,57, то коэффициент регрессии b статистически значим

Для выбора лучшей модели построим сводную таблицу результатов.
Таблица 4. Сравнительная таблица

Линейная
Гиперболическая
Модель
Коэффициент (индекс) корреляции 0,992 0,930
Коэффициент детерминации R 0,983 0,865
Коэффициент эластичности 0,799 0,618
Среднеквадратичная ошибка 4,053 11,571
Статистика Фишера 297,609 32,129
Средняя ошибка аппроксимации 2,665 7,506

Из таблицы 4 видно, что лучшими значениями всех рассматриваемых характеристик обладает линейная модель. Используем линейную парную регрессию для прогнозирования.

Рассчитаем прогнозное значение результата, если прогнозное значение фактора увеличится на 10 % от среднего уровня.
Прогнозное значение расходов на рекламу:

Прогнозное значение числа гостей при расходах на рекламу 7,7 тыс. руб.:
чел.

Выводы:
В ходе выполнения работы были построены линейное и гиперболическое уравнение зависимости:

В результате сравнительного анализа полученных моделей установлено, что лучше для описания исходных статистических данных подходит линейное уравнение парной регрессии.
Под описание линейной регрессии попадает в среднем 98,3% наблюдений.
Полученное уравнение статистически надежно и имеет высокое качество (ошибка аппроксимации всего 2,67%)
С помощью линейной модели установлено, что при расходах на рекламу в 7,7 тыс. руб. численность отпускников, останавливающихся в отеле, составит 125 человек.

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

два × пять =

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.

Adblock detector