Статистична модель: сутність методу, побудова та аналіз

Статистична модель являє собою математичну проекцію, яка втілює в собі набір різних припущень щодо генерації деяких вибіркових даних. Даний термін представляють часто в значно ідеалізованої формі.

Допущення, виражені в статистичної моделі, показують комплект імовірнісних розподілів. Багато з яких, як передбачається, правильно апроксимують розподіл, з якого відбирається певний комплект інформації. Розподілу ймовірностей, властиві статистичними моделям, - це те, що виділяє проекцію від інших математичних модифікацій.

Загальна проекція

статистичні моделі процесів

Математична модель являє собою опис системи з використанням певних понять і мови. Вони застосовуються в природничих науках (таких як фізика, біологія, наука про Землю, хімія) і інженерних дисциплінах (таких як інформатика, електротехніка), а також в соціальних науках (таких як економіка, психологія, соціологія, політологія).

Модель може допомогти пояснити систему і вивчити вплив різних компонентів, а також зробити прогнози поведінки.

Математичні моделі можуть приймати різні форми, включаючи динамічні системи, статистичні проекції, диференціальні рівняння або теоретико-ігрові параметри. Ці та інші типи можуть перетинатися, причому дана модель включає в себе безліч абстрактних структур. В цілому математичні проекції можуть включати в себе і логічні компоненти. У багатьох випадках якість наукової області залежить від того, наскільки добре математичні моделі, розроблені з теоретичного боку, узгоджуються з результатами повторюваних експериментів. Відсутність згоди між теоретичними процесами і експериментальними вимірами часто призводить до важливих досягнень у міру розробки досконаліших теорій.

У фізичних науках традиційна математична модель містить велику кількість таких елементів:

  • Керуючі рівняння.
  • Отримати додаткові подмодели.
  • Визначення рівнянь.
  • Установчі рівняння.
  • Допущення і обмеження.
  • Початкові і граничні умови.
  • Класичні обмеження і кінематичні рівняння.

Формула

Статистична модель, як правило, задається математичними рівняннями, які об’єднують одну або кілька випадкових величин і, можливо, інших закономірно, що випливають, змінних. Подібним чином проекція вважається “формальним поняттям концепції”.

Всі статистичні перевірки гіпотез і статистичні оцінки зароблені з математичних моделей.

Вступ

статистичні математичні моделі

Неформально статистична модель може розглядатися як допущення (або набір припущень) з певним властивістю: воно дозволяє обчислювати ймовірність будь-якої події. Як приклад можна розглянути пару звичайних шестигранних кубиків. Необхідно вивчити два різних статистичних припущення про кістки.

Перше припущення полягає в наступному:

Для кожного з кубиків ймовірність випадання одного з числа (1, 2, 3, 4, 5, і 6) становить: 16.

З цього припущення можна обчислити вірогідність обох кубиків: 1: 16 × 16 = 136.

У більш загальному сенсі можна розрахувати ймовірність будь-якої події. Однак варто розуміти, що неможливо розрахувати ймовірність будь-якого іншого нетривіального події.

Тільки лише перша думка збирає статистичну математичну модель: внаслідок того що тільки лише з одним припущенням можна визначити ймовірність кожного дії.

У наведеному вище зразку з початковим дозволом визначити можливість події легко. З деякими іншими прикладами розрахунок може бути важким або навіть нереальним (наприклад, це може вимагати безліч років обчислень). Для людини, що становить модель статистичного аналізу, подібна складність вважається неприйнятною: здійснення розрахунків не повинно бути практично неможливим і теоретично неможливим.

Формальне визначення

У математичних термінах статистична модель системи зазвичай розглядається як пара (S, P), де S це набір можливих спостережень, тобто простір вибірки, і P це набір розподілів ймовірностей на S.

Інтуїція цього визначення полягає в наступному. Передбачається, що існує “істинне” розподіл ймовірностей, викликане процесом, який генерує певні дані.

Набір

Саме він визначає параметри моделі. Параметризація, як правило, вимагає, щоб різні значення приводили до відмінних розподілів, т. Е.

Повинен триматися (іншими словами, він повинен бути ін’єкційних). Параметризація, яка відповідає вимозі, називається ідентифікованої.

Приклад

графік статистики

Припустимо, що є якась кількість школярів, які мають різний вік. Зростання дитини буде стохастически пов’язаний з роком народження: наприклад, коли школяреві 7 років, це впливає на ймовірність зростання, тільки так, що людина буде вище 3 сантиметрів.

Можна формалізувати цей підхід в модель прямолінійною регресії, наприклад, таким чином: висота i = b 0 + b 1agei + εi, де b 0 - перетин, b 1 - параметр, на який множиться вік при отриманні моніторингу височини. Це термін похибки. Тобто це передбачає, що зростання передбачається віком з певною помилкою.

Допустима форма зобов’язана відповідати всім точкам інформації. Таким чином, прямолінійний напрямок (рівень i = b 0 + b 1agei) не здатна бути рівнянням для моделі даних - якщо вона чітко не відповідає абсолютно всім пунктам. Тобто все без винятку відомості бездоганно лежать на лінії. Учасник погрешностіεi зобов’язаний бути введений в рівність, щоб форма відповідала абсолютно всіма пунктами інформації.

Щоб зробити статистичний висновок, спочатку потрібно прийняти деякі імовірнісні розподілу для ε i. Наприклад, можна припустити, що розподілу ε i мають гауссову форму з нульовим середнім. У цьому випадку модель буде мати 3 параметра: b 0, b 1 і дисперсію розподілу Гаусса.

Можна формально вказати модель у вигляді (S, Р).

У цьому прикладі модель визначається зазначенням S і тому можна зробити деякі припущення, які мають відношення до P. Є два варіанти:

Це зростання може бути апроксимувати лінійною функцією віку;

Що помилки в наближенні розподіляються як всередині гауссова.

Загальні зауваження

Статистичні параметри моделей - це особливий клас математичної проекції. Що відрізняє один вид від іншого? Так це те, що статистична модель недетермінірованного. Таким чином, в ній, на відміну від математичних рівнянь, певні змінні не мають певних значень, а замість цього мають розподілом повноважень. Тобто окремий змінні вважаються стохастичними. У наведеному раніше прикладі ε є стохастичною змінною. Без неї проекція була б детермінованою.

Побудови статистичної моделі часто використовуються, навіть якщо матеріальний процес вважається детермінованим. Наприклад, підкидання монет в принципі є предопределяющим дією. Однак все ж це в більшості випадків моделюється що стохастичний (через процес Бернуллі).

Згідно Konishi і Kitagawa, існує три мети для статистичної моделі:

  • Пророцтва.
  • Видобуток інформації.
  • Опис стохастичних структур.

Розмір проекції

Припустимо, що є модель статистичного прогнозування,

Модель називається параметричної, якщо Про має кінцеве вимір. У рішенні необхідно написати, що

різниця моделі

Де k - це позитивне ціле число (R позначає будь-які дійсні числа). Тут k називається розмірністю моделі.

Як приклад можна припустити, що всі дані виникають з одновимірного гауссовского розподілу:

формула статистики

У цьому прикладі розмірність k дорівнює 2.

А в якості іншого прикладу, можна припустити, що дані складаються з точок (x, y), які, як передбачається, розподілені по прямій лінії з залишками Гаусса (з нульовим середнім). Тоді розмірність статистичної економічної моделі дорівнює 3: перетин лінії, її нахил і дисперсія розподілу залишків. Необхідно звернути увагу, що в геометрії пряма лінія має розмірність 1.

Хоча вищеописане значення формально є єдиним параметром, який має розмірність k, іноді він розглядається як містить k окремих значень. Наприклад, з одновимірним розподілом Гаусса, Про це єдиний параметр з розміром 2, але іноді розглядається як містить два окремих параметра - середнє значення і стандартне відхилення.

Статистична модель процесу є непараметричної, якщо набір значень Про бесконечномерен. А також вона є напівпараметричною, якщо має як скінченномірні, так і безконечномірні параметри. Формально, якщо k є розмірністю О і n - число вибірок, напівпараметричний і непараметричні моделі мають

формула моделі

Тоді модель є напівпараметричною. В іншому випадку проекція є непараметричної.

Параметричні моделі є найбільш часто використовуваними статистичними даними. Що стосується напівпараметричний і непараметричних проекцій, сер Девід Кокс заявив:

“Як правило, вони мають на увазі найменше число гіпотез про текстуру і формі розподілу, однак вони включають потужні теорії про самостійність”.

Вкладені моделі

Не варто їх плутати з багаторівневими проекціями.

Дві статистичні моделі є вкладеними, якщо першу можна перетворити в другу шляхом накладення обмежень на параметри першої. Наприклад, безліч всіх гауссовских розподілів має вкладений в нього набір розподілів з нульовим середнім:

Тобто потрібно обмежити середнє в безлічі всіх гауссовских розподілів, щоб отримати розподілу з нульовим середнім. Як другий приклад, квадратична модель y = b 0 + b 1 x + b 2 x 2 + ε, ε ~ N (0, σ 2) має вкладену в неї лінійну модель Y = B 0 + B 1 X + ε, ε ~ N (0, σ 2) - тобто параметр b2 дорівнює 0.

В обох цих прикладах перша модель має більш високу розмірність, ніж друга модель. Таке часто, але не завжди буває. Як інший приклад можна привести безліч гауссових розподілів з позитивним середнім, яке має розмірність 2.

Порівняння моделей

статистична модель

Передбачається, що існує “істинне” розподіл ймовірності, що лежить в основі спостережуваних даних, індукованих процесом, який згенерував їх.

А також моделі можна порівнювати один з одним, за допомогою розвідувального аналізу або підтверджує. У дослідному розборі формулюються різні моделі, й проводиться оцінка того, наскільки добре кожен з них описує дані. В підтверджує аналізі раніше сформульована гіпотеза порівнюється з вихідною. Загальні критерії для цього включають Р 2, Байєсівський фактор і відносну ймовірність.

Думка Коніши і Китагава

“Більшість проблем статистичної математичної моделі можна розглядати як питання, пов’язані з прогнозуванням. Вони зазвичай формулюються як порівняння декількох факторів “.

Крім того, сер Девід Кокс сказав: “Як переклад з теми, проблема в статистичної моделі найчастіше є найбільш важливою частиною аналізу”.



ЩЕ ПОЧИТАТИ