matemãtinė statstika, nagrinėja eksperimentų planavimo, duomenų rinkimo, sisteminimo, analizės ir interpretavimo metodus. Tikslas – nustatyti tam tikra prasme optimalias sprendimų priėmimo taisykles esant neapibrėžtumo situacijai, t. y., kai stebėjimų duomenys yra atsitiktinių dydžių, vektorių ar procesų realizacijos. Statistiniai duomenys gaunami iš aplinkos nustatant kokios nors objektų aibės (populiacijos, generalinės aibės) elementų ir įvairių požymių skaitines reikšmes. Daug matuojamų charakteristikų, susijusių su įvairiomis populiacijomis, nusakomos atsitiktiniais dydžiais, pvz., žmonių, kuriems atliekama tam tikra operacija, gyvenimo trukmė, tam tikro tipo dirvožemio derlingumas, defektinių gaminių tam tikros gamyklos produkcijoje kiekis ir kita. Tikimybiniai požymių skirstiniai (t. y. jų reikšmių pasiskirstymas visoje populiacijoje) tiksliai nežinomi, nes dažniausiai visos populiacijos neįmanoma ištirti, todėl imama tik dalis jos objektų. Parinkus populiacijos objektą, prieš matavimą tiriamos charakteristikos reikšmė nežinoma, todėl ją galima interpretuoti kaip atsitiktinio dydžio realizaciją. Paprasčiausiais atvejais atliekama n eksperimentų ir matuojamos (nebūtinai tiesiogiai) nepriklausomų vienodai pasiskirsčiusių atsitiktinių dydžių X1, …, Xn įgytos reikšmės x1, …, xn, pvz., jei tiriamos didelės televizorių populiacijos funkcionavimo trukmės charakteristikos, stebima n gaminių ir matuojamos jų funkcionavimo trukmių reikšmės x1, …, xn, kurios gali būti interpretuojamos kaip n nepriklausomų vienodai pasiskirsčiusių atsitiktinių dydžių X1, …, Xn realizacijos. Atsitiktinis vektorius X = (X1, …, Xn) vadinamas imtimi, o per atskirą eksperimentą įgyta reikšmė x = (x1, …, xn) vadinama imties realizacija. Jei eksperimentai sudėtingesni, gali būti stebimi nevienodai pasiskirstę ir priklausomi atsitiktiniai dydžiai ir net atsitiktinių procesų realizacijos. Aprašomojoje statistikoje daromos išvados tik apie turimos imties realizacijos reikšmių pasiskirstymą, bet nedaromos apie visą populiaciją, o matematinė statistika nagrinėja duomenų statistinės analizės metodus, kai daromos išvados apie visos populiacijos tiriamų charakteristikų reikšmių pasiskirstymą. Šios išvados daromos naudojantis imties realizacija ir statistiniu modeliu, kuris nusako, kokia imties skirstinių klasė naudojama duomenims analizuoti. Imties skirstinys gali būti modeliuojamas skirstiniu, priklausančiu nuo baigtiniamačio (parametrinis modelis) arba nuo begaliniamačio parametro (neparametrinis modelis), pvz., tiriant gaminių patikimumą darbo laiko skirstinį galima modeliuoti Weibullio skirstiniu, priklausančiu nuo 2 parametrų. Uždavinį galima spręsti ir imant visus tolydžiuosius skirstinius, sukoncentruotus intervale (0, ∞). Kartais dar nagrinėjami semiparametriniai modeliai, kai imties skirstinys gali priklausyti ir nuo baigtiniamačio, ir nuo begaliniamačio parametro. Pagal tai, kaip formuluojamos statistinės išvados (sprendimai), dažniausiai nagrinėjami šie pagrindiniai matematinės statistikos uždavinių tipai: statistinių hipotezių tikrinimo, klasifikavimo, taškinių įverčių radimo, pasikliovimo sričių konstravimo. Statistinių hipotezių tikrinimo uždavinys: formuluojama prielaida (hipotezė), kad imties X skirstinys priklauso kuriai nors skirstinių aibei. Sprendimų aibė susideda iš 2 elementų – sprendimo, kad prielaida teisinga, ir sprendimo, kad prielaida klaidinga. Bendresniu atveju sprendimų aibė susideda iš k elementų – tai klasifikavimo uždavinys. Taškinių įverčių radimo uždavinys: daroma išvada apie nežinomo parametro θ tikrąją reikšmę (nežinoma). Sprendimų aibė sutampa su parametro θ reikšmių sritimi. Šis uždavinys dažniausiai sprendžiamas parenkant imties X funkciją (įvertį) T = T(X), kurios reikšmės susikoncentravusios apie θ. Turint imties realizaciją x galima rasti įverčio reikšmę T = T(x). Pasikliovimo sričių konstravimo uždavinys: ieškoma atsitiktinė sritis (ją nusako imtis X), kuri apima nežinomą parametro θ reikšmę su tikimybe, artima vienetui. Sprendimų aibę sudaro parametro θ reikšmių aibės Θ poaibiai.

Istorija

Mintis daryti išvadas apie visą populiaciją iš surinktų duomenų draudikams kilo jau 17 a. viduryje. Vėliau, 19 a. pradžioje, C. F. Gaussas panaudojo mažiausiųjų kvadratų metodą planetų padėčiai prognozuoti. Pagrindinės matematinės statistikos sąvokos susiklostė 20 a. pirmoje pusėje. W. S. Gossetas, K. Pearsonas ir R. A. Fisheris pradėjo vartoti Studento, chi kvadrato ir Fisherio skirstinių sąvokas ir įrodė jų naudojimo svarbą statistinėje duomenų analizėje. K. Pearsonas išplėtojo koreliacinę ir regresinę analizę, suformulavo chi kvadrato kriterijų statistinių duomenų suderinamumo realiems duomenims tikrinti ir įteisino svarbią eksponentinių skirstinių šeimos sąvoką. R. A. Fisheris suformulavo dispersinės analizės, eksperimentų planavimo, Ch. E. Spearmanas ir Haroldas Hotellingas (Didžioji Britanija) – faktorinės ir pagrindinių komponenčių analizės elementus. R. A. Fisheris suformulavo didžiausiojo tikėtinumo metodą parametrų įverčiams rasti, apibrėžė Fisherio informacijos sąvoką. A. Kolmogorovas ir Nikolajus Smirnovas (SSRS) pasiūlė vadinamąjį Kolmogorovo suderintumo kriterijų. J. Neymanas ir Egonas Sharpeʼas Pearsonas (Didžioji Britanija) sukūrė statistinių hipotezių tikrinimo metodus. A. Waldas suformulavo nuosekliosios analizės principus. 20 a. antroje pusėje sukurta daug neparametrinės, daugiamatės, procesų statistikos metodų, pradėti plačiai taikyti matematinės statistikos metodai, ypač atsiradus našiai skaičiavimo technikai. Susiklostė statistikos kryptys specifiniams matematinės statistikos uždaviniams spręsti: aktuarinė, verslo, demografinė, inžinerinė, sporto, valstybinė statistika, biostatistika, vaizdų atpažinimas, ekonometrija, epidemiologija, kokybės kontrolė, chemometrija, patikimumo, išgyvenamumo analizė ir kitos.

Lietuvoje

Matematinė statistika plėtojama nuo 20 a. 8 dešimtmečio pradžios šiomis kryptimis: atsitiktinių procesų statistika (B. Grigelionis, D. Surgailis, Raimundas Bentkus, L. Giraitis), kontrolės sistemų optimizavimas, technologinių procesų valdymas (J. J. Kruopis, Pranas Vaitkus), patikimumo teorija (V. Bagdonavičius, Vytautas Kazakevičius, A. J. Bikelis), išgyvenamumo teorija ir biomedicina (V. Bagdonavičius, Rimantas Eidukevičius, Leonardas Algirdas Vilkauskas), daugiamatė statistika (R. Rudzkis, M. Radavičius), atpažinimo ir klasifikavimo uždaviniai (A. L. Telksnys, S. N. Kligienė, Š. Raudys, K. Dučinskas), ekonometriniai ir finansų statistiniai modeliai (A. Račkauskas, R. Leipus, L. Giraitis, Vytautas Kazakevičius), valstybinė statistika (Aleksandras Plikusas, Danutė Krapavickaitė, Bronė Kaminskienė), asimptotiniai matematinės statistikos metodai (V. K. Bentkus, V. Paulauskas, M. P. Bloznelis, R. Rudzkis).

1024

Papildoma informacija
Turinys
Bendra informacija
Straipsnio informacija
Autorius (-iai)
Redaktorius (-iai)
Publikuota
Redaguota
Siūlykite savo nuotrauką