statstika (pranc. statistique < lot. status – būklė, padėtis), imties duomenų funkcija. Statistika yra taisyklė, pagal kurią iš duomenų apskaičiuojama skaitinė reikšmė (-ės). Naudojamasi matematinėje statistikoje nagrinėjant statistikos savybes (pagrįstumą, nepaslinktumą, efektyvumą ir kita) ir konstruojant geresnes statistikas. Statistikos skirtos įvairiems uždaviniams: aprašomosios statistikos rodikliai (pvz., vidurkis, kvartiliai), statistiniai įvertiniai (pvz., mažiausių kvadratų įvertinys), kriterijų statistikos (pvz., Studento ar Fisherio statistika); tam tikros konstrukcijos statistika, pvz., L‑statistika (R‑statistika) – pozicinių (ranginių) statistikų tiesinė funkcija; tam tikrų savybių statistika, pvz., minimalioji pakankama statistika (minimalaus matavimo statistika, išlaikanti visą imties informaciją apie vertinamą nežinomąjį parametrą); neparametrinė statistika (statistika, nesiremianti jokiu parametriniu modeliu); robastinė statistika (statistika, įgyjanti prasmingas reikšmes ir duomenims su ribotu kiekiu klaidingų duomenų). Statistika naudojama ir kaip statistikos duomenų funkcijos reikšmė (-ės) konkretiems duomenims. Plačiąja prasme statistika yra statistiniai duomenys (aprašomosios statistikos rodiklis arba jų rinkinys, statistinė eilutė, statistinė lentelė), pateikti tyrimų apžvalgose ir ataskaitose. Skaičiuojant statistiką svarbu atsižvelgti į imties kintamųjų prigimtį, kuri lemia jiems tinkamas matematines operacijas. Kiekybiniams kintamiesiems (santykinė ir intervalų skalė) dažniausiai naudojamos centro ir sklaidos statistikos, empiriniai momentai, empirinė pasiskirstymo funkcija, pozicinės statistikos bei jų funkcijos. Centro statistika (vidurkis, mediana, moda, nukirstas vidurkis) aprašo duomenų centrinę tendenciją, tipišką duomenų reikšmę. Sklaidos statistika (dispersija, standartinis nuokrypis, tarpkvartilinis skirtumas) aprašo duomenų sklaidą, išsidėstymo apie centro statistikos mastą. Duomenys, išdėstyti didėjimo tvarka, sudaro variacinę eilutę, kurios k‑tasis elementas yra k‑toji pozicinė statistika. Imties elemento vieta variacinėje eilutėje vadinama jo rangu. Variacinė eilutė vienareikšmiškai nusako empirinę pasiskirstymo funkciją, kuri paprastosios atsitiktinės (grąžintinės) imties atveju yra pagrindinė statistinė charakteristika (pagal Glivenkos‑Cantelli teoremą didėjant imties dydžiui ji vis tiksliau aproksimuoja tikrąją stebimo kintamojo pasiskirstymo funkciją). Empirinis p‑kvantilis – didžiausias iš imties elementų, už kurį mažesni elementai sudaro mažesnę už p dalį imties. Dažniausiai naudojami kvantiliai – mediana, kvartiliai ir procentiliai.

Kokybiniams kintamiesiems (ranginė ir nominalioji skalė) naudojamos statistinės dažnių lentelės, kelių kokybinių kintamųjų atveju – daugiamatės dažnių lentelės, kurių atitinkamoje ląstelėje įrašomas atitinkamos reikšmių kombinacijos pasitaikymo duomenyse (santykinis) dažnis. Daugiamačiams duomenims dar naudojamos ranginės statistikos bei jų funkcijos, pvz., Spearmano koreliacijos koeficientas. Dažnai naudojami statistiniai duomenys (imtis), kurie trumpai vadinami statistika. Taip pabrėžiamas duomenų atsitiktinis kintamumas (sąlygotas tiriamų populiacijos ar reiškinio požymių neapibrėžtumo ar jų matavimo paklaidų). Duomenys apie kelis atskirus atvejus laikomi nereprezentatyviais, jie adekvačiai neatspindi tiriamos populiacijos. Pradiniai autentiški (originalūs) statistiniai duomenys vadinami pirminiais. Išvestiniai arba pakartotinai naudojami statistiniai duomenys (galbūt kitam tikslui) vadinami antriniais. Planingai surinkti pirminiai statistiniai duomenys (konkrečiam tikslui) yra imtis. Dažnai naudojama paprastoji atsitiktinė imtis. Priežastiniams ryšiams tirti skirtos randomizuotos imtys: jų pagrindu sudaromos visais atžvilgiais homogeniškos, išskyrus tiriamą požymį, grupės. Reprezentatyvių (tiriamu aspektu adekvačiai atspindinčių visą populiaciją) ir informatyvių imčių sudarymo metodus nagrinėja imčių teorija (baigtinėms populiacijoms) ir eksperimento planavimas (tikslieji mokslai). Imties (pirminiai statistiniai) duomenys paprastai yra lentelės pavidalo. Lentelės eilutės atitinka stebėtus atvejus (matuotus objektus), o stulpeliai – kintamuosius (stebėtus rodiklius ar požymių matavimo rezultatus). Stebėtų atvejų skaičius vadinamas imties dydžiu (paprastai jis pakankamai didelis). Pirminių statistinių duomenų transformacijos gali prarasti juose esančią (statistinę) informaciją, tačiau gali palengvinti jos suvokimą. Statistinius duomenis apibendrina ir susistemina aprašomoji statistika. Svarbu atsižvelgti į kintamųjų tipą (kiekybiniai, ranginiai, nominalieji). Gauti antriniai statistiniai duomenys pateikiami statistinių dažnių lentelių (ranginiai ir nominalieji kintamieji), statistinių eilučių, statistinių lentelių sugrupuotiems duomenims ir kitokiais būdais, iliustruojami atitinkamais grafikais (histograma, sklaidos diagrama, stačiakampe diagrama ir kita). Statistinę eilutę sudaro duomenys, išdėstyti pagal pasirinktą požymį, variacinėje eilutėje duomenys išdėstomi didėjančia tvarka. Laiko eilutės, arba duomenys išdėstyti laike (chronologine tvarka), turi savą išplėtotą statistinės analizės teoriją.

1209

Papildoma informacija
Turinys
Bendra informacija
Straipsnio informacija
Autorius (-iai)
Redaktorius (-iai)
Publikuota
Redaguota
Siūlykite savo nuotrauką