Pages

Wednesday, March 20, 2013

Statističke metode : Analiza podataka, mere disperzije [Seminarski rad]

Molim sve djake i studente  da ne nasedaju na pricu o lakom i jednostavnom ucenju.

Potrudite se makar malo, jer dok trazite informacije, slike i podatke - tada najvise ucite, a kada branite seminarski rad ucite se da izlazete svoje znanje i da se jasno i sadrzajno izrazavate o temi.

Pisanje i odbrana seminarskih radova su jedan od najvaznijih procesa u razvoju vasem skolovanju.

Ovi radovi su postavljeni kako bi djaci i studenti videli jednu od mogucnosti izrade rada i pronasli, ideju za svoj rad.
Moji seminarski radovi su objavljeni bez ikakve zelje da imam bilo kakve materijalne ili bilo kakve druge koristi. 

*** Jedina moja greska je sto, neiskusno, u vreme pisanja nisam cuvala a kasnije i napisala linkove sajtova na kojima su originalne fotografije i podaci i sada mi je zao zbog toga i ovom prilikom se izvinjavam svima cije fotografije i ostale podatke sam koristila, a nisam navela link.
Bili su to dani i noci sakupljanja materijala, citanja, razmisljanja, selektovanja .. i eto nisam cuvala i zapisilvala  linkove .
Moj savet studentima je da ih cuvaju i zapisuju ne samo iz postovanja prema onima koji su ulozili svoj rad u njih, vec i zbog sebe , jer ce se kasnije u radu javiti potreba da nadograde svoje znaje i trebace im stranice iz kojih su ucili.
Ovo govirim iz perspektive nekoga koji se bavi poslom za koji se skolovao, koji voli i koji tezi da svakog dana nauci nesto novo.


INTERNACIONALI UNIVERZITET
U NOVOM PAZARU
FAKULTET ZA INFORMATIKU I INFORMACIONE TEHNOLOGIJE
SEMINARSKI RAD
Predmet: Statističke metode
Tema: Analiza podataka, mere disperzije
Mentor: Student:
prof. dr.Velimir Sotirović
Tatjana Dimitrijević
br.ind 2296 / 06
Pančevo, Decembar 2008. god.
1
1. KRATAK ISTORIJAT STATISTIČKE ANALIZE
Počeci statističke analize datiraju nekoliko vekova pre naše ere. Prva poznata
prebrojavanja sprovedena su u Kini oko 4 000 godina pre nove ere i u Egiptu oko 3 000
godina pre nove ere, dok su prvi organizovani popisi vršeni u starom veku u Rimskoj
republici. U srednjem veku vršeni su uglavnom popisi zemljišta i stoke i u nekim
evropskim zemljama registri rođenih, umrlih i venčanih lica.
Prvi sistematski organizovani popisi stanovništva vršeni su krajem XVIII veka u gradovima
Gotfrida Ačenvala (Gottfried Achenval), profesora univerziteta u Getingenu, Nemačka.
Počeci statistike kao naučne discipline skoro istovremeno datiraju od XVII veka u
Nemačkoj i Engleskoj. Početkom XIX veka dolazi do naglog razvoja statističkih teorija,
najviše zahvaljujući razvoju teorije verovatnoće i složenijih matematičkih analiza.
Vrtoglavi razvoj sistema elektronskih računara u drugj polovini XX veka, inicirao je
ogroman skok u aspektu primene statističkih metoda u gotovo svim analizama bilo kojih
masovnih pojava.
U današnje vreme statistika predstavlja simbiozu sledećih komponenti:
· Deskriptivna satistika koja se bavi prikupljanjem, obradom i prezentiranjem već
postojećih podataka,
· Statistčka analiza koja predstavlja skup statističkih metoda pomoću kojih se vrši
kvantivna analiza međusobnih odnosa između pojava koje imaju masovni karakter
i pomoću kojih se donose određeni zaključci i definišu zakonitosti ponašanja na
osnovu posmatranih pojava,
· Statistička teorija koja pronalaza nove statističke metode i usavršava već
postojeće.
1.1. Predmet statističkog istraživanja
Statistika istažuje pojave koje su po svojoj prirodi varijabilne, koje imaju masovni
karakter i čije ponačanje u masi, na našem noviou intelektualng razvoja, nije unapred
određeno egzaktnim uzročno posledičnim zakonitostima. Posmatranjem i analiziranjem
pojava na velikom broju tih slučajeva, statistika donosi određene zaključke o masovnom
po našanju tih pojava.
1.2. Statistički skup (populacija osnovni skup)
Skup svih elemenata na kojima se dređena pojava statistički posmatra zove se
statistički skup (populacija, osnovni skup). Pojedinačni elementi iz kojih se statistički skup
sastoji zovi se elementi statističkog skupa (statističke jedinice).
Definisajne statističkog skupa u svakom slučaju zavisi od prirodne pojave koja se želi
statistički analizirati, od cilja istaživanja i do raspoloživih mogućnosti posmatranja, ali se
uvek mora voditi računa o tome da statistički skup bude relativno homogen, odnosno da
elementi statističkog skupa imaju bar jednu zajedničku osobinu. Što elemnti statističkog
2
skupa imaju više zajedničkih osobina, to je statistički skup homogeniji. Takođe prilikom
definisanja statističkog skupa, mora se voditi računa o tome da elementi skupa budu
istovrsni, ali naravno ne i istovetni. Broj članova populacije obeležava sa N.
1.3. Uzorak
Uglavnom je nemoguće,a mahom je uvek ekonomkso-prostorno-vremenski
neopravdano, vršiti statističku analizu na čitavom statističkom skupu. Zbog toga se vrlo
često iz čitavog statističkog skupa vrši odabir nekoh elemenata skupa (uzorkovanje
skupa) na kojima se provodi dalja statistička analiza, koja rezultira obrađenim
kvantitativnim zaključcima koji važe za čitav statistički skup.
Načini na koje se vrši uzorkovanje nisu porizvoljni, već, moraju ispuniti određene zahteve.
Podskup statističkog skupa dobijen uzorkovanjem njegovih elemenata zove se uzorak.
Broj članova uzorka broj (elemenata uzorka) se obično obeležava sa n.
1.4. Obeležje
Osobine po kojima se jedinice statističkog skupa ili uzorka razlikuju, a koje su
predmet statističke analize, zovu se obeležja i obično se dele na atribna (opisna) i
numerička; prekidna i neprekidna numerička obeležja.
· Atributna obeležja su obeležja koja se izražavaju opisno (zanimanje, pol, boja
kose ...),
· Numerička obeležja su obeležja koja se izražavaju brojčano i mogu biti prekidna
( diskontinialna) i neprekidna(kontunialna).
· Prekidna numerička obeležja su ona koja mogu dobiti samo izolovane vrednosti
( broj prodatih automobila, broj rođenih, borj članova porodice ...)
· Neprekidna numerička obeležja su ona obeležja koja mogu imati bilo koju
vrednost unutar nekog intervala (visina, težina, potrošnja goriva...), Kod
neprekidnih obeležja vrednosti se grupišu u intervale i tako se dobijaju intervalne
serije distribucije frekvencije. Intervali odgovaraju klasama u koje je podeljen
statisticki skup kod prekidnih obeležja. Intervali se koriste i kada je preveliki broj
klasa kod prekidnih obeležja. Intervali imaju donju i gornju granicu. Radi lakšeg
predstavljanja i matematicke obrade intervalnih serija uvodi se razredna sredina.
Ona je aritmeticka sredina krajeva intervala.
1.5. Podele metoda statističke analize
Generalno, statistički metodi analize masovnih pojava se mogu svrstati u dve grupe:
· Deskriptivna statistika : Brojčani statistički podaci treba da budu prikazani
jasno, sažeto i na takav način da oni koji donose odluke brzo dobiju bitne
karakteristike podataka radi njihovog uključivanja u proces odlučivanja.
Glavna deskriptivna (opisna) količina izvedena iz podataka uzorka je sredina, koja
predstavlja aritmetički prosek podataka uzorka. Ona se koristi kao najpouzdanija
pojedinačna mera vrednosti tipičnog člana uzorka. Ako uzorak sadrži nekoliko vrednosti
3
koje su toliko velike ili toliko male da imaju iskrivljujući efekat na vrednost sredine, uzorak
se može predstaviti tačnije korišćenjem medijane – vrednosti koja sve vrednosti uzorka
deli na dve jednake polovine.
Količine najčešće korišćene za merenje rasipanja (disperzije) vrednosti oko njihove
sredine su varijansa σ2 i njen kvadratni koren, standardna devijacija σ. Varijansa se
izračunava određivanjem sredine, njenim oduzimanjem od svake vrednosti u uzorku (što
daje odstupanje-devijaciju uzoraka), a potom nalaženjem proseka kvadrata ovih
odstupanja. Sredina i standardna devijacija uzorka koriste se kao procene odgovarajućih
karakteristika celokupne grupe iz koje je uzorak izvučen. One, uopšte, ne omogućuju
potpuno opisivanje distribucije (Fx) vrednosti unutar svakog od uzoraka ili njihovih
grupacija, ali, različite distribucije mogu da imaju istu sredinu i standardnu devijaciju.
One, pružaju celoviti opis normalne distribucije (rasporeda), u kojoj su pozitivne i
negativne devijacije (odstupanja) od sredine jednake, a male devijacije su znatno manje
zajedničke nego velike devijacije. Za normalno raspoređeni skup vrednosti, grafikon koji
prikazuje zavisnost učestalosti (frekvencija) odstupanja od njihovih veličina (magnitudes)
jeste zvonasta kriva. Oko 68% vrednosti razlikovaće se od sredine rasporeda, manje od
jedne standardne devijacije, a skoro 100% će se razlikovati manje od tri standardne
devijacije.
· Inferentna statistika : Inferentna ili prosuđivačka statistika bavi se stvaranjem
sudova na osnovu uzoraka o populacijama iz kojih su uzorci izvučeni. Drugim
rečima, ako nađemo razliku između dva uzorka, želeli bismo da znamo, da li je to
“stvarna” razlika (tj. da li je ona prisutna u populaciji) ili je samo slučajna razlika
(tj. može da bude rezultat greške slučajnog uzorkovanja). Testovi statističke
značajnosti upravo to nastoje da saznaju. Svaki zaključak dobijen na osnovu
podataka uzorka, i prosuđivanjem pripisan populaciji iz koje je uzorak izvučen,
mora biti izražen terminom verovatnoće. Verovatnoća je jezik i sredstvo merenja
nesigurnosti u našim statističkim izračunavanjima.
Inferentna statistika može se koristiti za objašnjavanje neke pojave ili za proveru
validnosti (verodostojnosti) tvrdnje. U slučajevima takvog korišćenja inferentne statistike,
ona se naziva Eksplorativna analiza podataka ili Konfirmativna analiza podataka .
Metodi statističke analize se mogu podeliti na statčke i dinamičke.
· Metodi statičke statističke analize analiziraju promene obeležja unutar
osnovnog skupa (populacije) u okviru jednog trenutka ( ili intervala vremena),
· Metodi dinamičke statističke analize analiziraju vremensku zavisnost
obeležja.
Statističko prosuđivanje: Statističko prosuđivaje (inferencija) se odnosi na
uopštavanje (proširivanje) našeg znanja, dobijenog iz slučajnog uzorka izvučenog iz
celokupne populacije, na celokupnu populaciju. U matematici se taj saznajni postupak
naziva induktivno rezonovanje, to jest, znanje o celini izvedeno iz posebnosti.
Njegova glavna primena je u testovima hipoteza o određenoj populaciji. Statističko
prosuđivanje usmerava izbor primerenih statističkih modela. Modeli i podaci
međusobno utiču u statističkom radu. Prosuđivanje na osnovu podataka može se
shvatiti kao proces izbora osmišljenog modela, uključujući stav u jeziku verovatnoće o
tome koliko analitičar može da bude pouzdan u pogledu izbora.
4
Statistika se ne bavi prevashodno prosecima, kako joj se to pogrešno pripisuje, nego
mnogo više odstupanjima od proseka (ili od neke druge zajedničke karakteristike),
nastojeći da otkrije opšte karakteristike varijabiliteta posmatranog skupa.
2. ANALIZA PODATAKA
Da bi se izvršila analiza statistickog skupa ili nekog obeležja izračunavaju se nove
veličine, pokazatelji odredenih osobina. Pokazatelji (parametri) koji se najcešce koriste su:
Slika 1. Pregled najcešće korišćenih parametara statističkog skupa
3. MERE VARIJACIJE (MERE DISPERZIJE)
Mere varijacije su pokazatelji relativnih i apsolutnih odstupanja vrednosti obeležja od
aritmetičke sredine.
Mere varijacije ili mere disperzije pokazuju kakvo je variranje podataka u seriji. Mogu
postojati statističke serije sa istom srednjom vrednošću, a različitim variranjem podataka
oko te srednje vrednosti. Na slici 1 su prikazane dve krive sa istom sredinom i različitim
variranjem podataka oko te sredine. Podaci prikazani krivom B više variarju oko svoje
srednje vrednosti.
Mera varijacije je važna karakteristika jer omogućuje da se relativizira mera centralne
tendencije. Za podatke sa većim varijabilitetm sredina je manje reprezentativan
pokazatelj nego za podatke sa manjim varijabilitetom. Zbog toga se pored srednje
vrednosti uvek izračunava i neka mera varijacije.
U zavisnosti od načina izračunavanja mere varijacije se dele na apsolutne i relativne.
5
Slika 2. Distribucije frekvencija sa istom sredinom i različitim varijabilitetom
Apsolutne mere varijacije
su iskazane u jedinicama mere obeležja. Poznatije mere varijabiliteta su interval
varijacije, srednje apsolutno odstupanje, varijansa i standardna devijacija itd.
Relativne mere varijacije
su neimenovani pokazatelji varijabiliteta. Neke od relativnih mera varijacije su koeficijent
varijacije i normalizovano standardizovano odstupanje.
Slika 3. Mere centralne varijacije
U statističkoj praksi postoji velik broj mera varijacije u vom radu se govori o
apsolutnim i relativnim merama varijacije.
Aplsolutne mere varijacije:
· interval varijacije I,
· varijansa σ2,
· standardna devijacija σ,
6
Mere varijacije
interval varijacije varijansa
standardna devijacija koeficijent varijacije
normalizovano
(standardizovano) srednje apsolutno odstupanje
interkvartilna varijacija
· srednje apsolutno odstupanje ΑD,
· interkvartilna varijacija IQ,
Relativne mere varijacije:
· koeficijent varijacije CV ili Vu
· normalizovano (standardizovano) odstupanje z.
4. Apsolutne mere varijacije
4.1. Interval varijacije
Interval varijacije predstavlja razliku između najveće i najmanje vrednosti obeležja.
Formule za interval varijacije:
Za negrupisane podatke ili neintervalnu seriju: I = xmax - xmin
Kod intervalne serije: I = a k -a 0
gde je:
xmax – najveća vrednost obeležja,
xmin – najmanja vrednost obeležja,
ak – gornja granica poslednjeg intervala,
a0 – donja granica prvog intervala.
Primer:
U toku jedne sedmice izmerene su dnevne prosečne temperature u Celzijusovim
stepenima. Koliki je raspon dnevnih temperatura u toku te nedelje?
Nedelja 18,3 °C
Ponedeljak 19,8 °C
Utorak 17,6 °C
Sreda 17,9 °C
Cetvrtak 15,6 °C
Petak 18,1 °C
Subota 15,1 °C
7
Tabela 1.
xmax =19.8 ; xmin =15.1
Raspon dnevnih temperatura u toku posmatrane nedelje je:
I = xmax - xmin =19,8° - 15,1° = 4,7°
Interval varijacije je mera varijabiliteta koja se lako izračunava, ali je njeno korišćenje kao
mere varijabiliteta ograničeno. Rang uzima u obzir samo dve ekstremne vrednosti i
zanemaruje u obračunu ostale podatke serije, pa se dobija pogrešna slika o variranju u
seriji.
4.2. Srednje apsolutno odstupanje
Srednje apsolutno odstupanje je prosečno apsolutno odstupanje vrednosti
obeležja od srednje vrednosti. Za meru varijabiliteta nije bitan znak odstupanja, tj. da
li se podatak nalazi sa leve ili desne strane sredine, već koliko je udaljen od te sredine.
Ova mera varijacije varijabilitet podataka u seriji meri apsolutnim odstupanjem svakog
podatka od sredine i označava se sa AD. Najčešće se računa odstupanje od
aritmetičke sredine, mada se može koristiti i medijana.
Srednje apsolutno odstupanje za negrupisane podatke
Kada se posmatra variranje u odnosu na aritmetičku sredinu, izračunava se po formuli:
gde je:
· xi vrednost i-tog podatka iz serije
· aritmetička sredina serije
· n broj podataka
Primer:
Odrediti varijabilitet za broj dana koje radnik N.N. provodi na bolovanju u udnosu na
prosečan broj dana bolovanja. Kao meru varijabiliteta koristiti srednje apsolutno
odstupanje.
Broj
dana:
7 23 4 8 2 12 6 13 9 4
Rešenje:
Tabela 2.
8
Broj dana
x
7 -1,8 1,8
23 14,2 14,2
4 -4,8 4,8
8 -0,8 0,8
2 -6,8 6,8
12 3,2 3,2
6 -2,8 2,8
13 4,2 4,2
9 0,2 0,2
4 -4,8 4,8
88 43,6
Variranje broja dana od proseka je 4,36 dana.
Srednje apsolutno odstupanje za grupisane podatke
Kada se izračunava u odnosu na aritmetičku sredinu je:
gde je:
· k broj klasa
· fi frekvencija i-te klase
· xi vrednost obelžja i-te klase
· aritmetička sredina
Primer:
Odrediti varijabilite prodaje TV aparata. Za meru varijabiliteta koristiti srednje
apsolutno odstupanje.
Rešenje:
Za podatke o prodaji TV aparata aritmetička sredina je x=11. U Tabeli 3, su data
neophoda izračunavanja za srednje apsolutno odstupanje.
Tabela 3.
Broj
prodatih
Broj dana
u mesecu
9
TV aparata
x
f
8 2 3 6
9 4 2 8
10 6 1 6
11 7 0 0
12 5 1 5
13 4 2 8
14 1 3 3
15 1 4 4
ukupno 30 40
Prosečno dnevno variranje prodaje TV aparata je 1,33 komada.
Srednje apsolutno odstupanje je dobra mera varijacije jer uzima u obračun sve podatke iz
serije. Ova mera varijabiliteta se ne koristi često za dalju obradu podataka jer apsolutna
vrednost komplikuje primenu statističkih procedura.
4.3. Varijansa
Varijanjsa ili srednje kvadratno odstupanje je mera varijabiliteta koja se
izračunava kao prosek kvadrata odstupanja sredine i vrednosti svakog podatka u
seriji. Kvadriranjem razlike se eliminiše znak razlike i nije potrebno koristiti apsolutnu
vrednost.
Mera varijacije drugog stepena koja nema jedinicu mere.
Njena vrednost se nalazi u intervalu [0, +∞]
Varijansa za negrupisane podatke se izračunava se po formuli:
ili tkz. radnoj formuli:
10
· xi vrednost i-tog podatka iz serije
· aritmetička sredina serije
· n broj podataka
Primer:
Na osnovu podataka o broju dana koje je radnik N.N. proveo na bolovanju u toku jedne
godine.
Broj
dana:
7 23 4 8 2 12 6 13 9 4
odrediti varijabilitet u odnosu na prosečan broj dana na bolovanju. Kao meru varijabiliteta
koristiti varijansu (srednje kvadratno odstupanje).
Rešenje:
Prosečan broj dana koje je radnik proveo na bolovanju je
.
Neophodna izračunavanja data su u tabeli.
Tabela 4.
Broj dana na
bolovanju
x
x2
7 49 -1,8 3,24
23 529 14,2 201,64
4 16 -4,8 23,04
8 64 -0,8 0,64
2 4 -6,8 46,24
12 144 3,2 10,24
6 36 -2,8 7,84
13 169 4,2 17,64
9 81 0,2 0,04
11
4 16 -4,8 23,04
88
ili preko radne formule:
Varijansa je 33,36
Varijansa za grupisane podatke
Formula za izračunavanje varijanse u odnosu na grupisane podatke je:
ili tkz. radnoj formuli:
gde je:
· k broj klasa
· fi frekvencija i-te klase
· xi vrednost obeležja i-te klase
· aritmetička sredina.
Primer:
Odrediti varijabilitet prodaje TV aparata. Za meru varijabiliteta koristiti varijansu (srednje
kvadratno odstupanje).
Rešenje:
Prosečan broj prodatih TV aparata je x=11. U Tabeli su data neophoda izračunavanja za
srednje apsolutno odstupanje.
Tabela 5.
12
Prodato TV
aparata
x
Broj dana
u mesecu
f
x2 f x2
8 2 64 128 9 18
9 4 81 324 4 16
10 6 100 600 1 6
11 7 121 847 0 0
12 5 144 720 1 5
13 4 169 676 4 16
14 1 196 196 9 9
15 1 225 225 16 16
ukupno 30 81
ili preko radne formule:
Varijansa je 2,87
4.4. Standardna devijacija
Varijansa nije pogodna za interpretaciju jer je izražena u kvadratima jedinice u kojoj su
izraženi podaci. Zbog toga se za interpretaciju variranja neke pojave koristi kvadratni
koren iz varijanse koji se naziva standardna devijacija i označava se sa:
.
Za negrupisane podatke formula za izračunavanje je:
13
a za grupisane podatke je:
Prosečno odstupanje pojedinačnih vrednosti obeležja od aritmetičke sredine, izraženo u
jedinicama mere u kojima je izraženo i obeležje koje se posmatra.
Mera varijacije prvog stepena.
Njena vrednost se nalazi u intervalu [0, +∞].
Primer:
Odrediti varijabilitet vremena izrade proizvoda.
Rešenje:
U tabeli 6 prikazani su podaci za izračunavanje standardne devijacije
Tabela 6.
Vreme izrade
X
Sred.
intervala
X
Broj
radnika
f
fx fx2
15,2-15,5 15,35 3 46,05 706,8675
15,5-15,8 15,65 9 140,85 2204,3025
15,8-16,1 15,95 11 175,45 2798,4275
16,1-16,4 16,25 8 130,00 2112,5000
16,4-16,7 16,55 5 77,75 1286,7625
16,7-17,0 16,85 4 67,40 1135,69
ukupno 40
14
Variranje u odnosu na prosečno vreme izrade proizvoda je 1,425 proizvoda.
Varijansa, odnosno standardna devijacija, ima sledeće važne osobine:
1. Izračunava se na osnovu svih podataka u seriji.
2. Vrednost varijanse i standardne devijacije se ne menja ako se sve vrednosti
obeležja uvećaju za istu konstantu C.
3. Ako se sve vrednosti u seriji pomnože istom konstantom C onda se i standardna
devijacija množi tom konstantom.
4.5 Interkvartilna varijacija
Interkvartilna varijacija je mera varijacije koja zanemaruje uticaj ekstremnih
vrednosti obeležja i pokazuje razliku između prvog i trećeg kvartila u numeričkoj seriji.
IQ = Q3−Q1
Kvartili
Simboli: Q1, Q2, Q3
Kvartili su srednje vrednosti po položaju koje dele statističku seriju na četiri jednaka dela
kada su vrednosti obeležja poređane u rastući niz. Postoji ukupno tri kvartila.
Prvi kvartil (Q1) deli numeričku seriju tako da je jedna četvrtina podataka manja od njega
a tri četvrtine su veće.
Drugi kvartil (Q2) je jednak sa medijanom (Me) i deli numeričku seriju tako da je jedna
polovina podataka manja od njega a druga polovina veća.
Treći kvartil (Q3) deli numeričku seriju tako da je tri četvrtine podataka manja od njega a
jedna četvrtina su veća.
Formule za kvartile kad su podaci negrupisani ili grupisani u neintervalnu
seriju:
15
Neparan broj podataka, prvi kvartil: Q xn
4
1 1
= + ;
Neparan broj podataka, treći kvartil: Q x n
4
3 = 3( +1) ;
Paran broj podataka, prvi kvartil: ;
2
1
4 4
1
x x
Q
n + n +
=
Paran broj podataka, treći kvartil:
2
1
4
3
4
3
3
x x
Q
n n + +
= ;
5. Relativne mere varijacije
Relativne mere varijacije su neimenovani brojevi. Koriste se za poređenje
varijabiliteta između dve serije ili različitih jedinica u okviru jedne serije. Najpoznatije
relativne mere varijacije su koeficijent varijacije i normalizovanao ili standardizovano
odstupanje.
5.1. Koeficijent varijacije
Koeficijent varijacije je relativna mera varijacije koja se izračunava kao količnik
standardne devijacije i aritmetičke sredine i izražava se u procentima. Koristi se za
poređenje varijabiliteta u različitim statističkim serijama. Označava se sa Cv ili V i
izračunava se po formuli:
ili:
Prednost koeficijenta varijacije je što ne zavisi od jedinice mere obeležja, što omogućuje
poredjenje varijabiliteta statističkih serija koje su iskazane u različitim jedinicama mere.
Primer:
U jednom preduzeću prosečna plata je 1200din sa standardnom devijacijom 200, a
prosečan radni staž zaposlenih je 17 god. sa varijansom 25. Uporediti varijabilitet plata i
radnog staža u ovom preduzeću.
Rešenje:
Ovde se posmatraju dve pojave: plata (x) i radni staž (y)
Prosečna plata je: x=1200 sa standardnom devijacijom s=200, pa je koeficijent varijacije
za platu jednak:
Prosečan radni staž je: y=17 sa varijansom s2=25, pa je standardna devijacija
,
pa je koeficijent varijacije za platu jednak:
Radni staž u ovom preduzeću ima veći varijabilitet od plata.
16
Za osnovni skup: = ×100
m
V s ;
Za uzorak: = ×100
V xu
u
s ;
5.2 Normalizovano (standardizovano) odstupanje
Za poredjenje odstupanja pojedinih vrednosti obeležja od aritmetičke sredine koristi
se normalizovano ili standardizovano odstupanje. To je relativna mera varijacije kojom se
udaljenost pojedinih vrednosti obeležja od aritmetičke sredine isražava u standardnim
devijacijama. Označava se sa z i izračunava po formuli:
gde je:
· xi jedna vrednost obeležja
· aritmetička sredina obeležja
· s standardna devijacija obeležja
Primer:
Radnik jednog preduzeća ima platu 1800 din, a radnik drugog preduzeća ima platu 2100
din. Uporediti odstupanje plata od proseka preduzeća ako se zna da je u prvom preduzeću
prosečna plata 1200 din sa standardnom devijacijom 200, a u drugom 1500 din sa
standardnom devijacijom 150.
Rešenje:
Plata radnika prvog preduzeća je x=1800, prosečna plata je x=1200 i standardna
devijacija je s=200, pa ovaj radnik odstupa od proseka svog preduzeća
Plata radnika drugog preduzeća je y=2100, prosečna plata je y=1500 i standardna
devijacija je s=150, pa ovaj radnik odstupa od proseka svog preduzeća
Drugi radnik više odstupa od proseka svog preduzeća. Ako se uporedi apsolutno
odstupanja plata od proseka zaključili bi da oba radnika imaju za 600 din veću platu od
proseka svog preduzeća. Apsolutno odstupanje nije pravi pokazatelj jer ne uzima u obzir
variranje podataka oko srednje vrednosti.
6. ODLUČIVANJE I STATISTIKA
Obrazloženje odnosa statistike i biznisa
Može se reći da se za menadžere statistička analiza naročito primenjuje na
probleme odlučivanja. Njihova zainteresovanost je okrenuta posebno prema traganju za
donošenjem boljih odluka u uslovima nesigurnosti.
Proces odlučivanja u uslovima nesigurnosti je pretežno zasnovan na primeni
statističke analize podataka radi procene verovatnog rizika donete odluke. Menadžeri
imaju potrebu razumevanja varijacije iz dva ključna razloga. Prvo, da bi mogli da
predvode druge u primeni statističkog mišljenja u svakodnevnim aktivnostima i drugo, da
bi primenili pojam statističke analize radi neprekidnog unapređivanja i inovacija.
17
Kurs poslovne statistike teži razvijanju upotrebljivog iskustva radi promocije statističkog
mišljenja i tehnike njihovog primenjivanja u donošenju odluka uvek kada se u poslovnim
podacima pojave varijacije. To je kurs statističkog mišljenja putem na podatke
orijentisanog pristupa.
Iako mnoge organizacije raspolažu bogatstvom informacija, za donošenje odluka se koristi
samo njihov neznatan deo. Donosioci odluka su često frustrirani jer ne mogu da dobiju
podatke kritične za njihov biznis onda kada su im oni potrebni. Otuda, veoma mnogo
odluka se zasniva na procenama (pravilo palca), a ne na faktima. Takođe se mnoge šanse
gube, ukoliko su uopšte i zapažene.
Znanje obuhvata sve ono što dobro znamo. Informacija je saopštavanje znanja. U svakoj
razmeni znanja postoji pošiljalac i primalac. Pošiljalac čini opštim ono što je privatno,
informiše, saopštava (komunicira). Informacija može da se prema svom obliku klasifikuje
kao ispoljena-eksplicitna i kao neispoljena-tacit informacija. Ispoljena informacija može da
se objasni u strukturisanom obliku, dok je neispoljena informacija necelovita i rasplinuta
da bi mogla da se objasni. Treba znati da su podaci samo sirova informacija a ne znanje
po sebi.
Put od podataka do znanja je sledeći:
· od podataka do informacije
· od informacije do činjenica (fakata), i naposletku,
· od činjenica do znanja
Podatak postaje informacija onda kada postaje značajan za problem donošenja neke
odluke. Informacija postaje činjenica onda kada podatak može da je podrži. Činjenice su
ono što podaci čine jasnim i vidljivim. Ipak, instrumentalno (primenjeno) znanje
odlučivanja izražava se zajedno sa nekim stepenom statističkog poverenja.
Činjenica postaje znanje onda kada se koristi u uspešnom završavanju procesa
odlučivanja.
Statističko prosuđivanje usmereno je ka određivanju da li neka statistička značajnost
može da se pripiše nekoj slučajnoj varijaciji kao izvoru greške. Inteligentno i kritičko
prosuđivanje ne može doneti neko ko ne razume svrhu, uslove i primenljivost različitih
tehnika procene značajnosti (signifikantnosti).
Imajući u vidu nesigurno okruženje, šansa da će biti doneta “dobra odluka”, raste sa
raspoloživošću “dobre informacije”. Šansa da je “dobra informacija” raspoloživa, raste sa
nivoom strukturacije procesa Menadžmenta znanja .
Znanje je više od tehničkog poznavanja nečega. Znanje zahteva mudrost. Mudrost
je moć da se vreme i znanje na pravi način koriste. Mudrost dolazi sa godinama i
iskustvom. Mudrost je ispravno korišćenje ispravnog znanja i njegova glavna komponenta
je saznanje o granicama znanja. Mudrost se tiče znanja o tome kako nešto tehničko može
da se najbolje koristi za potrebe onoga ko odlučuje.
Skoro svaki profesionalac-menadžer ima potrebu za statističkim alatom (paketom
programa). Statističke sposobnosti osposobljavaju ga za inteligentno skupljanje,
analiziranje i tumačenje podataka relevantnih (primerenih) za odlučivanje. Statistički
pojmovi osposobljavaju ga za rešavanje problema u različitim okolnostima. Statističko
mišljenje osposobljava ga da doda supstancu (suštinu) svojim odlukama.
Šta je poslovna statistika?
18
Konstatujemo da je glavi cilj poslovne statistike prosuđivanje (predviđanje,
donošenje odluka, stvaranje logičkih sudova na osnovu evidencije o okolnostima i
prethodnim zaključcima, a ne na osnovu neposrednog posmatranja, o nekim
karakteristikama populacije na osnovu informacije sadržane u slučajnom uzorku
izvedenom iz celokupne populacije. Uslov slučajnosti je bitan za obezbeđivanje da uzorak
bude reprezentativan za populaciju.
Poslovna statistika je nauka “dobrog” odlučivanja ususret neizvesnosti i koristi se u
mnogim disciplinama, kakva je finansijska analiza, ekonometrija, revizija, proizvodnja i
operacije, i marketinška istraživanja. Program tipičnog kursa poslovne statistike obuhvata
statističke studije, deskriptivnu statistiku (skupljanje, opisivanje, analiza i sažimanje
podataka), verovatnoću, i binomijalnu i normalnu distribuciju, testove hipoteza i intervala
poverenja, linearnu regresiju i korelaciju.
Statistika je nauka donošenja odluka obzirom na karakteristike grupe osoba ili
objekata na osnovu brojčanih informacija dobijenih iz slučajno izabranog uzorka grupe.
Treba imati na umu da je slučajni uzorak samo uzorak nekog konačnog ishoda
nedovršenog slučajnog procesa (niko ne može videti slučajni uzorak).
Glavni zadatak statistike je naučna metodologija prikupljanja, analiziranja, tumačenja
nekog slučajnog uzorka radi izvlačenja suda o nekoj posebnoj karakteristici neke posebne
homogene populacije. Studiranje celokupne populacije nije izvodljivo iz dva razloga:
· Proces će biti preskup ili će zahtevati previše vremena;
· Proces može da bude destruktivan.
U oba slučaja priklanjamo se posmatranju uzorka izvučenog iz populacije i nastojeći da
prosudimo informaciju o celokupnosti populacije putem razmatranja samo manjeg uzorka.
Statistika je sredstvo koje nas osposobljava da unesemo red u dezorganizovanu
kakofoniju realnog sveta modernog društva.
Poslovna statistika je naučni pristup odlučivanju u uslovima rizika. Primenjujući poslovnu
statistiku, tragamo za uvidom, osećanjem, a ne za rešenjem. Naše traganje teži rešenju
koje zadovoljava sve potrebe nekog posla uz najniži nivo rizika. Iako poslovna statistika ne
može da nadomesti znanje i iskustvo onoga ko donosi odluke, ona predstavlja vredno
sredstvo koje menadžer može da upotrebi tokom procesa odlučivanja kako bi smanjio
svakom poslu svojstveni rizik.
Poslovna statistika pruža pouzdan odgovor na sledeća pitanja od interesa za svakog
potrošača i proizvođača:
· Šta je vaše, ili vašeg kupca, očekivanje povodom proizvoda/usluge koje prodajete
ili koje vaš kupac kupuje? Statističkim rečnikom, šta je dobra procena za srednju
vrednost, m ?
· Ako raspolažemo informacijom o vašem, ili vašeg kupca, očekivanju, koji je
kvalitet proizvoda/usluge koje prodajete ili koje vaš kupac kupuje? Statistički
rečeno, šta je dobra procena standardne devijacije, s ?
· Ako raspolažemo informacijom o vašem ili vašeg kupca očekivanju, i kvalitetu
proizvoda/usluge koje prodajete ili vaš kupac kupuje, kako se proizvod/usluga
može upoređivati sa drugim postojećim sličnim tipovima? Statistički rečeno, šta
pokazuje poređenje više sredina, m , i više standardnih devijacija, s .
Primena statističkog mišljenja i njegovih rezultata u poslovnoj praksi zahteva
razumevanje ključnih reči i fraza uobičajenih u komunikaciji statističara. Bez toga
menadžeri ne mogu da savladaju prepreke koje, i inače, izazivaju odbojnost prema
19
statistici koju prati pogrešna predrasuda kao o navodno “suvoparnoj”, “dosadnoj”
manipulaciji brojkama.
SARDŽAJ
7. KRATAK ISTORIJAT STATISTIČKE ANALIZE ……………………………………………………
…..1
7.1. Predmet statističkog istraživanja
...........................................................1
7.2. Statistički skup (populacija osnovni skup)
.................................................1
7.3. Uzorak ...................................................................................................2
7.4. Obeležje ..................................................................................................2
7.5. Podele metoda statističke analize
.............................................................2
8. ANALIZA PODATAKA .................................................................................................4
9. MERE VARIJACIJE (MERE DISPERZIJE) ......................................................................4
4. Apsolutne mere varijacije ...........................................................................................6
4.1. Interval varijacije ...................................................................................6
4.2. Srednje apsolutno odstupanje ..................................................................6
4.3. Varijansa ................................................................................................9
4.4. Standardna devijacija ............................................................................12
20
4.5. Interkvartilna varijacija
...........................................................................13
5. Relativne mere varijacije ........................................................................................14
5.1. Koeficijent varijacije ................................................................................14
5.2. Normalizovano odstupanje .....................................................................14
6. ODLUČIVANJE I STATISTIKA ....................................................................................15
BIBLIOGRAFIJA
1. http://www.knowledge-bank1.org/
2. http://ffknsstat.blogspot.com
3. http://www.knowledge-bank1.org
4. www.eccf.su.ac.yu
5. www.dif.bg.ac.yu
6. www.fpmbk.edu.yu
7. http://home.ubalt.edu
8. http://statlab0.fon.bg.ac.yu
21
22

No comments:

Post a Comment

Related Posts Plugin for WordPress, Blogger...