profil

Szeregi statystyczne, strukturalne i rozdzielcze.

poleca 85% 1782 głosów

Treść
Grafika
Filmy
Komentarze

SZEREGI STATYSTYCZNE, STRUKTURALNE I ROZDZIELCZE

Tematyka wykładu

1. Statystyczny szereg szczegółowy
2. Rodzaje prób statystycznych
3. Określenie szeregu strukturalnego
4. Konstrukcja szeregu strukturalnego
5. Konstrukcja szeregu rozdzielczego z zamkniętymi przedziałami klasowymi
6. Liczebności skumulowane
7. Konstrukcja szeregu rozdzielczego z otwartymi przedziałami klasowymi
8. Pojecie wykresu statystycznego
9. Rodzaje wykresów statystycznych


Statystyczny szereg szczegółowy

Zebrany w wyniku prowadzonego badania statystycznego materiał statystyczny po-dawany jest analizie przedmiotowej i merytorycznej z punktu postawionych przesłanek ba-dawczych. Analiza ta jest prowadzona na kilku poziomach, wśród których wyróżniamy czyn-ności obejmujące:
a) grupowanie, systematyzowanie i klasyfikowanie według zadanych klas, przedziałów, ty-pów, grup, itp.,
b) wizualizację graficzną danych pierwotnych lub wtórnych otrzymanych w wyniku reali-zacji punktu a),
c) obliczenia numeryczne wybranych wielkości z próby,
d) interpretację empiryczną uwzględniającą wszystkie podpunkty a), b) i c) .
Materiał statystyczny przedstawiany jest w postaci różnego rodzaju zbiorów informacji o badanych jednostkach i cechach statystycznych. Takie zbiory nazywa się szeregami staty-stycznymi.


Wśród szeregów statystycznych wyróżnia się szeregi:
· jednocechowe (jednowymiarowe) – obejmują wartości liczbowe jednej cechy, czyli próby jednowymiarowe (np. cecha – przychody z podatków z nieruchomości; jednostki – przedsiębiorstwa),
· wielocechowe (wielowymiarowe) – uwzględniają wartości liczbowe dwu lub więcej cech, czyli próby wielowymiarowe (np. cechy – liczba złożonych zeznań podatkowych, liczba prywatnych działalności gospodarczej, opłaty z działalności gospodarczej; jednostki – osoby fizyczne prowadzące działalność gospodarczą).
Wśród jednych i drugich wyodrębnia się szeregi szczegółowe i strukturalne. W sze-regach pierwszego rodzaju podawane są szczegółowe wartości liczbowe cech jednostek wchodzących w skład próby jedno lub wielowymiarowej. W przypadku drugim zadawane są pewne przedziały liczbowe oraz liczby jednostek do nich zaliczanych.
Szeregi szczegółowe najczęściej mają postać szeregu surowego i wtedy jest określany jako szereg nieuporządkowany. Gdy ma on postać odpowiednio uporządkowaną dla jednej z wybranych cech według wartości rosnących (niemalejących) lub malejących (nierosnących), to wówczas otrzymuje się szereg uporządkowany.


Rodzaje prób statystycznych

Oznaczmy przez X badaną cechę ilościową (mierzalną) dla jednostek w próbie po-branej z populacji generalnej w procesie zastosowania odpowiedniego schematu losowania. Liczba jednostek w próbie wyraża jej liczebność (wielkość) próby. Ciąg realizacji pomiarów (obserwacji) cechy X na wszystkich jednostkach stanowi próbę obserwacji (pomiarów).
Szeregi szczegółowe odnoszone do jednostek z próby, nazywane wprost próbą, wyra-żamy ciągiem wartości liczbowych

(1)

gdzie xi jest wartością cechy dla i-tej jednostki. Ciąg (1) wyraża próbę nieuporządkowaną. Uporządkowaną próbę według wielkości niemalejących przedstawia ciąg

(2)

przy czym ma miejsce ciąg nierówności nieostrych Oznacza to, iż w ciągu (2) wartości cechy dla niektórych jednostek w próbie mogą się powtarzać i wówczas są podawane obok siebie. Wielkości nazywa się statystykami pozycyjnymi próby, a in-deksy (i) wyrażają ich rangi, czyli pozycję w próbie nieuporządkowanej.
W próbie (2) wyróżniamy dwie skrajne statystyki pozycyjne:
· xmin = x(1) - obserwacja najmniejsza (minimalna),
· xmax = x(n) - obserwacja największa (maksymalna).
Ich różnica wyraża rozstęp (rozpiętość, zakres, przedział zmienności) obserwacji ce-chy w próbie i dany jest wzorem

. (3)

Przedział liczbowy x(1), x(n)ń stanowi obszar zmienności (wahania, fluktuacji, rozpro-szenia) próby. Obejmuje on wszystkie wartości próby, a jego długość odpowiada rozstępowi R. Oczywiście taki przedział nie pokazuje jak obserwacje z próbie są wewnątrz niego zlokali-zowane. Mogą tutaj wystąpić m. in. takie przypadki jak:
wszystkie obserwacje z próby są w miarę równomiernie rozmieszczone wewnątrz prze-działu rozstępu próby,
obserwacje z próby mogą się układać w pewne grupy (skupienia),
niektóre obserwacje w próbie mogą znacząco odbiegać od pozostałych.
W przypadku ostatnim są one uznawane za tzw. obserwacje odstające (wątpliwe, niepewne). Na rys. 1 została przykładowo pokazana jedna obserwacja odstająca położona po prawej strony jądra próby. Mówi się wówczas o prawostronnej obserwacji odstającej.


Rys. 1

Mogą wystąpić lewostronne obserwacje odstające lub dwustronne, czyli położone po obu stronach jądra próby. Naturę przyczyn występowania obserwacji odstających przeprowa-dzi się poprzez badanie monograficzne.
Ta część próby w jakiej koncentrują się obserwacje podstawowej grupy jednostek określana się jądrem (rdzeniem, skupieniem) próby (rys. 1). Czasami w próbie może wystą-pić kilka takich skupień w różnym stopniu od siebie oddalonych. Świadczy to wówczas o niejednorodności próby, co jest najczęściej efektem nie spełnienia wymagań stawianych pró-bie reprezentatywnej.

Odrzucenie co najmniej jednej obserwacji odstającej z próby powoduje, iż otrzymuje-my tzw. próbę cenzurowaną (obciętą). Może być ona cenzurowana jednostronnie lub dwustronnie. W ostatnim przypadku może być ono dwustronnie symetryczne (jednakowa liczba) lub niesymetryczne (niejednakowa liczba) usuniętych obserwacji odstających. Na rys. 2 pokazano sytuację odrzucenia jednej obserwacji po lewej stronie próby i dwie po prawej jej stronie.


Rys. 2.

Próba dla której liczebność n < 30, przyjęto nazywać próbą małą, natomiast pozosta-łe próby określa się jako próby duże. Dla każdego z wymienionych przypadków prowadzi się nieco odmiennie analizę statystyczną próby. Dla próby małej obejmuje ona analizę prowa-dzoną bezpośrednio na danych szczegółowych, natomiast dla prób dużych analiza jest najczę-ściej prowadzona na danych pogrupowanych w pewne grupy (klasy).


Określenie szeregu strukturalnego

Opracowywanie materiału statystycznego dla dużej próby jest najczęściej poprzedzone procesem grupowania (klasyfikowania, systematyzowania) jednostek za pomocą odpowied-nich wyróżnionych struktur (klas, typów).
Pojęcie struktury odniesione do badań statystycznych wiąże się z rozstępem badanej cechy, który z kolei jest utożsamiany z pewnym przedziałem liczbowym. W nim można wy-różnić dowolny podzbiór (podprzedział) liczbowy. Jeżeli taki podzbiór jest określony z punk-tu zadanego kryterium badawczego, to określa on pewną strukturę jednostek z próby, których wartości cechy należą do tego wyróżnionego podzbioru. Wskazany podzbiór nazywa się przedziałem strukturalnym (rys. 3). Przedział ten pozwala określić jaka część (frakcja) jednostek z próby jest w nim zawarta


Rys. 3.

Dla celów badań statystycznych wymagane jest aby wyróżnione struktury spełniały dwa warunki:
rozłączności, czyli dowolne dwie różne struktury nie mogą zawierać części wspólnej,
pokrywania, czyli suma wszystkich struktur pokrywa cały rozstęp.
Każdej wyróżnionej strukturze przyporządkowana jest niezerowa liczebność fj, tak, aby ich łączna suma odpowiadała liczebności próby, czyli

, (4)

gdzie k oznacza liczbę wyróżnionych struktur. Skrajne struktury mogą być otwarte, co ozna-cza lewostronne otwarcie dla 1-szej struktury lub prawostronne otwarcie dla k-tej struktury. Przypadki takie mają miejsce wówczas, gdy rzadko występują obserwacje do niskich lub wy-sokich wartości cechy.

Tworząc struktury, które także są nazywane klasami (przedziałami, grupami), dokonuje się grupowania materiału statystycznego do tych klas przy spełnieniu wymienionych warun-ków rozłączności i pokrywania. Oznacza to zastąpienie wartości cechy (skala przedziałowa) danej jednostki przez numer klasy (skala porządkowa), do której ta jednostka została zaklasy-fikowana.


Różnice między górną i dolną granicą zamkniętych przedziałów klasowych (p.k.) wy-raża ich długość klasową, którą wyrażamy przez . Długości te nie muszą być jednakowe. W szczególnym przypadku gdy te długości są jednakowe, to wówczas odpowied-ni szereg strukturalny nazywamy szeregiem rozdzielczym.
W zależności jaką uwzględnia się cechę, wyróżnia się szeregi strukturalne dla cechy:
a) jakościowej mierzonej na skali nominalnej (np. rodzaj własności podmiotów gospodar-czych),
b) jakościowej mierzonej na skali porządkowej (np. stopnie wykształcenia),
c) dyskretnej (skokowej) (np. liczba urzędów skarbowych),
d) ciągłej (np. odpady przemysłowe uciążliwe dla środowiska nagromadzone na terenie za-kładu pracy).

Przykłady szeregów strukturalnych


Podamy różne przykłady szeregów strukturalnych. Wiele z nich ma ściśle wyróżnione warianty (cechy jakościowe) lub przedziały klasowe (cechy ilościowe) wynikające z potrzeb badań prowadzonych w naukach ekonomicznych, demograficznych, socjologicznych, geogra-ficznych, rolniczych, turystycznych, itp. Wynika to z tego, iż w wymienionych dziedzinach badawczych warianty lub struktury odnoszą się bezpośrednio do opisu charakteru zachowy-wania się zjawisk empirycznych oraz społeczno-gospodarczych. Jest to w pewnym sensie podejście standaryzacyjne narzucane badaczom dla jednoznaczności ujmowania i interpreto-wania analizowanych faktów i zdarzeń. Ma to także swój wyraz w prowadzonych badaniach porównawczych wyników statystycznych, a także w badaniach ankietowych.
(A) Przykłady szeregów strukturalnych dla cech jakościowych mierzonych na skali nominalnej:
Grupy gospodarstw domowych:
· pracowników (P),
· pracowników użytkowujących gospodarstwa rolne (P-R),
· rolników (R),
· pracujących na własny rachunek (P-WR),
· emerytów i rencistów (E-R),
· utrzymujących się z nie zarobkowych źródeł (N-ŹR),
Stan cywilny - kawaler; panna; żonaty; zamężna; wdowiec; wdowa; rozwiedziony; rozwiedziona,
Podstawowy rodzaj działalności firmy - produkcyjna; handlowa; usługowa; budow-lana,
Rodzaj własności firmy - osoba fizyczna prowadząca działalność gospodarczą; spółka z ograniczona odpowiedzialnością; spółka akcyjna; spółka cywilna; spółka jawna; spółka komandytowa; spółdzielnia; stowarzyszenie; jednostka budżetowa,
Typ rodziny biologicznej gospodarstwa domowego - małżeństwo bez dzieci; małżeń-stwo z 1 dzieckiem; małżeństwo z 2 dzieci; małżeństwo z 3 i więcej dziećmi; samotny ro-dzic z dziećmi; małżeństwo z 1 dzieckiem i inne osoby; pozostałe gospodarstwa domowe,

(B) Szeregi strukturalne dla cechy jakościowej mierzonej na skali porządkowej:
wykształcenie głowy gospodarstwa domowego - wyższe; policealne; średnie; zasad-nicze zawodowe; podstawowe; bez wykształcenia,
podróżujący według segmentów rynkowych - dzieci podróżujące głównie z rodzica-mi; młodociani, osoby w wieku produkcyjnym; ludzie aktywni zawodowo, podróżujący bez dzieci; emeryci.

(C) Szeregi strukturalne punktowe dla cechy ilościowej mierzonej na skali przedzia-łowej:
liczba osób w gospodarstwie domowym - 1, 2, ..., 5, 6 i więcej osób,
liczba pracujących w gospodarstwie domowym - 0, 1, 2, 3 i więcej,
liczba odbytych wyjazdów służbowych w ostatnim miesiącu przez dyrektorów przed-siębiorstw - 0, 1, 2, 3, 4, 5 i więcej,

(D) Szeregi strukturalne przedziałowe dla cechy skokowej mierzonej na skali przedzia-łowej ustalane w przeliczeniu na wielkości bazowe:
mieszkania oddane do użytku na 1000 ludności - do 1; 2 – 4; 5 – 8; 9 – 12; 13 – 16; 17 – 32; powyżej 32,
Abonenci telefoniczni na 1000 ludności - do 50; 50 – 100; 100 – 150; 150 – 200; 200 – 250; 250 i więcej,
miejsca na widowni w kinach stałych na 1000 ludności - do 5; 5 – 10; 10 – 20;
20 – 40; 40 – 80; 80 – 120; powyżej 120,

(E) Szeregi strukturalne przedziałowe dla cechy ciągłej mierzonej na skali przedziałowej i ilorazowej:
wiek głowy gospodarstwa domowego (w latach) - 24 i mniej; 25 – 30; 31 – 44;
45 – 54; 55 – 64; 65 i więcej,
wiek produkcyjny (w latach) - 18 – 19; 20 – 24; 25 – 29; 30 –34; 35 – 44; 45 – 54; 55 – 59; 60 – 65,
czystość powietrza według wielkości emisji zanieczyszczenia gazowe (w t/rok) - < 25; 25 – 100; 101 – 500; 501 – 1000; 1001 – 2000; 2001 – 5000; 5001 – 10 000; 10 001 –
20 000; 20 001 – 50 000; > 50 000,

(F) Szeregi strukturalne przedziałowe dla cechy ciągłej mierzonej na skali przedziałowej i ilorazowej ustalane w przeliczeniu na wielkości bazowe:
powierzchnia użytkowa mieszkań w m2 na 1 osobę - < 13; 13 – 16; 16 – 19; 19 – 22; 22 – 25; > 25,
wydatki roczne (w zł) na cele kulturalne na 1 osobę w gospodarstwie domowym – do 50; 50 – 75; 75 – 100; 100 – 150; 150 – 250; 250 – 500; powyżej 500.

Szereg strukturalny dwuwymiarowy dla cech Wiek produkcyjny i nieprodukcyjny x Płeć w 3 grupach tematycznych ludności (w tys): ogółem, miasta i wieś. Podano odsetki dla drugiej cechy (płeć) w poziomach pierwszej cechy oraz odsetki dla poziomów pierwszej ce-chy w grupach: ogółem, miasta i wieś. Obie cechy są typu jakościowego, pierwsza na trzech poziomach (wiek przedprodukcyjny, produkcyjny, poprodukcyjny) i druga na dwóch pozio-mach (M – mężczyźni, K – kobiety).


Wiek produkcyjny i nieprodukcyjny Płeć Ogółem Miasta Wieś
n % n % n %
Przedprodukcyjny M 4 599 51,3 2 601 51,3 1 998 51,3
K 4 371 48,7 2 473 48,7 1 898 48,7
Razem 8 970 100,0 5 074 100,0 3 896 100,0
% X 23,2 X 21,3 X 26,4
Produkcyjny M 12 320 51,5 7 700 50,2 4 620 53,8
K 11 600 48,5 7 627 49,8 3 973 46,2
Razem 23 920 100,0 15 327 100,0 8 593 100,0
% X 61,9 X 64,3 X 58,1
Poprodukcyjny M 1 842 32,1 1 074 31,2 768 33,4
K 3 900 67,9 2 372 68,8 1 528 66,6
Razem 5 742 100,0 3 446 100,0 2 296 100,0
% X 14,9 X 14,5 X 15,5
Ogółem 38 632 100,0 23 847 100,0 14 785 100,0

Żródło: Rocznik Statystyczny GUS 2002


Szereg strukturalny dwuwymiarowy dla cech Wiek x Płeć z mieszanymi prze-działami strukturalnymi dla cechy pierwszej. Dla klas obok grup głównych wyróżniono grupy podrzędne o jednakowej długości klasowej liczącej 5 lat Dla każdej klasy wieku ludności podano ogólną liczbę ludności (w tys.) wraz z procentowym podziałem na płeć. Ze względu na komplementarność poziomów drugiej cechy (tylko dwa poziomy), wystarczy podawać wielkości procentowe tylko dla K – kobiety lub M – mężczyźni.




Grupy wieku Ogółem % Grupy wieku Ogółem %
Główne Podrzędne K M Główne Podrzędne K M
0 - 2 1 120,2 48,6 51,4 35 - 39 2 506,9 49,5 50,5
2 – 6 1 649,6 48,6 51,4 40 - 44 3 012,6 50,0 50,0
7 - 14 4 249,6 48,7 51,3 45 - 64 9 280,2 52,1 47,9
15 616,7 49,0 51,0 45 - 49 3 159,4 50,6 49,4
16 656,6 49,0 51,0 50 - 54 2 754,9 51,5 48,5
17 678,0 48,9 51,1 55 - 59 1 711,2 53,1 46,9
18 694,1 49,1 50,9 60 - 64 1 654,7 55,0 45,0
19 676,9 49,0 51,0 >= 65 4 832,1 61,9 38,1
20 - 24 3 217,8 49,1 50,9 65 - 69 1 596,4 57,2 42,8
25 - 29 2 954,4 49,2 50,8 70 - 74 1 409,6 60,2 39,8
30 - 44 8 006,3 49,5 50,5 75 -79 1 014,0 65,5 34,5
30 - 34 2 468,8 48,6 51,4 >= 80 812,1 69,4 30,6

Żródło: Rocznik Statystyczny GUS 2002


Szereg strukturalny przedziałowy jednowymiarowy dla cechy liczby ludności w mie-ście w rozłożeniu na pięć grup tematycznych. Ostatnie cztery grupy obejmują zagadnienie funkcjonowania urządzeń komunalnych w mieście. Przedziały klasowe są o nierównej długo-ściach.

Grupy miast według liczby ludności Liczbamiast Siećwodociągowa Siećkanalizacyjna Siećgazowa Oczyszczal-nie ścieków
< 5 0005 000 - 9 99910 000 - 19 99920 000 - 49 99950 000 - 99 999100 000 – 199 999> 200 000 291183181137502319 290183181137502319 268181181137502319 123131150126502319 248172172136492219

Żródło: Rocznik Statystyczny GUS 2002

Szereg strukturalny przedziałowy z otwartym tylko z ostatnim przedziałem klaso-wym. Wielkości odsetkowe pozwalają ustalić liczebności gospodarstw w poszczególnych grupach obszarowych, gdyż znana jest łączna liczba gospodarstw równa 1 882 000.

Powierzchnia w ha Procentgospodarstw
1,01 – 1,992,00 – 4,995,00 – 9,9910,00 – 14,9915 i więcej 22,833,824,39,79,4

Migracje zagraniczne ludności ze względu na wiek na pobyt stały według płci i wieku migrantów w roku 2001. Szereg strukturalny dla zadanych klas (grup) wiek zapropo-nowanych przez badania demograficzne odpowiadający posiadanemu statusowi społeczne-mu.. Dolna i górna granica są otwarte
Lata Liczba
poniżej 1818 – 2425 – 2930 – 4445 – 5960 i więcej 167262165614451245986

Szereg strukturalny dwuwymiarowy dla cech Ludność x Powierzchnia. Rozkład liczby gmin ze względu na liczbę ludności i powierzchnię według stanu na 31 XII 2001 roku. Obie cechy wyrażone przez przedziały klasowe o nierównych długościach. Dolne i górne klasy są otwarte. Wyróżniony wiersz przedstawia warunkowy szereg strukturalny rozkładu gmin we-dług powierzchni dla zadanej przedziałowo liczby mieszkańców. Analogicznie jest dla ko-lumn. Są to warunkowe szeregi strukturalne rozkładu liczby gmin ze względu na ludność w gminach o zadanej powierzchni.

Ludność Powierzchnia (km 2) Razem
< 5,0 5,0 –19,9 20,0-49,9 50,0 –99,9 100,0 –149,9 150,0 –199,9 200,0 –249,9 250,0 –299,9 > 300
< 2 500 2 500 – 4 999 5 000 – 7 499 7 500 – 9 999 10 000 - 14 999 15 000 - 19 999 20 000 – 39 999 40 000 – 99 999100 000 - 199 999> 200 000 1410100000 19115142234700 54334192420345060 102201928687221820183 4195249148972733827 4539379612626413 1254129292022300 14191518513204 171516231419002 28560655397354156199942719
Razem 7 103 235 676 770 350 170 81 97 2489
Konstrukcja szeregu rozdzielczego z zamkniętymi przedziałami klasowymi

Szczególnym rodzajem szeregu strukturalnego dla cechy mierzalnej (ilościowej) cią-głej jest przedziałowy szereg rozdzielczy (sz.r.), który ma wszystkie zamknięte przedziały klasowe o jednakowej długości. Wyróżnia się następujące kolejne kroki konstrukcji przedzia-łowego sz. r. :
Krok 1. Z próby nieuporządkowanej lub uporządkowanej odczytujemy obserwacje skrajne (brzegowe) próby: x(1) = xmin oraz x(n) = xmax oraz obliczamy rozstęp R = x(n) - x(1);
Krok 2. Ustalamy liczbę k p.k. (klas, struktur) według wzoru


k = 1+3,322 log n , (6)

gdzie log oznacza logarytm dziesiętny.
Krok 3. Wyznaczamy długości p.k. – d z zaokrąglenia ilorazu do rzędu do-kładności o jedną pozycję większą, niż zadane obserwacje próby (np. jeżeli obserwacje z pró-by były liczbami podanymi z dokładnością do jednego miejsca po przecinku i R/d = 15,349, to za długość d przyjmujemy liczbę d = 15,35),
Krok 5. Ustalanie granic p.k.
Za dolną granicę y1 pierwszego p.k. (klasy) przyjmujemy y1 = x(1). Granice następ-nych przedziałów wyrażają się odpowiednio:

y2 = y1 + d, y3 = y2 + d, ..., yk = yk-1 + d, yk+1 = yk + d,

co można zapisać wzorem rekurencyjnym

y1 = x(1), yj = yj-1 + d, j = 2, 3, ..., k+1,


Krok 6. Przydzielenie jednostek do p.k.
W procesie przydzielania (przyporządkowania, kreskowania) jednostek do zadanych p.k. ze względu na wartości badanej cechy, wyróżnimy dwa przypadki:
(i) jeżeli próba nie zawiera jednostek przestrzennych, to wówczas przeglądamy kolej-ne obserwacje w próbie nieuporządkowanej (lub uporządkowanej) i odpowiednio do wartości cechy przydzielamy je do wcześniej ustalonych p.k., co odnotowujemy przez wstawianie do tej klasy znaku kreski. Dla dalszego łatwiejszego ich zliczania, zbiera się je w grupy 5-ciu kresek w postaci symbolu
(ii) gdy próba obejmuje jednostki przestrzenne, wtedy tak jak w punkcie (i) przypo-rządkowujemy wartości cechy do poszczególnych klas, lecz teraz w miejsce kresek odnoto-wujemy numery tych jednostek. Takie postępowanie ma na celu podanie numerów jednostek przestrzennych, a tym samym ich nazw w zadanych p.k, co pozwala wykonanie odpowiedniej mapy statystycznej, w której p.k. pełnią rolę gradacji (skali) natężenia wartości badanej cechy;
Krok 7. Ustalanie liczebności klasowych.
Po przeprowadzeniu procesu kreskowania ustala się liczebności klasowe. Stanowią je liczby kresek lub liczba numerów jednostek przyporządkowanych danemu p.k. określonych w kroku 6. Liczebność j-tej klasy oznaczamy przez fj, j = 1, 2, ..., k. Oczywiście zliczanie bę-dzie poprawne, gdy f1 + f2 + ... + fk = n, czyli gdy łączna suma liczebności klasowych będzie równa zadanej liczebności próby. Ponadto wymaga się aby klasy były niepuste, czyli .
Tak więc, po wykonaniu wymienionych kroków konstrukcji sz.r., otrzymujemy szereg rozdzielczy liczebności (SRL), co podaje zbiór wyróżnionych p.k. oraz ich liczebności

SRL = {(( yj, yj+1), fj); j =1, 2, ..., k}. (7)

Przygotowany sz r. przedstawia się w postaci tabelarycznej, wyróżniając w niej p.k. oraz liczebności klasowe (tab. 1).

Tabela 1. Tabelaryczna postać przedziałowego
szeregu rozdzielczego liczebności

Numer klasy Przedziały klasowe Liczebności klasowe
12...k y1 - y2y2 - y3..............yk - yk+1 f1f2....fk
Suma X n

Podany w tablicy symbol X jest stosowany w wierszu sumacyjnym tablicy, gdy dana kolumna nie podlega sumowaniu. Graficznym obrazem SRL jest histogram liczebności (patrz dalej punkt dotyczący wykresów statystycznych). Dodatkowo możemy określić dla j-tego p.k. następujące wielkości klasowe:
· częstości (frekwencje, frakcje) -
· odsetki (w %) -
· częstości znormalizowane -
· środki przedziałów klasowych -
Odpowiednio do podanych wielkości wyróżnia się następujące punktowe sz. r:
liczebności - PSRL = {(yj’, fj ); j = 1, 2, ..., k},
częstości - PSRC = {(yj’, cj ); j = 1, 2, ..., k},
odsetek (w %) - PSRP = {(yj’, ); j = 1, 2, ..., k},
częstości znormalizowanych - PSRCZ = {(yj’, cj* ); j = 1, 2, ..., k}.
Analogiczne określenia można wprowadzić dla przedziałowych sz.r. Szeregi typu PSRC, PSRP oraz PSRCZ wyrażają się przez liczebności względne, a zatem mogą być stoso-wane do porównań z innymi sz.r. nie koniecznie o tych samych liczebnościach i dla tych sa-mych cechach. Jest to przydatne w badaniach porównawczych.

Liczebności skumulowane

Rozkład empiryczny cechy w próbie może być również badany poprzez liczebności (częstości) skumulowane, które wyznacza się wzorem rekurencyjnym

.

Także w odniesieniu do liczebności skumulowanych można podać różne rodzaje sz.r. Mamy zatem, szeregi rozdzielcze skumulowane: liczebności, częstości, odsetek oraz czę-stości znormalizowanych. Wymienione szeregi mogą być przedstawione graficznie w posta-ci histogramów. Ich konstrukcja pozostaje analogiczna do histogramów liczebności.

Konstrukcja szeregu rozdzielczego z otwartymi przedziałami klasowymi

Jak już wcześniej nadmieniono próba może być obciążona obserwacjami odstającymi, co oznacza znaczną jej asymetrię lewo- lub prawostronną (patrz także rys. 3). W takich przy-padkach gdyby uwzględniano skrajne obserwacje próby uporządkowanej, to wówczas otrzy-malibyśmy bardzo wysoki rozstęp oraz szerokie przedziały klasowe, a ponadto niektóre prze-działy mogłyby okazać się puste. W takich okolicznościach konstrukcję sz.r. prowadzi we-dług zasady:
(a) przy występowaniu asymetrii lewostronnej, należy arbitralnie ustalić górną granicę 1-go p.k. tak, aby wystąpiły w nim wszystkie obserwacje uznawane za odstające z lewej stro-ny skupienia (jądra) próby,
(b) przy występowaniu asymetrii prawostronnej, należy arbitralnie ustalić dolną granicę ostatniego p.k. tak, aby wystąpiły w nim wszystkie obserwacje uznawane za odstające z pra-wej strony skupienia próby,
(c) przy występowaniu obserwacji odstających po obu stronach skupienia próby należy stosować jednocześnie punkt (a) i (b).
(d) dla części centralnej prowadzi się konstrukcję sz.r. z zamkniętymi p.k. jak opisano wcześniej.
Jeżeli dla punktu (d) sz.r. zawiera k p.k., to przy stosowaniu punktu (a) lub (b) osta-teczny sz.r. zawiera k+1 p.k., natomiast dla punktu (c) będzie on zawierał k+2 p.k.

Przykład. Do konstrukcji szeregu rozdzielczego z otwartą górną granicą ostatniego przedziału klasowego wykorzystano dane liczbowe dotyczące przychodów ze sprzedaży pol-skich przedsiębiorstw w roku 2002. Zakresem badania objęto przedsiębiorstwa, które osiągnę-ły przychód w przedziale od 80 tys. do 1 mln zł. Podana list przedsiębiorstw w gazecie Rzecz-pospolita z dnia 6.10.2004 została potraktowana jako gotowy operat losowania. Jako schemat losowania zastosowano losowanie systematyczne przyjmując krok odczytu k = 20 od pozycji listy 174. Kolejno odczytywane pozycje z listy były numerami: 174, 194, 214, 234, 254, ..., 1494. Łącznie było odczytanych 67 liczb, które w porządku rosnącym stanowiły następujące obserwacje:
1 2 3 4 5 6 7 8 9 10
0 82 620 85 045 87 621 88 996 90 772 92 245 93 761 95 772 96 995 98 351
1 100 178 101 002 103 839 106 144 108 257 111 573 114 853 117 550 120 542 122 959
2 126 228 128 819 130 720 133 246 136 285 139 455 142 861 146 673 151 633 155 778
3 160 378 165 092 169 355 172 288 176 672 180 993 190 995 196 552 201 292 206 247
4 216 687 222 193 231 642 242 976 251 538 258 447 269 057 277 285 285 340 299 050
5 310 515 322 135 333 855 347 418 360 694 379 218 407 950 440 987 461 888 503 537
6 538 904 575 000 623 393 686 324 754 990 820 286 901 402

Dla konstrukcji szeregu rozdzielczego postąpiono następująco:
a) z danych wyłączono trzy ostanie obserwacje z próby, uznając je za odstające,
b) wyznaczono dla 64 obserwacji wielkości z próby: xmin = 82 620, xmax = 683324, R = 600 704, k = 1 + 3,322log64 = 7, 00013 » 8, d = 600 704/8 = 75 088;
c) liczebności przedziałów klasowych ustalono bezpośrednio z danych liczbowych tworzą-cych próbę uporządkowaną rosnąco,
d) odpowiedni szereg rozdzielczy

Numer klasy Przedziały klasowe Liczebności Częstości
Klasowe Skumulo-wane Klasowe Porcen-towe
1 82 620 157 708 29 29 0,4328 43,28
2 157 708 232 796 14 43 0,2090 20,90
3 232 796 307 884 7 50 0,1045 10,45
4 307 884 382 972 6 56 0,0896 8,96
5 382 972 458 060 2 58 0,0299 2,99
6 458 060 533 148 2 60 0,0299 2,99
7 533 148 608 236 1 61 0,0149 1,49
8 608 236 683 324 3 64 0,0448 4,48
9 683 324 3 67 0,0448 4,48
Suma 67 X 1,0000 100

Otrzymany sz.r. charakteryzuje się wysoką asymetrią prawostronną. Zdecydowanie przeważają przedsiębiorstwa o niskim poziomie przychodów ze sprzedaży. Przy takich przy-chodach nie przekraczających 232 800 zł jest aż 64,18 % badanych przedsiębiorstw, co moż-na oczekiwać, iż taka prawidłowość również wystąpiłaby, gdyby konstrukcja sz.r. obejmowa-ła wszystkie 1343 przedsiębiorstwa, które miały rozpatrywane przychody z przedziału od 80 000 do 1 000 000 zł.


Pojęcie wykresu statystycznego


Zebrany, skontrolowany, właściwie usystematyzowany według badanych cech klasy-fikujących i zliczony materiał statystyczny powinien być przedstawiony i zaprezentowany w takiej formie, aby możliwe było łatwe i natychmiastowe odczytywanie zawartej w nim infor-macji o własnościach próby oraz zależnościach zachodzących między badanymi wielkościami statystycznymi. Taka kondensacja danych statystycznych może być podana w formie tabela-rycznej, zestawienia, raportu lub wykresów (diagramów) graficznych. Do graficznej prezen-tacji danych stosowanych jest wiele wykresów statystycznych (w.s.).






Celem w.s. jest syntetyczne ujęcie informacji zawartej w próbie. Rodzaje i typy tych wykresów uzależnione są od:
postaci stosowanych symboli graficznych i ich prezentacji,
rodzaju użytych danych statystycznych,
przyjętych kryteriów merytorycznych względem jakich odnoszona jest informacja z próby.
Każdy wykres powinien zawierać:
tytuł wykresu dokładnie określający jego przedmiot wraz z jego numeracją,
obraz graficzny stanowiący podstawową część wykresu,
marginesy boczne oraz górny i dolny,
skalę wykresu,
legendę wykresu podającą informacje o poszczególnych liniach i oznaczeniach stosowa-
nych na wykresie,
ewentualnie źródło cytowania.
Metody prezentacji danych na w.s. można podzielić na dwie zasadnicze grupy:
· ideograficzne (symbole, znaki umowne, piktogramy, ikony, obrazki),
· geometryczne (symbole geometryczne).
W.s. można podzielić w zależności od postaci prezentacji danych, na:
porównawcze - porównywanie wielu wielkości statystycznych,
strukturalne - podział całości na części,
dynamiczne - zmiany natężenia badanego zjawiska w czasie,
funkcyjne - zależności funkcji jednej lub wielu zmiennych.
W każdej z wymienionych grup wyróżnia się dalsze ich rodzaje i typy, którymi mogą być wykresy: punktowe, liniowe, powierzchniowe, bryłowe, słupkowe, obrazkowe, ma-powe, pasmowe, kombinowane, sumaryczne, dwuwymiarowe (2D) oraz trzywymiarowe (3D).
Nie będziemy podawać przykładowych ilustracji poszczególnych rodzajów wymie-nionych wykresów. Można je znaleźć w Rocznikach Statystycznych GUS. Także znajdują się w dostępnych pakietach programowych (np. EXCEL, COREL DRAW) lub statystycznych (np. STATISTICA, SAS, SPSS), gdzie wykresy są tworzone wg tzw. kreatorów wykresów.

Histogramy i wieloboki liczebności

Przedziałowy szereg rozdzielczy liczebności przedstawia się na wykresie graficz-nym w postaci histogramu przedziałowego liczebności. Wykres taki ma postać słupkową, którą stanowi układ prostokątów o podstawach odpowiadających długościom p.k. oraz o wy-sokościach wyrażonych liczebnościami klasowymi. Łącząc odcinkami pary punktów w punk-towym szeregu rozdzielczym liczebności otrzymuje się wielobok (ogiwę) liczebności, czę-stości, odsetek procentowych lub częstości znormalizowanych (rys. 4).

Wielobok liczebności Histogram liczebności
Rys. 4

Histogram liczebności jest podstawą do prowadzenia analizy rozkładu empirycznego badanej cechy. Jego postać pozwala na wskazanie jakimi własnościami charakteryzuje się taki rozkład. Wśród nich wyróżnia się rozkłady: siodłowe, umiarkowanie asymetryczne (lewo i prawostronne), symetryczne, jednomodalne (jednoszczytowe), wielomodalne (wieloszczy-towe) oraz skrajnie asymetryczne.
Obok histogramów liczebności można także konstruować histogramy dla liczebności skumulowanych. Podane zasady budowania takich histogramów nie ulegają zmianom, lecz jedynie należy zastąpić liczebności klasowe ich skumulowanymi liczebnościami klasowymi.
W przypadku, gdy należy wykonać wykres histogramu liczebności dla przedziałowego sz..r. z zamkniętymi p.k., ale o nierównych długościach, wówczas wcześniej należy dokonć korekty liczebności klasowych. Jest to powodowane tym, iż nie jest tutaj zachowana zasada proporcjonalności liczebności klasowych (przypadek nierównych długości p.k.), jak to ma miejsce w sz.r. (przypadek równych długości p.k.). W miejsce liczebności klasowych fj sto-suje się skorygowane liczebności klasowe , które wyznacza się według następującej za-sady:
10 dokonujemy wyboru bazowego p,k, ,
20 oznaczmy długość bazowego p.k. przez ,
30 wyznaczamy skorygowane liczebności klasowe, wzorem

(9)

gdzie dj , dla j = 1,2, ..., k są długościami p.k.
W wyniku przeprowadzonych czynności uzyskujemy szereg strukturalny z skorygo-wanymi liczebnościami klasowymi wyrażony zbiorem par

, (10)

dla którego konstrukcja przebiega analogicznie jak dla SRL. Należy tutaj jednakże pamiętać aby na osi odciętych odkładać poszczególne p.k. proporcjonalnie do ich długości klasowych.

Czy tekst był przydatny? Tak Nie

Czas czytania: 23 minuty