Pomoč pri iskanju klasifikacij
Pregledovanje klasifikacij
Izbiranje klasifikacije
Uporabnik najprej:
(1) izbere generični izraz ali modul,
(2) izbere klasifikacijo in
(3) verzijo klasifikacije
Uporabnik se odloči za enega od možnih prikazov klasifikacije.
Izbira med:
- drevesnim pregledom
- pregledom v obliki tabele
- sistematičnim kodirnim seznamom
- abecednim kodirnim seznamom.
Slika 1: Koraki pri izbiranju klasifikacije
Prikaz klasifikacije v drevesni strukturi
Ko uporabnik izbere verzijo klasifikacije in se odloči za drevesni prikaz, se odpre nova stran, ki prikazuje kategorije za izbrano verzijo klasifikacije v drevesni strukturi.
Slika 2: Hierarhičen drevesni pregled kategorij
Uporabnik s pritiskanjem na plus ali minus pred kategorijo pregleduje izbrano verzijo klasifikacije. Z izbiro povezave »Nazaj«, se vrne na točko 1.
Če želi uporabnik izpisati kategorije za izbrano verzijo klasifikacije, lahko izbere povezavo »Izpis v tabeli«. Stran, ki se odpre, je v tabelarični obliki. Uporabnik lahko stran shrani z ustreznim ukazom v brskalniku (File-Save As), nato pa po potrebi s poljubnim uporabniškim orodjem (npr. Excel) nadaljuje z obdelavo podatkov.
Opis klasifikacije z vzorcem ravni
Z izborom gumba »Opis klasifikacije« se odpre stran s kratkim opisom klasifikacije. Pod opisom klasifikacije je izpisan vzorec ravni in število zapisov za vsako posamezno raven.
Slika 3: Opis klasifikacije z vzorcem ravni
Pregled klasifikacije v obliki tabele
Z gumbom »Pregled klasifikacije v tabeli« se izpiše izbrana verzija klasifikacije v tabelarični obliki. Standardna oblika zapisa vsebuje za vsako kategorijo šifro ravni, šifro kategorije, deskriptor, angleški deskriptor in šifro nadrejene kategorije (šifro starša).
Tabelo lahko shranimo (File - Save As) na lokalni disk v HTML obliki.
OPOZORILO: Prikaz klasifikacij, ki imajo nekaj tisoč kategorij (kot jih ima KNCT - Kombinirana Nomenkaltura Carinske Tarife), je lahko dolgotrajen.
Slika 4: Izpis klasifikacije v obliki tabele in shranjevanje na lokalni disk v HTML obliki
Pregled kodirnega seznama
Z gumbom »Pregled kodirnega seznama« se izpiše seznam, sestavljen iz šifre in deskriptorja kategorije ter iz vključitev, ki podrobneje opisujejo ključno zajetje kategorije. Uporabnik izbira med sistematično ali abecedno različico.
Slika 5: Izpis kodirnega seznama
Dostop do pretvornikov
Uporabnik izbere pretvornik iz seznama.
Slika 6: Seznam pretvornikov
Slika 7: Pari kategorij pretvornika
Iskanje po vseh klasifikacijah
Slika 8: Iskanje po vseh klasifikacijah; izbor lokacije iskanja in stopnje ujemanja
Uporabnik izbere polje in natančnosti ujemanja.
Polja, ki so na razpolago:
- ime (klasifikacije)
- vsa polja v podatkovni bazi
- šifra
- deskriptor kategorije (tekst za šifro)
- definicija kategorije
- formalna vključitev (sem spada /sem spada tudi).
Stopnja ujemanja je zelo pomemben izbor. Uporabniku svetujemo, da izbere polje
Na razpolago sta še izbora:
- natančno (kadar natančno vemo, kaj iščemo)
- se začne z...
Več informacij o strežniku
V tekstu so predstavljene temeljne predpostavke, izrazi in definicije ter načini pregledovanja statističnih klasifikacij.
Zgledi
Nova programska rešitev osrednje zbirke statističnih klasifikacij je bila izdelana v okviru Programa posodobitve državne statistike. Rešitev, ki smo jo razvili na Statističnem uradu Republike Slovenije (SURS), je zasnovana na dveh modelih - New Zealand Statistics Classifications And Related Standards System (CARS) in na modelu, kot smo ga povzeli po ISO/IEC 11179 Information technology - Specification and standardisation of data elements.
SURS in klasifikacije
Ena od nalog Statističnega urada Republike Slovenije je tudi oblikovanje in vzdrževanje različnih klasifikacij, ki se uporabljajo tako za potrebe statističnih obdelav, pa tudi v poslovnem svetu. Take klasifikacije so, na primer, Standardna klasifikacija dejavnosti[i], Standardna klasifikacija poklicev[ii], Klasifikacija gradbenih objektov[iii], Nomenklatura industrijskih proizvodov[iv], itd.
Klasifikacije se sčasoma dopolnjujejo in spreminjajo, kar zahteva na eni strani skrb za organizirano oblikovanje in uveljavljanje novih verzij ter arhiviranje starih, na drugi strani pa je potrebno zagotoviti primerljivost rezultatov statističnih obdelav v daljšem obdobju, v katerem so bile veljavne različne verzije klasifikacije.
Avtorji verjamemo, da je obravnavanje klasifikacij lahko problematično pri gradnji podatkovnih skladišč. Na pomembnost obravnavanja šifer v svoji knjigi opozarja tudi Kimball, ki pravi, da moramo za vsako šifro v podatkovnem skladišču vedeti njen pomen[v].
Izrazi in definicije
V nadaljevanju bomo na kratko predstavili uporabljene izraze in njihove definicije (slika 1).
Slika 1: KLASJE, diagram izrazov in definicij
Klasifikacija
Klasifikacija je niz povezanih kategorij, ki se uporabljajo za razvrščanje podatkov.
Klasifikacija je lahko: standardna, nestandardna ali neodvisna.
Raven
Raven je v klasifikaciji niz kategorij, s katerimi opazovano populacijo lahko razvrstimo do zahtevanih podrobnosti.
Vsaka klasifikacija ima vsaj eno raven. Ravni imajo lahko različna imena (nazive), na primer: področje, oddelek, skupina, razred, itd.
Vzorec ravni
Kategorije so organizirane v drevesno hierarhijo, ki ima v vsaki klasifikacijo natančno določene ravni. Vsaka raven ima svoje ime. Šifre kategorij so sestavljene po vzorcu, ki je enolično določen za vsako posamezno raven.
Verzija
Verzija klasifikacije je niz kategorij klasifikacije, ki se uporablja, oz. je na razpolago v določenem časovnem intervalu. O novi verziji govorimo, ko se spremenijo kategorije.
Spremembe kategorij, ki vplivajo na število ravni in/ali na vzorec klasifikacije, se morajo obvezno odraziti kot oblikovanje prve verzije nove klasifikacije.
Izraz verzija se nanaša na časovno obdobje, v katerem je prišlo do zaporednih ažuriranj ali revizij standardnih, nestandardnih ali neodvisnih klasifikacij. Vsaka klasifikacija praviloma začne s prvo verzijo, ki se postopoma, v nekem časovnem obdobju, razvije v zaporedne verzije.
Vsaka verzija klasifikacije ima določen datum, od katerega velja. Na primer, prva verzija Klasifikacije gradbenih objektov velja od 1.1.1998.
V določenem časovnem obdobju bomo imeli vrsto verzij, vendar bo imala vsaka svoj, določen datum, od katerega velja. Veljavna verzija je običajno tudi zadnja verzija izbrane klasifikacije. Podatki so praviloma šifrirani skladno z veljavno verzijo.
Kategorija
Kategorija je del populacije statističnih enot, razdeljenih skladno z izbranimi opazovanimi lastnostmi teh enot.
"Šifra" je simbol za kategorijo, ki omogoča lažje shranjevanje in priklic.
"Deskriptor" razlaga in določa pomen kategorije v tekstualni obliki.
"Oznaka" je okrajšava deskriptorja. Standardna oznaka ne presega 40 znakov in se predvsem pri standardnih klasifikacijah uporablja kot orodje za zagotavljanje enotnega izrazja pri izdelavi rezultatov raziskovanj (izpisov) in izkazovanju podatkov.
"Formalna vključitev" je postavka v obliki besedila, ki se v povezavi z deskriptorjem v nekaterih verzijah klasifikacij uporablja za natančnejšo opredelitev ključnega zajetja kategorije. Na primer: v Klasifikaciji gradbenih objektov (1999) kategorija Lokalni cevovodi za dobavo vode pokriva tudi: lokalne cevovode za dovod vroče vode, pare ali stisnjenega zraka ter vodne stolpe, zajetja, vodnjake in hidrante.
Pretvornik
Pretvornik določa prevajanje kategorij iz izvorne verzije klasifikacije v ciljnjo verzijo klasifikacije z uporabo določenega postopka ali kriterija.
Pretvarjamo lahko med različnimi verzijami iste klasifikacije ali med verzijami različnih klasifikacij.
Vsak pretvornik ima pare kategorij. Vsak par kategorij povezuje kategorijo izvorne verzije s kategorijo ciljnje verzije klasifikacije.
Enostaven pretvornik je pretvornik, ki vsebuje samo povezave ena proti ena in mnogo proti ena. V tem primeru podatke lahko neposredno pretvorimo iz ene verzije klasifikacije v drugo. Če pretvornik ni enostaven (če vsebuje povezave ena proti mnogo) potrebujemo pretvorno orodje, ki je lahko v numerični obliki (na primer odstotki). V tem primeru lahko razdelimo podatke, razvrščene v "eno" kategorijo ene verzije klasifikacije na "mnogo" kategorij ciljnje verzije.
Kodirni seznam
Kodirni seznam je seznam verjetnih odgovorov na določeno vprašanje v raziskovanju.
Kodirni seznam vsebuje deskriptorje in formalne vključitve izbrane verzije klasifikacije.