Page 29 - Työpoliittinen aikakauskirja 1 2018
P. 29

Työpoliittinen aikakauskirja 1/2018
Artikkeleita
 den vaikutus voi olla erilaista eri osissa maata, mikä voi selittää sitä, että postinumero vaikut- taa tulokseen.
Jos tärkeimmistä muuttujista otettaisiin selit- täjiksi vain 5 tärkeintä, niin TOP 3 % laskisi 3,8 prosenttiyksiköllä. Jos otetaan mukaan vain 10 tärkeintä, se laskisi 0,5 prosenttiyksiköllä ja jos otettaisiin mukaan 15 tärkeintä, se laskisi vain 0,1 prosenttiyksiköllä, joten sen monimutkaisem- paa mallia ei kannata sovittaa ja tähän malliin tekstianalytiikkamuuttujat eivät tulleet mukaan.
”Random forest” on yhdistelmä 1000 päätök- sentekopuusta. Yksittäisissä puissa tehdään eri- suuntaisia virheitä, joita monen eri puun teke- minen korjaa. Seuraavassa kuvassa (Kuva 1) on esitetty yksi esimerkki aineistosta piirretystä päätöksentekopuusta. Kuva on piirretty ope- tusaineistosta, jossa joka sadas työpaikka johti työllistymiseen. Tämän vuoksi absoluuttiset todennäköisyydet eivät vastaa reaalimaailman tilannetta, mutta niiden järjestys ja suhteet toi- siinsa ovat mielekkäitä. Tästä suureesta käyte- tään jatkossa muuttujien vaikutuksen kuvailu -osiossa termiä työllistymistodennäköisyys.
Kuva 1
Kuvassa ylin numero kuvaa työllistymistoden- näköisyyttä edellä mainituin reunaehdoin. Alin luku kuvaa, kuinka suuri osa aineistosta on kysei- sessä luokassa. Laatikon alla on muuttujiin liit- tyvä ehto ja ehdon täyttävät havainnot siirtyvät puussa vasemmalle puolelle ja ne, jotka eivät täytä siirtyvät oikealle puolelle.
Ensimmäisenä aineiston jakaa ylhäällä mää- rittely siitä, onko haetusta ISCO-koodista pää- tynyt yli 18 % työpaikanvaihtajista auki olevaan työpaikkaan. Kuvassa tästä muuttujasta on käy- tetty nimeä työpaikkahistoria. Jos näin ei ole käynyt, työllistymistodennäköisyys on 0 %, jos näin on käynyt, työllistymistodennäköisyys on 33 %. Jos seuraavaksi katsotaan oikeaan laitaan, niin ne, joiden työpaikkahistoria muuttujan arvo oli yli 18 % jaetaan etäisyyden mukaan. Jos hei- dän työpaikkojensa etäisyys asuinpaikasta on yli 47 kilometriä, työllistymistodennäköisyys on 9 %, jos se on alle 47 kilometriä, niin työllistymis- todennäköisyys on 85 %.
Tämän jaon alla jakajana on työsuhteen tyyppi. Tässä jaossa palkkatyölle, provisiotyölle ja yrittäjyydelle työllistymistodennäköisyys on
 29

   27   28   29   30   31