Page 30 - Työpoliittinen aikakauskirja 1 2018
P. 30

Artikkeleita
Työpoliittinen aikakauskirja 1/2018
 0,02. Vuorotteluvapaalle työllistymistodennä- köisyys on puun tässä lehdessä 50 %.
Kuvassa vasemmalla puolella aineistoa jakaa hakuISCOmats -muuttuja, joka kuvaa, montako yhteistä merkkiä parhaiten sopivalla haetulla työpaikalla ja avoimena olleella työpaikalla oli ISCO-koodeihin perustuen.
Tämä algoritmi siis arvioi työllistymisen kaik- kein epätodennäköisimmäksi, jos työnhakijan hakemasta ISCO-koodista ei ole päätynyt suurta osaa (18 %) haettavan paikan ISCO-koodiin ja työpaikka ei sijaitse asuinpaikan vieressä (0,3 km) ja parhaiten työpaikkaan sopiva työnhakijan hakukenttä ei täsmää viiden numeron tarkkuu- della haetun työpaikan ISCO-koodiin.
Esimerkkinä esitetty yksittäinen päätök- sentekopuu ennustaa noin 65 % työtarjouksen kautta työllistymiseen johtaneista työpaikoista parhaaseen kolmeen prosenttiin kaikista työ- paikoista. Kun teemme ”random forest” -mene- telmällä tuhat erilaista päätöksentekopuuta ja yhdistämme niistä saadun informaation, ennus- tetarkkuus nousee yli 95 prosenttiin.
Jatkokehitysmahdollisuudet
Algoritmi suosittelee työnhakijalle tällä hetkellä ensisijaisesti työpaikkoja, joihin työllistyminen on kaikkein todennäköisintä. Käyttäjillä on var- masti muitakin preferenssejä sille, mihin työ- paikkoihin he haluavat hakea. Kun algoritmi ote- taan käyttöön, käyttöliittymään kannattaa antaa mahdollisuus suodattaa työpaikkoja eri kritee- rein esimerkiksi sen perusteella, onko kyseessä kokopäivätyö vai osa-aikatyö. Algoritmi ei suo- raan huomioi kilpailua. Eli jos esim. tietyllä seu- tukunnalla on paljon työttömiä tietyn ammatin edustajia, mutta muualla Suomessa ammatin työllistymistodennäköisyys on korkea, algo- ritmi ei huomioi tätä. Tämän algoritmin mätsi on muodostettu työntekijänäkökulmasta, mutta parempia tuloksia saattaisi saada, jos painottaisi työntekijänäkökulmaa esim. 90 % ja työnanta- janäkökulmaa 10 %.
Tässä tutkimuksessa määriteltyä algoritmia voidaan parantaa, jos uusista datalähteistä saa-
daan lisätietoja, joilla työllistymistä pystytään ennustamaan. Esimerkiksi tiedot hakijoiden taidoista, muiden työpaikkasivustojen työpaik- katiedot ja web- analytiikan hyödyntäminen sekä kattavammat tiedot siitä, minne aiemmat työnhakijat ovat työllistyneet ovat potentiaalisia lisätietojen lähteitä. Lisäksi käyttäjiltä voidaan kerätä systemaattisesti palautetta ja hyödyntää tätä algoritmin jatkokehityksessä.
Algoritmin heikkouksia ja vahvuuksia
Työmarkkinatilanne vaikuttaa siihen, kuinka hyvin sopivia työnhakijoita työnantajat vaati- vat. Työnantajat vaativat, että työnhakija vas- taa paremmin heidän vaatimuksiaan, jotta he työllistäisivät hänet jatkuvaan työsuhteeseen. Määräaikaisia työsuhteita työnantajat ovat val- miita solmimaan myös hakijoiden kanssa, jotka eivät niin hyvin täytä kaikkia valintakriteereitä. Algoritmi ei tällä hetkellä huomioi näitä teki- jöitä.
Mallinnus on tehty käyttäen URA- järjestelmän tietoja. Jos algoritmia käytettäi- siin käyttäjien itse syöttämin tiedoin, datan laatu saattaisi samalla heiketä. Algoritmi toimii paremmin, kun sen käyttämä data on laadukasta.
Algoritmi muodostettiin käyttämällä tapaus-verrokki -tyyppistä asetelmaa, jossa yhtä työpaikkaa, johon henkilö oli työtarjouksen kautta tullut valituksi, vastasi 99 samaan aikaan auki ollutta työpaikkaa, joihin sama työnhakija ei työllistynyt. Tällainen algoritmi ei osaa huo- mioida puhtaasti työnhakijaan liittyvien omi- naisuuksien vaikutusta työllistymiseen. Tämä on sekä heikkous että vahvuus. Algoritmi ei esi- merkiksi syrji hakijoita iän perusteella, mutta toisaalta jos työnantajilla on preferenssi tietyni- käisiin työnhakijoihin, algoritmi ei tätä tunnista.
Yksi tulosten luotettavuutta heikentävä tekijä on se, että tiedämme, mitä tietoja työn- hakijoista on tällä hetkellä tietokannoissa, mutta emme tiedä, mitä tietoa heistä on ollut tietokan- nassa silloin, kun työpaikka on ollut avoinna. Saatamme siksi osin opettaa algoritmia tiedolla, jota ei ollut olemassa vielä silloin kun hakija haki
30



















































































   28   29   30   31   32