Page 24 - Työpoliittinen aikakauskirja 1 2018
P. 24

Artikkeleita
Työpoliittinen aikakauskirja 1/2018
 ”Survey of job recommender systems” (Al-Otaibi, Shaha & Ykhlef 2012) jakaa mät- säysalgoritmit neljään eri luokkaan:
1. ”Collaborative  ltering ”: Jos on tietoa siitä, miten työnhakija X käyttäytyy (esim. käynyt lukemassa työpaikkailmoituksen), suositellaan hänelle työpaikkoja, joita samalla tavalla käyttäytyneet työnhakijat ovat katsoneet.
2. ”Content based  ltering ”: Yhdistetään työnhakijoita ja työpaikkoja yhteisten sanojen mukaan, esim. titteli, koulutus jne. ja lasketaan kuinka lähellä työnanta- jan ja työntekijän käyttämät avainsanat ovat toisiaan.
3. ”Knowledge based filtering ”: Lähinnä nykyistä hakusysteemiä, ei pyri käyttä- mään olemassa olevia tietoja hakijasta, yksisuuntainen.
4. ”Hybrid approach”: Edellisten eri yhdis- telmät.
Guptan (Gupta 2012) kehittämässä ratkai- sussa kohtaanto-ongelmaan kerättiin työpaik- katietoa alasta, ajokortista, työkokemuksesta, työajasta, koulutuksesta ja kielestä säännöllis- ten lausekkeiden (regular expressions) avulla. Samankaltaisuudet (similarities) määriteltiin erikseen kaikille kokonaisuuksille, jonka jälkeen algoritmilla haettiin painot sille, kuinka tärkeä samankaltaisuus missäkin näistä kokonaisuuk- sista oli mätsäyksen onnistumisen näkökulmasta.
Lu:n (Lu, Yao, El Helou & Gillet 2013) toi- mintoihin perustuvassa suositteluskenaariossa jokaisella kokonaisuudella on oma profiili. Kokonaisuuksia yhdistävät sisältöön ja vuoro- vaikutukseen perustuvat suhteet, joiden perus- teella algoritmi voi suositella työpaikkoja.
Rakenteettomissa teksteissä työnantajan ja työntekijän mätsäämiseksi keskeisimpiä taitoja ovat usein substantiivit. On mahdollista määri- tellä käsin erilaisia taitoja ja käyttää niitä, mutta tällaisten listojen luominen ja ylläpitäminen on työlästä. Näin ollen taitoja voi olla hyödyllistä pyrkiä tunnistamaan tekstianalytiikan avulla.
Strukturoidulla taitotiedon keräämisellä työn-
antajalta ja –hakijalta voidaan työnantajan näkö- kulmasta asettaa paremmuusjärjestykseen ne hakijat, joilla on vaaditut/parhaat taidot. Taitoja voidaan lisäksi laittaa paremmuusjärjestykseen esimerkiksi koulutuksen, työkokemuksen tai LinkedIn –suositusten perusteella.
Suosittelualgoritmeja käsittelevä konferenssi Rec sys järjesti vuonna 2016 kilpailun jossa mät- sättiin työpaikkoja ja CV:itä anonymisoidulla datalla (Abel 2016). Kilpailijoiden käytössä oli tietoja työpaikoista ja CV:istä sekä tietoja työn- hakijoiden käyttäytymisestä nettisivuilla, kuten siitä mitä työpaikkoja työnhakija oli käynyt kat- somassa. Tavoitteena oli ennustaa mitä työpaik- koja työnhakija käy tulevaisuudessa katsomassa.
Kilpailun tärkeimpiä havaintoja oli se, että käyttäjät käyvät katsomassa samaa työpaikkaa moneen kertaan. Aikaelementti on myös tär- keä, sillä tuoretta työpaikkaa katsotaan paljon tiheämmin kuin työpaikkaa, joka on ollut sivus- tolla viikkoja. Muita vaikuttavia tekijöitä olivat työpaikan ja työntekijän samankaltaisuus, työ- paikan yleinen suosio sekä työntekijän aiemmat interaktiot samankaltaisten työpaikkojen kanssa.
Kilpailussa käytettiin seuraavia analyysime- netelmiä: TF-IDF, SVD, ”xgboost”, ”factorization machine”, ”LSTM encoder decoder”, ”collabora- tive  ltering ”, LDA, lähimmän naapurin mene- telmä, klusterointi. On huomioitava, että kilpai- lutulokset eivät yleensä ole suoraan tuotannol- listettavissa, koska monesti voittavat ratkaisut vaativat liikaa resursseja niin laskennalliseen suoritukseen kuin ylläpitoonkin.
Monet kaupalliset työpaikkaportaalit ovat rakentaneet omia mätsäysalgoritmeja. Näiden tarkka toiminta on osin heidän liikesalaisuu- tensa, mutta sivustojen toimintaa on kuvattu työpaikkaportaalien teknisissä blogeissa. Eri toi- mijoiden julkaisemia tämän työn kannalta kes- keisimpiä oppeja kuvataan seuraavaksi.
LinkedInin (Wu 2014) kokemusten perus- teella tulosten esittämistapa on jopa tärkeäm- pää kuin algoritmien tarkkuus. Sivusto esittää työnhakijoille työpaikkoja, sekä ”collaborative  ltering” että ”content based  ltering” -mene-
24

















































































   22   23   24   25   26