Miten mallien sovituksesta ja uudelleenkoulutuksesta saisi nopeampaa ja halvempaa? Visioimme monikäyttöisen AutoML-ratkaisun, jonka tavoitteena on ohittaa suorituskyvyssä markkinoilla jo olevat HPO-ratkaisut.
Työskentelimme Techilan asiantuntijoiden kanssa ja loimme uudenlaisen AI/ML-ratkaisun Techilan laskentaympäristöön.
Käyttämiämme teknologioita olivat Bayesin optimointi, satunnaishaku, grid-search sekä vahvistusoppiminen.
Tuote laajennettiin monikäyttöiseksi AutoML:ksi, jossa on black box -optimointiominaisuudet.
Techila Distributed Computing Engine on seuraavan sukupolven grid-laskentaratkaisu, joka parantaa käyttäjien tuottavuutta tutkimus- ja kehitystyössä. Techila halusi luoda uudenlaisen AI/ML-ratkaisun laskentaympäristöönsä ja yhdessä tunnistimme hyperparametrien optimoinnin mahdolliseksi ehdokkaaksi. Data scientistimme aloittivat työskentelyn osana Techilan tiimiä, tavoitteena luoda markkinoiden muita HPO-palveluita parempi ratkaisu.
Projektin edetessä laajensimme HPO-ratkaisuamme sisältämään monikäyttöisempää AutoML:ää ja black box -optimointia. Ratkaisu on vaivatta data science -ryhmien käytettävissä ja vähentää huomattavasti parametrien manuaalisen säätämisen tarvetta.
Käytännössä mallille määritellään parametrivälit ja ratkaisu käyttää evaluaatioiden pistemääriä malliparametrien hienosäätämiseen. Tämä tekee mallien sovituksesta ja uudelleenkoulutuksesta paljon nopeampaa ja halvempaa.
Hyödynsimme toteutuksessa Bayesin optimointia, satunnaishakua, grid-searchia sekä vahvistusoppimista. Työkaluista käytössä olivat Scikit-Learn, CatBoost, XGBoost, LGBM, Keras/Tensorflow ja Pytorch.