Kas iš tiesų yra Data Science specialistas ir kodėl visi apie juos kalba
Pastaraisiais metais Data Science tapo vienu iš tų terminų, kuriuos girdi kiekviename IT susitikime, konferencijoje ar net kavinėje, kur susiburia techie bendruomenė. Bet kas iš tiesų slypi už šio pavadinimo? Ne, tai ne tik žmonės, kurie daro gražius grafikus iš skaičių.
Data Science specialistas – tai profesionalas, kuris moka išgauti prasmę iš didžiulių duomenų kiekių, sukurti prognozavimo modelius ir padėti verslui priimti sprendimus, paremtus ne intuicija, o konkrečiais duomenimis. Jie dirba su mašininio mokymosi algoritmais, statistiniais modeliais, duomenų vizualizacija ir dažnai yra tie žmonės, kurie padeda įmonėms sutaupyti milijonus arba surasti naujus pajamų šaltinius.
Lietuvoje ši profesija pradėjo rimtai vystytis maždaug prieš 5-7 metus, kai didesnės įmonės suprato, kad duomenys – tai naujas auksas. Dabar situacija pasikeitė kardinaliai: beveik kiekviena vidutinio dydžio įmonė nori turėti bent vieną Data Science specialistą komandoje, o didesnės organizacijos kuria ištisas analitikos departamentus.
Kiek uždirba Data Science specialistai Lietuvoje realybėje
Dabar prie klausimo, kuris daugelį domina labiausiai – pinigai. Ir čia reikia pasakyti atvirai: Data Science srityje dirbantys žmonės Lietuvoje uždirba tikrai neblogai, nors ir ne visada tiek, kiek galėtų užsienio rinkose.
Junior Data Science specialistas, kuris ką tik baigė studijas arba perkvalifikavosi iš kitos srities, gali tikėtis atlyginimo nuo 1800 iki 2500 eurų į rankas. Taip, žinau, skamba neblogai, bet reikia suprasti, kad šiame lygyje nuo tavęs tikimasi jau nemažai – bent jau Python ar R programavimo įgūdžių, supratimo apie statistiką ir gebėjimo dirbti su duomenų bazėmis.
Mid-level specialistai, turintys 2-4 metų patirties, jau kalba apie 3000-4500 eurų į rankas. Šiame etape jau tikimasi, kad moki ne tik kodą rašyti, bet ir supranti verslo kontekstą, gali savarankiškai vesti projektus ir komunikuoti su skirtingų departamentų žmonėmis.
Senior Data Science specialistai ir tie, kurie turi specifinių sričių ekspertizę (pavyzdžiui, NLP, kompiuterinė rega ar rekomendacinės sistemos), gali uždirbti nuo 5000 iki 7000 eurų į rankas. O jei dirbi tarptautinei kompanijai remote arba turi Lead/Principal poziciją – skaičiai gali peršokti ir 8000-10000 eurų ribą.
Bet čia svarbu paminėti vieną niuansą: algos labai priklauso nuo įmonės tipo. Fintech startuapai ir tarptautinės tech kompanijos moka gerokai daugiau nei tradicinės Lietuvos įmonės. Pavyzdžiui, dirbdamas Revolut, Vinted ar panašioje kompanijoje gali tikėtis 30-50% didesnio atlyginimo nei analogiškoje pozicijoje lietuviškame banke ar telekomunikacijų įmonėje.
Kokių įgūdžių reikia ir kaip juos įgyti
Gerai, algos skamba patraukliai, bet kas reikia, kad jas gautum? Data Science nėra ta sritis, kur gali ateiti su vienos savaitės kursų sertifikatu ir tikėtis darbo. Čia reikia solidaus įgūdžių rinkinio.
Programavimas – absoliutus must-have. Python yra de facto standartas, ir jei nežinai Python, tavo galimybės rasti darbą sumažėja perpus. R dar naudojamas, ypač akademinėje aplinkoje ir farmacijos sektoriuje, bet Python dominuoja. Turėtum mokėti dirbti su pandas, NumPy, scikit-learn, ir bent paviršutiniškai suprasti TensorFlow ar PyTorch, jei nori dirbti su deep learning.
Statistika ir matematika – ne, nereikia būti matematikos profesoriumi, bet privalai suprasti, kas yra p-value, kaip veikia regresija, kas yra bias-variance tradeoff. Daug kas bando išmokti Data Science be šio pagrindo, ir tada gauna modelius, kurie atrodo gerai, bet realybėje yra visiškai netinkami.
SQL ir duomenų bazės – maždaug 60% Data Science specialisto laiko praleidžiama ne kuriant fancy modelius, o traukiant ir valant duomenis. SQL žinojimas yra kritiškai svarbus. Turėtum mokėti rašyti sudėtingas užklausas, suprasti, kaip veikia JOIN’ai, agregacijos, window functions.
Verslo supratimas – ir čia ta vieta, kur daugelis pradedančiųjų suklysta. Gali būti nuostabus matematikas ir programuotojas, bet jei nemoki savo darbo rezultatų paversti verslo rekomendacijomis, tavo vertė įmonei bus ribota. Reikia mokėti kalbėti su netehnine auditorija, suprasti, kaip įmonė uždirba pinigus ir kaip tavo modeliai gali padėti tai daryti geriau.
Kaip visa tai išmokti? Universitetas – geras startas, bet nebūtinas. Dabar Lietuvoje yra keletas gerų programų: VU Duomenų mokslo magistrantūra, KTU programos, Vilnius Coding School bootcamp’ai. Bet tiesą sakant, dauguma įgūdžių gali įgyti savarankiškai per Coursera, DataCamp, arba tiesiog darydamas projektus GitHub’e.
Kaip atrodo tipiškas darbo procesas
Paneikime vieną mitą: Data Science specialistas nedirba vien tik su Jupyter Notebook’ais, kurdamas modelius. Realybė daug įvairesnė ir, tiesą sakant, kartais net chaotiškesnė.
Tipiškas projektas prasideda nuo verslo problemos. Pavyzdžiui, marketingo komanda nori suprasti, kodėl klientai atsisako nuo jų paslaugų. Tu pradedi nuo susitikimo su jais, bandai suprasti, kokius duomenis jie turi, ko tikisi, ir – svarbiausia – kaip jie panaudos tavo rezultatus.
Paskui eina duomenų rinkimas ir valymas. Ir čia prasideda tikroji pramoga. Duomenys niekada nebūna tokie, kokių tau reikia. Trūksta reikšmių, datos užrašytos skirtingais formatais, yra dublikatų, outlier’ių. Gali praleisti savaites, kol duomenis paversi į kažką, su kuo galima dirbti.
Tik tada pradedi tyrinėjamąją analizę (EDA), kuri padeda suprasti, kas iš tiesų vyksta duomenyse. Čia kuri vizualizacijas, skaičiuoji koreliacijas, ieškoi įdomių pattern’ų. Ir dažnai būtent šiame etape randi atsakymus, kurie verslui yra vertingesni už bet kokį sudėtingą modelį.
Modelio kūrimas – taip, pagaliau! Bet ir čia ne viskas taip paprasta. Pradedi nuo paprastų modelių (logistinė regresija, decision trees), paskui bandai sudėtingesnius (random forests, gradient boosting, neural networks). Testuoji, validuoji, derinsi hyperparametrus. Ir dažnai paaiškėja, kad paprastas modelis veikia geriau nei sudėtingas.
Galiausiai – deployment ir monitoringas. Tavo modelis turi veikti production aplinkoje, ir tu turi užtikrinti, kad jis toliau veiktų gerai. Tai reiškia, kad reikia mokėti bent šiek tiek apie Docker, API, cloud platformas.
Kokios įmonės Lietuvoje ieško Data Science specialistų
Lietuvos Data Science rinka yra gana įvairi. Turime kelias kategorijas įmonių, kurios aktyviai samdo šios srities specialistus.
Fintech kompanijos – tai absoliutūs lyderiai. Revolut, Paysera, NEO Finance, Profitus – visos šios įmonės turi didelius duomenų komandas. Jie naudoja Data Science kreditų rizikos vertinimui, sukčiavimo aptikimui, personalizacijai. Čia paprastai mokamos geriausios algos ir dirbi su įdomiais projektais.
E-commerce ir marketplace’ai – Vinted yra akivaizdus pavyzdys, bet yra ir daugiau. Šios įmonės naudoja Data Science rekomendacijų sistemoms, kainų optimizavimui, logistikos gerinimui. Jei mėgsti dirbti su dideliais duomenų kiekiais ir matyti tiesioginį savo darbo poveikį milijonams vartotojų – tai tavo vieta.
Telekomunikacijos ir energetika – Telia, Tele2, Ignitis grupė. Šios įmonės turi milžiniškus kiekius duomenų apie savo klientus ir infrastruktūrą. Naudoja Data Science churn prediction, network optimization, demand forecasting. Galbūt ne taip sexy kaip startuapai, bet stabilūs darbdaviai su įdomiais iššūkiais.
Konsultacinės įmonės – Accenture, Deloitte, PwC. Čia dirbi su įvairiais klientais ir projektais, kas gali būti puikus būdas įgyti platų patirties spektrą. Minusas – dažnai projektas trunka tik kelis mėnesius, ir nematai ilgalaikio savo darbo poveikio.
Produktų kompanijos ir startuapai – nuo healthtech iki proptech, Lietuvoje auga vis daugiau startuapų, kurie stato savo produktus ant duomenų ir AI. Čia gali būti įdomu, jei nori turėti didesnę įtaką produkto vystymuisi, bet algos gali būti mažesnės, kompensuojamos equity.
Remote darbas ir tarptautinės galimybės
Vienas didžiausių Data Science pranašumų – ši profesija puikiai tinka remote darbui. Ir čia Lietuvos specialistai turi didžiulę galimybę.
Daugelis Lietuvoje dirbančių Data Science specialistų iš tiesų dirba tarptautinėms kompanijoms. Gali gyventi Vilniuje ar Kaune ir dirbti Londono, Berlyno ar net San Francisco įmonei. Tai reiškia užsienio rinkas atitinkančias algas, bet Lietuvos pragyvenimo kaštus.
Realiai, jei turi 3-4 metų patirties ir neblogai kalbi angliškai, gali pretenduoti į pozicijas, kur alga prasideda nuo 6000-8000 eurų į rankas, dirbant remote. Yra Lietuvoje žmonių, kurie uždirba 10000+ eurų, dirbdami US kompanijoms, nors tai vis dar gana reta.
Bet remote darbas turi ir savo iššūkių. Laiko zonų skirtumai, komunikacijos sunkumai, mažesnis socialinis bendravimas. Reikia būti labai savarankiškam ir disciplinuotam. Taip pat, kai kurios įmonės moka pagal location – tai reiškia, kad už tą patį darbą gausi mažiau nei kolega, gyvenantis San Francisco.
Dar vienas aspektas – kontraktorystė. Vis daugiau Data Science specialistų dirba kaip freelanceriai ar per savo įmones. Tai gali būti pelningiau (hourly rates siekia 80-150 eurų), bet reikia pačiam rasti klientus, tvarkyti buhalterinę apskaitą, neturi atostogų ar ligos dienų.
Kokios perspektyvos ateityje
Data Science srityje vyksta nuolatinė evoliucija, ir svarbu suprasti, kur ši sritis juda, jei planuoji ilgalaikę karjerą.
Pirma, AI ir mašininis mokymasis tampa vis labiau demokratiški. AutoML įrankiai, low-code platformos reiškia, kad kai kurie dalykai, kuriuos anksčiau darė Data Science specialistai, dabar tampa prieinami platesnei auditorijai. Bet tai nereiškia, kad profesija išnyks – priešingai, ji evoliucionuoja. Vertė persislenka nuo techninių įgūdžių link verslo supratimo ir strateginio mąstymo.
Antra, specializacija tampa vis svarbesnė. Vietoj „generic” Data Science specialisto, rinka vis labiau vertina ekspertus konkrečiose srityse: NLP, kompiuterinė rega, rekomendacinės sistemos, time series forecasting. Jei nori išsiskirti ir uždirbti daugiau, verta rinktis sritį ir tapti joje ekspertu.
Trečia, MLOps ir production skills tampa būtinybe. Nebepakanka sukurti modelį Jupyter Notebook’e – reikia mokėti jį deploy’inti, monitorinti, versijuoti. Specialistai, kurie moka ne tik Data Science, bet ir engineering praktikas, yra ypač vertinami.
Ketvirta, etika ir atsakingumas tampa vis svarbesni. Su GDPR, AI reguliacijomis, bias problemomis – Data Science specialistai turi suprasti ne tik kaip sukurti veikiantį modelį, bet ir kaip užtikrinti, kad jis būtų teisingas, skaidrus ir atitiktų reguliacijas.
Lietuvoje specifiškai, matome, kad rinka auga sparčiau nei specialistų pasiūla. Tai reiškia, kad artimiausius 3-5 metus perspektyvos bus puikios. Įmonės konkuruoja dėl talentų, algos auga, ir yra daug erdvės karjeros augimui.
Ar verta šokti į Data Science vandenis
Taigi, grįžtant prie pagrindinio klausimo – ar verta rinktis Data Science karjerą Lietuvoje? Atsakymas priklauso nuo to, ko tu ieškai.
Jei mėgsti spręsti sudėtingas problemas, dirbi su skaičiais ir logika, nori matyti tiesioginį savo darbo poveikį verslo rezultatams – tai puikus pasirinkimas. Algos yra konkurencingos, perspektyvos geros, o darbas tikrai nebus nuobodus.
Bet reikia būti realistams. Tai nėra lengvas kelias. Reikės daug mokytis, nuolat tobulėti, sekti naujausias tendencijas. Pirmieji metai gali būti sunkūs, ypač jei neturi techninio background’o. Ir ne viskas bus glamūringas – daug laiko praleisi valydamas duomenis ir debuggindamas kodą.
Praktinis patarimas tiems, kas svarsto šį kelią: pradėk nuo mažų projektų. Paimk kokį nors atvirą duomenų rinkinį (Kaggle pilnas jų), iškelk sau klausimą ir bandyk į jį atsakyti naudodamas duomenis. Sukurk GitHub portfolio, dalinkis savo darbais LinkedIn’e. Dalyvauk meetup’uose ir konferencijose – Lietuvoje vyksta Data Science meetup’ai Vilniuje ir Kaune, kurie puikiai tinka networking’ui.
Jei jau dirbi kitoje IT srityje – pavyzdžiui, esi software developer ar data analyst – perėjimas į Data Science gali būti natūralus karjeros žingsnis. Jau turi daug reikalingų įgūdžių, tiesiog reikia papildyti juos mašininio mokymosi ir statistikos žiniomis.
O jei esi visiškai naujas IT pasaulyje – taip, galima, bet būk pasirengęs intensyviai mokytis bent 6-12 mėnesių, kol pasieksi lygį, kuris leis pretenduoti į junior pozicijas. Bootcamp’ai gali pagreitinti procesą, bet nieko nepakeičia praktikos ir realių projektų.
Galiausiai, Data Science Lietuvoje – tai auganti, dinamiška sritis su realiais iššūkiais ir galimybėmis. Jei esi pasirengęs įdėti pastangų, rezultatai – tiek finansiniai, tiek profesiniai – tikrai atsiperka. Rinka tik auga, įmonės ieško talentų, ir dabar yra puikus laikas įšokti į šį traukinį.
