9. Rakendamise kava
Arendusmahtusid on hinnatud funktsionaalsuste kaupa. Masinõppe arenduse mahtude juures ei ole arvestatud andmekogude korjamise ja märgendamisega. On võimalik, et olemasolevate avalike andmestike ja tõlkemälude pealt on võimalik juba väga edukalt treenida adekvaatset tõlkemootorit, aga on tõenäoline, et anonümiseerimiseks ja tekstiliigi tuvastamiseks on vaja eraldi andmeid märgendada, mis ei ole õnneks aga kuigi suur ega kulukas töö.
Samuti on juba olemasolevad kõnetuvastuse mudelid eesti keele jaoks üpris head ning vabalt kättesaadav andmestik aina kasvab. Kõnetuvastuse puhul on aga tihtipeale vaja mudelit kohandada spetsiifilise ülesande jaoks. Eriti oluline on see parema täpsuse saavutamiseks lindistamistingimustes, mis ei ole ideaalsed - kehv mikrofon, taustahelid, kajad ruumis, telefonikõned, jne. Mudelit võib aga ka kohandada andma sobivamat väljundit tõlkeprotsessi jaoks - punktuatsioon, suured algustähed jne.
Arvestatud on ka asjaoluga, et kasutusele võetakse (kasvõi osaliselt) vabavaraline CAT-tööriist (nt MateCat) ning valmisolev kvaliteedikontrollilahendus, mida saab vajadusel täiendada.
Masinõppe töö mahtude puhul on ka eeldatud, et töid teostavad kogemusega spetsialistid - väljatoodud mahtudes ei ole kuigi palju eksperimenteerimise või õppimise ruumi. Masintõlkemudelite vastuvõtmiseks oleks mõistlik defineerida mingid kvaliteedistandardid (iga valdkonna jaoks mingid testandmed, mille peal peaks veaprotsent mingi kasutamiskõlbuliku piiri sisse jääma). Kasulik on ka küsida mudelite treenimise dokumentatsiooni, skripte ja tarkvara, et oleks tulevikus lihtsam sarnaseid mudeleid juurde treenida või olemasolevaid häälestada.
Allpool on tabel, milles on välja toodud oodatavad arendusmahud funktsionaalsuste lõikes, iga etapi eeldatav maksumus ning vajalikud ressursid.
Detailsem arenduskava koos mahuhinnangutega tundides funktsionaalsuste lõikes on välja toodud Exceli tabelis: Rakendamise kava (1) (2).xlsx
Etapp | Etapi tulemus | Eeldatav maksumus ja kestus kalendrikuudes (ilma puhvrita) | Vajalikud ressursid |
---|---|---|---|
Etapp I Minimaalselt kasutatava rakenduse (MVP) loomine |
| Maksumus: 416 024 eurot ilma KM-ta / 499 229 eurot KM-ga Kestus: 6 kuud |
|
Etapp II Optimaalse tarkvara loomine |
| Maksumus: 443 506 eurot ilma KM-ta / 532 207 eurot KM-ga Kestus: 8 kuud |
|
Etapp III Avalikkuse vaade, täiendused ja hooldustööd |
| Maksumus: 373 758 eurot ilma KM-ta / 448 510 eurot KM-ga Kestus: 6 kuud |
|
Kokku | Maksumus: 1 233 288 eurot ilma KM-ta, 1 479 946 eurot KM-ga Kestus: 20 kuud |
Süsteemi arendamisel on mõistlik kaasata erinevaid riigiasutusi, kellel on otsene kokkupuude tõlketeenuse osutamisega ning vajadus süsteemis arendatavate lisafunktsionaalsuste järele. Analüüsi käigus selgus, et väga aktiivsed tõlketeenuste tarbijad on sellised asutused, nagu politsei- ja piirivalveamet, prokuratuur ja erinevad ministeeriumid. Mõistlik on kaasata asutusi etapiviisiliselt. Sellega on võimalik säilitada rakendamise kavas planeeritud arendusi ning maandada riski, et soovitud lisafunktsionaalsuste arv kasvab.
I etapi raames võib kaasata järgnevaid asutusi:
- Politsei- ja Piirivalveamet. Asutus on väga aktiivne tõlketeenuse tarbija ning on huvitatud paljudest tõlkekeskkonda planeeritud funktsionaalsusest. Samuti on asutusel hästi organiseeritud olemasolev tõlkekorraldus, mis võimaldab jagada kasulikku kogemust.
- Eesti Keele Instituut. Tegeleb masintõlkemootori arendamisega ja saab palju kaasa rääkida just keeletehnoloogia ning erinevate terminibaaside liidestamise osas.
- Ministeerium (nt justiitsministeerium või rahandusministeerium). Lisaks projekti koordineerija ning ka tõlketeenuse tarbija. Omab kogemust erasektorist tõlkebüroodega suhtlemisel, vandetõlkidega ning oskab ühtlustada kõikide ministeeriumite vajadusi.
Järgmiste etappide raames võib kaasata rohkem asutusi (lisaks olemasolevatele), sest MVP peab olema juba loodud ning süsteemi ulatus on juba paigas. Süsteemi arendamisprotsessiga liitunud asutused saavad olemasolevaid nõudeid täiendada ning kaasa rääkida ülejäänud funktsionaalsuste arendamisel.
Asutused, keda võiks kaasata II ja III etapi raames: prokuratuur, maksu- ja tolliamet, statistikaamet ja erasektorist tõlkebüroo.
Samuti on oluline järgida teatud protsessi süsteemi juurutamisel uutele asutustele. Lähtuma peab vähemalt järgmistest tegevustest:
- Süsteemi lisatakse uus asutus koos kasutajate rollidega (vajadusel luuakse uusi rolle) ja kasutajatega.
- Süsteemi lisatakse asutuse peakasutaja, kes teeb vajalikud seadistused ära.
- Toimub peakasutajate koolitus (ja tõlkemälu omanikule nt).
- Seadistatakse asutuse töövood, muud vajalikud parameetrid, mis on asutusepõhised.
- Toimuvad koolitused ülejäänud kasutajatele.
- Oluline on tagada teiste asutuste peakasutajate tugi ehk asutused, kes on süsteemi juba mõnda aega kasutanud, saavad vajadusel uusi lisandunud liikmeid nõustada.