20.09.2018 09:06
Elering lõi võimaluse kasutada anonüümseks muudetud elektritarbimise andmebaasi
Elering on loonud elektritarbimise andmelao baasilt agregeeritud andmestiku, milles on andmekogumikuna iga Eesti postiindeksi kohta väiketarbijate tarbimise summa tunnise resolutsiooniga. Selline andmestik on kasulik ettevõtetele ja ülikoolidele energiasüsteemi modelleerimise eesmärgil. Samuti võimaldab Elering andmestiku loomisega turuosalistel geograafiliste piirkondade kaupa saada statistilisi andmeid elektritarbimise kohta.
Eleringi jaoks on oluline avalikku teenust osutades kogutud andmete taaskasutamise võimaluste loomine, et turuosalised saaksid nende andmete pinnalt luua uusi ja innovaatilisi digilahendusi. Kuna elektritarbimise andmed on kogutud isikustatud andmetena, on Elering taaskasutamise võimaldamiseks loonud elektritarbimise agregeeritud andmebaasi ehk muutnud elektritarbimise andmed anonüümseks, mis ei võimalda andmestikku tagasi isikuandmeteks muuta.
Anonüümne andmebaas on loodud järgmiste tegevuste ja põhimõtetega:
- agregeeritud on väiketarbijate tarbimisandmed postiindeksi kaupa ehk siis andmestikus ei ole ühegi konkreetse üksiktarbija andmeid;
- eemaldatud on postiindeksid, milles on alla 10 mõõtepunkti;
- üle 10 mõõtepunktiga postiindeksite seas viidi läbi ühe representatiivse nädala tarbimise graafiku visuaalne inspektsioon. Selle käigus on eemaldatud postiindeksid, mille tarbimise profiilis on ebatavalisi kõikumisi:
- nädalavahetuseti tunduvalt madalam tarbimine kui nädala sees, mis võib viidata, et postiindeksi all on äriettevõte;
- ebatavaliselt kõrged kõikumised tarbimises, mis võivad viidata seadme ulatuslikule sisse- või väljalülitamisele.
Eestis on kokku ligi 5000 postiindeksit. Kirjeldatud meetmete rakendamise tulemusena eemaldati andmebaasist kokku ligi 1000 postiindeksi andmed. Andmestik näeb välja järgnev:
Aeg |
Postiindeks |
Mõõtepunktide arv |
Tarbitud (W) |
---|---|---|---|
01/01/2017 00:00 |
10111 |
246 |
1906783 |
01/01/2017 00:00 |
10112 |
307 |
360570 |
01/01/2017 00:00 |
10113 |
938 |
319974 |
01/01/2017 00:00 |
10114 |
566 |
334790 |
01/01/2017 00:00 |
10115 |
680 |
356554 |
… |
… |
… |
… |
… |
… |
… |
… |
31/12/2017 23:00 |
94766 |
28 |
14595 |
Andmestikus on kokku ca 35 miljonit rida – aasta 2017 iga tunni kohta vastava tunni tarbimine ning mõõtepunktide (tarbijate) arv vastavas postiindeksis. Postiindekseid on ca 4000. Kokku pakitult on tabeli maht alla 400 MB.
Turuosalistel on võimalik osta kirjeldatud andmebaasist ühe postiindeksi ühe aasta andmed ühe euro eest või kogu ühe aasta andmed ligikaudu 4000 euro eest. Huvi korral palume pöörduda Georg Rute poole, georg.rute@elering.ee.
Anonümiseeritud andmebaasi loomine on üks Eleringi tegevustest, et muuta Eesti tarbija andmed kättesaadavaks nii tarbijale endale kui ka võimaldada nende andmete pinnalt arendada innovaatilisi teenuseid ja tooteid. Eelnevalt on tarbijatel alates 2017. aasta septembrist võimalik turvaliselt jagada isikustatud mõõteandmeid läbi Estfeedi platvormi. Käesolev anonümiseeritud andmebaas täiendab Eleringi platvormi Estfeed ka teenuste ja toodete loojate vaates, võimaldades andmestiku pinnalt statistilisi analüüse ja modelleerimist.