W celu świadczenia usług na najwyższym poziomie stosujemy pliki cookies. Korzystanie z naszej witryny oznacza, że będą one zamieszczane w Państwa urządzeniu. W każdym momencie można dokonać zmiany ustawień Państwa przeglądarki. Zobacz politykę cookies.
Powrót

Dane z administracji otwarte na świat

Czym są dane publiczne

Jeszcze kilka lat temu zdobycie podstawowych informacji z administracji w postaci elektronicznej było trudne lub wręcz niemożliwe. Tylko z nielicznych stron rządowych mogliśmy pobrać dane źródłowe z przeprowadzanych analiz, gromadzone w systemach informatycznych czy też zagregowanych zbiorach na potrzeby zarządzania procesami w administracji. Nieśmiałe próby publikacji danych podejmowały np. Główny Urząd Statystyczny, Ministerstwo Finansów i Ministerstwo Gospodarki.

Administracja publiczna wytwarza i gromadzi ogromne ilości danych. Mogą one być fundamentem do powstania innowacyjnych dóbr, usług i produktów, które pobudzają rozwój gospodarki: tworzą nowe miejsca pracy i zachęcają do inwestycji w przemysł kreatywny. Dostęp do danych jest też podstawowym instrumentem kontroli społecznej nad działalnością państwa, zwiększa odpowiedzialność i transparentność działań administracji. Udostępnienie danych pozwala je powtórnie wykorzystać i stworzyć wartość dodaną. Wcześniej są one ukryte w meandrach serwisów ministerialnych, rozproszone, dostępne w niejednolitych formatach i standardach. Często nieaktualne, mają charakter jednorazowej publikacji, np. analiza lub badanie. Dlatego powstał jednolity standard udostępniania danych i wytycznych. Dużym krokiem był „Program otwierania danych publicznych” (uchwała Rady Ministrów z dnia 20 września 2016 r. nr 107/2016), który wyznaczył m.in. Ministra Cyfryzacji do koordynacji całości zagadnień w tym obszarze, wprowadził instytucję pełnomocników ds. otwartości i określił ramowe standardy udostępniania danych w administracji publicznej.

Czym zatem są dane publiczne? Według definicji w programie dane publiczne to liczby i pojedyncze wydarzenia lub obiekty na możliwie najniższym poziomie agregacji. Administracja publiczna jeszcze ich nie przetworzyła do postaci raportów, wykresów itp. oraz nie nadała im odpowiedniego kontekstu lub interpretacji. Przykładów jest wiele. Są to m.in. informacje o wykorzystaniu budżetu, wskaźniki statystyczne, rejestry podmiotów leczniczych i ostatnio zyskujące na popularności informacje o poziomie zanieczyszczenia powietrza na danym terenie.

Na otwartości danych zyskują też autorzy polityk, dokumentów strategicznych i projektów aktów prawnych. Częstym mankamentem ocen skutków regulacji pozostaje jednak brak odniesień do konkretnych danych czy analiz powstałych na ich podstawie. Dzięki szerokiemu dostępowi do danych to może się zmienić. Otwarte dane to też wsparcie rozwoju biznesu i start-upów, a także rozwijanie rynku pracy. Według Komisji Europejskiej rynek usług i produktów wykorzystujących otwarte dane ma wzrosnąć do 75,7 mld euro w 2020 r. Przewiduje się także, że w tym czasie liczba osób pracujących w sektorach opartych na otwartych danych wzrośnie do ok. 100 tys. Intensywny rozwój innowacji technologicznych możemy obserwować na razie za granicą. W Polsce najbardziej popularne pozostają serwisy prezentujące rozkłady jazdy czy informacje na temat partnerów biznesowych. To się jednak zmienia w miarę udostępniania coraz większych zasobów danych dostępnych w jednym miejscu.

Portal otwarte dane

Ministerstwo Cyfryzacji uruchomiło portal dane.gov.pl (wcześniej danepubliczne.gov.pl) i rozbudowuje go w ramach projektów finansowanych z POPC (Program Operacyjny Polska Cyfrowa), tj. „Otwarte dane – dostęp, standard, edukacja” oraz "Otwarte dane+". Rozwiązuje on m.in. problemy związane z rozproszeniem informacji dostępnych publicznie. Na portalu są dane publiczne z ponad 120 instytucji w różnych formatach i zgodne z przyjętymi standardami (niemal 11 tys. zasobów).

Dane na portalu, zgodnie z „Programem otwierania danych publicznych”, są:

  • dostępne – może z nich korzystać bez żadnych ograniczeń szerokie grono użytkowników: obywatele, firmy, uczelnie, instytucje w dowolnych celach
  • upublicznione w wersji źródłowej – dostępne w oryginalnej i niezmienionej formie, a nie w postaci analiz, podsumowań, skrótów czy streszczeń, dlatego możesz np. łączyć dane z różnych źródeł
  • kompletne – udostępnione w całości
  • aktualne – udostępnione na tyle szybko, że wartość tych danych jest zachowana
  • odczytywalne maszynowo – udostępnione w formatach przeznaczonych do odczytu maszynowego i formacie otwartym, np. CSV, XML, arkusz kalkulacyjny. Zazwyczaj trudne do maszynowego odczytu są formaty PDF, HTML czy pliki tekstowe, które stają się użyteczne do ponownego wykorzystywania dopiero po przełożeniu ich na jeden z formatów otwartych
  • udostępnione niedyskryminująco – dostępne dla każdego bez konieczności rejestracji, weryfikacji tożsamości przez hasło, login i bez podpisywania umów
  • dostępne bez ograniczeń prawnych – nie są przedmiotem praw autorskich, patentów, znaków towarowych lub tajemnicy handlowej i możesz je wykorzystać w dowolnych celach bez zgody na ich używanie
  • niezastrzeżone – dostępne w formacie powszechnie stosowanym, który nie jest kontrolowany przez żaden podmiot

Ochrona danych osobowych, uwarunkowania prawne lub technologiczne nie powinny być przeszkodą w otwieraniu danych. Dlatego powstały standardy otwartości danych publicznych dla administracji. Pozwalają one właściwie przygotować i udostępniać dane do ponownego wykorzystywania. Obejmują wytyczne dotyczące regulacji prawnych, bezpieczeństwa i ochrony prywatności danych, technicznych aspektów ich udostępniania oraz dostępu do baz danych przez API (Application Programming Interface).

  1. Standard API

Określa minimalne rekomendowane zalecenia dla interfejsu programistycznego aplikacji dostępu do baz danych, które przechowują dane publiczne. Stworzony, by administracja publiczna udostępniała swoje dane przez API wg jednolitego standardu. To ułatwia wykorzystanie danych publicznych, łączenie danych z różnych źródeł. Standard obejmuje m.in. architekturę usług sieciowych REST, opis składni oraz elementów URI, obsługę zdarzeń http.

2. Standard bezpieczeństwa

Zbiór zaleceń dotyczących bezpieczeństwa otwierania danych publicznych. Zapewnia odpowiedni poziomu bezpieczeństwa otwierania danych przez administrację. W kontekście udostępniania danych z zasobów publicznych (które zapewniają prywatność, a przy tym zachowują wartości informacyjne danego zbioru i potencjał do ponownego wykorzystywania) kluczową kwestią dla bezpieczeństwa jest m.in. dobór odpowiednich technik anonimizacji.
Standard obejmuje m.in.:

  • minimalne czynności dotyczące udostępniania danych do ponownego wykorzystywania
  • grupy danych podlegające nieograniczonemu ponownemu wykorzystywaniu 
  • dane podlegające anonimizacji i pseudonimizacji 
  • sposoby doboru technik

3. Standard techniczny

Wskazuje wymagania techniczne dla danych publicznych, w tym poszczególnych 5 poziomów otwartości danych, o których mowa poniżej, i formatów danych wraz z przykładami. Standard obejmuje też wymagania dotyczące formatowania określonych typów danych: adresów, dat.

4. Standard prawny

Dotyczy ram prawnych. Pozwala na powszechny i swobodny dostęp do danych i ich ponowne wykorzystywanie. Dokument prezentuje zagadnienia prawne istotne przy podejmowaniu decyzji o udostępnianiu danych w sposób otwarty, m.in. kwestie licencjonowania oraz ochrony praw autorskich. Mówi też o barierach w udostępnianiu danych publicznych w sposób otwarty, filarach otwartości danych i wzorcach otwartości.

Otwartość na odpowiednim poziomie

By uchwycić różnicę między danymi otwartymi i tymi, do których dostęp jest utrudniony lub których nie można wykorzystać, odwołujemy się do systemu 5 poziomów otwartości. Opracował go Tim Berners-Lee. Charakteryzuje się prostym oznaczeniem w postaci od 1 do 5 gwiazdek w zależności od stopnia przedstawienia danych i możliwości ich wykorzystania (w literaturze znany jako 5 Star Open Data).

Poszczególne gwiazdki oznaczają:

*       udostępnienie danych w sieci Web (w dowolnym formacie) na warunkach otwartej licencji

**      udostępnienie danych w formie ustrukturyzowanej, np. arkusz kalkulacyjny zamiast zeskanowanego obrazu tabeli

***    używanie formatów otwartych, np. CSV zamiast arkusza kalkulacyjnego

****   używanie URI do oznaczania zasobów, aby możliwe było ich wyszukiwanie

*****  łączenie danych, aby zapewnić kontekst

Każdy kolejny poziom (gwiazdka) zawiera wszystkie poprzednie.

Skala jest stosowana m.in., by oznaczyć poziom otwartości na portalu dane.gov.pl przy każdym udostępnionym zasobie. Jest też punktem odniesienia dla kryteriów oceny projektów w POPC.

Otwarte dane a informacje sektora publicznego

Otwarte dane mogą być surowcem do budowy aplikacji, serwisów czy usług. Ich pochodzenie jest ściśle związane z sektorem publicznym. Są to informacje, które nadają się do wykorzystania zgodnie ze wspomnianą wcześniej charakterystyką.

Ramy prawne do ponownego wykorzystywania wyznacza ustawa z 25 lutego 2016 r. o ponownym wykorzystywaniu informacji sektora publicznego. Według ustawy:
Informacja sektora publicznego to każda treść lub jej część, niezależnie od sposobu utrwalenia, w szczególności w postaci papierowej, elektronicznej, dźwiękowej, wizualnej lub audiowizualnej, będąca w posiadaniu podmiotów publicznych.

Ponowne wykorzystywanie informacji sektora publicznego natomiast to wykorzystywanie informacji sektora publicznego w celach komercyjnych lub niekomercyjnych, innych niż pierwotny cel, dla którego informacja została wytworzona. Mogą to zrobić osoby fizyczne, osoby prawne i jednostki organizacyjne, nieposiadające osobowości prawnej.

Otwarte dane to ponownie wykorzystane informacje pochodzące od podmiotów sektora publicznego. Są udostępnione w postaci dającej się odczytać maszynowo w odróżnieniu od innych sposobów ich utrwalania. Nie każdą informację sektora publicznego możemy udostępnić w formule otwartych danych bez dalszego przetworzenia.

Dane publiczne w POPC

Program Operacyjny Polska Cyfrowa wpisuje otwieranie danych publicznych i wykorzystanie informacji sektora publicznego jako elementy niezbędne do rozwoju nowoczesnych usług publicznych i komercyjnych, systemów informatycznych oraz bezpośrednie bodźce do rozwoju gospodarki i społeczeństwa informacyjnego. Cel szczegółowy 4 POPC to cyfrowa dostępność i użyteczność informacji sektora publicznego. Mówią o tym poddziałania:

  • 2.3.1 – „Cyfrowe udostępnienie informacji sektora publicznego ze źródeł administracyjnych i zasobów nauki”
  • 2.3.2 – „Cyfrowe udostępnienie zasobów kultury”
  • 2.4 – „Tworzenie usług i aplikacji wykorzystujących e-usługi publiczne i informacje sektora publicznego”

Priorytetowo traktujemy udostępnianie ISP w sposób otwarty, czyli za darmo. Ograniczamy bariery w ich ponownym wykorzystaniu i zapewnieniu interoperacyjności z krajowymi i zagranicznymi systemami centralnymi, które są repozytoriami danych publicznych. Udostępnianie danych w postaci otwartej przez API ujmuje jeden ze wskaźników. Natomiast podniesienie otwartości i cyfrowej dostępności danych w standardzie 5 Star Open Data (powyżej 3) jest ważnym i wysoko punktowanym kryterium oceny projektów.

 

Autor: Marcin Rogalski

 

Źródło:

 

Artykuły powiązane:

Materiały

Standard API dla udostępniania danych
{"register":{"columns":[{"header":"Pozycja","value":"136","registerId":20735334,"dictionaryValues":[],"nestedValues":[],"showInContent":false,"positionSelector":".article-area__article h2","insertMethod":"after"},{"header":"Obszar publikacji","value":"","registerId":20735334,"dictionaryValues":[{"id":"rozwiązania IT","value":"rozwiązania IT"}],"nestedValues":[],"showInContent":false,"positionSelector":".article-area__article h2","insertMethod":"after"}]}}