Zapewnienie efektywnego dostępu do danych referencyjnych
Identyfikacja referencyjnych rejestrów publicznych i publikacja informacji o danych referencyjnych
Pierwszą i najważniejszą potrzebą wszystkich obecnych i potencjalnych użytkowników danych jest dostęp (łatwy, z jednego, znanego wszystkim, zaufanego miejsca) do następujących informacji:
- Jakie dane gromadzi administracja publiczna, w jakich rejestrach publicznych, które z tych rejestrów są rejestrami referencyjnymi dla tych danych?
- W jaki sposób i na jakich zasadach można te dane pobierać czy też sprawdzać poprawność własnych danych?
Aktualnie brak jest takiej kompletnej informacji, w jednym miejscu, „firmowanej” przez państwo.
Kancelaria Prezesa Rady Ministrów, w ramach Architektury Informacyjnej Państwa, identyfikuje, klasyfikuje oraz opisuje w jednolity sposób:
- zasoby informacyjne (zbiory danych) państwa, w szczególności te rejestry publiczne, które są - lub powinny być - źródłem danych referencyjnych dla innych systemów, rejestrów, e-usług czy procesów administracyjnych i gospodarczych,
- przechowywane w nich obiekty danych - w szczególności te najbardziej potrzebne czy najczęściej wykorzystywane w realizacji zadań publicznych drogą elektroniczną.
W ramach prac AIP zidentyfikowano do chwili obecnej ponad 1000 rejestrów publicznych i innych zasobów informacyjnych państwa. 150 z nich zaklasyfikowano jako kluczowe z punktu widzenia interoperacyjności. Lista tych rejestrów - z ogólnym wskazaniem, które z nich są referencyjne we wskazanym zakresie danych - została opublikowana na rządowym Portalu Interoperacyjności i Architektury Informacyjnej Państwa na stronie: Lista kluczowych rejestrów publicznych.
Dla interoperacyjności potrzebna jest jednak nie tylko wiedza, gdzie i jakie zasoby informacyjne posiada polska administracja publiczna. Potrzebne jest wspólne rozumienie danych. Obiekty danych reprezentujące te same obiekty rzeczywiste powinny mieć to samo znaczenie: taką samą i tak samo rozumianą definicję, atrybuty, powiązania z innymi (takimi samymi) obiektami, te same, standardowe słowniki klasyfikacyjne, formaty zapisu i zakres wartości. A jest z tym aktualnie jest bardzo duży problem. Przykładowo - istnieje kilka różnych definicji (nawet w ustawach) podmiotu publicznego, gospodarstwa rolnego czy rolnika.
Sytuacja ze słownikami danych jest jeszcze gorsza. Jeśli niemożliwe (lub niepraktyczne) jest stosowanie jednej definicji czy słownika, muszą być określone różnice w stosunku do jednej powszechnie stosowanej definicji, słownika, czy formatu danych i mapowanie (udokumentowanie) tych różnic.
Należy jednak podkreślić, że taki standardowy, referencyjny opis (wysokopoziomowy model) najważniejszych danych państwa jest sukcesywnie tworzony, konsultowany i publikowany w ramach prac AIP. Powinien stanowić wspólny punkt odniesienia dla budowy rejestrów publicznych i korzystania z ich danych, w szczególności do wymiany danych pomiędzy różnymi systemami teleinformatycznymi.
Znaczenie efektywnego dostępu do danych
Administracja publiczna prowadzi obecnie ponad 1000 rejestrów publicznych. Zasoby te stanowią wielki potencjał w zakresie usprawniania sposobu realizacji zadań publicznych w administracji. Pozwalają zarówno na dostarczanie coraz lepszych i kompleksowych elektronicznych usług publicznych, jak i umożliwiają stosowanie narzędzi automatyzujących i usprawniających zadania realizowane przez pracowników podmiotów publicznych. Aby w pełni wykorzystać potencjał drzemiący w danych przetwarzanych w administracji publicznej kluczowe jest zapewnienie efektywnego dostępu do tych danych.
Przez efektywny dostęp do danych administracji publicznej należy rozumieć dostęp:
- nieskomplikowany – jak najbardziej uproszczony w zakresie organizacyjnym i technicznym,
- powszechny – wszystkie podmioty potrzebujące dane do realizacji swoich zadań ustawowych powinny mieć dostęp do tych danych,
- dostosowany – zakres i sposób udostępniania danych jest dostosowany do potrzeb konsumenta,
- nowoczesny – wspierających wykorzystanie nowych technologii w procesie przetwarzania danych,
- wydajny – pozwalający na obsłużenie całego wolumenu danych potrzebnego do sprawnego działa administracji,
- optymalny kosztowo – wykorzystujący rozwiązania horyzontalne i sprawdzone narzędzia, pozwalające obniżyć koszty wdrożenia i utrzymania,
- bezpieczny – zapewniający poufność (dostęp tylko dla podmiotów i/lub osób które zostały uprawnione), integralność (brak możliwości nieautoryzowanego wytworzenia, modyfikacji i usunięcia), dostępność (dostęp do uprawnionego zakresu informacyjnego z żądanym czasie) informacji,
- rozliczalny – zapewniający, że dane były przetwarzane zgodnie z prawem,
- ustandaryzowany – realizowany za pomocą tych samych lub kompatybilnych rozwiązań zgodnych z określonymi standardami.
Stan aktualny
Wiele podmiotów publicznych zapewnia dostęp do danych przetwarzanych w rejestrach publicznych prowadzonych przez te podmioty. W większości przypadków dostęp do tych rejestrów odbywa się za pośrednictwem usług sieciowych, który aktualnie jest najbardziej efektywnym sposobem zapewniania dostępu do danych.
Usługa sieciowa jest to usługa oferowana przez system teleinformatyczny innemu systemowi teleinformatycznemu, gdzie systemy te komunikują się przez sieć (zazwyczaj przez internet). W takim rozumieniu usługi są rozumiane dosyć szeroko, jako funkcjonalność przekazywania ustrukturyzowanych danych (tak, aby mogły być interpretowane bezpośrednio i jawnie przez systemy konsumentów usług) za pośrednictwem różnych protokołów i innych rozwiązań, w tym:
- udostępnianie usług API on-line, - udostępnienia danych przez różne mechanizmy składowania danych (serwery http, ftp, dedykowane rozwiązania chmurowe), - publikacja informacji o zdarzeniach dotyczących danych. |
Niemniej podmioty publiczne potrzebujące dostępu do danych przetwarzanych w rejestrach publicznych za pośrednictwem usług sieciowych napotykają na wiele barier, które w znacznym stopniu utrudniają opracowanie optymalnych rozwiązań do realizacji zadań publicznych - a nierzadko to uniemożliwiają.
Podstawowe problemy związane z dostępem do danych w administracji
Brak informacji o dostępnych zasobach
Brak jest jednoznacznej bazy danych o wszystkich zasobach informacyjnych państwa. Podmioty publiczne mają trudność w zidentyfikowaniu zasobów, z których mogą obecnie skorzystać. Funkcjonują już wprawdzie rozwiązania, które katalogują informację o zbiorach danych przetwarzanych w państwie.
Rozwiązania, które katalogują informację o zbiorach danych przetwarzanych w Państwie, to m.in.:
- System Inwentaryzacji Systemów Teleinformatycznych – SIST, - Repozytorium Standardów Informacyjnych – RSI, - Repozytorium Architektury Informacyjnej Państwa – Repozytorium AIP (brak dostępu on-line) Rozwiązania te nie są jednak przygotowane pod kątem szerokiego udostępniania informacji. |
Gestorzy podmiotów z założenia nie zapewniają dostępu do całości zbiorów, a tylko do ich części za pośrednictwem usług sieciowych. Brak jest jednego miejsca, w którym podmioty publiczne mogą uzyskać informację o już dostępnych usługach sieciowych zapewniających dostęp do danych, z których mogli by skorzystać.
Problemy organizacyjne
Podmioty publiczne są zobowiązane do udostępniania danych z rejestrów publicznych innym podmiotom na warunkach, w sposób, w zakresie i terminie określonym w przepisach, na podstawie których jest prowadzony dany rejestr publiczny (podstawa prawna: Rozporządzenie Rady Ministrów w sprawie sposobu, zakresu i trybu udostępniania danych zgromadzonych w rejestrze publicznym, wydane na podstawie art. 15 ust. 3 ustawy z dnia 17 lutego 2005 r. o informatyzacji działalności podmiotów realizujących zadania publiczne (Dz.U. z 2017 r. poz. 570)).
Brak jest jednak standardów określających, jak powinny przebiegać procedury uzyskiwania dostępu do rejestrów publicznych. Poszczególni gestorzy udostępniający dane z rejestrów wielokrotnie sami muszą opracowywać standardy i narzędzia wspierające procesy wnioskowania, zarządzania i kontroli dostępu do ich rejestrów. Podmioty uzyskujące dostęp do rejestrów muszą w związku z tym przechodzić różne procedury, które nie zawsze są wystarczająco precyzyjnie określone. Brakuje opracowanych jednoznacznych procedur oraz narzędzi teleinformatycznych do obsługi wnioskowania o dostęp do danych, z których korzystali by zarówno konsumenci, jak i gestorzy rejestrów publicznych.
Problemy techniczne
Analogiczne problemy można zidentyfikować na poziomie technicznym dostępu do danych zgromadzonych w rejestrach państwowych. Zazwyczaj dostęp do danych zapewniany jest za pomocą usług sieciowych. Pomimo, iż najczęściej usługi te implementują ogólnie przyjęte standardy, to jednak mnogość tych standardów powoduje, że każda integracja z rejestrem publicznym stanowi wyzwanie dla konsumentów tych usług.
Dodatkowo najczęściej stosowaną metodą komunikacji pomiędzy konsumentem a rejestrem publicznym jest synchroniczne udzielanie odpowiedzi przez rejestr na zapytanie konsumentów. Dla wielu rozwiązań nie jest to optymalne rozwiązywanie przekazywania informacji w administracji.