Jednolity System Antyplagiatowy
Jednolity System Antyplagiatowy. Skuteczna walka z plagiatami na uczelniach
Tytuł projektu
Przygotowanie Jednolitego Systemu Antyplagiatowego i jego wdrożenie oraz obsługa
Nazwa Beneficjenta/Beneficjentów
Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy (OPI PIB)
Nazwa programu
Program Operacyjny Wiedza Edukacja Rozwój
Konkurs
Projekt pozakonkursowy. Działanie 3.4 Zarządzanie w instytucjach szkolnictwa wyższego
Wartość projektu
11 000 000,00 zł
Wartość dofinansowania
11 000 000,00 zł
Okres realizacji projektu
1 stycznia 2017 r. – 30 czerwca 2019 r.
Poznajcie nasz zespół
Doktor Marek Kozłowski – doktorat ze sztucznej inteligencji obronił w Instytucie Informatyki Politechniki Warszawskiej. Jest kierownikiem Laboratorium Inżynierii Lingwistycznej w Ośrodku Przetwarzania Informacji – Państwowym Instytucie Badawczym, gdzie prowadzi 30-osobowy zespół badaczy i programistów zajmujący się tworzeniem oprogramowania wzbogaconego inteligentnymi metodami przetwarzania danych (m.in. Jednolity System Antyplagiatowy – JSA, chatboty, semantyczne wyszukiwarki). Pasjonuje go przetwarzanie języka naturalnego, eksploracja danych i uczenie maszynowe. Autor ponad 30 publikacji naukowych z zakresu semantycznego przetwarzania tekstów i uczenia maszynowego.
Zobacz też: https://opi.org.pl/laboratoria/laboratorium-inzynierii-lingwistycznej/
Zobacz efekt naszej pracy
Jaki problem rozwiązuje nasz projekt?
Od stycznia 2019 r. polskie uczelnie i instytuty są zobowiązane do sprawdzania prac dyplomowych (licencjackich, inżynierskich, magisterskich i doktorskich) pod kątem plagiatu. Wykorzystują do tego Jednolity System Antyplagiatowy (JSA), stworzony w Ośrodku Przetwarzania Informacji – Państwowym Instytucie Badawczym w zespole dr. Marka Kozłowskiego. To jedyny bezpłatny system antyplagiatowy w Polsce.
Do momentu powstania i wdrożenia JSA uczelnie w Polsce sporadycznie wykorzystywały systemy antyplagiatowe (w 2016 r. pod kątem plagiatu sprawdzono 30-40 proc. prac). System powstał na zlecenie Ministerstwa Nauki i Szkolnictwa Wyższego.
„Działanie JSA z grubsza wygląda tak: dzielimy tekst na krótsze fragmenty: pięcio-, dziesięcio- albo dwudziestozdaniowe, tak zwane kęsy, a potem szukamy podobieństw między nimi a fragmentami o analogicznej długości, które mamy już w bazie danych. Jest z czym porównywać, bo takich mikrodokumentów zebraliśmy już ponad 10 miliardów” – wyjaśnia dr Marek Kozłowski, szef Laboratorium Inżynierii Językowej OPI PIB. „Te miliardy kęsów pochodzą z dziesięciu wielkich baz danych, m.in. z Ogólnopolskiego Repozytorium Prac Dyplomowych (ponad 3 mln), bazy NEKST (900 mln dokumentów z polskiego internetu), sześciu wersji językowych Wikipedii (w tym polskiej), baz aktów prawnych czy aktualnie zbieranych artykułów OpenAccess. Systemu nie da się oszukać, np. zmieniając szyk słów czy zastępując jedne słowa innymi. JSA, rozbijając tekst na poszczególne słowa, tworzy z nich bowiem nieuporządkowane kolekcje elementów. I dopiero takie zbiory są porównywane z tekstami źródłowymi”.
Innowacyjność JSA polega na:
- skali systemu – obejmuje cały kraj (wszystkie uczelnie, instytuty w Polsce, tzn. wszystkie jednostki kształcące na poziomie licencjackim, inżynierskim, magisterskim czy doktorskim),
- zakresie danych, na jakich pracuje system (NEKST – największy do tej pory zebrany korpus stron internetowych z polskich domen, ORPPD – największy zbiór prac dyplomowych, artykuły OpenAccess, akty prawne z polskiego systemu legislacyjnego czy wielojęzycznych zbiorów Wikipedii),
- wykorzystaniu metod sztucznej inteligencji do walki z plagiatami,
- przeprowadzeniu dwutorowego modelu wdrożenia systemu w skali całego kraju – UI vs API (czyli można używać ekranów systemu JSA bezpośrednio w przeglądarce albo używać JSA pośrednio przez systemy uczelniane zintegrowane z JSA),
- przeprowadzeniu setek szkoleń po Polsce – co jest wydarzeniem bez precedensu.
Podstawowe informacje o Jednolitym Systemie Antyplagiatowym dostępne są na stronach:
https://jsa.opi.org.pl/centrum-pomocy/o-jsa/
https://jsa.opi.org.pl/centrum-pomocy/wp-content/uploads/2019/09/2019-09-20_12h04_26-1.png
Kto korzysta/skorzysta z wyników projektu?
Bezpośrednimi użytkownikami systemu są promotorzy badań i pracownicy dydaktyczni wszystkich uczelni w Polsce. Jak dodaje dr Marek Kozłowski, z efektów projektów korzysta de facto „całe środowiska akademickie, bo wzrasta świadomość, czym jest badanie antyplagiatowe. Wielu autorów odstępuje od tego procederu w obawie przed wykryciem, rośnie też wiedza o rozkładzie tematycznym prac dyplomowych i podobieństwie między pracami”.
Co było dla nas największym wyzwaniem w projekcie?
„Największym wyzwaniem była skala przedsięwzięcia. Z systemu korzysta cały ekosystem edukacji wyższej, kilkaset tysięcy aktywnych użytkowników. Oznacza to olbrzymie repozytoria danych do porównywania i miliardy operacji w celu wykonania weryfikacji potoku prac bronionych co roku w Polsce” – mówi dr Marek Kozłowski.