O pożyczaniu innych światów, czyli po co nam polski LLM
11.08.2023
Zapraszamy więc do lektury najnowszego artykułu o AI oczami polskich specjalistów! Kwestia, którą poddano dyskusji, dotyczy ewentualnego połączenia potencjału naukowego oraz biznesowego w celu stworzenia w pełni polskiego, otwartego i transparentnego modelu języka na dużą skalę (LLM).
W ostatnich miesiącach byliśmy świadkami wyścigu gigantów w biegu o najlepszy duży model językowy (ang. LLM). Sęk, w tym, że obecnie modele te są albo zamknięte – tak jak ChatGPT (Microsoft) czy Bard (Google) – i nie można ich ani modyfikować, ani w pełni zrozumieć czy kontrolować, albo, nawet jeśli ich źródła są publicznie dostępne – tak jak w przypadku Llama2 (Meta) – to nie obsługują języka polskiego (w tym modelu udział polskiego wynosi 0,09%, co wystarcza, by zrozumieć polecenie, ale już niekoniecznie napisać sensowną odpowiedź). Zbiory treningowe użyte do tworzenia tych modeli też nie są publicznie dostępne ani choćby jawnie opisane. Ciekawą odpowiedzią na działania big-techów i pięknym przykładem współpracy świata nauki i biznesu jest Bloom – w pełni transparentny i otwarty model (zarówno pod kątem algorytmu, jak i danych). Niestety, pozostaje znów to samo „ale”: wśród wielu języków, które obsługuje, nie ma języka polskiego. Otwarty, dostępny i całkowicie transparentny duży model językowy dla języka polskiego to zatem luka, którą należy wypełnić. I to nie rękoma jednego giganta, a wspólnie, kolektywnie, łącząc siły najlepszych ze świata nauki, biznesu i administracji publicznej.
Ostatnio zaczynają pojawiać się regulacje w obszarze m.in. generatywnej AI. 14 czerwca 2023 roku Parlament Europejski przyjął tak zwany AI ACT, będący pierwszym europejskim aktem prawnym dotyczącym sztucznej inteligencji. Jak można było przewidzieć, zawiera on elementy związane z przejrzystością modeli generatywnej sztucznej inteligencji, zwłaszcza w kontekście praw własności zestawów danych służących do ich trenowania. W związku z tym wiele firm może zacząć obawiać się wykorzystywania na skalę biznesową dużych modeli językowych ze względu na brak transparencji w zakresie danych użytych do ich uczenia.
Stąd wynika konieczność rozpoczęcia dialogu w obszarze szeroko pojmowanej sztucznej inteligencji. Kwestia, którą powinniśmy poddać dyskusji, dotyczy ewentualnego połączenia potencjału naukowego oraz biznesowego w celu stworzenia w pełni polskiego, otwartego i transparentnego modelu języka na dużą skalę (LLM). Powinien on służyć nie tylko naukowcom i przedsiębiorcom, ale także, co nie mniej ważne, polskiemu społeczeństwu, jako ostatecznemu odbiorcy innowacji wynikłych z wykorzystania takiego modelu.
Zapraszamy więc do lektury najnowszego artykułu o AI oczami polskich specjalistów!
Materiały
O pożyczaniu innych światów czyli po co nam polski LLMO_pożyczaniu_innych_światów_czyli_po_co_nam_polski_LLM_.pdf 2.01MB