Silnik wyszukiwania semantycznego i eksploracji danych dostępny dla użytkowników biznesowych
Tytuł projektu
Silnik wyszukiwania semantycznego i eksploracji danych dostępny dla użytkowników biznesowych
Nazwa Beneficjenta/Beneficjentów
Causality Prosta S. A.
Nazwa programu
Program Operacyjny Inteligentny Rozwój
Konkurs
Szybka Ścieżka
Wartość projektu
5 520 888,16 PLN
Wartość dofinansowania
4 181 246,47 PLN
Okres realizacji projektu
od 01.01.2023 r. do 31.12.2023 r.
Poznaj nasz zespół
Zespół IT
Roman Bartusiak - Dyrektor Wykonawczy - Senior ML engineer
Krzysztof Sobota - Dyrektor Wykonawczy - Senior ML engineer
Grzegorz Suszka - Senior ML engineer
Jakub Kopyto - Backend developer
Konrad Procak - Full stack developer
Mateusz Gaweł - DevOps
Zobacz efekt naszej pracy
Jaki problem rozwiązuje nasz projekt?
Współczesne organizacje i firmy stają przed wyzwaniem efektywnego zarządzania rosnącymi wolumenami różnorodnych danych, które są coraz częściej dostępne w formatach wielomodalnych – takich jak tekst, obrazy, dźwięki czy dane strukturalne. Przetwarzanie tych danych w sposób, który umożliwia ich skuteczne przeszukiwanie, analizę oraz wykorzystanie do podejmowania decyzji, często wymaga zaawansowanych narzędzi, wiedzy technicznej oraz znacznych nakładów czasu i zasobów obliczeniowych. W rezultacie, organizacje nie są w stanie w pełni wykorzystać potencjału, jaki kryje się w posiadanych danych, co ogranicza ich konkurencyjność i innowacyjność.
Problemem jest również brak dostępnych na rynku narzędzi, które w sposób kompleksowy łączyłyby możliwość automatycznego przekształcania danych wielomodalnych w jednorodne reprezentacje (np. wektory w przestrzeni wektorowej) z funkcjonalnością intuicyjnej eksploracji i przeszukiwania tych danych – i to bez konieczności angażowania ekspertów programistycznych. Obecnie wiele rozwiązań wymaga zaawansowanego kodowania lub integracji, co wyklucza ich zastosowanie przez użytkowników o niskich kompetencjach technologicznych.
Nasz projekt rozwiązuje powyższe problemy poprzez stworzenie nowoczesnej platformy, która automatyzuje proces przekształcania danych w wektorowe reprezentacje oraz udostępnia intuicyjne narzędzia do ich analizy i przeszukiwania na zasadzie podobieństwa semantycznego. Użytkownicy mogą eksplorować dane w sposób „zero code” – całkowicie bez programowania – lub za pomocą „low code” w przypadku bardziej zaawansowanych zastosowań API. Dodatkowo, platforma wspiera procesy anotacji danych poprzez wykorzystanie nowoczesnych technologii, takich jak transfer wiedzy, uczenie aktywne czy podejście self-supervision, co minimalizuje potrzebę ręcznego oznaczania danych.
Rozwiązanie to przynosi korzyści zarówno użytkownikom indywidualnym, jak i organizacjom, eliminując bariery związane z dostępem do technologii przetwarzania danych. Umożliwia oszczędność czasu, zwiększenie efektywności pracy oraz lepsze wykorzystanie posiadanych informacji niezależnie od ich formatu. Dzięki temu projekt przyczynia się do przełomu w podejściu do analizy danych wielomodalnych, ustanawiając nowe standardy w tej dziedzinie.
Kto skorzysta z wyników projektu?
Z wyników projektu skorzystają przede wszystkim firmy i organizacje, które przetwarzają różnorodne dane – zarówno wielomodalne (tekst, obrazy, dane strukturalne), jak i niestrukturalne – a jednocześnie nie posiadają dużych zasobów technologicznych lub zaawansowanej wiedzy programistycznej. Rozwiązanie jest szczególnie przydatne dla działów analitycznych, marketingowych, badawczo-rozwojowych oraz sprzedażowych, które potrzebują szybko i precyzyjnie przeszukiwać, analizować oraz wykorzystywać dane w codziennej pracy.
Platforma umożliwia także wsparcie dla start-upów, małych i średnich przedsiębiorstw, które często nie mają dostępu do drogich narzędzi AI i muszą działać w ograniczonych budżetach. Co więcej, osoby indywidualne działające w ramach organizacji, bez zaawansowanych umiejętności technicznych, są w stanie efektywnie korzystać z narzędzia dzięki jego prostocie („zero code”). Ostatecznym beneficjentem są klienci końcowi organizacji, które dzięki lepszej analizie danych będą mogły dostarczać bardziej spersonalizowane i wartościowe produkty oraz usługi.
Co było dla nas największym wyzwaniem w realizacji projektu?
Największym wyzwaniem w realizacji projektu było opracowanie wydajnych metod przekształcania danych wielomodalnych w jednorodne reprezentacje wektorowe, przy jednoczesnym zachowaniu wysokiej jakości tych reprezentacji oraz minimalizacji zasobów obliczeniowych. Kluczowym aspektem było połączenie różnych technologii, takich jak transfer wiedzy, uczenie aktywne czy podejście self-supervision, w sposób, który zapewniłby skalowalność i uniwersalność rozwiązania.
Dodatkowym utrudnieniem był krótki czas realizacji projektu, który wymagał intensywnej pracy i optymalizacji działań. Jednocześnie brak dostępu do wystarczającej liczby specjalistów IT, zdolnych do szybkiego wdrożenia tak zaawansowanego technologicznie rozwiązania w krótkim okresie, wymusił na zespole elastyczne podejście, w tym wykorzystanie automatyzacji procesów programistycznych, co pozwoliło utrzymać wysoką jakość prac. Pomimo tych trudności udało się opracować rozwiązanie odpowiadające potrzebom rynku, zachowując prostotę użytkowania i wydajność.
Nasza rada dla innych Wnioskodawców
Nasza rada dla innych Wnioskodawców to przede wszystkim dokładne zaplanowanie projektu z uwzględnieniem realnych zasobów, zarówno czasowych, jak i kadrowych. Kluczowe jest zbudowanie zespołu o zróżnicowanych kompetencjach. W naszym przypadku zespół IT zaczęliśmy budować już dwa lata przed rozpoczęciem projektu, nawiązując współpracę z różnymi programistami oraz podmiotami z rynku IT. Dzięki temu udało się zgromadzić wiedzę i doświadczenie, które były kluczowe w realizacji tak zaawansowanego przedsięwzięcia.
Przy projektach krótkoterminowych ważne jest priorytetyzowanie działań, regularne monitorowanie postępów oraz korzystanie z automatyzacji i gotowych narzędzi wspierających prace badawczo-rozwojowe. Warto inwestować w nowoczesne technologie, takie jak transfer wiedzy czy uczenie aktywne, które przyspieszają realizację zadań. Kluczowe jest także zadbanie o przejrzystą komunikację w zespole oraz współpracę z ekspertami zewnętrznymi, gdy potrzeba specjalistycznej wiedzy.