• logo

Streszczenie projektu

Jednym z kluczowych problemów występujących we wszystkich praktycznie obszarach działalności społecznej, państwowej i gospodarczej jest lawinowo rosnąca ilość danych dostępnych w różnego rodzaju bazach danych, repozytoriach, a przede wszystkim w olbrzymich, rozproszonych zasobach sieciowych (WWW). W Internecie dostępna jest publicznie ogromna ilość wiedzy. Ponadto istnieje wiele kolekcji zamkniętych publicznie, ale dostępnych dla odpowiednich grup użytkowników (np. korporacyjnych). Tradycyjne wyszukiwarki nie zapewniają ani efektywnego wyszukiwania informacji i wiedzy, ani tym bardziej nie dają możliwości jej zautomatyzowanego wydobywania ze źródeł tekstowych, często rozszerzonych o artefakty multimedialne. W szczególności brakuje w nich narzędzi do analizy treści dokumentów. Obecnie zaczęto już prowadzić na świecie prace nad rozszerzeniem dotychczasowego modelu działania wyszukiwarki, ale nie dotyczy to jeszcze języka polskiego. Niniejszy projekt włączy język polski w ten obszar B+R.

Wynikiem realizacji projektu będzie system analizujący treść dostępnych dokumentów elektronicznych, dokonujący ich grupowania i zdolny do wyszukania dokumentów interesujących użytkownika. W odpowiedzi na problem zgłoszony do rozwiązania przez użytkownika w postaci swobodnego opisu w języku naturalnym (z dopuszczeniem możliwości dołączenia artefaktów multimedialnych), podstawowym zadaniem systemu będzie wydobycie właściwej informacji z dokumentów źródłowych poprzez wyszukanie tych dokumentów oraz tych ich fragmentów, które są relewantne do sformułowanego problemu. Tak wygenerowane dane będą integrowane i prezentowane w połączeniu z wizualizacją struktury wyszukanych dokumentów źródłowych i wskazaniem ich relewantnych fragmentów. Niezależnie od tego, system będzie analizował i wydobywał elementy oceny emocjonalnej lub opinii wyrażanej przez autora tego dokumentu.

System będzie zorientowany na analizę treści dokumentów polskojęzycznych, ale będzie wyposażony w mechanizmy przetwarzania dwujęzycznego (polsko-angielskiego), by móc korzystać z pewnych dobrze rozwiniętych narzędzi analizy języka angielskiego przy analizie tekstu polskojęzycznego. Będzie otwarty na rozbudowę w kierunku systemu wielojęzycznego. System będzie zorientowany na dokładną analizę dokumentów z wybranych dziedzin, ale dzięki włączeniu stosownych mechanizmów adaptacji będzie zdolny analizować teksty z innych dziedzin z mniejszą dokładnością.

Projekt Adaptacyjny system wspomagający rozwiązywanie problemów w oparciu o analizę treści dostępnych źródeł elektronicznych nie jest częścią żadnego większego przedsięwzięcia. Jest samodzielnym projektem badawczym. Prace badawczo rozwojowe Konsorcjum Projektowego zostały podzielone na zadania realizowane przez zespoły Instytutu Podstaw Informatyki Polskiej Akademii Nauk oraz Instytutu Informatyki Politechniki Wrocławskiej. Każde zadanie ma swego koordynatora, należącego do zespołu odpowiedzialnego za realizację zadania. Poszczególne prace projektowe pogrupowane zostały w 13 zadań.

Od wielu lat w Polsce, silniej niż w innych krajach, występuje problem małej liczby nowych rozwiązań technicznych i technologicznych, opracowanych w publicznych jednostkach naukowych (szkołach wyższych, instytutach naukowych PAN oraz jednostkach badawczo – rozwojowych), których użyteczność konfrontowano by z popytem w warunkach rynkowych i poddawano komercjalizacji. Realizacja niniejszego projektu pozwoli na pokonanie tych trudności co w znacznym stopniu zwiększy efektywność wykorzystania wyników prac badawczych i rozwojowych oraz nakładów poniesionych na te prace.

Niniejszy projekt ma istotnie wspomóc i przyśpieszyć wprowadzanie technologii informatycznych (przetwarzania i wykorzystywania informacji tekstowych, ale także obrazowych i multimedialnych). Planowane prace badawczo-rozwojowe i zbudowany w ich efekcie system wspomagający rozwiązywanie szerokiej klasy problemów w oparciu o analizę struktury i treści dostępnych dokumentów elektronicznych będzie miał istotne znaczenie dla rozwoju społeczeństwa informacyjnego. Końcowym efektem projektu będzie opracowanie nowych technologii, liczne zastosowania (wdrożenia), oczekiwana komercjalizacja niektórych wyników oraz umowy przekazania własności intelektualnej, zgłoszenie patentowe oraz liczne publikacje i uzyskane stopnie naukowe. Jak wynika z analizy przeprowadzonej przez wnioskodawcę już dzisiaj można mówić o wielkim zapotrzebowaniu rynkowym i gospodarczym, ale także społecznym na rezultaty projektu. Skonstruowany system będzie mógł być wykorzystany: w przestrzeni publicznej jako element struktury informacyjnej (e-społeczeństwo, e-urząd); w przestrzeni komercyjnej jako składnik systemów płatnej informacji, systemów zarządzania wiedzą czy też systemów obsługi klienta; w sferze nauki jako narzędzie badawcze w dziedzinie nauk społecznych i humanistycznych.

Print Email