• logo

Zadanie 13 - sprawozdanie 07-12.2013

Zadanie nr 13

Tytuł: Inteligentny system wspomagający rozwiązywanie problemów w oparciu o heterogeniczną analizę treści dostępnych źródeł elektronicznych

Streszczenie raportu z okresu od 01.07.2013 do 31.12.2013

Sprawozdanie przedstawia postęp prac nad realizacją zadania 13. projektu „NEKST”. Celem zadanie jest konstrukcja systemu integrującego wybrane aplikacje zbudowane w projekcie NEKST w system wspomagający użytkownika w rozwiązywaniu problemów poprzez wyszukiwanie i wydobywanie informacji z tekstów. Obecny etap prac obejmował okres lipiec–grudzień 2013. W rozpatrywanym okresie realizowano prace związane z zaprojektowaniem interaktywnego systemu formułowania opisów problemów oraz wybranymi aspektami wykorzystania kontekstu z opisów problemu do poprawy udzielania odpowiedzi na pytania zawarte w opisie. Opracowana została koncepcja systemu NEKST, który pobiera od użytkownika tekstowy opis problemu, następnie dokonuje jego analizy i po wydzieleniu pytań i opisów kontekstowych (czyli fragmentów tekstów) uruchamia inne systemy zbudowane w ramach projektu NEKST do dostarczenia użytkownikowi informacji pomocnych w rozwiązaniu problemu. Do integracji w ramach systemu NEKST wybrane zostały: system odpowiadania na pytania w języku naturalnym o nazwie Borsuk (zbudowanym w ramach zadania 8), wyszukiwarka NEKST (zadania 9-11), ogólny system wydobywania informacji Serel (zadanie 5) oraz wyszukiwarka obrazów (zadanie 12). Projekt interfejsu użytkownika przewiduje wyświetlenie odpowiedzi na poszczególne pytania składowe w osobnych, przełączanych zakładkach oraz dynamiczny układ paneli z odpowiedziami z poszczególnych systemów składowych. Jako pierwsza będzie prezentowana odpowiedź z najwyższą wagą pewności (przyjęto założenie, że systemy składowe mogą ocenić dopasowanie odpowiedzi). Obrazy wprowadzone przez użytkownika jako uzupełnienie opisu problemu, będą wykorzystywane do wyszukiwania obrazów podobnych. Koncepcja implementacji przewiduje komunikację z systemami składowymi poprzez usługi sieciowe. Dla ustalenia strategii łączenia poszczególnych systemów składowych bardzo istotna była ich ocena. W celu lepszej oceny systemu Borsuk korpus pytań i odpowiedzi Czywiesz został rozszerzony o lepsza anotacje odpowiedzi do pytań. Podczas ręcznych testów oznaczono wszystkie poprawne odpowiedzi występujące na listach kilkudziesięciu potencjalnych odpowiedzi zwróconych przez system. Opracowano procedurę anotacji i środowisko do jej przeprowadzenia. Wykonano anotację pierwszej wersji korpusu Czywiesz.

W ramach prac nad mechanizmem wykorzystania kontekstu pytania do poprawy jakości udzielania odpowiedzi, przeprowadzono testy dwóch algorytmów: opartego na częstości wystąpień termów oraz opartego na reprezentacji pytania i dokumentu rozszerzonych o lematy powiązane semantycznie pobrane z wordnetu. Nie uzyskano jeszcze poprawy działania w stosunku do braku wykorzystania kontekstu, zaproponowano modyfikacje algorytmu i dalszy proces testowania.

Print