• logo

Narzędzie EKsploatacji Semantycznej Tekstów - NEKST

NEKST to pierwsza w Polsce i największa dotychczas semantyczna wyszukiwarka internetowa, która powstała w ramach Programu Operacyjnego Innowacyjna Gospodarka POIG.01.01.02-14-013/09 pt. „Adaptacyjny system wspomagający rozwiązywanie problemów w oparciu o analizę treści dostępnych źródeł elektronicznych”. [Finansowanie: 14,9 mln zł, ze środków Europejskiego Funduszu Rozwoju Regionalnego: 12,7 mln zł]

NEKST to skrót od: Narzędzia EKsploracji Semantycznej Tekstów

Wyszukiwarka Nekst oferuje klasyczną metodę zapytań o dokumenty w postaci ciągu słów, fraz (ujętych w cudzysłowy), słów połączonych operatorami AND, OR, z możliwością budowy złożonych wyrażeń nawiasowych.

Poza zapytaniami o dokumenty istotną funkcjonalnością wyszukiwarki jest zdolność odpowiedzi na zapytania o fakty. Zapytanie takie dotyczy nie tyle dokumentu co frazy o zidentyfikowanej strukturze gramatycznej. Ta struktura gramatyczna to: podmiot - orzeczenie - dopełnienie. Przy tym podmiot może oznaczać całą klasę (grupę) obiektów (jak mówimy, instancji tej klasy). Na przykład zamiast zadać pytanie „Kto napisał Potop?” możemy zapytać o fakt: [CLASS{pisarz}] [napisał] [potop], w którym podmiotem jest właśnie klasa „pisarz”.

Użytkownik może także zadać pytanie w języku naturalnym. Przykładem dobrze ilustrującym zasadę działania tego modułu może być pytanie „W jakim państwie znajduje się Statua Wolności?”. Jeżeli chcielibyśmy udzielić odpowiedzi jednym zdaniem, ale bez wykorzystania elementów analizy semantycznej, to okaże się, że trudno jest znaleźć takie zdanie, które zwierałoby słowa „państwo”, „znajduje się statua wolności” oraz „USA”. Jedyne co można zrobić to znaleźć najlepiej dopasowany dokument i zmusić użytkownika do samodzielnego poszukania w nim odpowiedzi. Nasze algorytmy będą w stanie rozpoznać, że słowo „USA” odwołuje się do pojęcia „państwo”, dzięki czemu będzie możliwe zaprezentowanie gotowej odpowiedzi w postaci zdania np. „Statua Wolności znajduje się w Nowym Jorku w USA.”.

Więcej informacji o sposobie korzystania z wyszukiwarki można znaleźć na jej stronie WWW w zakładce Nekst Wiki.

Podsumowując: Jedną z podstawowych cech wyszukiwarki semantycznej jest zdolność poprawnej ekstrakcji relacji klasa-instancja (obiekt z klasy), relacji zachodzących pomiędzy instancjami oraz wnioskowanie na podstawie takiej wiedzy.

Na oprogramowanie wyszukiwarki składa się: system pająków internetowych pozyskujących dokumenty z sieci; system semantycznego indeksowania dokumentów; system odpowiedzi na zapytania. Każdy z tych systemów to wiele, a w sumie kilkadziesiąt, modułów (np. moduł indeksera, który m.in. zamienia dokumenty na ich specjalną reprezentację; moduł analizatora, który dokonuje wielopoziomowego grupowania dokumentów oraz opisuje pierwotne dokumenty i wygenerowane skupienia dokumentów dodatkowymi atrybutami).

Moduły te, we współdziałaniu bądź osobno, są w stanie dostarczyć funkcji użytkowych, przydatnych dla różnorakich zastosowań. Na przykład moduły wyszukiwarki NEKST będą wykorzystane w Otwartym Systemie Antyplagiatowym Międzyuniwersyteckiego Centrum Informatyzacji.