• logo

 

Tytuł zadania: Mechanizm semantycznego indeksowania wielkich kolekcji źródeł elektronicznych

Kierownik zadania: prof. dr hab. inż. Mieczysław Kłopotek, Instytut Podstaw Informatyki PAN

Czas realizacji: 01.01.2010 do 31.12.2013

Cel:

 

Fundamentalne znaczenie dla użytkownika ma stworzenie jednolitego systemu zarządzania treścią, pozwalającego na wspólne przeszukiwanie i analizowanie informacji strukturalnej (gdzie wspomniane przeszukiwanie realizowane jest w różnorodnych systemach baz danych) oraz kolekcji dokumentów nieustrukturalizowanych (gdzie wyszukiwanie odbywa się z wykorzystaniem wyszukiwarek inter- i intranetowych). Przy tym nie wystarczy dziś zaprezentować wyszukane dokumenty jako takie, lecz trudno obejść się bez uwzględnienia jakże ważnych asocjacji między nimi.

Integracja dokumentów w różnych formach – strukturalnych i niestrukturalnych – wymaga nowego podejścia do koncepcji baz danych. Dominujący obecnie paradygmat relacyjny nakłada nadmierne ograniczenia na postać zawartości dokumentów, nie pozwalając np. na elastyczną reprezentację naturalnych informacji o więzach między dokumentami (linkach).

Dlatego też w ramach niniejszego zadania zostanie wypracowana efektywna architektura gromadzenia dokumentów i strukturalnego indeksowania, obejmującego prócz tradycyjnego indeksu zorientowanego na termy, m.in. indeksowanie jednostek wieloczłonowych (por. zadanie Z3), częściowych struktur składniowych, sensów słów oraz odwołań do jednostek identyfikacyjnych, czy ich atrybutów, która będzie jednocześnie platformą do implementacji systemów wymienionych wcześniej.

 

 

Print