• logo

Zadanie 3 - Opracowanie mechanizmów pogłębionego przetwarzania składniowo-semantycznego

Tytuł zadania:  Opracowanie mechanizmów pogłębionego przetwarzania składniowo-semantycznego

Kierownik zadania: dr Elżbieta Hajnicz, Instytut Podstaw Informatyki PAN

Czas realizacji: 01.01.2010 do 31.12.2013

Cel:

Celem zadania jest opracowanie i implementacja metod wysokopoziomowego syntaktycznego i semantycznego przetwarzania tekstów, tak ogólnych, jak i dziedzinowych. Przetwarzanie syntaktyczne sprowadzać się ma głównie do przetwarzania powierzchniowego oraz w uzasadnionym zakresie do głębokiej analizy syntaktycznej. Przetwarzanie semantyczne polegać ma na wskazaniu wysokopoziomowych zależności semantycznych pomiędzy pojęciami występującymi w tekście. Analiza na obu poziomach ma wykorzystywać słowniki jednostek wieloczłonowych oraz subkategoryzacji.

Sprawna analiza syntaktyczna, zwłaszcza głęboka, nie jest możliwa bez słownika walencji (subkategoryzacji) syntaktycznej. Z kolei analiza semantyczna wymaga informacji o związkach semantycznych pomiędzy argumentami, a słownik semantyczny stanowi źródło takich związków. Zastosowanie słownika jednostek wieloczłonowych usprawni działanie analizatorów i poprawi uzyskiwane wyniki. Dłuższe teksty i większe repozytoria tekstowe będą przetwarzane w sposób powierzchniowy. Fragmenty uznane na tej podstawie za istotne (np. zapytania do systemu) będą w miarę potrzeby przetwarzane w sposób głęboki.

Podstawową cechą systemu opracowywanego w ramach niniejszego projektu będzie jego elastyczność i zdolność dopasowywania do nowych dziedzin zastosowań. Zmiana dziedziny wymaga nie tylko zmiany ontologii, ale i syntaktyczno-semantycznego słownika subkategoryzacji. W celu zwiększenia adaptowalności systemu niezbędna jest możliwość automatycznego lub półautomatycznego tworzenia tych zasobów. Będzie to skutkować samoistnym dostosowaniem się analizatorów syntaktycznych i semantycznych (z możliwością posłużenia się automatycznie rozbudowywaną gramatyką, por. podzadanie Z4.3).

Print