• logo

Zadanie 11 - Masowe zrównoleglenie procesu przetwarzania informacji opisanych w zadaniach Z1-Z10 oraz Z12

 

Tytuł zadania:  Masowe zrównoleglenie procesu przetwarzania informacji opisanych w zadaniach Z1-Z10 oraz Z12

Kierownik zadania: prof. dr hab. inż. Mieczysław Kłopotek, Instytut Podstaw Informatyki PAN

Czas realizacji: 01.01.2010 do 31.12.2013

Cel:

Wielkość współczesnych kolekcji dokumentów w porównaniu z zasobami pojedynczego komputera wymaga, aby ich przetwarzanie odbywało się w sposób zrównoleglony, rozproszony, na wielu maszynach. Algorytmy rozwiązujące sensu stricte zadania Z1-Z11 na jedną maszynę są w różnym stopniu podatne na zrównoleglenie przetwarzania (różny stopień interakcji między dokumentami, słownikami, tezaurusami itp.).

W ramach projektu zostaną opracowane i zbadane metody równoległego przetwarzania informacji w języku naturalnym, w tym: automatycznej segmentacji tekstu, znakowania morfo-syntaktycznego i semantycznego, płytkiej i głębokiej analizy syntaktycznej, ekstrakcji informacji (w tym opinii), indeksowania pojedynczych dokumentów i ich kolekcji, analizy skupień, tworzenia map dokumentów.

Od lat nieodłącznym problemem systemów wyszukujących informacje jest lawinowy przyrost liczby dokumentów. Implikuje to radykalny wzrost czasu przetwarzania, czasu wyszukiwania, wzrost liczby użytkowników i generowanych przez nich zapytań, potęgujący powyższe problemy. Implikuje to także nieadekwatność odpowiedzi.

Podejmowane próby radzenia sobie z tym problemem obejmują wysiłki tworzenia specjalizowanych systemów ekstrakcji definicji, specjalizowanych systemów filtrów rodzinnych, filtrów dla branż, grup użytkowników itp.

Kolejną komplikację stanowią nowoczesne metody analizy i prezentacji koleklcji dokumentów jak np. mapowe wyszukiwarki internetowe, które ponownie aktualnym czynią problem czasu i miejsca.

Jednym z podejść podjętych w celu osiągnięcia skalowalności systemów wyszukiwawczych jest opracowanie nowych algorytmów, promujących kontekstowość przetwarzania, i jego przyrostowość. Ten kierunek badań napotyka jednakże naturalne ograniczenia algorytmizowalności, stawiając przed alternatywą: albo masowość albo precyzja.

Zatem nieodzownym remedium na powyższe problemy staje się wykorzystanie współczesnych możliwości zrównoleglania i rozpraszania przetwarzania.

 

 

Print