• logo

Wykaz produktów powstałych w trakcie realizacji projektu

  1. Konstrukcja podstawowych, brakujących do tej pory zasobów i narzędzi językowych – zadania Z1-Z4 projektu (zadanie Z4 dotyczyło konstrukcji podstawowych zasobów dwujęzycznych dla pary język polski – języka angielski)
    • Toki - moduł podziału tekstu na słowa i zdania
    • MACA - analizator morfologiczny
    • WMBT - tager morfosyntaktyczny języka polskiego
    • LexCSD – system do ujednoznaczniania znaczeń słów w oparciu o metody nienadzorowane
    • Spejd - płytki parser i dezambiguator
    • Świgra — parser i gramatyka języka polskiego oparta na gramatykach metamorficznych
    • Składnica frazowa 0.6 — bank składnikowych drzew składniowych
    • Moduł ujednoznaczniania statystycznego drzew składniowych
    • Składnica semantyczna
    • Gramatyka POLFIE
    • Wielojęzyczna ontologia nazw własnych PROLEXBASE
    • Środowisko leksykograficzne Toposław
    • Słownik Elektroniczny Jednostek Frazeologicznych SEJF
    • Słownik wydźwięku
    • SuperMatrix – wersja dostosowana do obliczeń zrównoleglonych
    • Słowosieć 2.0 - wordnet języka polskiego, wielka leksykalno-semantyczna baza danych
    • WordnetLoom 1.0 – wizualny, sieciowy edytor wordnetu
    • WordnetWeaver – system do półautomatycznego rozszerzania wordnetu
    • Rzutowanie Słowosieci na Princeton WordNet
  2. Systemy wydobywania informacji z tekstu, w tym informacji powiązanych z postawionym problemem – zadania: Z5-Z8
    • Inforex - internetowy system do anotacji korpusów
    • Specjalistyczne korpusy polskich tekstów
    • Liner – narzędzie do rozpoznawania i znakowania nazw własnych w tekście
    • Serel – system do konstrukcji bazy faktów z plików tekstowych
    • Borsuk - system odpowiadający na pytania zadane w języku naturalnym
  3. Jednolity system zarządzania treścią oraz dostępu do treści w masowych kolekcjach dokumentów inter- i intra-netowych (w tym konstrukcja architektury systemu) – zadania: Z9-Z11
    W ramach tych zadań powstała semantyczna polskojęzyczna wyszukiwarka NEKST.
      Wybrane funkcjonalności wyszukiwarki:
    • Kategoryzacja dokumentów internetowych (kategoryzator)
    • System wysokowydajnych pająków internetowych
    • Zasób ontologii - bazy faktów
    • System wydajnego indeksowania dokumentów tekstowych
    • Ekstrakcja informacji z danych częściowo ustrukturyzowanych
    • System ekstrakcji bazy faktów z dokumentów tekstowych
    • System ekstrakcji taksonomii (relacji IS-A) z dokumentów tekstowych (taksonomizator)
    • System odpowiadania na pytania na podstawie bazy faktów oraz taksonomii
    • Analiza wydźwięku emocjonalnego w oparciu o słownik kolokacji przymiotnikowych
  4. Wydobywanie informacji z wybranych typów artefaktów multimedialnych oraz wykorzystanie wyników interpretacji artefaktów multimedialnych w analizie treści danych tekstowych – zadanie Z12
    • System do automatycznej segmentacji dokumentów traktowanych jak obrazy
    • Moduł ekstrakcji tekstów z obrazów o charakterze wektorowym
    • Moduł analizy strukturalnej diagramów i schematów
    • PATSI+ – uogólniona metoda anotacji obrazów
    • Moduł Threshold Finder dla metody PATSI+
    • Wyszukiwarka Zabytków Dolnego Śląska
  5. System wspomagający rozwiązywanie problemów w oparciu o analizę treści dostępnych źródeł elektronicznych – zadanie Z13
    • Korpus pytań i opisów problemów
    • Korpus „Czywiesz“ 2.0 – duży anotowany korpus pytań i odpowiedzi
    • Annotator - narzędzie wspierające pracę nad oznaczaniem korpusu pytań i odpowiedzi
    • Semantic Matcher – moduł do semantycznej klasyfikacji pytań i fragmentów tekstu
    • System NEKST – system odpowiadania na pytania formułowane w postaci ilustrowanych opisów

Print Email