• logo

Wykaz produktów powstałych w trakcie realizacji projektu

 1. Konstrukcja podstawowych, brakujących do tej pory zasobów i narzędzi językowych – zadania Z1-Z4 projektu (zadanie Z4 dotyczyło konstrukcji podstawowych zasobów dwujęzycznych dla pary język polski – języka angielski)
  • Toki - moduł podziału tekstu na słowa i zdania
  • MACA - analizator morfologiczny
  • WMBT - tager morfosyntaktyczny języka polskiego
  • LexCSD – system do ujednoznaczniania znaczeń słów w oparciu o metody nienadzorowane
  • Spejd - płytki parser i dezambiguator
  • Świgra — parser i gramatyka języka polskiego oparta na gramatykach metamorficznych
  • Składnica frazowa 0.6 — bank składnikowych drzew składniowych
  • Moduł ujednoznaczniania statystycznego drzew składniowych
  • Składnica semantyczna
  • Gramatyka POLFIE
  • Wielojęzyczna ontologia nazw własnych PROLEXBASE
  • Środowisko leksykograficzne Toposław
  • Słownik Elektroniczny Jednostek Frazeologicznych SEJF
  • Słownik wydźwięku
  • SuperMatrix – wersja dostosowana do obliczeń zrównoleglonych
  • Słowosieć 2.0 - wordnet języka polskiego, wielka leksykalno-semantyczna baza danych
  • WordnetLoom 1.0 – wizualny, sieciowy edytor wordnetu
  • WordnetWeaver – system do półautomatycznego rozszerzania wordnetu
  • Rzutowanie Słowosieci na Princeton WordNet
 2. Systemy wydobywania informacji z tekstu, w tym informacji powiązanych z postawionym problemem – zadania: Z5-Z8
  • Inforex - internetowy system do anotacji korpusów
  • Specjalistyczne korpusy polskich tekstów
  • Liner – narzędzie do rozpoznawania i znakowania nazw własnych w tekście
  • Serel – system do konstrukcji bazy faktów z plików tekstowych
  • Borsuk - system odpowiadający na pytania zadane w języku naturalnym
 3. Jednolity system zarządzania treścią oraz dostępu do treści w masowych kolekcjach dokumentów inter- i intra-netowych (w tym konstrukcja architektury systemu) – zadania: Z9-Z11
  W ramach tych zadań powstała semantyczna polskojęzyczna wyszukiwarka NEKST.
   Wybrane funkcjonalności wyszukiwarki:
  • Kategoryzacja dokumentów internetowych (kategoryzator)
  • System wysokowydajnych pająków internetowych
  • Zasób ontologii - bazy faktów
  • System wydajnego indeksowania dokumentów tekstowych
  • Ekstrakcja informacji z danych częściowo ustrukturyzowanych
  • System ekstrakcji bazy faktów z dokumentów tekstowych
  • System ekstrakcji taksonomii (relacji IS-A) z dokumentów tekstowych (taksonomizator)
  • System odpowiadania na pytania na podstawie bazy faktów oraz taksonomii
  • Analiza wydźwięku emocjonalnego w oparciu o słownik kolokacji przymiotnikowych
 4. Wydobywanie informacji z wybranych typów artefaktów multimedialnych oraz wykorzystanie wyników interpretacji artefaktów multimedialnych w analizie treści danych tekstowych – zadanie Z12
  • System do automatycznej segmentacji dokumentów traktowanych jak obrazy
  • Moduł ekstrakcji tekstów z obrazów o charakterze wektorowym
  • Moduł analizy strukturalnej diagramów i schematów
  • PATSI+ – uogólniona metoda anotacji obrazów
  • Moduł Threshold Finder dla metody PATSI+
  • Wyszukiwarka Zabytków Dolnego Śląska
 5. System wspomagający rozwiązywanie problemów w oparciu o analizę treści dostępnych źródeł elektronicznych – zadanie Z13
  • Korpus pytań i opisów problemów
  • Korpus „Czywiesz“ 2.0 – duży anotowany korpus pytań i odpowiedzi
  • Annotator - narzędzie wspierające pracę nad oznaczaniem korpusu pytań i odpowiedzi
  • Semantic Matcher – moduł do semantycznej klasyfikacji pytań i fragmentów tekstu
  • System NEKST – system odpowiadania na pytania formułowane w postaci ilustrowanych opisów

Print Email