TIN

TIN to system szybkiego wielokryterialnego wyszukiwania fraz słownych w dużych bazach nagrań audio i wideo. Realizuje automatyczne rozpoznawanie mowy, indeksację tekstową uzyskanych transkrypcji oraz pełnotekstowe wyszukiwanie nagrań. System implementowany jest w modelu serwerowym z webowymi aplikacjami użytkownika.

TIN jest systemem dostosowanym głównie do potrzeb służb odpowiedzialnych za bezpieczeństwo państwa. Umożliwia szybkie wyszukiwanie w nagraniach, określonych i potrzebnych dla danej czynności operacyjnej lub procesowej fraz słownych. W przypadku dużych baz nagrań, ręczne odnalezienie w nagraniu istotnego dla sprawy fragmentu, wymaga dużych zasobów ludzkich i czasowych, a w związku z tym jest bardzo kosztowne. Tekstowa indeksacja bazy nagrań znacznie przyspiesza ten proces, zmniejsza jego koszty oraz tworzy nowe możliwości przetwarzania i wykorzystania nagrań.


  • nagrań telefonicznych systemów alarmowych
  • nagrań telefonicznych systemów konsultacyjnych
  • różnego rodzaju nagrań operacyjnych

Inne możliwe obszary zastosowań to wyszukiwanie w bazach nagrań z konferencji, posiedzeń parlamentarnych, rozpraw sądowych.


System realizuje automatyczne rozpoznawanie nagrań oraz tekstowe indeksowanie uzyskanej transkrypcji. Możliwe jest równoległe przetwarzanie dużej liczby nagrań dzięki skalowalności systemu. System wykorzystuje autorski silnik rozpoznawania mowy dla języka polskiego przystosowany do przetwarzania nagrań o różnorodnej specyfice. Rozpoznawanie realizowane jest z wykorzystaniem różnych zestawów parametrów silnika rozpoznawania dedykowanych dla poszczególnych typów nagrań, co umożliwia optymalizację procesu rozpoznawania mowy.


TIN umożliwia wyszukiwanie fraz słownych składających się z kilku wyrazów w różnych trybach, np. w formie podanej przez użytkownika lub z uwzględnieniem odmian gramatycznych podanych wyrazów. W procesie wyszukiwania może być wykorzystany tezaurus standardowy oraz zbiory synonimów zdefiniowane przez użytkownika.

  • autentykację użytkowników systemu – istnieje możliwość integracji z istniejącymi systemami
  • autoryzację – dla użytkownika definiowany jest zbiór operacji jakie ma on prawo wykonywać w odniesieniu do wskazanych zbiorów nagrań
  • logowanie kluczowych działań użytkowników systemu
  • dostęp do nagrań i wyników realizowany jest przez aplikację webową
  • istnieje możliwość eksportu danych (nagrań, metadanych i wyników rozpoznawania) i przeszukiwania ich lokalnie na maszynie użytkownika
  • do działania nie jest wymaga komunikacja z żadnym systemem zewnętrznym, tzn. systemem czy usługą działającą poza siecią lokalną
  • Repozytorium nagrań zapewniające bezpieczne przechowywanie nagrań
  • Baza danych przechowująca dane dotyczące nagrań i ich transkrypcji oraz użytkowników i wykonywanych przez nich czynności
  • Baza i usługa uwierzytelniania użytkowników systemu (istnieje możliwość integracji z zewnętrznym systemem autentykacji)
  • Moduł Tekstowej Indeksacji Nagrań odpowiedzialny za realizację zleceń indeksowania tekstowego wskazanych nagrań
  • Silnik rozpoznawania mowy odpowiedzialny za tworzenie transkrypcji nagrań
  • Aplikacje użytkownika:
    • webowa aplikacja administracyjna
    • desktopowa aplikacja zarządzania nagraniami
    • webowa aplikacja przeglądania i wyszukiwania nagrań

TIN jest rezultatem projektu ARM-1 i powstaje przy aktywnej współpracy przedstawicieli służb, dla których jest przeznaczony

wiadomości