Notice: Undefined index: linkPowrot in C:\wwwroot\wwwroot\publikacje\publikacje.php on line 1275
Publikacje
Pomoc (F2)
[47504] Artykuł:

Speech Signal Processing and Analysis Tool

(Narzędzie do przetwarzania i analizy sygnału mowy)
Czasopismo: Pomiary, Automatyka, Kontrola   Tom: 53, Zeszyt: 12, Strony: 87-89
ISSN:  0032-4140
Opublikowano: 2007
 
  Autorzy / Redaktorzy / Twórcy
Imię i nazwisko Wydział Katedra Procent
udziału
Liczba
punktów
Marzena Mięsikowska orcid logoWMiBMKatedra Mechaniki**1006.00  

Grupa MNiSW:  Publikacja w recenzowanym czasopiśmie wymienionym w wykazie ministra MNiSzW (część B)
Punkty MNiSW: 6


Pełny tekstPełny tekst     Web of Science LogoYADDA/CEON    
Słowa kluczowe:

rozpoznawanie mowy  klasyfikacja tekstu  przeglądanie informacji 


Keywords:

speech recognition  text classification  information retrieval 



Streszczenie:

W tej pracy przedstawiono próbę stworzenia aplikacji umożliwiającej swobodniejszą nawigację użytkownika wśród zasobów Internetu za pomocą poleceń mowy, klasyfikację oraz uporządkowanie przeglądanej informacji. Aplikacja posiada dwa zasadnicze moduły, przy pomocy których możliwe jest przeglądanie informacji w Internecie. Pierwszy moduł nawigacji, przetwarza strony internetowe, wyodrębnia z nich elementy nawigacyjne takie jak odnośniki do innych stron, oraz nadaje elementom identyfikacyjną nazwę, dzięki której użytkownik może wydawać słowne polecenia. Strona internetowa wyświetlona zostaje użytkownikowi w niemalże oryginalnej postaci. Drugi moduł również przetwarza strony internetowe, wyodrębniając z nich elementy nawigacyjne. Jedyną różnicą w działaniu obu modułów jest sposób przetwarzania strony i ostatecznej jej reprezentacji. Drugi moduł wyodrębnia z elementów słownictwo, dzięki któremu możemy sklasyfikować informację znajdującą się na stronie, uzyskując i wyświetlając w ten sposób uporządkowany zbiór elementów nawigacyjnych. Aplikacja zaimplementowana została w języku Java z wykorzystaniem oprogramowania Oracle. W przypadku systemu rozpoznawania mowy zastosowano narzędzie Sphinx-4.




Abstract:

The paper presents an attempt to create an application enabling the user to surf much easier the resources of the Internet with the help of voice commands, as well as to classify and arrange the browsed information. The application has two basic modules which enable browsing the information on the Internet. The first navigation module processes websites, isolates navigation elements , such as links to other websites, from them and gives an identification name to the elements, which enables the user to pronounce voice commands. The website is presented to the user in a practically original form. The second module also processes websites, isolating navigation elements from them. The only difference in operation of the both modules is the mode of processing the website and its final presentation. The second module isolates from the elements vocabulary, which makes it possible to classify the information included in the website, this way acquiring and displaying, an ordered set of navigation elements. The application was implemented in Java language with the use of Oracle software. For the system of recognition and understanding of speech the Sphinx 4 tool was used.



B   I   B   L   I   O   G   R   A   F   I   A
[1] Dulas Janusz, Skubis Tadeusz: Parametryzacja sygnału stochastycznego za pomocą siatek dwuwymiarowych. Pomiary Automatyka Kontrola, 2002.
[2] Dulas Janusz: Metoda siatek o zmiennych parametrach w zastosowaniu do rozpoznawania fonemów mowy polskiej. Rozprawa doktorska 2002.
[3] Zieliński Tomasz, Gajda Paweł, Stachura Marcin, Wilgat Robert, Król Daniel, Woźniak Tomasz, Grabias Stanisław: Zastosowanie współczynników HFCC jako cech sygnału mowy w automatycznej detekcji wad wymowy. Pomiary Automatyka Kontrola, 2006.
[4] Willie Walker, Paul Lamere, Philip Kwok, Bhiksha Raj, Rita Singh, Evandro Gouvea, Peter Wolf, Joe Woelfel: Sphinx-4: A Flexible Open Source Framework for Speech Recognition. SMLI TR-2004-139 Sun Microsystems Inc., November 2004.
[5] Basztura Czesław: Źródła, sygnały, obrazy akustyczne. WKŁ 1988.