Wyniki wyszukiwania dla: kodowanie sygnalu mowy - MOST Wiedzy

Wyszukiwarka

Wyniki wyszukiwania dla: kodowanie sygnalu mowy

Wyniki wyszukiwania dla: kodowanie sygnalu mowy

  • A hybrid speech codec employing parametric and perceptual coding techniques

    Publikacja

    W referacie przedstawiono hybrydowy kodek mowy dla zastosowan w komunikacji VoIP wykorzystujący kodowanie parametryczne i percetualne. Sygnał mowy jest dzielony na składowe dźwięczne, które podlegają kodowania perceptualnemu, składowe bezdźwięczne, które kodowane są metodą parametryczną oraz transjenty, które nie są kodowane żadną stratną metodą. Dodatkowo przedstawiono architekturę kodeka, w której perceptualnie kodowana i przesyłana...

  • High quality speech coding using combined parametric and perceptual modules. [Kodowanie sygnału mowy z zachowaniem wysokiej jakości przy wykorzystaniu modułu parametrycznego i perceptualnego]

    W komunikacie zaprezentowano nową metodę hybrydowego kodowania sygnału mowy. Techniki kodowania parametrycznego oraz perceptualnego zostały wykorzystane w celu zapewnienia wysokiej jakości kodowania sygnału mowy. Przedstawiono wyniki badań dla dwóch architektur kodeka. Jedna z nich bazuje na algorytmie pozwalajacym wyodrębnić składowe dźwięczne, bezdźwięczne oraz transjenty. Składowe dźwięczne kodowane są metodą perceptualną, bezdźwięczne...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Głębokie przetwarzanie tekstu i sygnału mowy 2022

    Kursy Online
    • S. Cygert
    • S. Zaporowski
    • P. Szczuko

  • Głębokie przetwarzanie tekstu i sygnału mowy 2023

    Kursy Online
    • S. Cygert
    • S. Zaporowski
    • P. Szczuko
    • A. Harasimiuk

  • Novel approaches to wideband speech coding

    Publikacja

    Dwie metoda kodowania szerokopasmowego mowy zostały zaprezentowane. W pierwszej metodzie wykorzystano algorytm kompresji i ekspansji czasowej sygnału mowy, pozwalający na kodowanie szerokopasmowe sygnału mowy z wykorzystaniem ustandaryzowanych kodeków. Metoda ta jest przewidziana do zastosowania w adaptacyjnych algorytmach kodowania mowy. Drugie z proponowanych rozwiazan dotyczy nowej metody estymacji obwiedni widma sygnalu mowy...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Improving signal quality in speech codec using hybrid perceptual-parametric algorithm. [Poprawa jakości sygnału w kodekach mowy przy użyciu hybrydowego, parametryczno-perceptualnego algorytmu kodowania]

    Publikacja

    Przedstawiono hybrydową, parametryczno-perceptualną architekturę kodeka. Podstawowa struktura kodeka parametrycznego CELP została wzbogacona o kodowanie perceptualne. Celem hybrydyzacji kodeka jest uzyskanie znaczącej poprawy subiektywnej jakości zdekodowanego sygnału. Zaproponowano dwie hybrydowe struktury. Pierwsza polega na perceptualnym kodowaniu dźwięcznych elementów sygnału rezydualnego kodeka CELP. Druga metoda dzieli sygnał...

  • Przetwarzanie dźwięków i obrazów

    Kursy Online
    • P. Odya
    • J. Kotus
    • S. Cygert
    • B. Kostek
    • G. Szwoch
    • A. Czyżewski
    • M. Szczodrak

    Cyfrowy tor foniczny i wizyjny. Elementy grafiki komputerowej i jej przetwarzania. Zniekształcenia dźwięku i obrazu, ich przyczyny i podstawowe metody ograniczania. Przetwarzanie brzmienia i synteza dźwięku. Podstawowe metody przetwarzania obrazu wizyjnego. Kodowanie  dźwięku w  procesie  zapisu. Filtracja cyfrowa i metody projektowania filtrów cyfrowych. Podstawowe metody przetwarzania obrazu wizyjnego. Specjalne metody przetwarzania...

  • Badanie jakości transmisji mowy w sieciach IP.

    Praca zawiera opis eksperymentu mającego na celu zbadanie relacji pomiędzy oceną subiektywną sygnału mowy a jakością transmisji tego sygnału w kanale telekomunikacyjnym. Zrealizowano symulację transmisji pakietowej sygnału mowy w sieci Internet (VoIP). Wykonano serię testów odsłuchowych opartych na listach logatomowych i odpowiednio dobranych zdaniach. Do interpretacji wyników zastosowano analizę statystyczną.

  • Tensor-product versus geometric-product coding

    Publikacja

    - PHYSICAL REVIEW A - Rok 2008

    Kodowanie przy pomocy iloczynów tensorowych, a kodowanie przy pomocy iloczynów geometrycznych. Formalizm jest zilustrowany przy pomocy paru przykładów.

    Pełny tekst do pobrania w portalu

  • KORPUS MOWY ANGIELSKIEJ DO CELÓW MULTIMODALNEGO AUTOMATYCZNEGO ROZPOZNAWANIA MOWY

    W referacie zaprezentowano audiowizualny korpus mowy zawierający 31 godzin nagrań mowy w języku angielskim. Korpus dedykowany jest do celów automatycznego audiowizualnego rozpoznawania mowy. Korpus zawiera nagrania wideo pochodzące z szybkoklatkowej kamery stereowizyjnej oraz dźwięk zarejestrowany przez matrycę mikrofonową i mikrofon komputera przenośnego. Dzięki uwzględnieniu nagrań zarejestrowanych w warunkach szumowych korpus...

  • Bożena Kostek prof. dr hab. inż.

  • Akustyka Mowy - 2022

    Kursy Online
    • J. Kotus
    • G. Szwoch
    • A. Czyżewski

    Celem przedmiotu jest zapoznanie studentów z podstawowymi zagadnieniami z zakresu wytwarzania, analizy i parametryzacji sygnału mowy, W ramach przedmiotu prezentowane są również zagadnienia z zakresu syntezy mowy oraz rozpoznawania mowy. W niniejszym kursie będą również zamieszczane materiały przydatne do realizacji ćwiczeń laboratoryjnych.

  • Akustyka Mowy - 2023

    Kursy Online
    • J. Kotus
    • G. Szwoch
    • A. Czyżewski

    Celem przedmiotu jest zapoznanie studentów z podstawowymi zagadnieniami z zakresu wytwarzania, analizy i parametryzacji sygnału mowy, W ramach przedmiotu prezentowane są również zagadnienia z zakresu syntezy mowy oraz rozpoznawania mowy. W niniejszym kursie będą również zamieszczane materiały przydatne do realizacji ćwiczeń laboratoryjnych.

  • Akustyka Mowy - 2024

    Kursy Online
    • J. Kotus
    • G. Szwoch

    Celem przedmiotu jest zapoznanie studentów z podstawowymi zagadnieniami z zakresu wytwarzania, analizy i parametryzacji sygnału mowy, W ramach przedmiotu prezentowane są również zagadnienia z zakresu syntezy mowy oraz rozpoznawania mowy. W niniejszym kursie będą również zamieszczane materiały przydatne do realizacji ćwiczeń laboratoryjnych.

  • AUTOMATYCZNA KLASYFIKACJA MOWY PATOLOGICZNEJ

    Publikacja

    Aplikacja przedstawiona w niniejszym rozdziale służy do automatycznego wykrywania mowy patologicznej na podstawie bazy nagrań. W pierwszej kolejności przedstawiono założenia leżące u podstaw przeprowadzonych badan wraz z wyborem bazy mowy patologicznej. Zaprezentowano również zastosowane algorytmy oraz cechy sygnału mowy, które pozwalają odróżnić mowę niezaburzoną od mowy patologicznej. Wytrenowane sieci neuronowe zostały następnie...

    Pełny tekst do pobrania w serwisie zewnętrznym

  • Kodowanie niedostarczonej do odbiorców informacji w systemach satelitarnych z wolnym kanałem zwrotnym

    Publikacja
    • M. Jurkiewicz

    - Rok 2012

    W poniższym artykule przedstawiono problem kodowania źródła satelitarnego opisany przez Birka i Kola. Przytoczono również nieoptymalne kodowanie dla postawionego problemu oraz miarę określającą możliwości takiego kodowania oraz kilka przykładów, w których wcześniej wspomniane kodowanie staje się optymalne.

  • Zaawansowane technologie multimedialne [Moduł dyscyplinarny, Grupa A i B]

    Kursy Online
    • B. Kostek
    • P. Szczuko
    • A. Czyżewski

    Prowadzący: prof. dr hab. inż. Andrzej Czyżewski, prof. dr hab. inż. Bożena Kostek, dr hab. inż. Piotr Szczuko Terminy realizacji zajęć: 19.11, godz. 12:00-14:45 19.11, godz. 15:30-18:15 + wykłady offline Tematyka realizowanego przedmiotu obejmuje: Telemonitoring obiektów i aglomeracji Fonoskopia i analiza obrazów Podstawy psychofizjologii słyszenia i widzenia Kodowanie perceptualne i formaty zapisu dźwięku i obrazu Podstawy...

  • Analiza sygnału mowy w foniatrii

    Praca zawiera opis algorytmów analizy sygnału mowy opracowanych do zastosowań medycznych. Mają one znaczenie wspomagające w diagnostyce schorzeń krtani, objawiających się jako np. chrypka, dwugłos oraz nieprawidłowa artykulacja tonu krtaniowego (głos drżący). Opisano algorytmy służące do ekstrakcji tonu krtaniowego (parametr F0 i jego przebieg zmienności w czasie) oraz do wygładzania widma (np. do estymacji parametrów formantowych...

  • Metoda oceny skuteczności cyfrowego korektora mowy

    Cyfrowy korektor mowy, który został opracowany w Katedrze Inżynierii Dźwięku i Obrazu PG, jest urządzeniem pozwalającym na poprawę płynności mowy osób jąkających się z wykorzystaniem nowego typu metodykę modyfikacji audytoryjnej pętli sprzężenia zwrotnego. W niniejszej pracy zawarto podstawowe informacje na temat wady wymowy, jaką jest jąkanie się oraz na temat opracowanego korektora.

  • Wykorzystanie analizy obrazu w rozpoznawaniu mowy

    Publikacja

    - Rok 2005

    Niniejszy referat przedstawia metodę rozpoznawania mowy na podstawie analizy ruchu ust. W pracy opisano algorytm wyznaczana i śledzenia położenia ust wykorzystujący modele Active Shape Models oraz zbadano efektywność jego działania. Sztuczna sieć neuronowa została wykorzystana jako klasyfikator rozpoznający sześć wypowiadanych samogłosek w oparciu o wizualne parametry mowy. W pracy umieszczono wyniki klasyfikacji oraz wnioski.