Wyniki wyszukiwania dla: TEXT-TO-SPEECH TRANSCRIPTION

Digital analysis of ethnic speech – extraction of information code

Publikacja

K. Wojan

- Archives of Acoustics - Rok 2003

On the EM algorithm for the estimation of speech AR parameters in noise

Publikacja

M. Kuropatwinski
B. Kleijn
M. Kuropatwiński

- Rok 2014

Pełny tekst do pobrania w serwisie zewnętrznym

Investigations of speech signal parameters with regard to articulation influences

Publikacja

A. Kaczmarek

- Zeszyty Naukowe Wydziału ETI Politechniki Gdańskiej. Technologie Informacyjne - Rok 2008

W pracy zostało podjęte zagadnienie parametryzacji sygnału mowy w kontekście ekstrakcji cech biometrycznych. Analizowane parametry to parametry cepstralne (cepstrum liniowe i mel-cepstrum, czyli MFCC), parametry liniowej predykcji (LPC) oraz momenty widmowe i parametr F0. Zastosowano analize w krótkich stałych segmentach sygnału z zastosowaniem dużego zakładkowania, tzw. ''implicite segmentation''. Umożliwiło to zaobserwowanie...

New approach to localization of clicks in archive speech signals.

Publikacja

- Rok 2004

Przedstawiono problem lokalizacji zniekształceń impulsowych w archiwalnych sygnałach mowy. Pokazano, że detekcja oparta na dwuzakresowym modelu autoregresyjnym i przetwarzanie dwukierunkowe pozwala uzyskać znaczącą poprawę działania w stosunku do istniejących metod lokalizacji zniekształceń.

Advanced speech archiving and restoration system for aviation applications

Publikacja

A. Czyżewski
J. Kotus
A. Kaczmarek
A. Rypulak
A. Pawlik

- Rok 2005

W referacie przedstawiono opracowany System Rejestracji I Rekonstrukcji Mowy dla potrzeb lotnictwa. System ten umożliwia jednoczesny zapis, archiwizację i poprawę zrozumiałości sygnału mowy pochodzącego z wielu różnych kanałów komunikacji radiowej. Głównym celem systemu jest rejestracja i rekonstrukcja komunikatów słownych wymienianych drogą radiową pomiędzy pilotem samolotu a stacją kontroli lotów - jest to niezwykle istotne w...

Application of hybrid signals processors to speech and hearing aids

Publikacja

- Rok 2005

Dzięki postępowi w technice Cyfrowych Procesorów Sygnałowych (ang. DSP) stało się możliwe budowanie miniaturowych protez słuchu i mowy. Mimo niewielkich wymiarów procesory te są w stanie wykonywać złożone algorytmy. Ich dodatkową zaletą jest łatwość zmiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. W pracy skupiono się na zagadnieniach związanych z projektowanie i implementacją algorytmów mających zastosowanie...

A hybrid speech codec employing parametric and perceptual coding techniques

Publikacja

- Rok 2006

W referacie przedstawiono hybrydowy kodek mowy dla zastosowan w komunikacji VoIP wykorzystujący kodowanie parametryczne i percetualne. Sygnał mowy jest dzielony na składowe dźwięczne, które podlegają kodowania perceptualnemu, składowe bezdźwięczne, które kodowane są metodą parametryczną oraz transjenty, które nie są kodowane żadną stratną metodą. Dodatkowo przedstawiono architekturę kodeka, w której perceptualnie kodowana i przesyłana...

Real-time speech streching for supporting hearing impaired schoolchildren

Publikacja

- Elektronika : konstrukcje, technologie, zastosowania - Rok 2010

A study of time scale modification algorithms applied to support hearing impaired schoolchildren is presented. Variety of algorithms are considered, namely: overlap-and add, two variations of synchronous overlapand- add, and the phase vocoder. Their effectiveness as well as real-time processing capabilities are examined.

Pełny tekst do pobrania w serwisie zewnętrznym

Auditory-model based robust feature selection for speech recognition

Publikacja

C. Koniaris
M. Kuropatwinski
W. Kleijn
M. Kuropatwiński

- Journal of the Acoustical Society of America - Rok 2010

Pełny tekst do pobrania w serwisie zewnętrznym

Excess nitrogen responsive HvMADS27 transcription factor controls barley root architecture by regulating abscisic acid level

Publikacja

A. Smoczynska
A. Pacak
A. Grabowska
D. Bielewicz
M. Zadworny
K. Singh
J. Dolata
M. Bajczyk
P. Nuc
J. Kesy... i 6 innych

- Frontiers in Plant Science - Rok 2022

Pełny tekst do pobrania w serwisie zewnętrznym

A multi-label text message classification method designed for applications in call/contact centre systems

Publikacja

K. Poczeta
M. Płaza
T. Michno
M. Krechowicz
M. Zawadzki

- APPLIED SOFT COMPUTING - Rok 2023

Pełny tekst do pobrania w serwisie zewnętrznym

Time-scale modification of speech signals for supporting hearing impaired schoolchildren

Publikacja

- Rok 2009

A study of time scale modification algorithmsapplied to hearing impaired schoolchildren supporting ispresented. Variety of algorithms are considered, namely:overlap and add, two variations of synchronized overlapand add, and the phase vocoder. Their effectiveness as wellas real-time processing capabilities are examined.

Speech formant frequency and pitch estimation using instantaneous complex frequency

Publikacja

M. [. Kaniewska

- Rok 2008

W pracy opisany został algorytm estymacji częstotliwości podstawowej oraz częstotliwości środkowych i pasm formantów mowy z wykorzystaniem zespolonej pulsacji chwilowej. W artykule przedstawiono również wyniki działania algorytmu dla polskich samogłosek.

Analysis of 2D Feature Spaces for Deep Learning-based Speech Recognition

Publikacja

G. Korvel
P. Treigys
G. Tamulevicus
J. Bernataviciene
B. Kostek

- JOURNAL OF THE AUDIO ENGINEERING SOCIETY - Rok 2018

convolutional neural network (CNN) which is a class of deep, feed-forward artificial neural network. We decided to analyze audio signal feature maps, namely spectrograms, linear and Mel-scale cepstrograms, and chromagrams. The choice was made upon the fact that CNN performs well in 2D data-oriented processing contexts. Feature maps were employed in the Lithuanian word recognition task. The spectral analysis led to the highest word...

Expression of zinc finger transcription factors (ZNF143 and ZNF281) in serous borderline ovarian tumors and low-grade ovarian cancers

Publikacja

P. Sadłecki
M. Grabiec
D. Grzanka
J. Jóźwicki
P. Antosik
M. Walentowicz-Sadłecka

- Journal of Ovarian Research - Rok 2019

Pełny tekst do pobrania w serwisie zewnętrznym

Expression of selected epithelial–mesenchymal transition transcription factors in serous borderline ovarian tumors and type I ovarian cancers

Publikacja

P. Sadlecki
J. Jóźwicki
P. Antosik
M. Grabiec

- TUMOR BIOLOGY - Rok 2018

Pełny tekst do pobrania w serwisie zewnętrznym

GlaR (YugA)—a novel RpiR‐family transcription activator of the Leloir pathway of galactose utilization in Lactococcus lactis IL 1403

Publikacja

T. Aleksandrzak‐Piekarczyk
K. Szatraj
K. Kosiorek

- MicrobiologyOpen - Rok 2019

Pełny tekst do pobrania w serwisie zewnętrznym

Are 8-oxoguanine (8-oxoGua) and 5-hydroxymethyluracil (5-hmUra) oxidatively damaged DNA bases or transcription (epigenetic) marks?

Publikacja

E. Zarakowska
D. Gackowski
M. Foksinski
R. Olinski

- Mutation Research/Genetic Toxicology and Environmental Mutagenesis - Rok 2014

Pełny tekst do pobrania w serwisie zewnętrznym

Drastically decreased transcription from CII-activated promoters is responsible for impaired lysogenization of the Escherichia coli rpoA341 mutant by bacteriophage λ

Publikacja

A. Szalewska-Palasz
K. P. Bielawski

- FEMS MICROBIOLOGY LETTERS - Rok 1996

Pełny tekst do pobrania w serwisie zewnętrznym

Improving signal quality of a speech codec using hybrid perceptual-parametric algorithm

Publikacja

- International Journal of Intelligent Information and Database Systems - Rok 2008

W artykule zaprezentowano hybrydową architekturę parametryczno-perceptualną kodeka mowy. Jego podstawę stanowi kodek CELP, który wspomagany jest kodekiem perceptualnym. Celem zastosowania proponowanej metody jest uzyskanie poprawy jakości kodowania sygnału mowy. Badaniom poddano dwie architektury, z których w jednej dźwięczne części sygnału rezydualnego kodeka CELP kodowane są perceptualnie. Drugi z proponowanych kodeków dokonuje...

Pełny tekst do pobrania w serwisie zewnętrznym

Combining visual and acoustic modalities to ease speech recognition by hearing impaired people

Publikacja

- Rok 2005

Artykuł prezentuje system, którego celem działania jest ułatwienie procesu treningu poprawnej wymowy dla osób z poważnymi wadami słuchu. W analizie mowy wykorzystane zostały parametry akutyczne i wizualne. Do wyznaczenia parametrów wizualnych na podstawie kształtu i ruchu ust zostały wykorzystane modele Active Shape Models. Parametry akustyczne bazują na współczynnikach melcepstralnych. Do klasyfikacji wypowiadanych głosek została...

Can mutations in the gene encoding transcription factor EKLF (Erythroid Krüppel-Like Factor) protect us against infectious and parasitic diseases?

Publikacja

K. Mikołajczyk
R. Kaczmarek
M. Czerwiński

- Postępy Higieny i Medycyny Doświadczalnej - Rok 2016

Pełny tekst do pobrania w serwisie zewnętrznym

Stochastic Integration and Long Term Predictor Estimation under Noisy Conditions for Speech Enhancement

Publikacja

M. Kuropatwinski
W. Kleijn
M. Kuropatwiński

- Rok 2005

Pełny tekst do pobrania w serwisie zewnętrznym

POPRAWA OBIEKTYWNYCH WSKAŹNIKÓW JAKOŚCI MOWY W WARUNKACH HAŁASU

Publikacja

K. Kąkol
B. Kostek

- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej - Rok 2018

Celem pracy jest modyfikacja sygnału mowy, aby uzyskać zwiększenie poprawy obiektywnych wskaźników jakości mowy po zmiksowaniu sygnału użytecznego z szumem bądź z sygnałem zakłócającym. Wykonane modyfikacje sygnału bazują na cechach mowy lombardzkiej, a w szczególności na efekcie podniesienia częstotliwości podstawowej F0. Sesja nagraniowa obejmowała zestawy słów i zdań w języku polskim, nagrane w warunkach ciszy, jak również w...

Pełny tekst do pobrania w portalu

Replicating DNA by cell factories: roles of central carbon metabolism and transcription in the control of DNA replication in microbes, and implications for understanding this process in human cells

Publikacja

S. Barańska
M. Glinkowska
A. Herman-Antosiewicz
M. Maciąg-Dorszyńska
D. Nowicki
A. Szalewska-Pałasz
A. Węgrzyn
G. Węgrzyn

- Microbial Cell Factories - Rok 2013

Pełny tekst do pobrania w serwisie zewnętrznym

Akustyczny obraz słowa na tle mowy etnicznej [The acoustic image of ethnic speech words]

Publikacja

K. Wojan

- Rok 2002

Badanie rozkładów parametrów sygnału mowy w zastosowaniach do prognozowania prawdopodobieństwa popełnienia błędów w systemach identyfikacji mówców = Examining distribution of speech signal parameters for the prognosis of error probability in speaker verification systems

Publikacja

A. Kaczmarek

- Rok 2010

Przedmiotem pracy jest system identyfikacji mówców w sposób zależny od tekstu ("text dependent''). Dokonano analizy wielu różnych wypowiedzi kilkudziesięciu mówców. Zastosowana metoda parametryzacji to metoda oparta na wynikach analizy cepstralnej sygnału mowy. Zdefiniowane zostały nowe parametry skojarzone z elementarnymi zdarzeniami w procesie weryfikacji mówców. Na tej podstawie dokonano estymacji funkcji gęstości prawdopodobieństwa...

The development of speech in early childhood in children from twin pregnancies with twin-twin transfusion syndrome (TTTS)

Publikacja

M. Bidzan
Ł. Bieleninik
M. Lipowska

- Polish Psychological Bulletin - Rok 2013

Pełny tekst do pobrania w serwisie zewnętrznym

Minimum mean square error estimation of speech short-term predictor parameters under noisy conditions

Publikacja

M. Kuropatwinski
W. Kleijn
M. Kuropatwiński

- Rok 2003

Pełny tekst do pobrania w serwisie zewnętrznym

Impact of heat shock transcription factor 1 on global gene expression profiles in cells which induce either cytoprotective or pro-apoptotic response following hyperthermia

Publikacja

M. Kus-Liśkiewicz
J. Polańska
J. Korfanty
M. Olbryt
N. Vydra
A. Toma
W. Widłak
J. Polanska

- BMC GENOMICS - Rok 2013

Pełny tekst do pobrania w serwisie zewnętrznym

Cyfrowa analiza mowy etnicznej – ekstrakcja kodu informacji [A digital analysis of ethnic speech – deciphering the information code]

Publikacja

K. Wojan

- Rok 2003

Multicopy Suppressor Analysis of Strains Lacking Cytoplasmic Peptidyl-Prolyl cis/trans Isomerases Identifies Three New PPIase Activities in Escherichia coli That Includes the DksA Transcription Factor

Publikacja

- INTERNATIONAL JOURNAL OF MOLECULAR SCIENCES - Rok 2020

Consistent with a role in catalyzing rate-limiting step of protein folding, removal of genes encoding cytoplasmic protein folding catalysts belonging to the family of peptidyl-prolyl cis/trans isomerases (PPIs) in Escherichia coli confers conditional lethality. To address the molecular basis of the essentiality of PPIs, a multicopy suppressor approach revealed that overexpression of genes encoding chaperones (DnaK/J and GroL/S),...

Pełny tekst do pobrania w portalu

Цифровой анализ сигналов речи как инструмент сравнительного языкознания [A digital analysis of speech signals as an instrument in comparative linguistics]

Publikacja

K. Wojan

- Rok 2003

System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych = System of speech signal processing and visualisation of the results

Publikacja

Z. Wojan
W. Lis
K. Wojan

- Rok 2005

W artykule przedstawiono sposób przetwarzania i wizualizacji sygnału mowy w formie prostego w obsłudze i relatywnie niedrogiego urządzenia do nagrywania sygnału akustycznego oraz przetwarzania cyfrowego wyselekcjonowanych fragmentów i wizualizacji uzyskanych rezultatów przekształceń. Zastosowano do tego celu komputer z kartą dźwiękową. Przetwarzanie cyfrowe oraz wizualizacja dokonywana była w oparciu o program MATLAB bezpośrednio...

System przetwarzania i wizualizacji sygnału mowy dla potrzeb lingwistycznych [A system of speech signal processing and visualisation for linguistic purposes]

Publikacja

K. Wojan

- Rok 2005

High quality speech coding using combined parametric and perceptual modules. [Kodowanie sygnału mowy z zachowaniem wysokiej jakości przy wykorzystaniu modułu parametrycznego i perceptualnego]

Publikacja

- Transaction on Engineering, Computation and Technology - Rok 2006

W komunikacie zaprezentowano nową metodę hybrydowego kodowania sygnału mowy. Techniki kodowania parametrycznego oraz perceptualnego zostały wykorzystane w celu zapewnienia wysokiej jakości kodowania sygnału mowy. Przedstawiono wyniki badań dla dwóch architektur kodeka. Jedna z nich bazuje na algorytmie pozwalajacym wyodrębnić składowe dźwięczne, bezdźwięczne oraz transjenty. Składowe dźwięczne kodowane są metodą perceptualną, bezdźwięczne...

Pełny tekst do pobrania w serwisie zewnętrznym

Improving signal quality in speech codec using hybrid perceptual-parametric algorithm. [Poprawa jakości sygnału w kodekach mowy przy użyciu hybrydowego, parametryczno-perceptualnego algorytmu kodowania]

Publikacja

- Rok 2006

Przedstawiono hybrydową, parametryczno-perceptualną architekturę kodeka. Podstawowa struktura kodeka parametrycznego CELP została wzbogacona o kodowanie perceptualne. Celem hybrydyzacji kodeka jest uzyskanie znaczącej poprawy subiektywnej jakości zdekodowanego sygnału. Zaproponowano dwie hybrydowe struktury. Pierwsza polega na perceptualnym kodowaniu dźwięcznych elementów sygnału rezydualnego kodeka CELP. Druga metoda dzieli sygnał...

New approach for determining the QoS of MP3-coded voice signals in IP networks

Publikacja

T. Uhl
S. Paulsen
K. Nowicki

- EURASIP Journal on Audio Speech and Music Processing - Rok 2017

Present-day IP transport platforms being what they are, it will never be possible to rule out conflicts between the available services. The logical consequence of this assertion is the inevitable conclusion that the quality of service (QoS) must always be quantifiable no matter what. This paper focuses on one method to determine QoS. It defines an innovative, simple model that can evaluate the QoS of MP3-coded voice data transported...

Pełny tekst do pobrania w portalu

Modelling gene expression of a self-regulating protein

Publikacja

A. Bartłomiejczyk
M. Bodnar

- Rok 2014

We analyze a model of gene transcription and protein synthesis. We take into account the number of sites on the protein’s promoter at which the protein’s dimers can bind blocking transcription of protein mRNA.

Introduction to the special issue on machine learning in acoustics

Publikacja

Z. Michalopoulou
P. Gerstoft
B. Kostek
M. A. Roch

- Journal of the Acoustical Society of America - Rok 2021

When we started our Call for Papers for a Special Issue on “Machine Learning in Acoustics” in the Journal of the Acoustical Society of America, our ambition was to invite papers in which machine learning was applied to all acoustics areas. They were listed, but not limited to, as follows: • Music and synthesis analysis • Music sentiment analysis • Music perception • Intelligent music recognition • Musical source separation • Singing...

Pełny tekst do pobrania w portalu

AUTOMATYCZNA KLASYFIKACJA MOWY PATOLOGICZNEJ

Publikacja

- Rok 2023

Aplikacja przedstawiona w niniejszym rozdziale służy do automatycznego wykrywania mowy patologicznej na podstawie bazy nagrań. W pierwszej kolejności przedstawiono założenia leżące u podstaw przeprowadzonych badan wraz z wyborem bazy mowy patologicznej. Zaprezentowano również zastosowane algorytmy oraz cechy sygnału mowy, które pozwalają odróżnić mowę niezaburzoną od mowy patologicznej. Wytrenowane sieci neuronowe zostały następnie...

Pełny tekst do pobrania w serwisie zewnętrznym

Hopf bifurcation in time‐delayed gene expression model with dimers

Publikacja

A. Bartłomiejczyk
M. Bodnar

- MATHEMATICAL METHODS IN THE APPLIED SCIENCES - Rok 2023

We study a mathematical model of gene transcription and protein synthesis with negative feedback. We consider a system of equations taking into account the formation of dimers (i.e., complex formed by two protein monomers), the way in which dimers bind to DNA and time delay in translation process. For the model consisting of three ordinary differential equations with time delay, we derive conditions for stability of the positive...

Pełny tekst do pobrania w serwisie zewnętrznym

Metoda i algorytmy modyfikacji sygnału do celu wspomagania rozumienia mowy przez osoby z pogorszoną rozdzielczością czasową słuchu

Publikacja

A. Kupryjanow

- Rok 2013

Przedmiotem badań przeprowadzonych w ramach rozprawy są metody modyfikacji czasu trwania sygnału (ang. Time Scale Modification –TSM) mowy operujące w czasie rzeczywistym oraz ocena ich wpływu na rozumienie wypowiedzi przez osoby z pogorszoną rozdzielczością czasową słuchu. Pogorszona rozdzielczość słuchu jest jednym z symptomów związanych z ośrodkowymi zaburzeniami słuchu (ang. Cetnral Auditory Processing Disorder – CAPD). W odróżnieniu...

WYKORZYSTANIE SIECI NEURONOWYCH DO SYNTEZY MOWY WYRAŻAJĄCEJ EMOCJE

Publikacja

- Rok 2018

W niniejszym artykule przedstawiono analizę rozwiązań do rozpoznawania emocji opartych na mowie i możliwości ich wykorzystania w syntezie mowy z emocjami, wykorzystując do tego celu sieci neuronowe. Przedstawiono aktualne rozwiązania dotyczące rozpoznawania emocji w mowie i metod syntezy mowy za pomocą sieci neuronowych. Obecnie obserwuje się znaczny wzrost zainteresowania i wykorzystania uczenia głębokiego w aplikacjach związanych...

Regulated assembly of lipopolysaccharide and sensing of its alterations in Escherichia coli

Publikacja

A. Stupak

- Rok 2018

This thesis describes mechanism of the regulation of the transcription of the rpoE gene encoding an essential RNA polymerase subunit in Escherichia coli. The RpoE regulates extracytoplasmic stress response regulon and is required to initiate transcription of genes, whose products are involvedin the folding of periplasmic proteins and synthesis and transport of outer membrane components. The transcriptional regulation of the rpoE...

Pełny tekst do pobrania w portalu

Investigating Feature Spaces for Isolated Word Recognition

Publikacja

G. Korvel
G. Tamulevicus
P. Treigys
J. Bernataviciene
B. Kostek

- Rok 2018

Much attention is given by researchers to the speech processing task in automatic speech recognition (ASR) over the past decades. The study addresses the issue related to the investigation of the appropriateness of a two-dimensional representation of speech feature spaces for speech recognition tasks based on deep learning techniques. The approach combines Convolutional Neural Networks (CNNs) and timefrequency signal representation...

Enhanced voice user interface employing spatial filtration of signals from acoustic vector sensor

Publikacja

- Rok 2015

Spatial filtration of sound is introduced to enhance speech recognition accuracy in noisy conditions. An acoustic vector sensor (AVS) is employed. The signals from the AVS probe are processed in order to attenuate the surrounding noise. As a result the signal to noise ratio is increased. An experiment is featured in which speech signals are disturbed by babble noise. The signals before and after spatial filtration are processed...

Pełny tekst do pobrania w serwisie zewnętrznym

Zastosowanie spowalniania wypowiedzi w celu poprawy rozumienia mowy przez dzieci w szkole

Publikacja

- Rok 2009

This paper presents a time-scale modification algorithms that could be used for hearing impairment therapy supported by real-time speech stretching. In this paper the OLA based algorithms and Phase Vocoder were described. In the experimental part usability of those algorithms for real-time speech stretching was discussed

KORPUS MOWY ANGIELSKIEJ DO CELÓW MULTIMODALNEGO AUTOMATYCZNEGO ROZPOZNAWANIA MOWY

Publikacja

- Przegląd Telekomunikacyjny + Wiadomości Telekomunikacyjne - Rok 2016

W referacie zaprezentowano audiowizualny korpus mowy zawierający 31 godzin nagrań mowy w języku angielskim. Korpus dedykowany jest do celów automatycznego audiowizualnego rozpoznawania mowy. Korpus zawiera nagrania wideo pochodzące z szybkoklatkowej kamery stereowizyjnej oraz dźwięk zarejestrowany przez matrycę mikrofonową i mikrofon komputera przenośnego. Dzięki uwzględnieniu nagrań zarejestrowanych w warunkach szumowych korpus...

Analyzing and Visualizing Uncertain Knowledge: The Use of TEI Annotations in the PROVIDEDH Open Science Platform

Publikacja

M. Kozak
A. Rodríguez
A. Benito-Santos
R. Therón
M. Doran
A. Dorn
J. Edmond
C. Mazurek
E. Wandl-Vogt

- Journal of the Text Encoding Initiative - Rok 2021

Pełny tekst do pobrania w serwisie zewnętrznym

Wyszukiwarka

Filtry

Katalog

Kategoria

Rok

Opcje

Wyniki wyszukiwania dla: TEXT-TO-SPEECH TRANSCRIPTION