Wyniki wyszukiwania dla: REKONSTRUKCJA AUDIO-WIDEO

Wyniki wyszukiwania dla: REKONSTRUKCJA AUDIO-WIDEO

wyników na stronę:
osadź ten widok na swojej stronie

Filtry

wszystkich: 526

wyczyść wszystkie filtry niedostępne

Audio codec employing frequency-derived tonality measure
Publikacja
- M. Kulesza
- A. Czyżewski
- Rok 2009
A transform codec employing efficient algorithm for detection of spectral tonal components is presented. The tonality measure used in MPEG psychoacoustic model is replaced with the method providing adequate tonality estimates even if the tonal components are deeply frequency modulated. The reliability of hearing threshold estimated using psychoacoustic model with standardized tonality measure and the proposed one is investigated...
Wow detection and compensation employing spectral processing of audio.
Publikacja
- Rok 2004
Praca zawiera opis opracowanych algorytmów detekcji i kompensacji pasożytniczych modulacji częstotliwości wynikających z nierównomiernego przesuwu nośnika dźwięku. Proponowane metody opracowano ze szczególnym uwzględnieniem przypadkowych zniekształceń drżenia obecnych w archiwalnych filmowych ścieżkach dźwiękowych. Dodatkowo algorytmy badają wpływ zniekształceń na strukturę formantową sygnałów. Analiza zmian położenia formantów...
New algorithms for wow and flutter detection and compensation in audio
Publikacja
- Rok 2005
W referacie przedstawiono nowe metody dyskryminacji naturalnych efektów muzycznych i pasożytniczych zniekształceń drżenia dźwięku. Dodatkowo, opisano w nim metody wyznaczania przebiegu zniekształceń drżenia. Wśród nich znajdują się: detekcja okresowości sygnału w poszczególnych ramkach czasowych, śledzenie zmian przydźwięku sieciowego wykorzystujące modelowane AR widma sygnału, śledzenie zmian wysokoczęstotliwościowego prądu podkładu....
Applications of neural networks and perceptual masking to audio restoration
Publikacja
- A. Czyżewski
- Journal of New Music Research - Rok 2002
Omówiono zastosowania algorytmów uczących się w dziedzinie rekonstruowania nagrań fonicznych. Szczególną uwagę zwrócono na zastosowanie sztucznych sieci neuronowych do usuwania zakłócających impulsów. Ponadto opisano zastosowanie inteligentnego algorytmu decyzyjnego do sterowania maskowaniem perceptualnym w celu redukowania szumu.
New algorithms for wow and flutter detection and compensation in audio
Publikacja
- Rok 2005
W referacie przedstawiono nowe metody dyskryminacji naturalnych efektów muzycznych i pasożytniczych zniekształceń drżenia dźwięku. Dodatkowo, opisano w nim metody wyznaczania przebiegu zniekształceń drżenia. Wśród nich znajdują się: detekcja okresowości sygnału w poszczególnych ramkach czasowych, śledzenie zmian przydźwięku sieciowego wykorzystujące modelowane AR widma sygnału, śledzenie zmian wysokoczęstotliwościowego prądu podkładu....
Wireless intelligent audio-video surveillance prototyping system
Publikacja
- M. Kłosowski
- Przegląd Elektrotechniczny - Rok 2013
The presented system is based on the Virtex6 FPGA and several supporting devices like a fast DDR3 memory, small HD camera, microphone with A/D converter, WiFi radio communication module, etc. The system is controlled by the Linux operating system. The Linux drivers for devices implemented in the system have been prepared. The system has been successfully verified in a H.264 compression accelerator prototype in which the most demanding...

Pełny tekst do pobrania w portalu
Analysis of allophones based on audio signal recordings and parameterization
Publikacja
- Journal of the Acoustical Society of America - Rok 2017
The aim of this study is to develop an allophonic description of English plosive consonants based on recordings of 600 specially selected words. Allophonic variations addressed in the study may have two sources: positional and contextual. The former one depends on the syllabic or prosodic position in which a particular phoneme occurs. Contextual allophony is conditioned by the local phonetic environment. Co-articulation overlapping...

Pełny tekst do pobrania w serwisie zewnętrznym
Józef Kotus dr hab. inż.

Osoby

Katedra Systemów Multimedialnych
IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING

Czasopisma

ISSN: 1063-6676
Rekonstruktion des Baudenkmals ''Das grune Tor'' in Danzing nach einem Teileinsturz.
Publikacja
- BAUTECHNIK - Rok 2006
W pracy przedstawiono opis konstrukcyjny zabytkowej ''Zielonej Bramy'' w Gdańsku, która jako kilkukondygnacyjny obiekt murowany została wzniesiona w XVI wieku nad brzegiem Motławy. Podczas prowadzenia prac rmontowych w styczniu 2002r uległ zawaleniu fragment sklepienia wraz z podpierającą go kamienną kolumną. Dokładny przegląd całej konstrukcji wykazał, że bardzo zły stan także innych elementów konstrukcji nośnej tego obiektu....

Pełny tekst do pobrania w serwisie zewnętrznym
Seafloor relief reconstruction from side scan sonar data
Publikacja
- Z. Łubniewski
- K. Bikonis
- HYDROACOUSTICS - Rok 2007
Side scan sonar is one of the most widely used imaging systems in the underwater environment. It is relatively cheap and easy to deploy, in comparison with more powerful sensors. Although side scan sonar does not provide seafloor bathymetry directly, its records are directly related to seafloor images. In the paper, the method for 3D seafloor relief reconstruction from side scan sonar data is presented. The method is based on the...

Pełny tekst do pobrania w portalu
Two-stage method of impulsive noise detection for audio signals
Publikacja
- K. Cisowski
- Poznan University of Technology Academic Journals. Electrical Engineering - Rok 2007
Przedstawiono nowa dwuetapową metodę detekcji zakłóceń impulsowych opartą na analizie funkcji gęstości rozkładu prawdopodobieństwa zakłóconego sygnału. Opisano algorytm określania poziomu wyzwalania detektora progowego.
IEEE Transactions on Audio Speech and Language Processing

Czasopisma

ISSN: 1558-7916
Rekonstrukcja ewolucji układu przestrzennego średniowiecznego miasta i portu Szczecin Reconstruction of the Spatial Evolution of the Medieval City and Port of Szczecin
Publikacja
- K. Krośnicka
- Architectus - Rok 2016
Praca rekonstruuje ewolucję układu osadniczego Szczecina w okresie od połowy VIII w. do początku XIV w., w oparciu o interpretację dostępnej literatury naukowej dotyczącej historii i archeologii Szczecina oraz metodę analizy planistycznej. Bardzo istotnym elementem opisu struktury urbanistycznej wczesnośredniowiecznego Szczecina było określenie roli i położenia portu. W wyniku analizy zmian układu przestrzennego miasta w omawianym...

Pełny tekst do pobrania w portalu
Noise reduction in audio employing spectral unpredictability measure and neural net.
Publikacja
- A. Czyżewski
- M. Dziubiński
- Rok 2004
modelu psychoakustycznym zostały przedyskutowane. Uczący się algorytm decyzjny, działający w opraciu o sztuczną sieć neuronową wykorzystany został w klasyfikacji składowych na pasożytnicze i użyteczne. Przedstawiona została również nowa iteracyjna procedura obliczania progu maskowania. W pracy zawarte zostały wyniki eksperymentów, oraz konkluzje odnoszące się do przedstawionych algorytmów.
Multimodal human-computer interfaces based on advanced video and audio analysis
Publikacja
- Advances in Intelligent Systems and Computing - Rok 2014
Multimodal interfaces development history is reviewed briefly in the introduction. Some applications of multimodal interfaces to education software for disabled people are presented. One of them, the LipMouse is a novel, vision-based human-computer interface that tracks user’s lip movements and detect lips gestures. A new approach to diagnosing Parkinson’s disease is also shown. The progression of the disease can be measured employing...

Pełny tekst do pobrania w serwisie zewnętrznym
Intelligent acquisition of audio signals, employing neutral networks and rough set algorithms
Publikacja
- A. Czyżewski
- Rok 2003
Algorytmy oparte na sztucznych sieciach neuronowych i metodzie zbiorówprzybliżonych zostały zastosowane do lokalizacji sygnałów fonicznych obar-czonych pasożytniczym szumem i rewerberacjami. Informacja o kierunku napły-wania dźwięku była uzyskiwana na wyjściach tych algorytmów na podstawie re-prezentacji parametrycznej. Przedstawiono wyniki eksperymentalne i przepro-wadzono ich dyskusję.
Pomiary wartości opóźnień w torze audio urządzeń z systemem Android
Publikacja
- Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej - Rok 2018
Poniższy artykuł opisuje metody pomiarów wartości opóźnienia w torze fonicznym urządzeń pracujących na różnych wersjach systemu Android. W pierwszej części artykułu podano krótką charakterystykę środowiska Android w kontekście opóźnień w torze fonicznym. Następnie przedstawiono sposób pomiaru opóźnienia w torze fonicznym za pomocą aplikacji SuperPowered Latency oraz Dr. Rick O’Rang Loopback. W końcowej...

Pełny tekst do pobrania w portalu
Machine Learning Applied to Aspirated and Non-Aspirated Allophone Classification—An Approach Based on Audio "Fingerprinting"
Publikacja
- Rok 2018
The purpose of this study is to involve both Convolutional Neural Networks and a typical learning algorithm in the allophone classification process. A list of words including aspirated and non-aspirated allophones pronounced by native and non-native English speakers is recorded and then edited and analyzed. Allophones extracted from English speakers’ recordings are presented in the form of two-dimensional spectrogram images and...

Pełny tekst do pobrania w serwisie zewnętrznym
IEEE-ACM Transactions on Audio Speech and Language Processing

Czasopisma

ISSN: 2329-9290
Evaluation of Six Degrees of Freedom 3D Audio Orchestra Recording and Playback using multi-point Ambisonic interpolation
Publikacja
- T. Ciotucha
- A. Rumiński
- T. Żernicki
- B. Mróz
- Scopus - Rok 2021
This paper describes a strategy for recording sound and enabling six-degrees-of-freedom playback, making use of multiple simultaneous and synchronized Higher Order Ambisonics (HOA) recordings. Such a strategy enables users to navigate in a simulated 3D space and listen to the six-degrees-of-freedom recordings from different perspectives. For the evaluation of the proposed approach, an Unreal Engine-based navigable 3D audiovisual...

Pełny tekst do pobrania w serwisie zewnętrznym
Adaptive system for recognition of sounds indicating threats to security of people and property employing parallel processing of audio data streams
Publikacja
- K. Łopatka
- Rok 2015
A system for recognition of threatening acoustic events employing parallel processing on a supercomputing cluster is featured. The methods for detection, parameterization and classication of acoustic events are introduced. The recognition engine is based onthreshold-based detection with adaptive threshold and Support Vector Machine classifcation. Spectral, temporal and mel-frequency descriptors are used as signal features. The...
Testing A Novel Gesture-Based Mixing Interface
Publikacja
- M. Lech
- B. Kostek
- JOURNAL OF THE AUDIO ENGINEERING SOCIETY - Rok 2013
With a digital audio workstation, in contrast to the traditional mouse-keyboard computer interface, hand gestures can be used to mix audio with eyes closed. Mixing with a visual representation of audio parameters during experiments led to broadening the panorama and a more intensive use of shelving equalizers. Listening tests proved that the use of hand gestures produces mixes that are aesthetically as good as those obtained using...

Pełny tekst do pobrania w portalu
EURASIP Journal on Audio Speech and Music Processing

Czasopisma

ISSN: 1687-4714 , eISSN: 1687-4722
Jerzy Wtorek prof. dr hab. inż.

Osoby

Katedra Inżynierii Biomedycznej

Jerzy Wtorek uzyskał tytuł magistra inżyniera w 1976 roku na Wydziale Elektroniki Politechniki Gdańskiej, a stopień doktora nauk technicznych i doktora habilitowanego na Wydziale Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej, odpowiednio w 1986 i 2004 roku. Tytuł profesora uzyskał w 2016 r. Jego zainteresowania dotyczą nieinwazyjnych metod oceny układu krążenia, elektrycznych (aktywnych i pasywnych) właściwości...
Musical Instrument Tagging Using Data Augmentation and Effective Noisy Data Processing
Publikacja
- D. Koszewski
- B. Kostek
- JOURNAL OF THE AUDIO ENGINEERING SOCIETY - Rok 2020
Developing signal processing methods to extract information automatically has potential in several applications, for example searching for multimedia based on its audio content, making context-aware mobile applications (e.g., tuning apps), or pre-processing for an automatic mixing system. However, the last-mentioned application needs a significant amount of research to reliably recognize real musical instruments in recordings....

Pełny tekst do pobrania w portalu
Adaptive Personal Tuning of Sound in Mobile Computers
Publikacja
- JOURNAL OF THE AUDIO ENGINEERING SOCIETY - Rok 2016
An integrated methodology for enhancing audio quality in mobile computers is presented. The key features are adaptation of the characteristics of their acoustic track to changing acoustic conditions of the environment and to users’ individual preferences. Signal processing algorithms are introduced that concern: linearization of frequency response, dialogue intelligibility enhancement, and dynamics processing tuned up to the users’...

Pełny tekst do pobrania w portalu
Editor's note and 2018 reviewers
Publikacja
- B. Kostek
- JOURNAL OF THE AUDIO ENGINEERING SOCIETY - Rok 2018
Przedmiotem pracy jest odniesienie do prac opublikowanych w 2018 roku, jak również do serii artykułów w ramach specjalnego wydania: Special Issue on Augmented and Participatory Sound and Music Interaction Using Semantic Audio.

Pełny tekst do pobrania w serwisie zewnętrznym
KORPUS MOWY ANGIELSKIEJ DO CELÓW MULTIMODALNEGO AUTOMATYCZNEGO ROZPOZNAWANIA MOWY
Publikacja
- Przegląd Telekomunikacyjny + Wiadomości Telekomunikacyjne - Rok 2016
W referacie zaprezentowano audiowizualny korpus mowy zawierający 31 godzin nagrań mowy w języku angielskim. Korpus dedykowany jest do celów automatycznego audiowizualnego rozpoznawania mowy. Korpus zawiera nagrania wideo pochodzące z szybkoklatkowej kamery stereowizyjnej oraz dźwięk zarejestrowany przez matrycę mikrofonową i mikrofon komputera przenośnego. Dzięki uwzględnieniu nagrań zarejestrowanych w warunkach szumowych korpus...
Digital Audio Effects Conference

Konferencje
Sylwester Kaczmarek dr hab. inż.

Osoby

Katedra Sieci Teleinformacyjnych

Sylwester Kaczmarek ukończył studia w 1972 roku jako mgr inż. Elektroniki, a doktorat i habilitację uzyskał z technik komutacyjnych i inżynierii ruchu telekomunikacyjnego w 1981 i 1994 roku na Politechnice Gdańskiej. Jego zainteresowania badawcze ukierunkowane są na: sieci IP QoS, sieci GMPLS, sieci SDN, komutację, ruting QoS, inżynierię ruchu telekomunikacyjnego, usługi multimedialne i jakość usług. Aktualnie jego badania skupiają...
EVENTS VISUALIZATION POST IN A DISTRIBUTED TELEINFORMATION SYSTEM FOR THE BORDER GUARD
Publikacja
- Przegląd Telekomunikacyjny + Wiadomości Telekomunikacyjne - Rok 2017
Events Visualization Post is a part of the STRADAR project, which is dedicated to streaming real-time data in distributed dispatcher and teleinformation systems of the Border Guard. Events Visualization Post is a software designed for simultaneous visualization of data of different types. In the paper, the structure of the software is presented, the process of generation of tasks is described, and the visualization of audio, files,...
Automatic music signal mixing system based on one-dimensional Wave-U-Net autoencoders
Publikacja
- D. Koszewski
- T. Görne
- G. Korvel
- B. Kostek
- EURASIP Journal on Audio Speech and Music Processing - Rok 2023
The purpose of this paper is to show a music mixing system that is capable of automatically mixing separate raw recordings with good quality regardless of the music genre. This work recalls selected methods for automatic audio mixing first. Then, a novel deep model based on one-dimensional Wave-U-Net autoencoders is proposed for automatic music mixing. The model is trained on a custom-prepared database. Mixes created using the...

Pełny tekst do pobrania w portalu
Analysis of 2D Feature Spaces for Deep Learning-based Speech Recognition
Publikacja
- G. Korvel
- P. Treigys
- G. Tamulevicus
- J. Bernataviciene
- B. Kostek
- JOURNAL OF THE AUDIO ENGINEERING SOCIETY - Rok 2018
convolutional neural network (CNN) which is a class of deep, feed-forward artificial neural network. We decided to analyze audio signal feature maps, namely spectrograms, linear and Mel-scale cepstrograms, and chromagrams. The choice was made upon the fact that CNN performs well in 2D data-oriented processing contexts. Feature maps were employed in the Lithuanian word recognition task. The spectral analysis led to the highest word...
Bass Enhancement Settings in Portable Devices Based on Music Genre Recognition
Publikacja
- P. Hoffmann
- B. Kostek
- JOURNAL OF THE AUDIO ENGINEERING SOCIETY - Rok 2015
The paper presents a novel approach to the Virtual Bass Synthesis (VBS) applied to mobile devices, called Smart VBS (SVBS). The proposed algorithm uses an intelligent, rule-based setting of bass synthesis parameters adjusted to the particular music genre. Harmonic generation is based on a nonlinear device (NLD) method with the intelligent controlling system adapting to the recognized music genre. To automatically classify music...

Pełny tekst do pobrania w portalu
Measuring and Analyzing Audio Levels in Film, Commercials, and Movie Trailers Using Leq(A) Values and the LUFS Loudness Model . Analiza pomiarów dźwięku w filmie oraz w reklamach filmowych z wykorzystaniem modelu głośności
Publikacja
- Rok 2015
The purpose of this paper is to describe the measurement of loudness levels in movies, movie trailers, and commercials displayed before feature films at movie theaters. In the initial section, the paper discusses the issues related to measurement of loudness levels, provides recommendations regarding permissible loudness levels during movie screenings, and mentions the applied units of measurement. The following section of the...
SYSTEMY BEZDOTYKOWEJ OCENY PARAMETRÓW ŻYCIOWYCH
Publikacja
- J. Rumiński
- Rok 2019
W rozdziale przedstawiono metody ekstrakcji sygnałów biomedycznych i parametrów medycznych z wideo twarzy. W szczególności omówiono metody pozyskiwania pulsu w wideo uzyskiwanego w zakresie widzialnym oraz parametrów oddychania z zapisów sekwencji obrazów termograficznych.
Piotr Odya dr inż.

Osoby

Katedra Systemów Multimedialnych

Piotr Odya urodził się w Gdańsku w 1974. W 1999 roku ukończył z wyróżnieniem studia na Wydziale Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej zdobywając tytuł magistra inżyniera. Praca dyplomowa dotyczyła problemów poprawy jakości dźwięku w studiach emisyjnych współczesnych rozgłośni radiowych.Jego zainteresowania dotyczą montażu wideofonicznego, systemów dźwięku wielokanałowego. W ramach studiów doktoranckich...
International Symposium on Audio, Video, Image Processing and Intelligent Applications

Konferencje
Grzegorz Szwoch dr hab. inż.

Osoby

Katedra Systemów Multimedialnych

Grzegorz Szwoch urodził się w 1972 roku w Gdańsku. W latach 1991-1996 studiował na wydziale Elektroniki Politechniki Gdańskiej. W roku 1996 ukończył studia w Zakładzie Inżynierii Dźwięku (obecnie Katedra Systemów Multimedialnych), broniąc pracę dyplomową pt. Modelowanie fizyczne wybranych instrumentów muzycznych. W tym samym roku dołączył do zespołu badawczego Katedry jako uczestnik Studium Doktoranckiego. Od stycznia 2001 roku...
Matching Split Distance for Unrooted Binary Phylogenetic Trees
Publikacja
- D. Bogdanowicz
- K. Giaro
- IEEE-ACM Transactions on Computational Biology and Bioinformatics - Rok 2011
Rekonstrukcja drzew ewolucji jest jednym z głównych celów w bioinformatyce. Drzewa filogenetyczne reprezentuje historię ewolucji i związki pokrewieństwa między różnymi gatunkami. W pracy proponujemy nową ogólną metodę określania odległości między nieukorzenionymi drzewami filogenetycznymi, szczególnie użyteczną dla dużych zbiorów gatunków. Następnie podajemy szczegółowe własności jednej metryki określonej przy użyciu tej metody...

Pełny tekst do pobrania w serwisie zewnętrznym
Dynamic Bayesian Networks for Symbolic Polyphonic Pitch Modeling
Publikacja
- S. Raczyński
- E. Vincent
- S. Sagayama
- IEEE Transactions on Audio Speech and Language Processing - Rok 2013
Symbolic pitch modeling is a way of incorporating knowledge about relations between pitches into the process of an- alyzing musical information or signals. In this paper, we propose a family of probabilistic symbolic polyphonic pitch models, which account for both the “horizontal” and the “vertical” pitch struc- ture. These models are formulated as linear or log-linear interpo- lations of up to fi ve sub-models, each of which is...

Pełny tekst do pobrania w serwisie zewnętrznym
Instalacja artystyczna "W sztuce lubię: romantyzm, poezję i figle"
Publikacja
- P. Różycki
- Rok 2019
Instalacja artystyczna "W sztuce lubię: romantyzm, poezję i figle" instalacja z 70 koszul męskich różnego koloru, wraz z wideo wyświetlanym na suficie. Wystawa w Instytucie Cybernetyki Sztuki.
Workflow application for detection of unwanted events
Publikacja
- P. Czarnul
- W. Kicior
- Zeszyty Naukowe Wydziału ETI Politechniki Gdańskiej. Technologie Informacyjne - Rok 2010
Zaprezentowano rozproszoną aplikację do wykrywania potencjalnie niebezpiecznych zdarzeń z wejściowych strumieni wideo. Rozpoznanie niepożądanych zdarzeń wywołuje alarmy i wysyła powiadomienia do odpowiednich służb, jak również powoduje zarejestrowanie filmu. Model aplikacji składa się z węzłów z kamerami, pobierajacych strumienie danych, przetwarzajacych dane, wysyłajacych powiadomienia i zapisujacych dane. Zaimplementowana aplikacja...
Automatic sound recognition for security purposes
Publikacja
- P. Żwan
- Rok 2008
In the paper an automatic sound recognition system is presented. It forms a part of a bigger security system developed in order to monitor outdoor places for non-typical audio-visual events. The analyzed audio signal is being recorded from a microphone mounted in an outdoor place thus a non stationary noise of a significant energy is present in it. In the paper an especially designed algorithm for outdoor noise reduction is presented,...
QoS/QoE in the Heterogeneous Internet of Things (IoT)
Publikacja
- K. Nowicki
- T. Uhl
- Rok 2017
Applications provided in the Internet of Things can generally be divided into three categories: audio, video and data. This has given rise to the popular term Triple Play Services. The most important audio applications are VoIP and audio streaming. The most notable video applications are VToIP, IPTV, and video streaming, and the service WWW is the most prominent example of data-type services. This chapter elaborates on the most...
Akcelerator transformacji DCT do kompresji obrazu w sensorach wizyjnych
Publikacja
- Rok 2015
W komunikacie przedstawiono konfigurowalny cyfrowyakcelerator transformacji DCT przeznaczony dla enkodera wideo standardu H.264. Akcelerator realizuje także odwrotnątransformacjęDCT oraz kwantyzację i dekwantyzację. Akcelerator początkowo zaimplementowano w układzie FPGA. Został on pomyślnie zweryfikowany, a następnie zaimplementowany w układzie ASIC w technologiiUMC 90 nm. Szczegółowe wyniki testów akceleratora ASIC zostały...
Akcelerator transformacji DCT do kompresji obrazu w sensorach wizyjnych
Publikacja
- Przegląd Elektrotechniczny - Rok 2015
W komunikacie przedstawiono konfigurowalny cyfrowy akcelerator transformacji DCT przeznaczony dla enkodera wideo standardu H.264. Akcelerator realizuje także odwrotnątransformacjęDCT oraz kwantyzacjęi dekwantyzację. Akcelerator początkowo zaimplementowano w układzie FPGA. Zostałon pomyślnie zweryfikowany, a następnie zaimplementowany w układzie ASIC w technologii UMC 90 nm. Szczegółowe wyniki testów akceleratora ASIC zostały...

Pełny tekst do pobrania w portalu
Material for Automatic Phonetic Transcription of Speech Recorded in Various Conditions
Publikacja
- Rok 2016
Automatic speech recognition (ASR) is under constant development, especially in cases when speech is casually produced or it is acquired in various environment conditions, or in the presence of background noise. Phonetic transcription is an important step in the process of full speech recognition and is discussed in the presented work as the main focus in this process. ASR is widely implemented in mobile devices technology, but...

Pełny tekst do pobrania w serwisie zewnętrznym
Dworzec Morski - gdyńskie okno na świat
Publikacja
- M. Sołtysik
- Rok 2012
Artykuł przedstawia zabytkowy Dworzec Morski w Gdyni i ideę urządzenia w nim Muzeum Emigracji. Mówi o powstaniu i dziejach tego budynku, o jego zabytkowych wnętrzach oraz o jego wartości dla gdyńskiej architektury. Podkreśla, że to właśnie sam ten budynek jest najbardziej wartościowym świadectwem ruchu emigracyjnego, jaki w okresie międzywojennym odbywał się przez Gdynię. Dlatego też najważniejszym etapem urządzania gdyńskiego...

Pełny tekst do pobrania w serwisie zewnętrznym

Wyszukiwarka

Filtry

Katalog

Wyniki wyszukiwania dla: REKONSTRUKCJA AUDIO-WIDEO

Józef Kotus dr hab. inż.

Jerzy Wtorek prof. dr hab. inż.

Sylwester Kaczmarek dr hab. inż.

Piotr Odya dr inż.

Grzegorz Szwoch dr hab. inż.