Database of references - Multimedia Systems Department, TUG
784 record found

Return to the search page

Entry No. 1 
Entry typeconference paper 
AuthorsA. Czyżewski, P. Odya, J. Smulko, G. Lentka, B. Kostek, M. Kotarski 
English titleScent Emitting Multimodal Computer Interface for Learning Enhancement 
Polish titleWspomaganie procesu uczenia z wykorzystaniem Multimodalnego Interfejsu Aromatowego 
ConferenceMIMIC 2010 - Fourth International Workshop on Management and Interaction with Multimodal Information Content 
Preprint 
Number 
Volume 
Pages142 - 146 
Conference siteBilbao, Hiszpania 
Conference date30.8.10- 3.9.10 
NotesDEXA 2010 - 21. Int. Workshops on Databse and Expert System Applications 
AbstractA scent emitting multimodal computer interface is an important supplement of the polysensoric stimulation process. Such stimulation plays an essential role in education and therapy in children with developmental disorders (e.g. in the case of autism or ADHD). The interface engineered may be a part of the equipment of the so-called world experience rooms but can also be used separately, therefore enhancing substantially educational software. Emitting scents facilitate learning new material during the science lessons and/or make them more attractive; e.g. biology. The device developed uses USB and Bluetooth interfaces and supports a standard PC. Details about the interface are described in the paper, along with possible fields of application. 
StreszczenieKomputerowy interfejs aromatyczny stanowi ważne uzupełnienie procesu stymulacji polisensorycznej. Stymulacja ta odgrywa kluczową rolę w terapii i kształceniu dzieci z zaburzeniami rozwoju (np. w przypadku autyzmu czy ADHD). Opracowany interfejs może stać się elementem wyposażenia tzw. sal doświadczania świata, ale może być także stosowany niezależnie stanowiąc znaczące wzbogacenie komputerowych programów edukacyjnych. Dzięki możliwości emitowania zapachów można urozmaicać i uatrakcyjniać lekcje np. biologii czy materiałoznawstwa. Opracowane urządzenie korzysta z interfejsu USB lub Bluetooth i współpracuje z typowym komputerem klasy PC. Możliwe jest także uzyskanie informacji zwrotnych, które pozwalają sterować nasyceniem zapachu w pomieszczeniu.  

Entry No. 2 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski, S. K. Zieliński 
English titleArtificial Intelligence Approach to the Detection of Events in Musical Signal 
Polish titleWykorzystanie sztucznej inteligencji do wykrywania zdarzeń w sygnale muzycznym 
Conference96th AES Convention 
Preprint3822 (P7.8) 
Number 
Volume 
Pages 
Conference siteAmsterdam, Holland 
Conference date26.2.1994- 1.3.1994 
Abstract Experiments with events detection in musical signal with the use of the learning algorithm were described. Particular attention was paid to the recognition of transient states in pipe organ sound. The concept of the computer pipe organ control system based on artificial intelligence approach raised from these experiments. Applications of learning algorithm to musical pattern recognition and analyzing of transient states in musical sound were shown. 
StreszczenieZostały opisane eksperymenty z wykrywaniem zdarzeń w sygnale muzycznym z użyciem algorytmu uczącego się. Szczególna uwaga została poświęcona rozpoznawaniu stanów transjentowych w dźwięku piszczałki organowej. Z eksperymentów tych powstała koncepcja komputerowego systemu sterującego piszczałką organową bazującego na sztucznej inteligencji. Zostały przedstawione zastosowania algorytmu uczącego się do rozpoznawania fraz muzycznych i analizy stanów transjentowych w dźwiękach muzycznych. 

Entry No. 3 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, S. K. Zieliński 
English titleNew approach to the synthesis of organ pipe sound 
Polish titleNowa metoda syntezy dźwięku organowego  
Conference98th AES Convention 
Preprint3957 (E2) 
Number 
Volume 
Pages 
Conference siteParis, France 
Conference date25.2.1995- 28.2.1995 
Abstract Apperance of cheap digital signal processors on the electronics market opens a new domain of applications related to the real-time synthesis of sound of wind instruments basing directly on their physical models. Problems related to the implementation of physical model based synthesis of organ sound are discussed. Results of some experiments with this kind of synthesis are presented. Special features of the practically implemented method are quoted. 
Streszczenie Pojawienie się tanich cyfrowych procesorów sygnałowych na rynku elektronicznym otwiera nową dziedzinę zastosowań związanych z syntezą w czasie rzeczywistym dźwięków instrumentów dętych bazujących bezpośrednio na ich modelach fizycznych. Przedyskutowano problemy związane z implementacją modeli fizycznych, na których bazuje synteza dźwięku organowego. Przedstawiono rezultaty niektórych eksperymentów z tego rodzaju syntezą. Wspomniano o specjalnych właściwościach praktycznie zaimplementowanych metod. 

Entry No. 4 
Entry typeconference paper 
AuthorsA. Czyżewski, R. Królikowski 
English titleNoise Reduction in Audio Employing Auditory Masking Approach 
Polish titleRedukcja szumu w sygnałach fonicznych z wykorzystaniem zjawiska maskowania 
Conference106th Audio Engineering Society Convention  
Preprint4930 
Number 
Volume 
Pages 
Conference siteMonachium, Germany 
Conference date8.5.1999- 11.5.1999 
AbstractA new method of noise reduction which exploits some features of the human auditory system is proposed by the authors. The noise suppression is obtained twofold: by uplifting masking thresholds and by keeping noisy components just beneath these thresholds. The foundations of the engineered method are discussed extensively in the paper, and some engineered perceptual noise reduction algorithms are described. The way of introduction of the noise reduction features into an MPEG encoder is demonstrated. 
StreszczenieW referacie zaproponowano metodę redukcji szumu polegającą na wykorzystaniu niektórych cech systemu słuchowego człowieka. Tłumienie szumu może być uzyskane na dwa sposoby: poprzez podniesienie progów maskowania lub też przez składowych szumowych tuż poniżej tych progów. Szczegółowo przedstawiono podstawy opracowanej metody, jak również opisano algorytmy perceptualnej redukcji szumu. W referacie zamieszczono także sposób włączenia tej metody do schematu funkcjonalnego kodera w standardzie MPEG. 

Entry No. 5 
Entry typeconference paper 
AuthorsS.K. Zieliński, A. Czyżewski 
English titleA Method for Echo Cancellation in Audio Signals Using the Genetic Algorithm 
Polish titleMetoda tłumienia echa przy użyciu algorytmów genetycznych 
ConferenceJoint Meeting, 137th regular meeting of the Acoustical Society of America and the 2nd convention of the EAA: Forum Acusticum - integrating the 25th German Acoustics DAGA Conference 
Preprint 
Number 
Volume 
Pages 
Conference siteBerlin, Germany 
Conference date14.3.1999- 19.3.1999 
AbstractIn this paper, a new method of echo cancellation is proposed. This method is based on the use of models of systems causing the echo. Parameters of such models are optimized using the genetic algorithm. The computational cost of the proposed method can be minimized by the application of the correlation function. 
StreszczenieW komunikacie konferencyjnym przedstawiono nową metodę tłumienia echa. Metoda ta wykorzystuje modele systemów wytwarzających echo. Parametry modeli optymalizowane są przy użyciu algorytmów genetycznych. Złożoność obliczeniowa zaproponowanego algorytmu może być zmniejszona poprzez zastosowanie przetwarzania wstępnego sygnału wykorzystującego funkcje korelacji. 

Entry No. 6 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Lasecki, B. Kostek 
English titleNeural network-based beamformer 
Polish titleBeamformer oparty o sieć neuronową 
Conference3rd World Multiconference on Systemics, Cybernetics and Informatics (SCI’99) and the 5th International Conference on Information System Analysis and Synthesis (ISAS’99) 
Preprintpp. 195-198 
Number 
Volume
Pages 
Conference siteOrlando, USA 
Conference date31.7.1999- 5.8.1999 
AbstractA simple and robust spatial filtration algorithm working in the frequency domain is described. This algorithm uses neural network trained to decide whether a spectral component comes from forward or lateral/backward directions. Some details explaining how the neural network is acquiring knowledge about the signal directivity are presented. A discussion of the algorithm efficiency and limitations is also included.  

Entry No. 7 
Entry typeconference paper 
AuthorsH. Skarżyński, A. Czyżewski, B. Kostek 
English titleElectrostimulation Tests as a Tool in Cochlear Implant Preoperative Diagnostics 
Polish titleTesty elektrostymulacji jako badania kwalifikujące do implantowania osób niesłyszących 
Conference137 Acoust. Soc. of Amer. Meeting 
Preprint 
Number5aPPb 
Volume 
Pages 
Conference siteBerlin,  
Conference date13.3.1999- 18.3.1999 
AbstractThe procedures developed at the Institute of Physiology and Pathology of Hearing in Warsaw allow to determine some vital characteristics of the hearing sense that help to make decisions regarding the cochlear implantation. Apart from standard pre-examination procedures a test based on the electrical stimulation via the external auditory canal filled with saline can be performed. In order to evaluate the test results both the dynamics range defined by auditory threshold and uncomfortable loudness level and the Time Difference Limen Test are considered. Moreover in some deaf patients a speech communication was achieved with the use of the ball shaped electrode and the spectral compression of speech signal. In this way, the interpretation of the electrical stimulation test results for the new diagnosed cases was made more reliable.  
StreszczenieW referacie przedstawiono bezwzględne i względne kryteria kwalifikacji do implantacji wszczepów ślimakowych. Przedstawiono również nową metodę badania kwalifikującego do operacji. 

Entry No. 8 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Lasecki, B. Kostek 
English titleComputational Approach to Spatial Filtering 
Polish titleRealizacja algorytmu filtracji przestrzennej opartego o sztuczne sieci neuronowe 
Conference7th European Congress on Intelligent Techniques and Soft Computing 
Preprintpp.242 
Number 
VolumeCD-ROM Proceedings 
Pages 
Conference siteAachen, Germany 
Conference date13.9.1999- 16.9.1999 
AbstractHearing impaired persons have difficulty in understanding speech in cocktail-party conditions. Spatial filtering may be very helpful for such people. This feature should be applied to the hearing aid, thus the computational complexity of spatial filtering-based algorithm must allow real time implementation. In order to meet this assumption some investigations were made and neural network-based algorithm was proposed. This algorithm is presented in this paper. 
Streszczenieyyyy 

Entry No. 9 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski, J. Lasecki 
English titleSpatial Filtration of Sound for Multimedia Systems 
Polish titleFiltracja przestrzenna dźwięku w systemach multimedialnych 
ConferenceIEEE Signal Processing Society 1999 Workshop on Multimedia Signal Processing 
Preprint209-213 
Number 
VolumeCD-ROM Proceedings 
Pages 
Conference siteCopenhagen, Denmark 
Conference date13.9.1999- 15.9.1999 
AbstractThis paper deals with the problem of receiving of a desired signal in noisy or “cocktail-party" conditions. This problem is vital in many domains, such as communications, multimedia (multimodal interaction), speech recognition, and psychoacoustics (hearing prostheses). It can be partially solved by classical filtering techniques, however these techniques often introduce distortions into the filtered signal. On the other hand, as it results form experiments performed by the authors, a spatial filtration can be performed based on the Artificial Neural Network (ANN). Such an algorithm was elaborated, and some details concerning its implementation are described. Moreover, results of experiments are presented. These results demonstrate that ANN-based nonlinear filter increases the signal-to-noise ratio and improves speech intelligibility. 
StreszczenieW pracy przedstawiono nowe rozwiązanie filtracji przestrzennej sygnału w obecności dookólnego szumu. W odróżnieniu od klasycznych podejść, w których stosuje się typowe filtry cyfrowe, w podejściu opisywanym w niniejszej pracy jako element filtrujący zastosowano sztuczną sieć neuronową. W pracy zaprezentowano wyniki pomiarów opracowanego filtru przestrzennego. 

Entry No. 10 
Entry typeconference paper 
AuthorsA. Czyżewski, R. Królikowski, S.K. Zieliński, B. Kostek 
English titleIntelligent Echo and Noise Reduction 
Polish titleInteligenta metoda tłumienia echa i szumu 
Conference3rd World Multiconference on Systemics, Cybernetics and Informatics (SCI’99) and the 5th International Conference on Information System Analysis and Synthesis (ISAS’99) 
Preprintpp.234-238 
Number 
Volume
Pages 
Conference siteOrlando, USA 
Conference date31.7.1999- 4.8.1999 
AbstractNew concepts of echo cancellation and reduction of non-stationary noise affecting audio signals transmitted in telecommunication channels are proposed. In the both cases, some methods originated form artificial intelligence domain, i.e.: genetic algorithms, neural networks, rough sets are applied. In turn, in the noise reduction method, some features of the human auditory system are presented in the paper. Furthermore, a number of experiments have been carried out, and a brief discussion on some of them is included in the paper. 
StreszczenieW referacie zaproponowano nową koncepcję redukcji echa oraz szumu niestacjonarnego, zakłócających sygnały foniczne transmitowane w kanałach telekomunikacyjnych. W obu przypadkach wykorzystano niektóre metody z dziedziny sztucznej inteligencji, tj.: algorytmy genetyczne, sieci neuronowe i zbiory przybliżone. Z kolei, w metodzie redukcji szumu wykorzystywane są pewne cechy systemu słuchowego człowieka. W referacie przedstawiono podstawy opracowanej metody wraz z opisem zastosowanych algorytmów inteligentnych. Ponadto, przeprowadzono szereg eksperymentów i zamieszczono krótką dyskusja nad uzyskanymi wynikami.  

Entry No. 11 
Entry typeconference paper 
AuthorsG. Szwoch, B. Kostek, A. Czyżewski 
English titleDesigning Waveguide Elements of a Hearing Aid Using the Physical Modeling Techniques 
Polish titleProjektowanie falowodowych elementów aparatów słuchowych przy użyciu metody modelowania fizycznego 
Conference106th AES Convention 
Preprint4870 
Number 
Volume 
Pages 
Conference siteMunich, Germany 
Conference date8.5.1999- 11.5.1999 
AbstractThe aim of this paper is to model a desired transfer function of a hearing aid. For this purpose physical modeling techniques were used in order to change parameters of a model in real time. The main features of a system allow one to design waveguide elements of a hearing aid. Such a system may be helpful in the process of fitting some hearing aid elements. 
StreszczenieW artykule opisano metodę projektowania akustycznych elementów aparatów słuchowych, posiadających pożądane charakterystyki częstotliwościowe. Metoda modelowania fizycznego została wykorzystana w celu umożliwienia regulacji parametów modelu w czasie rzeczywistym. System ten pozwoli na projektowanie falowodowych elementów aparatów słuchowych. Może on być pomocny w procesie dobierania aparatu słuchowego. 

Entry No. 12 
Entry typeconference paper 
AuthorsA. Czyżewski, R. Królikowski, S.K. Zieliński, B. Kostek 
English titleEcho and Noise Reduction Methods for Multimedia Communication Systems 
Polish titleMetody redukcji echa i szumu dla multimedialnych systemów komunikacyjnych 
ConferenceIEEE Signal Processing Society 1999 Workshop on Multimedia Signal Processing 
Preprintpp. 239-244 
Number 
Volume 
Pages 
Conference siteCopenhagen, Denmark 
Conference date13.9.1999- 15.9.1999 
AbstractNew concepts of echo cancellation and reduction of non-stationary noise affecting audio signals transmitted in telecommunication channels are proposed. In the both cases, some methods originated form artificial intelligence domain, i.e.: genetic algorithms, neural networks, rough sets are applied. Moreover, in the noise reduction method, some features of the human auditory system are exploited. A number of experiments have been carried out, and a brief discussion on some of them is included in the paper. 
StreszczenieW referacie zaproponowano nową metodę redukcji echa oraz szumu niestacjonarnego, zakłócających sygnały foniczne transmitowane w kanałach telekomunikacyjnych. W obu przypadkach wykorzystano niektóre metody z dziedziny sztucznej inteligencji, tj.: algorytmy genetyczne, sieci neuronowe i zbiory przybliżone. Dodatkowo, w metodzie redukcji szumu wykorzystywane są pewne cechy systemu słuchowego człowieka. Przeprowadzono szereg eksperymentów i zamieszczono krótką dyskusja nad uzyskanymi wynikami.  

Entry No. 13 
Entry typeconference paper 
AuthorsH. Skarżyński, A. Czyżewski, B. Kostek, G. Szwoch 
English titleComputer Techniques in Electrostimulation Testing of Hearing and Hearing Aid Modeling 
Polish titleWybrane zastosowania techniki komputerowej w testowaniu i modelowaniu charakterystyk słyszenia 
Conference3rd World Multiconference on Systemics, Cybernetics and Informatics (SCI'99) and the 5th International Conference on Information System Analysis and Synthesis (ISAS'99) 
Preprintpp. 216-221 
Number 
Volume
Pages 
Conference siteOrlando, USA 
Conference date31.7.1999- 5.8.1999 
AbstractIn this paper two aplications of computer techniques in audiology are presented. In the first part of the paper, a new method to examine electrostimulation of structure of the auditory tract, developed in the Institute of Physiology and Pathology of Hearing, is described. The study is dedicated to the problem of an evaluation of the auditory nerve electrical sensitivity in deaf people, assisted by computer technology. A new method is proposed, which enables an assessment of both hearing loss in a given moment of time and the future benefits of the cochlear implant to the patient. In the second part of the paper, a new method of fitting acoustical elements of a hearing aid is proposed. A digital waveguide model of these elements is designed. Next,on the basis of this model computer simulations are performed. It is possible to obtain the desired shape of transfer function of the model by changing the values of its parameters. Resulting a computer simulation dimensions of the physical system can be calculated. This method can be used to design acoustical elements of a hearing aid, having desired acoustical properties. Both applications, although aimed at different group of patient 

Entry No. 14 
Entry typeconference paper 
AuthorsR. Królikowski, A. Czyżewski 
English titleNoise Reduction in Telecommunication ChannelsUsing Rough Sets and Neural Networks 
Polish titleRedukcja szumu w kanałach telekomunikacyjnych z wykorzystaniem zbiorów przybliżonych i sieci neuronowych 
Conference7th International Workshop on Rough Sets, Fuzzy Sets, Data Mining, and Granular-Soft Computing 
Preprintpp. 100-108 
Number 
Volume 
Pages 
Conference siteUbe, Yamaguchi, Japonia,  
Conference date9.11.1999- 11.11.1999 
AbstractA new concept of reduction of non-stationary noise affecting audio signals transmitted in telecommunication channels is proposed. This concept exploits some features of the human auditory system as well as some methods originated from soft computing domain, i.e. rough set-based reasoning and neural processing. The foundations of the engineered method and a description of applied decision algorithms are presented. A number of experiments have been prepared, and some of them have already been carried out. A brief discussion of these experiments' results and some conclusions are also included. 
StreszczenieW referacie zaproponowano nową koncepcję redukcji szumu niestacjonarnego zakłócającego sygnały foniczne w kanałach telekomunikacyjnych. Koncepcja ta wykorzystuje pewne cechy systemu słyszenia, jak również pewne metody z dziedziny soft-computingu, tj. wnioskowanie w oparciu o zbiory przybliżone oraz przetwarzanie neuronowe. Przedstawiono podstawy opracowanej metody oraz opis zastosowanych algorytmów. Przygotowano i wykonano pewną liczbę eksperymentów. W referacie zamieszczono krótką dyskusję nad otrzymanymi wynikami wraz wnioskami końcowymi. 

Entry No. 15 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Lasecki, B. Kostek 
English titleComputational Approach to Spatial Filtering 
Polish titleRealizacja algorytmu filtracji przestrzennej opartego o sztuczne sieci neuronowe 
Conference7th European Congress on Intelligent Techniques and Soft Computing 
Preprintpp.242 
Number 
VolumeCD-ROM Proceedings 
Pages 
Conference siteAachen, Germany 
Conference date13.9.1999- 16.9.1999 
AbstractHearing impaired persons have difficulty in understanding speech in cocktail-party conditions. Spatial filtering may be very helpful for such people. This feature should be applied to the hearing aid, thus the computational complexity of spatial filtering-based algorithm must allow real time implementation. In order to meet this assumption some investigations were made and neural network-based algorithm was proposed. This algorithm is presented in this paper. 
Streszczenieyyyy 

Entry No. 16 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Lasecki, B. Kostek 
English titleComputational Approach to Spatial Filtering 
Polish titleRealizacja algorytmu filtracji przestrzennej opartego o sztuczne sieci neuronowe 
Conference7th European Congress on Intelligent Techniques and Soft Computing 
Preprintpp.242 
Number 
VolumeCD-ROM Proceedings 
Pages 
Conference siteAachen, Germany 
Conference date13.9.1999- 16.9.1999 
AbstractHearing impaired persons have difficulty in understanding speech in cocktail-party conditions. Spatial filtering may be very helpful for such people. This feature should be applied to the hearing aid, thus the computational complexity of spatial filtering-based algorithm must allow real time implementation. In order to meet this assumption some investigations were made and neural network-based algorithm was proposed. This algorithm is presented in this paper. 
Streszczenieyyyy 

Entry No. 17 
Entry typeconference paper 
AuthorsS.K. Zieliński, A. Czyżewski 
English titleA Novel Approach to Echo Cancellation 
Polish titleNowe podejście do tłumienia echa 
Conference106th Audio Engineering Society Convention 
Preprint4901 
Number 
Volume 
Pages 
Conference siteMunich, Germany 
Conference date8.5.1999- 11.5.1999 
AbstractIn this paper a new method of echo cancellation is proposed. This method is based on the genetic algorithm. 
StreszczenieW pracy zaproponowano nową metodę tłumienia echa. Metoda ta opiera się na wykorzystaniu algorytmów genetycznych. 

Entry No. 18 
Entry typebook 
AuthorsA. Czyżewski, R. Królikowski 
English titleApplication of Fuzzy Logic and Rough Sets to Audio Signal Enhancement 
Polish titleZastosowanie logiki rozmytej i zbiorów przybliżonych do poprawy jakości sygnału fonicznego s. 397-409 
EditorSpringer-Verlag 
Pages379 
AbstractA method of noise reduction, related to spectral subtraction and controlled by intelligent algorithms, is described in the paper. A decision system based on fuzzy logic and rough sets is presented. The engineered inference algorithm exploiting rough sets is also included. 
StreszczenieW artykule opisano metodę redukcji szumu, zbliżoną do odejmowania widmowego, sterowaną przy pomocy algorytmów inteligentnych. Przedstawiono zastosowanie systemu decyzyjnego pracującego w logice rozmytej oraz wykorzystującego wnioskowanie oparte na zbiorach przybliżonych. Zamieszczono również opracowany algorytm decyzyjny działający przy użyciu zbiorów przybliżonych. 

Entry No. 19 
Entry typeconference paper 
AuthorsA. Czyżewski, R. Królikowski 
English titlePerceptual Approach to Noise Reduction 
Polish titlePerceptualna redukcja szumu 
Conference8th International Symposium on Sound Engineering and Mastering 
Preprints. 53-58 
Number 
Volume 
Pages 
Conference siteGdańsk, Poland 
Conference date9.9.1999- 11.9.1999 
AbstractA perceptual approach to noise reduction problem is presented in the paper. According to this, the noise suppression can be obtained by exploiting some masking properties of the auditory system. In the paper, mathematical foundations of the engineered method with relevant algorithms, and some observations related to the carried out experiments are briefly presented. 
StreszczenieW referacie przedstawiono podejście perceptualne do problemu redukcji szumu, zgodnie z którym, redukcja szumu może być uzyskana wskutek wykorzystania właściwości maskowania ucha ludzkiego. W referacie krótko omówiono matematyczne podstawy opracowanej metody wraz z odpowiednimi algorytmami, a także zamieszczono niektóre obserwacje dotyczące wykonanych eksperymentów.  

Entry No. 20 
Entry typeconference paper 
AuthorsR. Królikowski, A. Czyżewski 
English titleNoise Reduction in Acoustic Signals Using the Perceptual Coding 
Polish titleRedukcja szumu w sygnałach fonicznych z wykorzystaniem kodowania perceptualnego 
Conference137th Regular Meeting of the Acoustical Society of America 
PreprintS49 (1pSCa8) 
Number 
VolumeCD Proceedings  
Pages 
Conference siteBerlin, Germany 
Conference date14.3.1999- 19.3.1999 
AbstractA new method of noise reduction exploiting some features of the human auditory system is proposed by the authors. The noise suppression is obtained twofold: by uplifting masking thresholds and by keeping noisy components just beneath these thresholds. The foundations of the engineered method are described, and some results of the carried out experiments are briefly discussed in the paper. 
StreszczenieW referacie, zamieszczono propozycję metody redukcji szumu z wykorzystaniem pewnych cech systemu słyszenia człowieka. Wg niej, redukcję szumu obecnego w sygnale można uzyskać w trakcie perceptualnego kodowania w dwojaki sposób: poprzez podniesienie progów maskowania lub też utrzymując składowe szumowe poniżej tych progów. W referacie opisano podstawy opracowanej metody oraz krótko przedyskutowano wyniki przeprowadzonych eksperymentów. 

Entry No. 21 
Entry typeconference paper 
AuthorsA. Czyżewski, R. Królikowski 
English titleNoise Reduction in Audio Signals Based on the Perceptual Coding Approach 
Polish titleRedukcja szumu w sygnałach fonicznych w oparciu o perceptualne kodowanie sygnałów 
ConferenceIEEE Workshop on Applications of Signal Processing to Audio and Acoustics 
Preprintpp. 147-150 
Number 
Volume 
Pages 
Conference siteNew Paltz, NY, USA 
Conference date17.10.1999- 20.10.1999 
AbstractA new concept of the reduction of noise affecting audio signals transmitted in telecommunication channels is proposed. This concept is exploiting some features of the human auditory system. A strong subjective effect of noise suppression in noisy audio can be obtained by uplifting masking thresholds above the estimated level of noisy components or by reducing this level in such a way that the components be maintained just below masking thresholds. The foundations of the engineered method together with the appropriate algorithms are described in the paper. A brief discussion on the results of carried out experiments and some conclusions are also included in the paper. The main focus is put on perceptual foundations of the noise reduction method.  
StreszczenieW referacie zaproponowano nową koncepcję redukcji szumu, wykorzystującą pewne cechy systemu słyszenia człowieka. Silny subiektywny efekt tłumienia szumu można uzyskać albo przez podniesienie progów maskowania powyżej oszacowanego poziomu składowych szumowych, albo przez redukcję poziomu tych składowych poniżej progów maskowania. W referacie opisano podstawy opracowanej metody wraz z odpowiednimi algorytmami oraz zamieszczono krótką dyskusję na temat uzyskanych rezultatów wraz z wnioskami. Skupiono się w nim głównie na perceptualnych podstawach opracowanej metody redukcji szumu.  

Entry No. 22 
Entry typeconference paper 
AuthorsR. Królikowski, A. Czyżewski 
English titleApplications of Rough Sets and Neural Nets to Noisy Audio Enhancemen 
Polish titleZastosowanie zbiorów przybliżonych oraz sieci neuronowych do poprawy jakości sygnału fonicznego 
Conference7th European Congress on Intelligent Techniques and Soft Computing 
Preprintpp. 240 
Number 
VolumeCD-ROM Proceedings 
Pages 
Conference siteAachen, Germany 
Conference date13.9.1999- 16.9.1999 
AbstractA new concept of reduction of non-stationary noise affecting audio signals transmitted in telecommunication channels is proposed. This concept exploits some features of the human auditory system as well as some methods originated from artificial intelligence domain, i.e. reasoning based on rough sets and neural processing. The foundations of the engineered method together with a description of applied intelligent decision algorithms are presented in the paper. A number of experiments have been prepared, and some of them have already been carried out. Hence, a brief discussion on the results of these experiments and some conclusions are also included in the paper.  
StreszczenieW referacie zaproponowano nową metodę redukcji szumu niestacjonarnego, zakłócającego sygnały foniczne transmitowane w kanałach telekomunikacyjnych. Wykorzystuje ona zarówno pewne cechy systemu słuchowego człowieka, jak również pewne metody sztucznej inteligencji, tj. wnioskowanie oparte na zbiorach przybliżonych i przetwarzanie neuronowe. Przedstawiono podstawy opracowanej metody wraz z opisem zastosowanych inteligentnych systemów decyzyjnych. Przygotowano szereg eksperymentów i zamieszczono krótką dyskusję nad ich wynikami wraz z wnioskami.  

Entry No. 23 
Entry typejournal paper 
AuthorsA. Kaczmarek, A. Czyżewski, B. Kostek 
English titleInvestigating Polynomial Approximation of Spectra of the Pipe 
Polish titleAproksymacja wielomianowa widma dźwięków piszczałek organowych 
JournalArchives of Acoustics 
Volume24 
Number
Pages3 - 24 
AbstractA precise method for the determination of the spectral representation of pipe sounds was introduced. The polynomial approximation of the spectral envelope was found to be an effective tool, allowing the study of differences between sounds produced by organ pipes of various types belonging to some selected instruments. The paired comparison subjective testing procedure was applied in order to assess the similarities between sounds synthesized using polynomial smoothed spectra and the original organ sound patterns. The statistical processing of test results revealed that a direct relation exists between the type of organ pipe and the minimum order of the approximating polynomial that can be used to represent the pipe sound spectrum, as determined by the positive opinions of the experts. The applied pipe organ sound recording and processing methods, subjective testing procedures and experiment results are discussed in the paper.  

Entry No. 24 
Entry typeconference paper 
AuthorsA. Czyżewski, H. Skarżyński, B. Kostek, R. Królikowski 
English titleRough Set Analysis of Electrostimulation Test Database for the Prediction of Post-Operative Profits in Cochlear Implanted Patients 
Polish titleAnaliza bazy danych testów elektrostymulacji w oparciu o zbiory przybliżone w celu przewidywania pooperacyjnych korzyści u pacjentów z implantami ślimakowym 
Conference7th Int. Workshop on Rough Sets, Fuzzy Sets, Data Mining, and Granular-Soft Computing 
Preprintpp. 109-117 
Number 
Volume 
Pages 
Conference siteUbe, Yamaguchi, Japonia,  
Conference date9.11.1999- 11.11.1999 
AbstractA new method of examining the hearing nerve in deaf people is presented. It consists in testing deaf people with a speech signal delivered via a microelectrode connected to a current source and attached to the promontory. The current delivered to the electrode is modulated with the speech signal, transposed downwards the frequency scale. A database of patients’ data and electrostimulation test results was created, and analyzed using a rough set method in order to find rules allowing prediction of hearing recovery of cochlear implantation candidates. 
StreszczeniePrzedstawiono nową metodę badania nerwu słuchowego u osób głuchych, polegającą na badaniu reakcji takich osób przy podaniu sygnału mowy poprzez mikroelektrodę, połączoną ze źródłem prądu i umieszczoną na promontorium. Prąd modulowany jest sygnałem mowy, transponowanym w dół skali częstotliwości. Utworzono bazę danych pacjentów i wyników testów elektrostymulacji, która przetworzono w oparciu o metodę zbiorów przybliżonych w celu znalezienia reguł umożliwiających predykcję polepszania słyszenia u kandydatów do implantacji. 

Entry No. 25 
Entry typeconference paper 
AuthorsA. Czyżewski, R. Królikowski 
English titleNeural Algorithm-Based Modelling of Some Properties of the Human Auditory System 
Polish titleModelowanie pewnych właściwości systemu słuchowego człowieka w oparciu o algorytm neuronowy 
ConferenceIV Konferencja Sieci Neuronowych i Ich Zastosowań 
Preprints. 117-122 
Number 
Volume 
Pages 
Conference siteZakopane,  
Conference date18.5.1999- 22.5.1999 
AbstractA parallel algorithm derived form the standard neural net was applied to simulation of simultaneous masking of sound. Due to proposed innovations, the neural topology is more strictly related to the chosen model, and the standard model of an neuron is extended by a synaptic function for each biased input. These modifications lead to a „dedicated” structure for which the traditional training can be replaced by the data storage. The extended neuron’s model and the topology of the auditory masking-oriented net are discussed. A brief description of the chosen perceptual model is also included. 
StreszczenieNa podstawie standardowej struktury neuronowej, opracowano równoległy algorytm i zastosowano do symulacji maskowania jednoczesnego dźwięku. Przez wprowadzenie, topologia proponowanej sieci jest ściślej związana z wybranym modelem psychoakustycznym. Poza tym, standardowy model neuronu został rozszerzony przez wprowadzenie funkcji synaptycznej dla każdego wejścia, które zostało obciążone wartością progową. Te modyfikacje prowadzą do dedykowanej struktury, dla której tradycyjny trening może zostać zastąpiony zapamiętywaniem danych. W referacie omówiono rozszerzony model neuronu, topologię sieci zorientowanej na system słuchowy oraz zamieszczono krótki opis wybranego modelu psychoakustycznego. 

Entry No. 26 
Entry typeconference paper 
AuthorsH. Skarżyński, A. Czyżewski, B. Kostek 
English titlePrediction of Post-Operative Profits in Cochlear Implanted Patients Using the Electricostimulation Procedure 
Polish titleKwalifikacja pacjentów do operacji wszczepu ślimakowego na podstawie wyników elektroatymulacji nerwu słuchowego 
ConferenceIEEE Workshop on Applications of Signal Processing to Audio and Acoustics 
Preprintpp. 239-242 
Number 
Volume 
Pages 
Conference siteNew Paltz, NY, USA 
Conference date17.10.1999- 20.10.1999 
AbstractThe presented research is devoted to the problem of evaluation of the auditory nerve electrical sensitivity in deaf people. In the case of profound hearing impairments the assessment of the degree of hearing loss by using standard acoustic tests such as tonal or vocal audiometry, ABR testing, impedance audiometry, etc. would often conclude in a complete lack of response to an acoustic stimulus in the patient. That is why other diagnostic methods that would enable evalualion of the auditory nerve electrical sensitivity have been designed and introduced to the clinical practice. The method of speech signal transmission to the auditory nerve before cochlear implantation was conceived and tested. This method uses spectral transposition of signal delivered to the external electrode allowing to stimulate the auditory nerve. 

Entry No. 27 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski, P. Suchomski 
English titleMultimedia Fitting System for Hearing Impaired People. 
Polish titleMultimedialny system doboru protez. 
Conference3rd World Multiconference on Systemics, Cybernetics and Informatics (SCI'99) and the 5th International Conference on Information System Analysis and Synthesis (ISAS'99), pp. 169-175,6 fig., 1 tab., 9 
Preprint 
Number 
Volume
Pages 
Conference siteOrlando, USA,,  
Conference date31.7.1999- 5.8.1999 
AbstractOne of the most important stages in the recovery of hearing impaired people is the choice of n adequate hearing aid. The elaborated Multimedia Hearing Aid Fitting System (MHAFS) is an experimental software that allows to find the characterictics of a hearing aid matching patient's needs and to choose automatically a suitable hearing device. It is planned that this system will be made available in the Internet, so it can be used by anybody who is willing to experience a remote approximate testing of hearing characteristics and receive sounds processed like in some well fitted hearing aids. The key issues related to the engineered system will be presented in the paper. 

Entry No. 28 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, S.K Zieliński 
English titleCommon Hearing Tester and Computer-Based Audiometer 
Polish titleTester słuchu i audiomets komputerowy 
ConferenceWarsztaty Naukowo-Szkoleniowe Audiologii: Nowoczesna diagnostyka zaburzeń słuchu, Wystapienie seminaryjne - ustne 
Preprint 
Number 
Volume 
Pages 
Conference siteWarszawa,  
Conference date8.6.2000- 10.6.2000 
AbstractWarsztaty Naukowo-Szkoleniowe Audiologii: Nowoczesna diagnostyka zaburzeń słuchu W celu pomiaru słuchu można wykorzystać odtwarzacz płyt kompaktowych lub komputer osobisty. Do celów pomiarowych wykorzystano metodę adudiometrii tonalnego oraz metodę audiometrii mowy w szumie.  
StreszczenieIt is possible to use CD player and/or the personal computer for hearing evaluation. The tonal audiometry and the speech in noise audiometry were employed for these purposes. 

Entry No. 29 
Entry typeconference paper 
AuthorsR. Królikowski, A. Czyżewski, B. Kostek 
English titleLocalization of Sound Sources by Means of Recurrent Neural Networks 
Polish titleLokalizacja źródeł dźwięku przy pomocy rekurencyjnych sieci neuronowych  
ConferenceThe Second International Conference on Rough Sets and Current Trends in Computing (RSCTC 
Preprint 
Number 
Volume 
Pages564 - 573 
Conference siteBanff, Kanada 
Conference date16.10.2000- 19.10.2000 
AbstractThe issue of localization of sound sources for videoconferencing is discussed in the paper. A new algorithm for estimating speaker locations, based on recurrent neural networks (RNN), is introduced and described. The scheme of experiments carried out in an acoustically adopted chamber, exploiting the engineered method is detailed. 
StreszczenieW referacie poruszono kwestie lokalizacji źródeł dźwięku dla potrzeb wideokonferencji. Przedstawiono i opisano nowy algorytm estymacji miejsca położenia mówcy, działający w oparciu o rekurencyjne sieci neuronowe. Ponadto, zamieszczono schemat eksperymentów przeprowadzonych w pomieszczeniu dopasowanym akustycznie i wykorzystujących opracowaną metodę.  

Entry No. 30 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, P. Odya, S. Zieliński 
English titleDetermining Influence of Visual Cues on the Perception of Surround Sound Using Soft Computing 
Polish titlePercepcja obrazu i dźwięku w systemie dookólnym 
ConferenceRSCTC'2000 
Preprint 
Number 
Volume 
Pages507 - 516 
Conference siteBanff, Canada,  
Conference date16.10.2000- 19.10.2000 
AbstractContemporary digital video, film or multimedia presentations are often accompanied by the surround sound. Techniques and standards involved in digital video processing are much more developed than concepts underlying creating recording and mixing of the multichannel sound. The main challenge in the sound processing in the multichannel system is to create an appropriate basis for the relating multimodal context of visual and sound domains. Therefore, one of the purposes of experiments is to study in which way and how the surround sound interferes or is associated with the visual context. This kind of study was hitherto carried out when two-channel sound technique was associated with a stereo TV. However, there is not much study done yet that associates surround sound and digital video presented at the TV screen. The main issue in such experiments is the analysis of the influence of visual cues on perception of the surround sound. This problem will be solved with the application of fuzzy logic to the processing of subjective test results.  
StreszczenieReferat pokazuje eksperymenty mające na celu ocenę wpływu obrazu na percypowany dźwięk w systemie dookólnym. Przedsykutowano metodykę badań oraz przedstawiono wyniki przeprowadzonych testów subiektywnych. W referacie zawarto też dyskusję sposobów obróbki uzyskanych wyników. W przeprowadzonych eksperymentach posłużóno się logiką rozmytą. 

Entry No. 31 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski, P. Odya 
English titleShift in Localization of Phantom Sound Sources in Surround Sound versus Video Context 
Polish titleWpływ obrazu na lokalizację źródeł pozornych w systemie dookólnym 
Conference21st Tonmeistertagung 
Preprint 
Number 
Volume 
Pages1 - 8 
Conference siteHanower, Niemcy,  
Conference date24.11.2000- 27.11.2000 
AbstractContemporary digital video, film or multimedia presentations are often accompanied by the surround sound. The visual objects displayed on the screen can affect perception of the phantom sound sources in surround panorama. Therefore, one of the purposes of experiments is to study in which way and how the surround sound interferes or is associated with the visual context. The main issue in such experiments is the analysis of the influence of visual cues on perception of the surround sound. This problem will be solved with the application of fuzzy logic to the processing of subjective test results.  
StreszczenieCelem referatu było zbadanie wpływu obrazu na lokalizację źródeł pozornych w systemie dookólnym. W referacie przedstawiono założenia eksperymentów i sposób ich przeprowadzenia oraz kalibrację systemu złożonego z czterech głośników, komputera wyposażonego w kartę DVD oraz programu komputerowego symulującego zmianę położenia źródeł pozornych. Przedyskutowano również otzrymane wyniki i pdano wnioski. 

Entry No. 32 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, P. Odya, S. Zieliński 
English titleDetermining Influence of Visual Cues on the Perception of Surround Sound Using Soft Computing 
Polish titlePercepcja obrazu i dźwięku w systemie dookólnym 
ConferenceRSCTC'2000 
Preprint 
Number 
Volume 
Pages1 - 10 
Conference siteBanff, Canada,  
Conference date16.10.2000- 19.10.2000 
AbstractContemporary digital video, film or multimedia presentations are often accompanied by the surround sound. Techniques and standards involved in digital video processing are much more developed than concepts underlying creating recording and mixing of the multichannel sound. The main challenge in the sound processing in the multichannel system is to create an appropriate basis for the relating multimodal context of visual and sound domains. Therefore, one of the purposes of experiments is to study in which way and how the surround sound interferes or is associated with the visual context. This kind of study was hitherto carried out when two-channel sound technique was associated with a stereo TV. However, there is not much study done yet that associates surround sound and digital video presented at the TV screen. The main issue in such experiments is the analysis of the influence of visual cues on perception of the surround sound. This problem will be solved with the application of fuzzy logic to the processing of subjective test results.  
StreszczenieReferat pokazuje eksperymenty mające na celu ocenę wpływu obrazu na percypowany dźwięk w systemie dookólnym. Przedsykutowano metodykę badań oraz przedstawiono wyniki przeprowadzonych testów subiektywnych. W referacie zawarto też dyskusję sposobów obróbki uzyskanych wyników. W przeprowadzonych eksperymentach posłużóno się logiką rozmytą. 

Entry No. 33 
Entry typeconference paper 
AuthorsP. Odya, A. Kornacki, S. Zieliński, A. Czyżewski 
English titleInfluence of Video Context on the Localization of Phantom Sound Sources 
Polish titleWpływ obrazu na lokalizację pozornych źródeł dźwięku 
ConferenceVII Sympozjum Nowości w Technice Audio 
Preprint 
Number 
Volume 
Pages13 - 20 
Conference siteWarszawa,  
Conference date6.10.2000- 7.10.2000 
StreszczenieWe współczesnych produkcjach filmowych i multimedialnych wykorzystywany jest coraz częściej dźwięk w formacie dookólnym. Dość trudnym zagadnieniem z punktu widzenia realizacji dźwięku jest odpowiednie rozmieszczenie źródeł dźwięku w panoramie. Zawartość obrazu może mieć wpływ na lokalizację pozornych źródeł dźwięku. Stąd też celem opisanych eksperymentów było zbadanie zjawiska interakcji pomiędzy zawartością obrazu wizyjnego a lokalizacją źródeł pozornych dźwięku wokół słuchacza. 

Entry No. 34 
Entry typeconference paper 
AuthorsH. Skarżyński, A. Czyżewski, L. śliwa, A. Senderski, S.K. Zieliński 
English titleMultimedia System for Screening of Hearing via Internet 
Polish titleMultimedialny internetowy system powszechnych badań uszkodzeń słuchu. 
ConferenceII Konferencja Naukowo-Techniczna "Technologie Internet i Intranet" 
Preprint 
Number 
Volume 
Pages 
Conference siteKielce,  
Conference date27.10.2000- 27.10.2000 
AbstractA System for Screening of Hearing via Internet was presented. Its structure and the way of working was discussed. 
StreszczenieZaprezentowano pierwszy w Polsce system do badań przesiewowych słuchu u dzieci i młodzieży. Przedstawiono założenia leżące u podstawo opracowanego systemu. 

Entry No. 35 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski 
English titleAn Approach to the Automatic Classification of Musical Souns 
Polish titleAutomatyczna klasyfikacja dźwięków instrumentów muzycznych 
Conference108th AES Convention 
Preprint5115 
Number 
Volume 
Pages1 - 33 
Conference siteParis, France 
Conference date19.2.2000- 22.2.2000 
AbstractA study on the automatic classification of musical instrument sounds is presented. For this purpose a large database of musical instrument sounds was built, which consists of both solo and duet stereo recordings. The classification process of musical instrument sounds is done on the basis of some soft computing techniques, such as neural networks. The results of the classification are given as a percentage of musical instrument sounds properly recognized by the system. A discussion of the system efficiency and of its limitations is presented. Conclusions and remarks concerning further development of this study are included. 
StreszczenieW pracy przedstawiono założenia dotyczące automatycznego rozpoznawania dźwięków instrumentów muzycznych. Problem ten jest istotny przy automatycznym przeszukiwaniu baz komputerowych. Sparametryzowane dźwięki tworzą wektory parametrów, które są nastepnie podawane na wejście sieci neuronowej. W fazie treningu przebudowano różne konfiguracje wektorów parametrów i sieci neuronowych. W pracy zawarto wyniki automatycznej klasyfikacji uzyskane w oparciu o sieci neuronowe i podano wnioski. (20 rys., 5 tab., bibl. 19 poz.) 

Entry No. 36 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski, H. Skarżyński, J. Mazur 
English titleMultimedia Hearing Aids Fitting System 
Polish titleSystem dopasowania protez 
Conference4th World Automation Congress, WAC 2000 
PreprintIFMIP011 
Number 
Volume 
Pages47 - 48 
Conference siteMaui, Hawaii, USA,  
Conference date11.6.2000- 15.6.2000 
AbstractThe application described in the paper is concerned with automatic finding the dynamic characteristics of the hearing aid matching patients needs. The multimedia computer technology makes it practical to organize hearing aid fitting basing on the computer software. Consequently, the proposed method of testing hearing abilities and finding the adequate hearing aid dynamical processing characteristics can be based entirely on multimedia computer technology.The subject of the application is the method of hearing aids fitting employing compressed speech understanding tests in noise and the way of organizing such procedure of hearing aids fit in.  

Entry No. 37 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, P. Suchomski, H. Skarżyński 
English titleMultimedia Hearing Aids Fitting System 
Polish titleMultimedialny system doboru protez słuchu 
ConferenceKonferencja Naukowo-Techniczna Systemy i Technologie Telekomunikacji Multimedialnej STM 2000 
Preprint 
Number 
Volume 
Pages237 - 242 
Conference siteŁódź,  
Conference date14.3.2000- 15.3.2000 
AbstractThe obtaining an optimum dynamic hearing characteristic for suitable hearing device is the main task of the elaborated Multimedia Hearing Aids Fitting System (MHAFS). To achieve the dynamic characteristic of the impaired hearing the system uses loudness scaling test results. The system creates proper compressor characteristics (used in typical hearing aids), based on the obtained hearing dynamic characteristic. Next the system tests the compressor characteristics exploiting speech in noise audiometry. The main features of the elaborated system will be presented in this paper 
StreszczenieZasadniczym zadaniem opracowywanego Multimedialnego Systemu Doboru Protez Słuchu (MSDPS) jest wyznaczenie optymalnej charakterystyki dynamiki poszukiwanego aparatu słuchowego. Punktem wyjścia do pracy systemu jest przeprowadzenie badania wrażenia narastania głośności, którego wyniki pozwalają określić charakterystykę dynamiki uszkodzonego słuchu. Na podstawie charakterystyki dynamiki słuchu system wyznacza poszukiwaną charakterystykę kompresji stosowaną w aparatach słuchowych. Oprogramowanie pozwala również przetestować wyznaczone charakterystyki na podstawie badania mowy w szumie. W niniejszym komunikacie zostaną zaprezentowane istotne zasady działanie tworzonego systemu doboru protez słuchu. (5 rys, bibl. 8 poz.) 

Entry No. 38 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek 
English titleMultimedia Technology Based Orientation System for Visually Impaired People 
Polish titleMultimedialny system orientacji dla osób niedowidzacych i niewidomych  
Conference4th World Automation Congress, WAC 2000., Abstr.,book, full-paper CD-ROM. 
PreprintIFMIP012 
Number 
Volume 
Pages47 - 47 
Conference siteMaui, Hawaii, USA 
Conference date11.6.2000- 15.6.2000 
AbstractThe research performed by authors consisted in multimedia system that aimed at enabling people orientating in their surrounding and to avoid any kind of obstacles and theats. The latter aim may be achieved by an intelligently controlled synthesis of the acoustic field based on the digital image analysis. One of the features of such a system should be the ability to identify the location and to describe the dimension of obstacles in the environment. The idea of perceiving the "sound picture" instead of the visual one brings with itself many issues that are closely related to the research subject discussed in the paper.  

Entry No. 39 
Entry typeconference paper 
AuthorsG. Szwoch, B. Kostek, A. Czyżewski 
English titleSimulating Acoustics of Hearing Aid Employing Non Linear Signal Filtering and Waveguide Modeling 
Polish titleSymulacja akustyki aparatów słuchowych przy użyciunieliniowej filtracji sygnału i modelowania falowodowego 
Conference108th AES Convention 
Preprint5087 
Number 
Volume 
Pages1 - 15 
Conference siteParis, France 
Conference date19.2.2000- 22.2.2000 
AbstractA model of hearing aid is designed and used to perform computer simulations that include signal processing (amplification, filtering and compression) as well as transmitting the sound to the ear by the acoustical waveguide. The method and some results of simulations are presented applicable to the process of fitting the hearing aid to the individual patient’s needs. 
StreszczenieW referacie przedstawiono cyfrowy model protezy słuchu, w oparciu o który przeprowadzono szereg symulacji charakterystyk akustycznych. Zaimplementowane algorytmy wykorzystują nieliniową filtrację sygnału i modelowanie falowodowe. Wykorzystywany model może być pomocny przy projektowaniu elementów akustycznych protezy słuchu o zadanych właściwościach. ( 9 rys., 11 poz. bibl.) 

Entry No. 40 
Entry typeconference paper 
AuthorsA. Czyżewski, A. Kornacki, B. Kostek, P. Odya, S. Zieliński 
English titleInfluence of visual cues on the perception of surround sound 
Polish titleKorelacja wzrokowo-słuchowa w systemach dookólnych 
Conference139th Meeting of the Acoustical Society of America, J. Acoust. Soc. Amer.  
Preprint3aPP14 
Number
Volume107 
Pages2851 
Conference siteAtlanta, GA, USA,  
Conference date30.5.2000- 3.6.2000 
AbstractContemporary digital video, film or multimedia presentations are often accompanied by the surround sound. Techniques and standards involved in digital video processing are much more developed than concepts underlying creating recording and mixing of the multichannel sound. The main challenge in the sound processing in the multichannel system is to create an appropriate basis for connecting multimodal context of visual and sound domains. Therefore one of the purposes of experiments is to study in which way and how the surround sound interfere or is associated with the visual context. This kind of study was hitherto carried out when two-channel sound technique was associated with a stereo TV. However, there is not much study done yet that associate surround sound and digital video presented at the TV screen. The main issue in such experiments is the analysis of the influence of visual cues on perception of the surround sound. This problem will be addressed in the paper.  
StreszczenieObecne produkcje multimedialne często zą wyposażane w dźwięk dookólny. Ze względu na to, że obraz wpływa na subiektywnie postrzeganą panoramę dźwięku dookólnego, zjawisko to należy poddać dokładnym badaniom. (str. ..., 4 rys., 1 tab., 9 poz. bibl.) 

Entry No. 41 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski, H. Skarżyński, J. Mazur 
English titleMultimedia Hearing Aids Fitting System 
Polish titleSystem dopasowania protez 
Conference4th World Automation Congress, WAC 2000., Abstr.,book, full-paper CD-ROM Proc. 
Preprint 
Number 
Volume 
Pages47 - 47 
Conference siteMaui, Hawaii, USA 
Conference date11.6.2000- 15.6.2000 
AbstractThe application described in the paper is concerned with automatic finding the dynamic characteristics of the hearing aid matching patients needs. The multimedia computer technology makes it practical to organize hearing aid fitting basing on the computer software. Consequently, the proposed method of testing hearing abilities and finding the adequate hearing aid dynamical processing characteristics can be based entirely on multimedia computer technology.The subject of the application is the method of hearing aids fitting employing compressed speech understanding tests in noise and the way of organizing such procedure of hearing aids fit in.  

Entry No. 42 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, P. Suchomski 
English titleExpert System for Hearing Aids Fitting 
Polish titleAutomatyczny dobór charakterystyk protezy słuchowej w oparciu o system ekspercki 
Conference108th AES Convention 
Preprint5094 
Number 
Volume 
Pages1 - 14 
Conference siteParis, France 
Conference date19.2.2000- 22.2.2000 
AbstractThe engineered experimental software allows to find the characteristics of a fearing aid matching patients needs and to choose automatically a suitable hearing device characteristics. The key issues related to the engineered application are based on the expert system implementation. This expert system uses both fuzzy logic and rough set processing of analytical data. The principles of the engineered expert system application and some details of the rough set and fuzzy logic implementation will be presented in the paper. 
StreszczenieW referacie opisano założenia eksperymentalnego systemu eksperckiego, pozwalającego na automatyczny dobór charakterystyk protezy słuchowej. W systemie zaimplementowano moduł testujący różne charakterystyki elektronicznej protezy słuchu w oparciu o podawany sygnał mowy w szumie. Opracowany system wykorzystuje algorytmy pracujące w oparciu o wnioskowanie rozmyte i analizę danych w oparciu o metodę zbiorów przybliżonych.(11 rys., bibl. 12 poz.) 

Entry No. 43 
Entry typeconference paper 
AuthorsA. Czyżewski, A. Senderski, B. Kostek, S.K Zieliński, P. Klimek 
English titleTesting Hearing with Noisy Speech Employing Multimedia Computers 
Polish titleTestowanie słuchu za pomocą sygnału mowy generowanego w systemie multimedialnym 
ConferenceWarsztaty Naukowo-Szkoleniowe Audiologii: Nowoczesna diagnostyka zaburzeń słuchu, Wystapienie seminaryjne - ustne 
Preprint 
Number 
Volume 
Pages 
Conference siteWarszawa,  
Conference date8.6.2000- 10.6.2000 
AbstractWarsztaty Naukowo-Szkoleniowe Audiologii. 
StreszczenieWarsztaty Naukowo-Szkoleniowe Audiologii. 

Entry No. 44 
Entry typejournal paper 
AuthorsA. Czyżewski, R. Królikowski 
English titleNeuro-Rough Control of Masking Thresholds for Audio Signal Enhancement 
Polish titleSterowanie poziomami progów maskowania dla potrzeb redukcji szumu. Journal of Neurocomputing 
Journal 
Volumew druku 
Number 
Pages1 - 26 
AbstractThe paper addresses the problem of neuro-rough hybridisation applied to non-stationary noise reduction. The goal of the intelligent controller is to estimate the current statistics of corrupting noise on the basis of the analysis of signals taken from telecommunication channel. Thereafter, the noise estimate enables determining the masking threshold levels which allow making the noise inaudible in the audio. Since the implemented decision algorithm requires quantised data, thus the Kohonen’s self-organising maps extended by various distance metrics were used as data quantisers. Some results of the experiments in the domain of non-stationary noise reduction in speech are discussed in the paper. (Journal of Neurocomputing) 
Streszczenie(str. 26, rys. 7, tab. 7, bibl. 46 poz.) 

Entry No. 45 
Entry typeconference paper 
AuthorsA. Czyżewski, S.K. Zieliński, R. Królikowski 
English titleIntelligent methods of noise and echo reduction in audio signals 
Polish titleInteligentne metody redukcji szumu i echa w sygnale fonicznym 
ConferenceKonferencja Nukowo-Techniczna: Systemy i Technologie Telekomunikacji Multimedialnej (STM2000) 
Preprint 
Number 
Volume 
Pages279 - 284 
Conference siteŁódź,  
Conference date14.3.2000- 15.3.2000 
AbstractArtificial intelligence algorithms (neural nets, fuzzy logic, rough sets, genetic algorithms) can be applied to noise and echo reduction. Results of experiments cencerning applications of the mentioned alogrithms are presented. 
StreszczenieAlgorytmy sztucznej inteligencji (sieci neuronowe, logika rozmyta, zbiory przybliżone, algorytmy genetyczne) mogą być zastosowane do tłumienia echa i szumu w sygnałach fonicznych. W pracy przedstawiono nową metodę redukcji echa i niestacjonarnego szumu zakłócającego sygnał foniczny. (str. 6, rys. 4, tab. 0, bibl. 6 poz.) 

Entry No. 46 
Entry typejournal paper 
AuthorsA. Czyżewski, R. Królikowski 
English titleNeuro-Rough Control of Masking Thresholds for Audio Signal Enhancement 
Polish titleSterowanie poziomami progów maskowania dla potrzeb redukcji szumu 
Journal 
Volume36 
Number1-4 
Pages5 - 27 
AbstractThe paper addresses the problem of neuro-rough hybridisation applied to non-stationary noise reduction. The goal of the intelligent controller is to estimate the current statistics of corrupting noise on the basis of the analysis of signals taken from telecommunication channel. Thereafter, the noise estimate enables determining the masking threshold levels which allow making the noise inaudible in the audio. Since the implemented decision algorithm requires quantised data, thus the Kohonen’s self-organising maps extended by various distance metrics were used as data quantisers. Some results of the experiments in the domain of non-stationary noise reduction in speech are discussed in the paper. 
StreszczenieArtykuł niniejszy odnosi się do problemu hybrydyzacji systemów opartych na zbiorach przybliżonych oraz przetwarzaniu neuronowym dla potrzeb redukcji szumu niestacjonarnego. Zadaniem inteligentnego kontrolera jest oszacowanie aktualnej statystyki zakłócającego szumu na podstawie analizy sygnału w kanale telekomunikacyjnym. Estymata szumu służy następnie do wyznaczenia poziomów maskowania w sygnale, a następnie do redukcji szumu. Dla potrzeb kwantyzacji zastosowano samoorganizujące się mapy Kohonena, które zostały zmodyfikowane poprzez dodanie różnych metryk. W artykule zamieszczono szczegółowy opis opracowanego systemu, a także przedstawiono przykładowe wyniki przeprowadzonych eksperymentów. 

Entry No. 47 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, S. Zieliński 
English titleWaveguide Modeling of Ancient, Japanese Musical Instruments 
Polish titleModelowanie fizyczne dawnych instrumentów japońskich 
ConferenceISMA'2001 
Preprint 
Number 
Volume 
Pages 
Conference sitePerugia, Italy 
Conference date9.2001- 9.2001 
AbstractProblems related to the implementation of physical modeling-based synthesis of two traditional Japanese instruments are discussed. Examples of computer analyses of sounds of shakuhachi and koto are presented. On the basis of these analyses some assumptions concerning waveguide models were made. Physical modeling principles of musical instrument sounds generation were also shortly reviewed. Main differences in modeling wind and string instruments were highlighted. The process of constructing models of these two musical instruments was explained. A short discussion concerning problems occurred while creating such models was given. Some general conclusions concerning real-time implementation of the digital waveguide models were also included.  
StreszczenieW referacie przedyskutowano problemy związane z konstrukcją modelu fizycznego wybranych instrumentów japońskich. Przeprowadzono szereg analiz dźwięków naturalnych pochodzących z shakuhachi i koto. Nastepnie zaprojektowano modele fizycznych tych instrumentów i przeprowadzono analizę uzyskanych dźwięków. Podano wnioski. 

Entry No. 48 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski, H. Skarżyński, K. Kochanek 
English titleInternet-Based Automatic Hearing Assessment System 
Polish titleInternetowy system badania słuchu 
Conference46 Internationales Wissenschaftliches Kolloquium Ilmenau 
Preprint 
Number 
Volume 
Pages87 - 89 
Conference siteIlmeanu, Germany 
Conference date24.9.2001- 27.9.2001 
AbstractThe aim of this paper is to show the new media application to the domain of health care. In the paper the Internet-based system that allows for automatic testing of hearing is described. Hearing impairment is one of the fastest growing diseases of modern society. Therefore it is very important to organize mass screening tests to identify people suffering from this kind of impairment. The described application provides a test that uses automatic questionnaire analysis, audiometric tone test procedures, and assesses speech intelligibility in noise. When all the testing is completed, the system automatically analyzes the results for each person examined. Based on the number of incorrect answers, the decision is made automatically by the expert system: does the person have normal hearing or does he or she have hearing problems and requires to be examined in one of the consulting centers? Those whose hearing impairment is confirmed are referred to treatment in rehabilitation centers. All these centers are connected via the Internet and are provided with special distributed database access allowing them to automatically register and track the patient discovered during the remote screening. 
StreszczenieCelem referatu jest prezentacja możliwości wykorzystania multimediów w medycynie. Opisano w nim system internetowy umożliwiający automatyczne badanie słuchu. Wady słuchu stanowią jedną z najszybciej postępujących chorób we współczesnym społeczeństwie. W tym świetle bardzo ważnym staje się umożliwienie przeprowadzania masowych testów wykrywających ubytki słuchu. Przedstawiona aplikacja zawiera audiometryczny test tonalny, test ilustrowany dla dzieci oraz test rozumienia mowy w szumie. Po zakończeniu testów system automatycznie analizuje wyniki dla każdej badanej osoby. Osoby z wykrytą wadą słuchu kierowane są do specjalistycznych centrów rehabilitacyjnych na dalsze badania. Ośrodki te są połączone przy pomocy łączy internetowych z bazą danych systemu "Słyszę...". 

Entry No. 49 
Entry typeconference paper 
AuthorsA. Czyżewski, R. Królikowski, B. Kostek 
English titleNeural Networks Applied to Sound Source Localization 
Polish titleZastosowanie sieci neuronowych do lokalizacji źródeł dźwięku 
Conference110th Audio Engineering Society Convention 
Preprint5375 
Number 
Volume 
Pages 
Conference siteAmsterdam, Netherlands 
Conference date12.5.2001- 15.5.2001 
AbstractThe primary aim of this paper is to show that it is possible to localise the direction of the incoming acoustical signal based on the neural network trained for that purpose. Consequently, the automatically localised acoustical signal may be attenuated if it obscures the desired target sound. A set of parameters was formulated in order to localise target source and unwanted signals. In order to process acoustical signals incoming from various directions at the same time the neural network-based system was designed and implemented. The feature extraction method is thoroughly discussed, the training process is described and recently obtained results are discussed. 
StreszczeniePodstawowym celem referatu jest pokazanie, że jest możliwa lokalizacja kierunku nadchodzącego sygnału akustycznego w oparciu o odpowiednio wytrenowane sieci neuronowe. W tym celu sformułowano zbiór parametrów oraz zaprojektowano i zaimplementowano stosowną sieć neuronową. W referacie przedstawiono proces parametryzacji oraz przedyskutowano uzyskane wyniki eksperymentów. 

Entry No. 50 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Jaroszuk, B. Kostek 
English titleDigital Waveguide Models of the Panpipes 
Polish titleModel fizyczny fletni Pana 
ConferenceISMA’2001 
Preprint 
Number 
Volume 
Pages 
Conference sitePerugia, Italy 
Conference date9.2001- 9.2001 
AbstractThe principal aim of this paper is to present a digital waveguide model of the Panpipes. For the efficient modeling of the Panpipes instrument its structure and its physics were studied and thoroughly discussed. The acquired knowledge was then used during the construction of the model. In this context principles of the digital waveguide modeling of woodwind instruments are shortly reviewed. Because of the simplicity of designing the digital waveguide as a set of delay lines and scattering junctions the model can be easily implemented to a digital signal processor. In the paper two digital waveguide models of the Panpipes instruments were presented. They differ from each other by their complexity. This was due to examining the influence of decreasing the complexity of the model on the synthetic sound quality. The performed subjective tests resulted in showing that introduced simplifications in digital waveguide models reveal no noticeable influence on the sound quality. A comparison between synthetic and real Panpipes sounds was made. The results of both subjective tests and objective analyses obtained using engineered models of Panpipes are also included in the paper. Conclusions are derived.  
StreszczenieCelem referatu jest przybliżenie zagadnień związanych z modelowaniem fizycznym wybranych instrumentów dętych. W referacie przedstawiono dwa modele fizyczne fletni Pana, różniące się stopniem skomplikowania i jakością otrzymanego dźwięku syntetycznego. Dokonano wszechstronnych analiz dźwięków otrzymanych w modelach i porównano je z dźwiękiem naturalnym. Dodatkowo przeprowadzono serię testów subiektywnych, które potwierdziły, że skonstruowane modele pozwalają na otrzymanie dźwięku zbliżonego do dźwięku naturalnego fletni Pana. 

Entry No. 51 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski 
English titleMultimedia Techniques Applied to Health Care Procedures- Hearing Aid Fitting expert System 
Polish titleWykorzystanie technik multimedialnych w medycynie - System doboru aparatów słuchowych 
Conference46 Internationales Wissenschaftliches Kolloquium 
Preprint 
Number 
Volume 
Pages85 - 87 
Conference siteIlmenau, Germany 
Conference date24.9.2001- 27.9.2001 
AbstractIn this paper an exemplary implementation of the complex multimedia system in the domain of the health care and its integration to the user environment is shown. The engineered Multimedia Hearing Aid Fitting Expert System is an experimental software program that allows finding automatically characteristics of a hearing aid matching patients needs. The fitting of the hearing aids is based either on classical methods that use audiometric test results or on loudness scaling principles. All these methods are based on artificial test signals. However, the fitting of hearing aids should be performed on the basis of testing speech understanding in noise. A satisfying reliability of these tests may be achieved through the use of modern computer technology, properly calibrated. The principles of the engineered software application, some details of the calibration process, and results of the experiments will be presented in the paper.  
StreszczenieCelem referatu jest przedstawienie multimedialnego systemu wspomagającego dobór protez słuchowych. Aplikacja ta umożliwia automatyczne określanie optymalnych dla pacjenta charakterystyk protez słuchowych. Proces dopasowywania oparty na klasycznych metodach audiometrycznych lub zasadach skalowania głośności wykorzystuje generowane sygnały testowe. Dobór protezy słuchowej powinien być jednak oparty na teście rozumienia mowy w szumie. Wierność takiego testu może zostać osiągnięta dzięki użyciu współczesnej techniki komputerowej przy odpowiedniej kalibracji interfejsu użytkownika. W referacie przedstawiono opis zaimplementowanego systemu, zasadę jego kalibracji oraz uzyskane wyniki. 

Entry No. 52 
Entry typeconference paper 
AuthorsA. Kornacki, B. Kostek, P. Odya, A. Czyżewski 
English titleProblems Related to Surround Sound Production 
Polish titleProblemy realizacji dźwięku w systemach dookólnych 
Conference110th AES Convention 
Preprint5374 
Number 
Volume 
Pages 
Conference siteAmsterdam, Netherlands  
Conference date12.5.2001- 15.5.2001 
AbstractThe problem of production of recordings designated for sound surround systems becomes a vital problem in sound technology. Existing standards of surround systems allow for reproduction of spatial sound. However, there are no consistent recommendations as to which microphone and mixing technique could be used in specific situations. For the purpose of research presented in this paper several microphone techniques were used for recordings of a quartet playing classical music. The mixing results in two-channel excerpts and several multichannel ones designated for 5.1 reproduction system. Then, in order to find the most preferable recording technique these excerpts were used in subjective tests.  
StreszczenieWspółczesne media zapisu dźwięku pozwalają na rejestrację i odtwarzanie dźwięku w wielokanałowych formatach dookólnych, np. w formacie 5.1. Możliwości te wymagają jednak opracowania odpowiednich metod realizatorskich. Dotyczy to zarówno technik mikrofonowych, jak również sposobu tworzenia panoramy dźwiękowej. W pracy przedstawiono porównanie kilku metod realizacji nagrań dookólnych.  

Entry No. 53 
Entry typeconference paper 
AuthorsA. Czyżewski, S. Zieliński 
English titleDereverberation Based on the Genetic Algorithm 
Polish titleUsuwanie pogłosu przy użyciu algorytmów genetycznych 
Conference17th International Congress on Acoustics 
Preprint6A.06.01 
Number 
Volume 
Pages264 
Conference siteRome, Italy 
Conference date2.9.2001- 7.9.2001 
AbstractIn this paper, a new method of echo cancellation is proposed applicable to some telecommunication systems. This method is based on the application of the reverse model of a system causing echo. Parameters of such a model are optimized using the genetic algorithm. Some exemplary results of echo cancellation obtained with the use of the proposed method are discussed. 
StreszczenieW artykule zaproponowano nową metodę usuwania echa, mającą zastosowanie w systemach telekomunikacyjnych. Metoda oparta jest na zastosowaniu systemu odwrotnego do tego, który powoduje powstawanie echa. Parametry tego modelu zostały zoptymalizowane przy użyciu algorytmów genetycznych. Przedstawiono i przedyskutowano przykładowe wyniki usuwania echa uzyskane przy uzyciu proponowanych metod. 

Entry No. 54 
Entry typeconference paper 
AuthorsA. Czyżewski, A. Kornacki, G. Szwoch, B. Kostek 
English titleSimulation of the Reverberant Space in the Multichannel Audio Using the Convolution Method 
Polish titleSymulacja pogłosu w technice wielokanałowej przy użyciu metody splotu 
Conference17th International Congress on Acoustics 
Preprint4D.09.04 
Number 
Volume 
Pages163 
Conference siteRome, Italy 
Conference date2.9.2001- 7.9.2001 
AbstractThe convolution method is commonly used to simulate the reverberant space by convolving monophonic or stereophonic sounds with the impulse responses of the room.In this paper,application of this method to the multichannel audio is proposed. The impulse responses of the real room were recorded.Each of the audio channels was obtained using the convolution of the adequate room impulse response with monophonic source sound.The results of the convolution were then combined and encoded as the multichannel surround audio in the format 5.1. The time and spectral analyses of the resulting sounds,as well as the listening tests were performed.The results of these experiments are presented and discussed in the paper. The presented method allows one to simulate the acoustical conditions of the room where the monophonic audio was acquired. Possible applications of this method include advanced Internet teleconferencing in which the bandwidth requirements may be decreased by transmitting only monophonic sounds and the impulse responses of the room instead of the whole multichannel audio.  
StreszczenieMetoda splotu jest powszechnie stosowana w celu zasymulowania warunków pogłosowych poprzez splot sygnału monofonicznego lub stereofonicznego z odpowiedzią impulsową pomieszczenia. W artykule zaproponowano zastosowanie tej metody w technice dźwięku wielokanałowego. Zarejestrowano odpowiedzi impulsowe rzeczywistych pomieszczeń. Każdy z kanałów dźwięku został otrzymany przez splot odpowiedniej odpowiedzi impulsowej pomieszczenia z monofonicznym sygnałem źródłowym. Wyniki splotu zostały następnie połaczone i zakodowane w formacie dźwięku wielokanałowego 5.1. Przeprowadzono analizy czasowe i widmowe otrzymanych dźwięków oraz testy odsłuchowe. Wyniki eksperymentów zostały przedstawione i przedyskutowane w niniejszym artykule. Przedstawiona metoda umożliwia symulację warunków akustycznych pomieszczenia, w którym zarejestrowano dźwięk monofoniczny. Możliwe zastosowania tej metody to zaawansowane techniki telekonferencyjne w Internecie, w których możliwe będzie zmniejszenie wymagań dotyczacych przepustowości łaczy, poprzez transmisję wyłącznie dźwięku monofonicznego oraz odpowiedzi impulsowych pomieszczenia zamiast pełnego dźwięku wielokanałowego. 

Entry No. 55 
Entry typeconference paper 
AuthorsA. Czyżewski, R. Królikowski 
English titleAutomatic Identification of Sound Source Direction Based on Neural Networks 
Polish titleAutomatyczna identyfikacja kierunku źródła dźwięku w oparciu o sieci neuronowe 
Conference142nd Meeting of the Acoustical Society of America, J. Acoust. Soc. Amer.  
Preprint4aSP9 
Number
Volume110 
Pages2741 
Conference siteFort Lauderdale, USA 
Conference date3.12.2001- 7.12.2001 
AbstractIn this paper a method for automatic detection of sound source was studied. Both standard feed-forward- and recurrent neural networks were employed in that method. Comparison of the results obtained is given. Conclusions are also derived. 
StreszczenieW niniejszym referacie przeanalizowano metodę automatycznego wykrywania kierunku źródeł dźwięku. Zarówno standardowe jednokierunkowe sieci neuronowe jak i rekurencyjne zostały zastosowane w tek metodzie. W referacie podano uzyskane w eksperymentach wyniki oraz przedstawiono wnioski. 

Entry No. 56 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski 
English titleA method for the automatic hearing aid fitting employing speech in noise 
Polish titleSystem ekspercki do doboru protez 
Conference142nd Acoustical Soc. of America Meeting 
Preprint2pPP10 
Number
Volume110 
Pages2680 
Conference siteFort Lauderdale, USA 
Conference date3.12.2001- 7.12.2001 
AbstractSome limitations of the hearing aid fitting process are discussed. The classical procedures in this process are based on audiometric test results and/or the loudness scaling method employing artificial test signals. However, the fitting of hearing aids should be also performed on the basis of testing speech understanding in noise, because this is much closer to the real life conditions. A satisfying reliability of these tests may be achieved through the use of modern computer technology with an application of a properly calibrated sound system. A new strategy applicable to fitting prostheses was developed. It allows finding automatically characteristics of a hearing aid matching patients needs. The principles of the fitting method employing fuzzy reasoning, and some results of the experiments will be presented in the paper.  
StreszczenieW referacie przedstawiono problemy związane z procesem doboru protez. Zaprojektowano multimedialny system wspomagający dobór protez słuchowych. System ten umożliwia automatyczne określenie optymalnych dla pacjenta charakterystyk protez słuchowych.  

Entry No. 57 
Entry typeconference paper 
AuthorsA. Czyżewski, R. Królikowski 
English titleAcquisition of Acoustic Signals Assisted by Recurrent Neural Networks 
Polish titlePozyskiwanie sygnałów akustycznych wspomagane przez rekurencyjne sieci neuronowe 
Conference17th International Congress on Acoustics 
Preprint 
Number 
VolumeCD-ROM 
Pages 
Conference siteRzym, Włochy 
Conference date2.9.2001- 7.9.2001 
AbstractThe issue of localisation of sound sources for videoconferencing is addressed in the paper, where a new method for estimating speaker locations is introduced. It is based on exploitation of temporal relationships between signals received by an array of microphones, and thereby recurrent neural networks are employed. Additionally, a parametrisation of the time-domain audio signals prior to the neural processing is performed. Some of the results of the experiments are briefly presented in the paper. 
StreszczenieW referacie poruszono zagadnienie lokalizacji źródeł dźwięku dla potrzeb wideokonferencji, wraz z propozycją nowej metody oszacowania położenia mówcy. Metoda ta oparta jest na wykorzystaniu czasowych zależności pomiędzy sygnałami odebranymi przez matrycę mikrofonów i z tego powodu zastosowano rekurencyjne sieci neuronowe. Ponadto przed przetwarzaniem neuronowym zastosowano parametryzację sygnału w dziedzinie czasu. W referacie zamieszczono niektóre wyniki przeprowadzonych eksperymentów. 

Entry No. 58 
Entry typebook 
AuthorsA. Czyżewski, B. Kostek, P. Odya, S. Zieliński  
English titleDetermining Influence of Visual Cues on the Perception of Surround Sound Using Soft Computing 
Polish titleBadanie wpływu treści obrazu wizyjnego na percepcję dźwięku z wykorzystaniem soft computingu 
EditorSeries: Lecture Notes in Computer Science, vol. 2005, Springer-Verlag 
Pages545 - 552 
AbstractThe main challenge in the sound processing in the multichannel system is to create an appropriate basis for the relating multimodal context of visual and sound domains. Therefore, one of the purposes of experiments is to study in which way and how the surround sound interferes or is associated with the visual context. This kind of study was hitherto carried out when two-channel sound technique was associated with a stereo TV 
StreszczenieOpisano przebieg i wyniki eksperymentów w dziedzinie badania wpływu treści obrazu na percepcję dźwięku w systemach stereofonii dookólnej.  

Entry No. 59 
Entry typebook 
AuthorsR. Królikowski, A. Czyżewski , B. Kostek 
English titleLocalization of Sound Sources by Means of Recurrent Neural Networks 
Polish titleLokalizacja źródeł dźwięku za pomocą rekurencyjnych sieci neuronowych 
EditorSeries: Lecture Notes in Computer Science, vol. 2005, Springer-Verlag 
Pages603 - 610 
AbstractThe issue of localization of sound sources for videoconferencing is discussed in the paper. A new algorithm for estimating speaker locations, based on recurrent neural networks (RNN), is introduced and described. The scheme of experiments carried out in an acoustically adopted chamber, exploiting the engineered method is detailed. 
StreszczeniePrzedyskutowano problematyke lokalizacji dźwięku dla potrzeb wideokonferencji. Zaprezentwano nowy algorytm estymacji położenia mówcy, oparty na wykorzystaniu rekurencyjnych sieci neuronowych. Omówiono wyniki eksperymentów, wykorzystujące materiał dźwiękowy przygotowany w komorze bezechowej.  

Entry No. 60 
Entry typeconference paper 
AuthorsA. Czyżewski 
English titleThe Internet Sound Restoration Service Based on the Perceptual Denoising Method 
Polish titleInternetowy system rekonstrukcji nagrań oparty na perceptualnej metodzie redukcji szumów 
Conference20th Audio Eng. Soc. International Conference 
Preprint 
Number 
Volume 
Pages162 - 167 
Conference siteBudapest, Hungary 
Conference date5.10.2001- 7.10.2001 
AbstractThe Internet service was launched intended to on-demand restoration and publishing of audio content related to world's cultural heritage. A special way of acquiring, processing and publishing archive recordings was conceived in order to ensure a proper dissemination of the proposed service and its long-term maintenance. The sound enhancement method underlying the system operation employs the extended perceptual coding of audio material allowing for simultaneous noise reduction and sound compression. Moreover, the non-linear predictor employing neural networks was applied to the detection and removal of impulse distortions. The system is still in the development phase, thus both: system features implemented already and technical assumptions related to its further development are presented in the paper. 
StreszczenieUruchomiono Internetowy system rekonstruwania nagrań archiwalnych. W tym celu opracowano kocepcję sposobu akwizycji i upowszechniania nagrań archiwalnych. System umożliwia usuwanie szumu z nagrań przy wykorzystaniu algorytmu opartego na kompresji perceptualnej oraz usuwanie zakłóceń impulsowych przy wykorzystaniu neuronowej predykcji nieliniowej. 

Entry No. 61 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, K. Kochanek, J. Mazur, P. Odya, H. Skarżyński 
English title 
Polish titleMasowe badania przesiewowe słuchu, wzroku, mowy i szumów usznych przy wykorzystaniu komputerów  
ConferenceV Koszalińska Konferencja Naukowo-Techniczna  
Preprint 
Number 
Volume 
Pages9 - 18 
Conference siteKołobrzeg,  
Conference date5.12.2001- 7.12.2001 

Entry No. 62 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, P. Odya, T. Smoliński 
English titleDiscovering the Influence of Visual Stimuli on The Perception of Surround Sound Using Genetic Algorithms 
Polish titleBadanie wpływu obrazu na percepcję dźwięku dookólnego z wykorzystaniem algorytmów genetycznych  
Conference19th International AES Conference 
Preprint 
Number 
Volume 
Pages287 - 294 
Conference siteSchloss Elmau, Germany 
Conference date21.6.2001- 24.6.2001 
AbstractThe paper contains a description of experiments that aim to determine visual cue influence on the perception of spatial sound. Earlier stage of the carried out experiments showed that there exists a relationship between the perception of video presented in the screen and sound signals reproduced in a surround system. However, this relationship is dependent on the type of audio-visual signals. Thus a series of subjective tests has been performed on dozens of experts in order to discover these dependencies. The main issue in such experiments is the analysis of the influence of visual cues on the perception of the surround sound. This problem is solved with the application of genetic algorithms to the processing of subjective test results. Conclusions concerning the complexity of the investigated problem are included. 
StreszczenieNiniejszy artykuł zawiera opis eksperymentów, które miały na celu wykazanie wpływu obrazu na postrzeganie dźwięku przestrzennego. Wcześniejsze eksperymenty wykazały bowiem istnienie zależności pomiędzy obrazem i dźwiękiem w systemie dźwięku dookólnego. Niemniej jednak związek ten zależy od rodzaju sygnałów audio-wizyjnych. Wykonano serię subiektywnych eksperymentów na wielu ekspertach w celu zbadania tych zależności. Podstawowym problemem tego typu eksperymentach jest analiza uzyskanych wyników. Problem ten rozwiązano z wykorzystaniem algorytmów genetycznych. Artykuł zawiera także wnioski dotyczące złożoności badanego problemu. 

Entry No. 63 
Entry typejournal paper 
AuthorsG. Szwoch, B. Kostek, A. Czyżewski 
English titleComputer Modeling of Acoustical Elements of a Hearing Aid 
Polish titleKomputerowe modelowanie akustycznych elementów aparatów słuchowych 
JournalArchives of Acoustics 
Volume26 
Number
Pages203 - 213 
AbstractIn this paper, application of computer modeling methods to the process of hearing aid fitting is described. A computer model of the acoustical system of a hearing aid is presented. Exemplary results of the experiments are presented and compared with measurement data. The model proved to behave similarly to the physical system. Further improvements to the model are discussed. 
StreszczenieW artykule opisano wykorzystanie metod modelowania komputerowego w procesie doboru aparatu słuchowego. Przedstawiono komputerowy model akustycznego układu aparatu słuchowego. Zamieszczono wyniki przykładowych eksperymentów i porównano te wyniki z danymi pomiarowymi. Wpływ zmian parametrów na charakterystyki modelu był podobny jak w przypadku rzeczywistego systemu. Przeprowadzono dyskusję koniecznych rozszerzeń modelu. 

Entry No. 64 
Entry typeconference paper 
AuthorsA. Czyżewski, R. Królikowski, B. Kostek 
English titleEncoding Spatial Information for Advanced Teleconferencing 
Polish titleKodowanie informacji przestrzennej dla potrzeb zaawansowanej telekonferencji 
Conference19th International AES Conference 
Preprint 
Number 
Volume 
Pages309 - 322 
Conference siteSchloss Elmau, Germany 
Conference date21.6.2001- 24.6.2001 
AbstractThe aim of this paper is to show a system that enables automatic identification of a sound source position in noisy acoustical conditions with a considerable accuracy. Automatic detection of sound source in such an acoustical environment is much needed in advanced teleconferencing. The approach shown in the paper is based on Artificial Neural Networks (ANNs) used for automatic sound localisation. Both standard feed-forward ANNs and Recurrent Neural Networks (RNNs) are employed for that purpose. Comparison of the results obtained, based on both types of ANNs, is also given. Conclusions are derived and shown. 
StreszczenieW referacie pokazano system umożliwiający automatyczną identyfikację pozycji źródła dźwięku w zaszumionych akustycznych warunkach, co jest pożądane w przypadku telekonferencji. Opracowane rozwiązania bazują na sztucznych sieciach neuronowych, zarówno jednokierunkowych jak i rekurencyjnych. W referacie zamieszczono porównanie obu podejść oraz wnioski.  

Entry No. 65 
Entry typeconference paper 
AuthorsP. Odya, A. Czyżewski, B. Kostek 
English titleDetermination of Influence of Visual Cues on Perception of Spatial Sound 
Polish titleBadanie wpływu obrazu na percpecję dźwięku dookólnego 
Conference110th Audio Eng. Soc. Conv. 
Preprint5311 
Number 
Volume 
Pages 
Conference siteAmsterdam, Netherlands 
Conference date12.5.2001- 15.5.2001 
AbstractThe paper contains a description of experiments that aim to determine visual cue influence on the perception of spatial sound. Earlier stage of the carried out experiments showed that there exists a relationship between the perception of video presented in the screen and sound signals reproduced in a surround system. However, this relationship is dependent on the type of audio-visual signals. Thus a series of subjective test has been performed on dozens of experts in order to discover these dependencies. The main issue in such experiments is the analysis of the influence of visual cues on the perception of the surround sound. Conclusions concerning the complexity of the investigated problem are included. 
StreszczenieNiniejszy artykuł zawiera opis eksperymentów, które miały na celu wykazanie wpływu obrazu na postrzeganie dźwięku przestrzennego. Wcześniejsze eksperymenty wykazały bowiem istnienie zależności pomiędzy obrazem i dźwiękiem w systemie dźwięku dookólnego. Niemniej jednak związek ten zależy od rodzaju sygnałów audio-wizyjnych. Wykonano serię subiektywnych eksperymentów na wielu ekspertach w celu zbadania tych zależności. Podstawowym problemem tego typu eksperymentach jest analiza uzyskanych wyników. Artykuł zawiera także wnioski dotyczące złożoności badanego problemu. 

Entry No. 66 
Entry typeconference paper 
AuthorsT. Fidecki, J. Adamczyk, A. Czyżewski, A. Kornacki, T. Lida, B. Okoń-Makowska 
English title 
Polish titleAd Laudes - realizacja koncertu internetowego 
ConferenceISSET'2001 
Preprint 
Number 
Volume 
Pages 
Conference siteWarszawa, Polska 
Conference date18.10.2001- 20.10.2001 

Entry No. 67 
Entry typeconference paper 
AuthorsT. Fidecki, J. Adamczyk, A. Czyżewski, A. Kornacki, T. Lida, B. Okoń-Makowska 
English title 
Polish titleAd Laudes - realizacja koncertu internetowego 
ConferenceISSET'2001 
Preprint 
Number 
Volume 
Pages 
Conference siteWarszawa, Polska 
Conference date18.10.2001- 20.10.2001 

Entry No. 68 
Entry typeconference paper 
AuthorsP. Odya, A. Czyżewski, B. Kostek, T. Smolinski 
English titleDetermining the influence of visual stimuli on the peception of surround sound using data mining algorithms 
Polish titleBadanie wpływu obrazu na dźwięk w systemach dookólnych z wykorzystaniem algorytmów sztucznej inteligencji 
Conference142nd Meeting of the Acoustical Society of America, J. Acoust. Soc. Amer.  
Preprint2pPP3 
Number
Volume110 
Pages2679 
Conference siteFort Lauderdale, USA 
Conference date3.12.2001- 7.12.2001 
AbstractA short description of experiments that aim to determine visual cues influence on the perception of spatial sound is provided in the paper. The earlier stage of the carried out experiments showed that there exists a relationship between the perception of video presented in the screen and sound signals reproduced in a surround system. However, this relationship is dependent on the type of audio–visual signals. Thus a series of subjective tests has been performed on dozens of experts in order to discover these dependencies. The main issue in such experiments is the analysis of the influence of visual cues on the perception of the surround sound. This problem is solved with the application of genetic algorithm and rule searching mechanism to the processing of subjective test results. Some results and conclusions concerning the complexity of the investigated problem are included.  
StreszczenieNiniejszy referat zawiera krótki opis eksperymentów, które miały na celu wykazanie wpływu obrazu na postrzeganie dźwięku przestrzennego. Wcześniejsze eksperymenty wykazały bowiem istnienie zależności pomiędzy obrazem i dźwiękiem w systemie dźwięku dookólnego. Niemniej jednak związek ten zależy od rodzaju sygnałów audio-wizyjnych. Wykonano serię subiektywnych eksperymentów na wielu ekspertach w celu zbadania tych zależności. Podstawowym problemem tego typu eksperymentach jest analiza uzyskanych wyników. Problem ten rozwiązano z wykorzystaniem algorytmów genetycznych. Artykuł zawiera także wyniki eksperymentów i wnioski dotyczące złożoności badanego problemu.  

Entry No. 69 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski 
English titleEmploying Fuzzy Logic and Noisy Speech for Automatic Fitting of Hearing Aids  
Polish titleSystem doboru protez oparty o wnioskowanie rozmyte 
Conference142nd Acoustical Soc. of America Meeting, , J. Acoust. Soc. Amer.  
Preprint 
Number
Volume110 
Pages 
Conference siteFort Lauderdale, USA 
Conference date3.12.2001- 7.12.2001 
AbstractIn this paper some limitations of the hearing-aid fitting process are discussed. In the fitting process, an audiologist performs tests on the wearer of the hearing aid, which is then adjusted based on the results of the test, with the goal of making the device work as best as it can for that individual. Traditional fitting procedures employ specialized testing devices which use artificial test signals. Ideally, however, the fitting of hearing aids should also simulate real-world conditions, such as listening to speech in the presence of background noise. Therefore, more satisfying and reliable fitting tests may be achieved through the use of multimedia computers equipped with a properly calibrated sound system. We have developed a new automatic system for fitting hearing aids. It employs fuzzy logic. In this process, a computer makes choices for adjusting the hearing aid's settings by analyzing the patient's responses and answering questions with replies that can lie somewhere between a simple "yes" or "no." This paper will describe the method and present some results of the experiments conducted to test the system. 
StreszczenieNiniejszy referat przedstawia główne założenia systemu doboru protez opartego o wnioskowanie rozmyte. W systemie tym w pierwszej fazie badania wykorzystywana jest metoda LGOB (ang. Loudness Growth in 1/2-Octave Bands), pozwalająca na zbadanie zależności subiektywnego wrażenia głośności w funkcji częstotliwości. W metodzie tej badany określa odbierany sygnał według skali subiektywnej. Po określeniu zakresu dynamiki słuchu badanej osoby, określa się następnie sposób narastania wrażenia głośności w ustalonym zakresie. Kolejna faza, to badanie wykorzystujące mowę w szumie. Ten etap pozwala na uzyskanie adekwatnych charakterystyk kompresji protezy. Przetwarzanie uzyskanych wyników dokonywane jest w oparciu o logikę rozmytą. 

Entry No. 70 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski 
English titleIn Search for Surround Sound Recording Techniques 
Polish titleWielokanałowe systemy w nagraniach muzyki klasycznej 
ConferenceISMA'2001 
Preprint 
Number 
Volume 
Pages 
Conference sitePerugia, Italy 
Conference date9.2001- 9.2001 
AbstractThe existing and recently introduced standards of surround systems allow for reproduction of spatial sound in almost any room conditions. The vital concern of sound production for surround systems is the number of microphones, their positioning, proportion between direct sound, early reflections and the reverberation, artificially added delays, etc. The proper solution of such problems may result in creating spatial impression that is comparable to the live music perception. However this kind of a study should address some of the questions related to surround sound production. The broader aim is to establish recommendations as how to produce recordings of classical music designated for sound surround systems in specific acoustical conditions and then to reproduce it properly. This paper shows a study in which several microphone techniques were used for recordings of classical music in two auditory halls having different acoustical properties. Based on these recordings and various mixing techniques two channel stereo excerpts and some multichannel ones were produced. The latter were encoded in 5.1 multichannel format. The extensive subjective tests were performed employing a group of sound engineers and students in order to find the most preferable recording techniques. The listening tests were first performed employing excerpts obtained for each room separately, then the best production was compared for two rooms. The subjective tests were carried out in the same listening room equipped with the 5.1 surround reproduction system. In the paper results of such a comparison tests are shown. The methodology of carrying out subjective tests is presented. The discussion of obtained results and some conclusions are also included.  
StreszczenieW referacie przedyskutowano problemy związane z nagraniem muzyki klasycznej przy użyciu wielokanałowych systemów mikrofonowych. Opisano kilka wybranych systemów, które posłużyły do nagrań muzyki kameralnej. Przeprowadzono szereg testów subiektywnych, których wyniki pozwoliły na wskazanie optymalnego w danych warunkach systemu mikrofonowego.  

Entry No. 71 
Entry typejournal paper 
AuthorsB. Kostek, A. Czyżewski 
English titleRepresenting Musical Instrument Sounds for Their Automatic Classification 
Polish titleParametryzacja dźwięków muzycznych do celów automatycznej klasyfikacji instrumentów muzycznych 
JournalJ. Audio Eng. Soc. 
Volume49 
Number
Pages768 - 785 
AbstractA study of the automatic classification of musical instrument sounds is presented. For this purpose a database of musical instrument sound parameters was built which consists of musical instrument recordings and their parametric representations. The parameterization process was conceived and performed in order to find significant musical instrument sound features and to remove redundancy from the musical signal. Classification experiments of musical instrument sounds were performed with neural networks allowing a discussion of the efficiency of the feature extraction process and its limitations. Conclusions and remarks concerning further development of this study and its relation to the current MPEG-7 standardi-zation process are included. 
StreszczenieArtykuł dotyczy zagadnień związanych z automatycznym rozpoznawaniem instrumentów muzycznych. Zawarto w nim dyskusję na temat sposobów parametryzacji, a także przedstawiono wybrane posatci wektora cech. Do celów automatycznej klasyfikacji użyto sztucznych sieci neuronowych. Zawarto wnioski dotyczące tworzonego standardu MPEG-7. 

Entry No. 72 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski 
English titleAutomatic Recognition of Musical Instrument Sounds - Further Developments  
Polish titleAutomatyczna klasyfikacja dźwięków instrumentów muzycznych - rozwój badań 
Conference110th Audio Eng. Soc. Convention 
Preprint5116 
Number 
Volume 
Pages 
Conference siteAmsterdam, Netherlands  
Conference date12.5.2001- 15.5.2001 
AbstractDiscussion on the subject of retrieval of musical data from Internet or multimedia databases, which is carried out now for some time does not successfully reach its final stage of application. There are still many problems related to the subject of automatic recognition of music or musical instrument sounds that cannot be easily solved. Especially important is to find adequate parameters of musical signal based on time and frequency and/or wavelet analyses. Proposed feature vectors were derived on the basis of the constructed databases that contain recorded musical sounds. The presented study shows methods of automatic identification of musical instruments based both on classical statistical and soft computing approaches. They were used then to classify musical instruments. A set of results obtained in the carried out investigations is provided and analyzed and concluding remarks are included in the paper. 
StreszczenieReferat dotyczy zagadnień związanych z automatycznym wyszukiwaniem informacji w bazach muzycznych. Głównym celem referatu było przedstawienie wektora cech zawierającego parametry dźwięków muzycznych opartych o analizę falkową. Przedstawiono przykładowe wyniki i podano wnioski. 

Entry No. 73 
Entry typejournal paper 
AuthorsA. Czyżewski, J. Jaroszuk, B. Kostek 
English titleDIGITAL WAVEGUIDE MODELS OF THE PANPIPES 
Polish titleSynteza falowodowa fletni Pana 
JournalArchives of Acoustics 
Volume27 
Number
Pages357 - 371 
AbstractThe aim of this paper is to present a digital waveguide model of the Panpipes. For the efficient modelling of the Panpipes instrument its structure and its physics were studied and discussed. Principles of the digital waveguide modelling of woodwind instruments were also briefly reviewed. In the paper two digital waveguide models of Panpipes instruments differing from each other in their complexity were presented. Consequently it enabled studying the influence of the decreasing complexity of the model on the resulting synthetic sound quality. The subjective tests performed showed that the simplifications in digital waveguide models introduced reveal no noticeable influence on the sound quality. Comparison of synthetic and real Panpipes sounds was also made and conclusions reached. 
StreszczenieW artykule przedstawiono główne cechy syntezy falowodowej. Omówiono cechy instrumentu fletni Pana. Przedyskutowano cechy zaproponowanych dwóch modeli fletni Pana różniących się złożonością obliczeniową. Pokazano szczegóły implementacyjne tych modeli, a także uzyskane wyniki symulacji dźwięków w modelach. Dokonano porównania dźwięków rzeczywistych i uzyskanych w wyniku syntezy falowodowej. 

Entry No. 74 
Entry typeconference paper 
AuthorsJ. Czerniawski, A. Czyżewski, R. Królikowski 
English titleNeural Computation of Direction-Of-Arrival of Sound 
Polish titlePrzetwarzanie neuronowe dla potrzeb wyznaczania kierunku przychodzenia dźwięku 
Conference3rd WSEAS (World Scientific and Engineering Academy and Society) Int.Conf. on Neural Network and Applications (NNA '02) 
PreprintCD-ROM 
Number 
Volume 
Pages 
Conference siteInterlaken, Szwjacaria 
Conference date11.2.2002- 15.2.2002 
AbstractOne of issues related to videoconferencing is addressed in the paper, namely - the problem of sound source localization. A new neural approach for estimation direction of arrival (DOA) is presented and discussed therein. The introduced algorithms are based on various types and structures of neural networks, including feedforward and recurrent ones. Considerations of the proposed DOA estimation are supported by some of the results of numerous experiments, carried out using audio material recorded in an anechoic chamber and acoustically adopted room. The results are briefly discussed. 
StreszczenieW referacie zaprezentowano rozwiązania wykrywania kierunku źródła dźwięku. W tym celu sygnał akustyczny jest odbierany przy pomocy matrycy mikrofonów, a następnie jako sygnał wielokanałowy jest parametryzowany i jako sekwencja wektorów odpowiednich współczynników jest przetwarzany przez sztuczne sieci neuronowe. W przedstawionych w referacie eksperymentach wykorzystano zarówno jednokierunkowe, jak i rekurencyjne sieci neuronowe.  

Entry No. 75 
Entry typebook 
AuthorsA. Czyżewski, B. Kostek, H. Skarżyński 
English title 
Polish titleTechnika komputerowa w audiologii, foniatrii i logopedii 
EditorAkademicka Oficyna Wydawnicza EXIT 
Pages1 - 441 
AbstractKsiążka prezentuje opracowania, które są wynikiem kilkuletniej współpracy naukowaców z dziedziny informatyki, telekomunikacji, otolaryngologii, audiologii, psychologii, pedagogiki, logopedii i foniatrii. Książka prezentuje zastosowania techniki komputerowej w dziedzinach określonych w jej tytule. 

Entry No. 76 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Czerniawski 
English titleExperimenting with Neural Network – Based Identification of Sound Source Position  
Polish titleEksperymenty z opartą na sieciach neuronowych identyfikacji położenia źródel dźwięku  
ConferenceProc. 6th IASTED Intern. Conference,Artificial Intelligence and Soft Computing 
Preprint 
Number 
Volume 
Pages385 - 390 
Conference siteBanff, Canada 
Conference date17.7.2002- 19.7.2002 
AbstractSound source position identification systems are often used in many telecommunication areas. Numerous approaches to this task were developed. Usually such systems are based on digital signal processing technology and are computationally intensive. This paper presents one of alternative methods implementing intelligent neural network–based decision module. The method effectiveness was tested with various types and structures of multilayer neural networks. The obtained results are discussed in the paper.  
StreszczenieW referacie zaprezentowano alternatywną metodę lokalizacji położenia źródeł dźwięku opartą na zastosowaniu modularnej sieci neuronowej. Skuteczność tej metody detekcji kierunku napływania dźwięku była testowana z użyciem różnych struktur tego typu sieci, zaś uzyskane wyniki zostały przedyskutowane w referacie.  

Entry No. 77 
Entry typeconference paper 
AuthorsH. Skarżyński, B. Kostek, A. Czyżewski, J. Kotus, K. Kochanek 
English titleA COMPUTER EXAMINE OF HEARING OF SMALL CHILDREN USING BEHAVIORAL AUDIOMETRY METHOD 
Polish titleKOMPUTEROWE BADANIE SŁUCHU MAŁYCH DZIECI METODĄ AUDIOMETRII BEHAWIORALNEJ 
ConferenceIII KONGRES POLSKIEGO TOWARZYSTWA MEDYCYNY PERINATALNEJ 
Preprint 
Number 
Volume 
Pages38 
Conference siteŁódź, Polska 
Conference date27.9.2002 
AbstractThe software to examine hearing of small children using behavioral audiometry method was presented in the paper. It enable children diagnostic in age from 6 to 36 months. A common features of the program were presented. The testing conditions and the hardware requirements were described. A multichannel sound system applied in the program, make possible to verify capabilities of localization sound sources. A large variety of the testing signals from a child environment cause, that the software could be used in checking a progress in rehabilitation process. Moreover, it could be used in fixing a hearing aids. At the end of the examine it is possible to print a report witch include a result and a description of test conditions and the child and his parent personal data. 
StreszczenieW referacie przedstawiono program komputerowy do badania słuchu małych dzieci metodą audiometrii behawioralnej. Umożliwia on badanie dzieci w wieku od 6 do 36 miesięcy. Przedstawiono podstawowe cechy programu, opisano warunki badania oraz wymagania sprzętowe. Zastosowanie w programie wielokanałowego systemu odsłuchu dźwięku umożliwia weryfikację zdolności w zakresie lokalizowania źródła dźwięku. Duża różnorodność sygnałów testowych z otoczenia dziecka sprawia, że program może być pomocny do kontroli postępów w procesie rehabilitacji. Ponadto, może znaleźć zastosowanie podczas dopasowywania protez słuchowych. Po zakończeniu badania istnieje możliwość wydrukowania raportu zawierającego wyniki badania, opis profilu testu oraz dane osobowe dziecka i opiekuna. 

Entry No. 78 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski, M. Dziubiński 
English titleDecomposition of Duet Instrument Sounds 
Polish titleDekompozycja duetów muzycznych 
ConferenceISMA'2002 
Preprint 
Number 
Volume 
Pages292 - 301 
Conference siteMeksyk, Meksyk 
Conference date9.12.2002- 13.12.2002 
AbstractThis paper shows first a review of recent developments in the domain of separation of musical instrument sounds and then presents some methods of this kind developed at the Sound and Vision Engineering Department of the Technical University of Gdansk,Poland. The proposed technique for the decomposition of duet sounds is based on the modified Frequency Envelope Distribution analysis (FED). Recently introduced Frequency Envelope Distribution (FED)algorithm decomposes signal into linear expansion of waveforms,called EMO – Envelope Modulated Oscillations providing a combination of complex exponential signals modulated by complex amplitude envelopes.These waveforms are chosen to best match harmonic parts of the signal,however non-harmonic structures can be also represented by EMO.The first step of the engineered algorithm is the estimation of the fundamental frequency of the lower pitched instrument.Pitch estimation is carried out in block processing.The input signal is divided into short overlapping blocks,and pitch is estimated for each block separately,resulting in Pitch Contour Signal (PCS). Then harmonics of the second sound are searched in the residual signal.Therefore in this approach based on the FED algorithm the multi-pitch detection is not needed.Results of the performed experiments are shown and conclusions are derived.  
StreszczenieW referacie zaprezentowany został algorytm separacji nagrań duetów muzycznych. Metoda separacji oparta została na algorytmie FED, przy pomocy którego możliwa jest ekstrakcja części harmonicznych sygnałów. Ponadto wykorzystany został algorytm estymacji częstotliwości podstawowej oparty na korelacji skrośnej, w celu estymacji częstotliwości dekomponowanych harmonicznych. 

Entry No. 79 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski 
English titleFitting hearing aids employing fuzzy logic 
Polish titleDopasowanie protez słuchu z wykorzystaniem logiki rozmytej 
ConferenceProc. 6th IASTED Intern. Conference, Artificial Intelligence and Soft Computing 
Preprint 
Number 
Volume 
Pages599 - 602 
Conference siteBanff, Canada 
Conference date17.7.2002- 19.7.2002 
AbstractThe paper describes first limitations of the clinical hearing aid fitting process. The audiological assessment in this process is based both on classical methods that use as a basis results of the audiometric test and the loudness scaling method. These methods employ artificial test signals. However, the fitting of hearing aids should be also performed on the basis of testing speech understanding in noise, because this is much closer to the real life conditions. A satisfying reliability of these tests may be achieved through the use of modern computer technology with application of a properly calibrated sound system. A new strategy applicable to fitting prostheses was developed. It allows finding automatically characteristics of a hearing aid matching patients needs. The principles of the fitting method, and results of the experiments will be also presented in the paper.  
StreszczenieW referacie przedstawiono nowa metodykę dopasowania aparatów słuchowych opartą na wykorzystaniu badania zrozumiałości mowy w szumie. Metodyka ta wykorzystuje logikę rozmytą w procesie skalowania poziomu głośności bodźców słuchowych.  

Entry No. 80 
Entry typeconference paper 
AuthorsA. Czyżewski, M. Szczerba 
English titlePitch Estimation Enhancement Employing Neural Network- Based Music Prediction 
Polish title 
ConferenceProc. IASTED Intern. Conference, Artificial Intelligence and Soft Computing 
Preprint 
Number 
Volume 
Pages413 - 418 
Conference siteBanff, Canada 
Conference date17.7.2002- 19.7.2002 
AbstractIn this paper a new method for pitch estimation enhancement was presented. Pitch estimation methods are widely used for extracting musical data from digital signal. A brief review of these methods is included in the paper. However, since processed signal may contain noise and distortions, the estimation results can be erroneous. The proposed method was developed in order to override disadvantages of standard pitch estimation algorithms. The new -approach is based on both pitch estimation in terms of signal processing and pitch prediction based on musical knowledge modeling. First, signal is partitioned into segments roughly analogous to consecutive notes. Thereafter, for each segment an autocorrelation function is calculated. Autocorrelation function values are then altered using pitch predictor output. A music predictor based on artificial neural networks was introduced for this task. The description of the proposed pitch estimation enhancement method is included and some details concerning music prediction are discussed in the paper.  
StreszczenieW referacie przedstawiono metodę umożliwiającą poprawę skuteczności detekcji wysokości dźwięku muzycznego opartą na wykorzystaniu predykcji fraz muzycznych. Opracowany detektor wysokości dźwięku działa w oparciu o metodę autokorelacyjną, wspomaganą przez odpowiednio wytrenowaną sieć neuronowa.  

Entry No. 81 
Entry typeconference paper 
AuthorsG. Szwoch, A. Czyżewski, K. Kochanek, H. Skarżyński 
English title 
Polish titleBaza danych internetowych systemów telemedycznych 
ConferenceInfobazy 2002 - Bazy danych dla nauki 
Preprint 
Number 
Volume 
Pages57 - 62 
Conference siteGdańsk-Sobieszewo, Polska 
Conference date24.6.2002- 26.6.2002 
AbstractIn this paper, database of internet telemedical systems „Telezdrowie” is described. This database collects personal data of the users and results of tests performed using this system. The structure of the database, the data collected, a method of collecting and searching data, as well as implementation of the database is described. 
StreszczenieW artykule opisano bazy danych współpracujące z internetowymi serwisami telemedycznymi „Telezdrowie”. Baza danych umożliwia gromadzenie danych osobowych użytkowników systemu oraz wyników badań przeprowadzonych przy użyciu omawianych systemów. Opisano strukturę bazy danych, rodzaj zbieranych informacji, sposób gromadzenia i wyszukiwania danych w bazie, a także realizację techniczną bazy. 

Entry No. 82 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek 
English titleDeriving Rules for Mastering Surround Sound to Accompany Video 
Polish titleEkstrakcja reguł w dla potrzeb masteringu dźwięku dookólnego i video 
ConferenceDAGA'02 
Preprint 
Number 
Volume 
Pages 
Conference siteBochum, Germany 
Conference date4.3.2002- 7.3.2002 
Notesreferat plakatowy 
AbstractThe methodology of testing influence of video image on surround sound perception developed by authors led to formulation of some principles of mastering multi-channel sound accompanying video content. The literature relates mostly to the classical studies on this subject including stereo sound systems for HDTV. At present, digital video, film or multimedia presentations are often accompanied by the surround sound. However, there is still no clear answer to the question: how the video influences the localization of virtual sound sources in multichannel surround systems (e.g. DTS) and in most references one can find a list of problems only to be solved while testing relevant inter-modal relations. Therefore, authors addressed in their studies similar problems employing subjective testing procedures in which experts listened to the sound with- and without video image presence and provided answers. Results of such experiments demonstrated in which cases and in what way video may affect the localization of virtual sound sources. The so called image proximity effect confirmed some dependencies between reactions of sight and hearing senses due to perception of visual stimuli accompanied by surrounding sound. The obtained data were then analyzed by means of modern techniques of intelligent data exploration and knowledge discovery allowing finding some hidden relations between semantic descriptors of subjective impressions. Finally, basing on the results of data analysis a set of rules concerning mastering of multichannel audio to accompany various types of video content were derived. Some results of this study will be presented and discussed in the paper.  
StreszczenieW referacie sformułowano przykłady reguł dotyczących tworzenia dźwięku w systemie dookólnym towarzyszącemu obrazowi video. Reguły te tworzono w opraciu o wyniki testów subiektywnych. 

Entry No. 83 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, A. Kornacki, P. Odya, M. Dziubiński 
English titleComparing some convolution-based methods for creation of surround sound 
Polish titleSystem nagrań dźwięku dookólnego z wykorzystaniem splotu odpowiedzi impulsowej sali 
Conference144th Meeting of the Acoustical Society of America (First Pan-American/Iberian Meeting on Acoustics), J. Acoust. Soc. Am. 
Preprint 
Number
Volume112 
Pages2274 
Conference siteCancun, Meksyk 
Conference date2.12.2002- 7.12.2002 
Notes1-7 
AbstractSpatialization of the sound using the multichannel techniques is now getting widespread. One can derive many rules for surround sound recording and reproduction. However, there exists only few methods suitable for recording sound in large auditoria ensuring its proper subsequent reproduction in small reproduction rooms, preserving spatial properties of sound acquired in the original recording location. Some experiments presented in the paper were devoted to simulation of acoustics of the recording hall using the convolution of monophonic audio signal with the multichannel impulse response of the hall. A special microphone setup was created to that end and an original method of recording multichannel impulse response of auditory halls was conceived and implemented. In this method the acoustical signal recorded quasi-anechoically was convolved with 5 impulse responses of the simulated room measured in the room corners and at the stage position. The firecracker shots used for impulse response recording were equalized during the subsequent recorded signal processing. Surround recordings made with above mentioned convolution techniques were then compared each to others on the basis of subjective testing results. The details of the examined surround recording methods and results of their assessments will be discussed in the paper.  
StreszczenieW referacie przedstawiono eksperymenty związane z symulacją dźwięku dookólnego w sali koncertowej. W tym celu wykorzystywano splot odpowiedzi impulsowej z danego wnętrza (wielokanałowe nagrania odpowiedzi impulsowej) z nagraniami z komory bezechowej. Uzyskany w ten sposób sygnał został następnie przypisany do odpowiednich kanałów w systemie dookólnym. Uzyskane w ten sposób nagrania były następnie porównywane w testach subiektywnych z nagraniami pochodzącymi z innych systemów dookólnych. 

Entry No. 84 
Entry typeconference paper 
AuthorsA. Czyżewski, M. Szczerba, B. Kostek 
English titlePitch Estimation Assisted by the Neural Network-Based Prediction Algorithm 
Polish titleEstymacja częstotliwości podstawowej z wykorzystaniem predykcji neuronowej 
ConferenceISMA'2002 
Preprint 
Number 
Volume 
Pages246 - 255 
Conference siteMeksyk, Meksyk 
Conference date9.12.2002- 13.12.2002 
AbstractIn this paper recent developments in pitch estimation methods enhancement were presented. This issue is well-developed within signal processing domain. However, because processed signal often contains noise and distortions, the estimation results may be erroneous. First, a brief review of such methods is shown. The developed method was introduced in order to diminish processing errors of the known pitch estimation algorithms. The proposed approach is two-fold. Both pitch estimation in terms of signal processing and pitch prediction based on neural networks are employed. First, signal is partitioned into segments roughly analogous to consecutive notes. Then, for each segment the autocorrelation function is calculated. Autocorrelation function values are then processed using pitch predictor output. A music predictor based on artificial neural networks was introduced for this task. The description of the proposed pitch estimation enhancement method is included and some details concerning music prediction are discussed in the paper. 
StreszczenieW referacie zawarto przegląd metod estymacji częstotliwości podstawowej we frazach muzycznych. W celu zmniejszenia błędów oktawowych w procesie estymacji częstotliwości podstawowej dźwięków zaproponowano uwzględnienie w systemie predyktora neuronalnego. Pokazano skuteczność estymacji częstotliwości podstawowej w zaproponowanym systemie i podano wnioski. 

Entry No. 85 
Entry typeconference paper 
AuthorsA. Czyżewski, A. Kornacki, P. Odya 
English titleSome Rules and Methods for Creation of Surround Sound 
Polish titleZasady realizacji dźwięku dookólnego 
Conference21st AES Conference 
Preprint 
Number 
Volume 
Pages 
Conference sitePetersburg, Russia 
Conference date1.6.2002- 3.6.2002 
AbstractThe problem of selection of an adequate surround sound life recording and reproduction methods is still open. Alternative methods of organizing this process are discussed in the paper. Some experimental recording sessions employing the 5.1 format were made with the use of various miking techniques and the convolution-based multichannel audio processing algorithm. The results were submitted to some subjective assessments and then compared. Conclusions resulting from performed experiments are derived and discussed. 
StreszczenieW artykule opisano alternatywną metodę tworzenia dźwięku dookólnego wykorzystującą splot. Opisano wykorzystane techniki mikrofonowe. Zawarto wyniki subiektywnych testów odsłuchowych. 

Entry No. 86 
Entry typejournal paper 
AuthorsA. Czyżewski 
English titleApplications of Neural Networks and Perceptual Masking to Audio Restoration 
Polish titleZastosowanie sieci neuronowych i maskowania perceptualnego do rekonstrukcji nagrań 
JournalJourn. of New Musical Research 
Volume30 
Number
Pages341 - 351 
AbstractApplications of learning algorithms to the restoration of recordings are presented. Attention is paid to the usage of artificial neural networks as a decision system determining which components of an input signal are valid and which ones are unwanted. It provides a basis for the parasitic impulse detection and for the interpolation of lost signal intervals. Such an approach enables also an efficient noise reduction employing the extended perceptual coding algorithm. The proposed algorithms are described briefly in the paper, obtained results are discussed and some general conclusions concerning the application of soft computing and perceptual masking to sound restoration are added. 
StreszczenieOmówiono zastosowania algorytmów uczących się w dziedzinie rekonstruowania nagrań fonicznych. Szczególną uwagę zwrócono na zastosowanie sztucznych sieci neuronowych do usuwania zakłócających impulsów. Ponadto opisano zastosowanie inteligentnego algorytmu decycyzyjnego do sterowania maskowaniem perceptualnym w celu redukowania szumu.  

Entry No. 87 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus 
English title 
Polish titleZASTOSOWANIE WSPÓŁCZESNEJ TECHNOLOGII TELEINFORMATYCZNEJ DO POWSZECHNEJ DIAGNOSTYKI ZAGROŻEŃ HAŁASOWYCH 
ConferenceVI Koszalińska Konferencja Naukowo-Techniczna „Hałas – Profilaktyka – Zdrowie” 
Preprint 
Number 
Volume 
Pages 
Conference siteKołobrzeg, Polska 
Conference date12.11.2002- 14.11.2002 
AbstractThe principal objective of the project currently being realized at the Sound and Vision Engineering Department of the Gdansk University of Technology is reduction of frequency of hearing disease occurrence, whereby such diseases are caused by excessive industry, urban and traffic noise and objectionable sounds of other kind that occur in everyday life. Such an aim will be achieved as a result of implementation of solutions that will be developed within the project, whereby such solutions will be based on innovatory ideas and ways of evaluating noise and vibration nuisance and its negative impact on psychosomatic and vegetative system. The latest technological advances in information technology will be used in the course of project realization. Implementation of an all-Polish noise telemonitoring system will contribute to the increase in consciousness of society and authorities concerning impact of noise on health and can turn to be an essential factor in changing the situation for better. 
StreszczenieNadrzędnym celem projektu realizowanego aktualnie w Katedrze Inżynierii Dźwięku i Obrazu Politechniki Gdańskiej jest zmniejszenie częstości występowania chorób słuchu powodowanych nadmiernym hałasem przemysłowym, urbanistycznym, komunikacyjnym i innego rodzaju niepożądanymi dźwiękami, które występują w życiu codziennym. Cel ten będzie osiągany w wyniku wdrożenia rozwiązań opracowanych w ramach projektu, które opierają się na nowatorskich koncepcjach i sposobach szacowania stopnia dokuczliwości hałasu oraz wibracji i ich negatywnego wpływu na słuch oraz na układy psychosomatyczny i wegetatywny. W toku realizacji projektu zostaną wykorzystane najnowsze osiągnięcia technologiczne z dziedziny teleinformatyki. Wdrożenie ogólnokrajowego systemu telemonitoringu hałasu przyczyni się do wzrostu stopnia uświadomienia przez społeczeństwo i władze problematyki wpływu hałasu na zdrowie i może stać się istotnym czynnikiem przyszłej poprawy sytuacji w tym zakresie. 

Entry No. 88 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, P. Odya 
English titleMaking Surround Audio Considering Image Proximity Effect 
Polish titleTworzenie dźwięku przestrzennego z uwzględnieniem wpływu ściągającego obrazu na dźwięk 
Conference112th AES Convention 
Preprint5583 
Number 
Volume 
Pages 
Conference siteMunich, Germany 
Conference date10.5.2002- 13.5.2002 
AbstractThe problem of influencing surround sound perception by video content was addressed employing subjective testing procedures in which experts listened to the sound with- and without video image presence and provided their answers. Results of experiments demonstrated in which cases and how video may affect the localization of virtual sound sources. The obtained data were then analyzed by means of modern techniques of intelligent data exploration and knowledge discovery allowing finding some hidden relations between semantic descriptors of subjective impressions. Finally, basing on the results of data analysis a set of rules concerning mastering of multichannel audio to accompany various types of video content were derived. Some results of this study will be presented and discussed in the paper.  
StreszczenieProblem wpływu obrazu na dźwięk badany jest z wykorzystaniem subiektywnych testów odsłuchowych. Uzyskane wyniki analizowane są z wykorzystaniem algorytmów sztucznej inteligencji. Na podstawie uzyskanych analiz uzyskano reguły dotyczące zasad tworzenia dźwięku wielokanłowego towarzyszącego różnym typom obrazu. 

Entry No. 89 
Entry typejournal paper 
AuthorsA. Czyżewski, H. Skarżyński 
English title 
Polish titleInteraktywne badania słuchu, wzroku i mowy 
JournalElektronizacja 
Volume 
Number10 
Pages27 - 30 
StreszczenieTelemedycyna jest jedną z najważniejszych i najszybciej rozwijających się technologii społeczeństwa informacyjnego. Pomimo dostępności wielu aplikacji, wciąż jeszcze brakuje aplikacji interaktywnych. W artykule zaprezentowano kilka przykładowych rozwiązań interaktywnych aplikacji telemedycznych, opartych na opracowaniach zrealizowanych w Katedrze Inżynierii Dźwięku i Obrazu PG.  

Entry No. 90 
Entry typejournal paper 
AuthorsA. Czyżewski, B. Kostek 
English titleExpert Media Approach to Hearing Aids Fitting  
Polish titleSystem ekspercki dopasowania protez słuchu 
JournalInt. Journ. of Intelligent Systems 
Volume17 
Number 
Pages277 - 294 
AbstractThe engineered Multimedia Hearing Aid Fitting Expert System is the experimental software that allows to find the characteristics of a hearing aid matching patients needs and to choose automatically a suitable hearing device characteristics. The key issues related to the engineered application are based on the expert system implementation. This expert system uses both fuzzy logic and rough set processing of analytical data. The principles of the engineered expert media application, some details of the rough set and fuzzy logic implementation will be presented in the paper.  
StreszczenieW artykule zaprezentowano problematyke dopasowania protez słuchu. Przedstawiono system ekspercki, ktory pozwala na znalezienie charakterystyk aparatu słuchowego adekwatnego do uszkodzenia słuchu. System został oparty o metodę zbiorów przybliżonych i logikę rozmytą. 

Entry No. 91 
Entry typejournal paper 
AuthorsA. Czyżewski, H. Skarżyński 
English title 
Polish titleTelemedycyna - czy może być interaktywna ?  
JournalEkspert Medyczny 
Volume
Number
Pages39 - 41 
StreszczenieObecne aplikacje telemedyczne stają się jednym ze zwrotnych motorów napędowych przyśpieszających rozwój elektroniki i teleinformatyki. W artykule opisano wdrożenia z tej dziedziny dokonane przez Katedrę Inżynierii Dźwięku i Obrazu PG we współpracy z Instytutem Fizjologii i Patologii Słuchu w Warszawie, dotyczące systemów telemedycznych do badania słuchu, wzroku i mowy.  

Entry No. 92 
Entry typeconference paper 
AuthorsA. Wieczorkowska, A. Czyżewski 
English titleRough Set Based Automatic Classification of Musical Instrument Sounds 
Polish titleAutomatyczna klasyfikacja instrumentów muzycznych z zastosowaniem metody zbiorów przybliżonych 
ConferenceRSKD - International Workshop on Rough Sets in Knowledge Discovery and Soft Computing 
Preprint 
Number 
Volume 
Pages297 - 308 
Conference siteWarsaw,  
Conference date5.4.2003- 13.4.2003 
AbstractThis paper addresses the problem of automatic recognition of musical instrument sounds, applying rough set based techniques as a tool of classification. Instruments representing wind and string families were used in the experiments. Since the main problem in case of audio data is the proper parameterization, we also investigated issues regarding various parameterization methods. Fourier transform and wavelet analysis were applied as parameterization tools. The obtained feature vectors were tested using rough set tools. The analyzed data represent singular sounds of full musical range of 11 musical instruments, played with various articulation techniques. Results of experiments are presented and discussed in this paper. We summarize our paper with conclusions on musical signal representation for timbre classification purposes. 
StreszczenieReferat dotyczy problemu automatycznego rozpoznawania indtrumentów muzycznych, rozwiązywanego z zastosowaniem inteligentnych algorytmów decyzyjnych. Instrumenty muzyczne należące do rodziny dętych i strunowych zostały poddane procesowi parametryzacji z zastosowaniem analizy falkowej. Otrzymane dane stanowią reprezentację pełnej skali muzycznej 11 instrumentów, zarejestrowanych z uwzględnieniem artykulacji muzycznej. Wnioski zawarte w referacie dotyczą reprezentacji sygnałów muzycznych, która jest przydatna w procesie automatycznej klasyfikacji barwy dźwięku.  

Entry No. 93 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek 
English titleWAVEGUIDE MODELLING OF THE PANPIPES  
Polish titleFalowodowy model Fletni Pana 
ConferenceMusic Acoustics Conference 
Preprint 
Number 
Volume 
Pages 
Conference siteStockholm, Szwecja 
Conference date6.8.2003- 9.8.2003 
AbstractThe principal aim of this paper is to present a digital waveguide model of the Panpipes. For the efficient modeling of the Panpipes instrument its structure and its physics were studied and thoroughly discussed. The acquired knowledge was then used during the construction of the model. In this context principles of the digital waveguide modeling of woodwind instruments are shortly reviewed. Because of the simplicity of designing the digital waveguide as a set of delay lines and scattering junctions the model can be easily implemented to a digital signal processor. In the paper two digital waveguide models of the Panpipes instruments were presented. They differ from each other by their complexity. This was due to examining the influence of decreasing the complexity of the model on the synthetic sound quality. The performed subjective tests resulted in showing that introduced simplifications in digital waveguide models reveal no noticeable influence on the sound quality. A comparison between synthetic and real Panpipes sounds was made. The results of both subjective tests and objective analyses obtained using engineered models of Panpipes are also included in the paper. Conclusions are derived.  
StreszczenieZaprezentowano falowodowy model Fletni Pana. W procesie opracowywania tego modelu przestudiowano zjawiska fizyczne zwiazane z powstawaniem dźwięku w tym instrumencie. W referacie przedstawiono dwa modele tego isntrumentu muzycznego, różniące się złożonością obliczeniową. Na podstawie wyników testów wykazano, że model uproszczony generuje dźwięki o podobnej jakości, jak model złożony. Wyniki i wnioski zawarto w treści referatu.  

Entry No. 94 
Entry typeconference paper 
AuthorsP. Suchomski, B. Kostek, A. Czyżewski 
English titleThe Multimedia Hearing Training System for Hearing Impaired People 
Polish titleMultimedialny system treningu słuchowego dla osób niedosłyszących 
ConferenceI Międzynarodowa Konferencja Telemedycyny i Telekomunikacji Multimedialnej 
Preprint 
Number 
Volume 
Pages 
Conference site 
Conference date10.10.2003- 12.10.2003 
AbstractA large majority of hearing aid fitting systems are focused on improving the speech understanding, because the speech is the base of people communication. A hearing aid fitting problem could be simply describe as a problem with fitting wide dynamic of speech signal to narrow dynamic of impaired hearing. To solve the problem the majority hearing aids use dynamic processors like compressor and exspander. The aim of the experiments was to design multimedia computer system which could be helpful for: - measurement of impaired hearing dynamic characteristic; - making approximate hearing impairment simulation; - obtaining dynamic characteristic of desired hearing aid; - making approximate hearing aid simulation; In the system was implemented LGOB loudness scaling test. The results of the LGOB test are the base for the hearing dynamic characteristic calculating. Base of the dynamic characteristic the system can make approximate hearing impairment simulation. The desired hearing aid dynamic characteristic is obtained as the compensation of impaired hearing dynamic characteristic. Using the hearing aid dynamic characteristic the system makes approximate simulation. For the both kind of simulation the system uses numerous recorded speech signal (logatoms, Polish words and Polish sentences). The hearing trainings are carried out based on the implemented hearing aid simulation algorithm and stored speech signal database. The details of the elaborated system will be presented in the paper.  
StreszczenieWiększość systemów dopasowania protez słuchu skupia się na poprawie zrozumienia mowy, ponieważ sygnał mowy jest podstawowym sposobem komunikowania się ludzi. W uproszczeniu problem dopasowania protezy słuchu może byc przedstawiony jako problem dopasowania szerokiej dynamiki sygnału do wąskiej dynamiki uszkodzonego słuchu. Do rozwiązania tego problemu większość protez słuchu wykorzystuje procesory dynamiki takie jak: kompresor i ekspander. Celem eksperymentó było stworzenie multimedialnego systemu, który byłby pomocny w: - pomiarze charakterystyki dynamiki słuchu; - tworzeniu przybliżonych symulacji ubytku słuchu; - obliczaniu poszukiwanej charakterystyki dynamiki protezy słuchu; - przeprowadzaniu przybliżonych symulacji według wyznaczonych charakterytyk protez słuchu; W systemie został zaimplementowany algorytm skalowania głośności w pasmach oktawowych. Jego wyniki są podstawą do wyznaczenia charakterystyki dynamiki uszkodzonego słuchu. Dzięki kompensacji charakterystyki dynamiki słuchu w systemie wyznaczana jest charakterystyka dynamiki protezy słuchu. W oparciu o tą wyznaczoną charakterystykę w systemie przeprowadzane są przyblizone symulacje, w których wykorzystywany jest sygnał mowy w postaci nagrań logatomów, słów i zdań w języku polskim. Szczególy opracowanego systemu są przedmiotem niniejszego plakatu. 

Entry No. 95 
Entry typebook 
AuthorsA. Czyżewski 
English titleIntelligent Acquisition of Audio Signal Employing Neural Network and Rough Set Algorithms 
Polish titleInteligentna akwizycja sygnału fonicznego przy pomocy sieci neuronowych i zbiorów przybliżonych 
EditorROUGH-NEURO COMPUTING: A WAY TO COMPUTING WITH WORDS, Springer Verlag, Series on Artificial Intelligence  
Pages 

Entry No. 96 
Entry typeconference paper 
AuthorsJ. Kotus, A. Czyżewski 
English titleTelemedia System For Diagnosing Environmental Noise 
Polish titleMultimedialny system teleinformatyczny do diagnostyki hałasu. 
ConferenceI Międzynarodowa Konferencja Telemedycyny i Telekomunikacji Multimedialnej 
Preprint 
Number 
Volume 
Pages 
Conference siteKajetany, Polska 
Conference date10.10.2003- 12.10.2003 

Entry No. 97 
Entry typeconference paper 
AuthorsP. Suchomski, B. Kostek, A. Czyżewski 
English titleThe Multimedia Hearing Training System for Hearing Impaired People 
Polish titleMultimedialny system treningu słuchowego dla osób niedosłyszących 
ConferencePrezentacja plakatowa na VII Międzynarodowej konferencji implantów ślimakowych i medycyny audiologicznej 
Preprint 
Number 
Volume 
Pages 
Conference siteKajetany, Polska 
Conference date22.5.2003- 22.5.2003 
AbstractA large majority of hearing aid fitting systems are focused on improving the speech understanding, because the speech is the base of people communication. A hearing aid fitting problem could be simply describe as a problem with fitting wide dynamic of speech signal to narrow dynamic of impaired hearing. To solve the problem the majority hearing aids use dynamic processors like compressor and exspander. The aim of the experiments was to design multimedia computer system which could be helpful for: - measurement of impaired hearing dynamic characteristic; - making approximate hearing impairment simulation; - obtaining dynamic characteristic of desired hearing aid; - making approximate hearing aid simulation; In the system was implemented LGOB loudness scaling test. The results of the LGOB test are the base for the hearing dynamic characteristic calculating. Base of the dynamic characteristic the system can make approximate hearing impairment simulation. The desired hearing aid dynamic characteristic is obtained as the compensation of impaired hearing dynamic characteristic. Using the hearing aid dynamic characteristic the system makes approximate simulation. For the both kind of simulation the system uses numerous recorded speech signal (logatoms, Polish words and Polish sentences). The hearing trainings are carried out based on the implemented hearing aid simulation algorithm and stored speech signal database. The details of the elaborated system will be presented in the paper.  
StreszczenieWiększość systemów dopasowania protez słuchu skupia się na poprawie zrozumienia mowy, ponieważ sygnał mowy jest podstawowym sposobem komunikowania się ludzi. W uproszczeniu problem dopasowania protezy słuchu może byc przedstawiony jako problem dopasowania szerokiej dynamiki sygnału do wąskiej dynamiki uszkodzonego słuchu. Do rozwiązania tego problemu większość protez słuchu wykorzystuje procesory dynamiki takie jak: kompresor i ekspander. Celem eksperymentó było stworzenie multimedialnego systemu, który byłby pomocny w: - pomiarze charakterystyki dynamiki słuchu; - tworzeniu przybliżonych symulacji ubytku słuchu; - obliczaniu poszukiwanej charakterystyki dynamiki protezy słuchu; - przeprowadzaniu przybliżonych symulacji według wyznaczonych charakterytyk protez słuchu; W systemie został zaimplementowany algorytm skalowania głośności w pasmach oktawowych. Jego wyniki są podstawą do wyznaczenia charakterystyki dynamiki uszkodzonego słuchu. Dzięki kompensacji charakterystyki dynamiki słuchu w systemie wyznaczana jest charakterystyka dynamiki protezy słuchu. W oparciu o tą wyznaczoną charakterystykę w systemie przeprowadzane są przyblizone symulacje, w których wykorzystywany jest sygnał mowy w postaci nagrań logatomów, słów i zdań w języku polskim. Szczególy opracowanego systemu są przedmiotem niniejszego plakatu.  

Entry No. 98 
Entry typeconference paper 
AuthorsG. Szwoch, B. Kostek, A. Czyżewski 
English titleComputer Modeling As a Useful Tool For Designing Acoustical Elements of Hearing Aid 
Polish title 
ConferenceVII Międzynarodowa Konferencja Implantów Ślimakowych i Medycyny Audiologicznej  
Preprint 
Number 
Volume 
Pages 
Conference siteKajetany, Polska 
Conference date22.5.2003- 24.5.2003 
AbstractOne of the most difficult aspects of hearing aid fitting is the proper choice of acoustical elements, including earmold. The aim of the research was to propose a computer tool that may be useful in this process. The computer model of the acoustical system of hearing aid is based on the physical waveguide modeling method. The algorithm computes and plots frequency response of the acoustical system. It is possible to examine the relationship between modification of the model parameters and respective changes in frequency response. Some chosen acoustical properties of the ear are implemented in the model. Although the model is simplified at this stage of research, comparison of model responses with the measurement data of real acoustical elements proved that the model behaves similarly to the physical system. In order to provide more accurate simulation of sound processing in hearing aid, dynamic signal compression was also included in the model. Signal processing procedures are performed independently in four frequency bands, compatible to LGOB examination. The complete model is implemented in Matlab as a computer program with graphical user interface. The ongoing listening tests with hearing-impaired people will be useful in validation of the model. The fully developed computer system is intended to be a helpful tool assisting the person who chooses the acoustical elements of hearing aid. It will enable one to design the acoustical system with acoustical properties optimal for the hearing aid user’s needs.  
StreszczenieJednym z najtrudniejszych aspektów dopasowywania aparatów słuchowych jest odpowiedni dobór elementów akustycznych aparatu, w tym wkładki usznej. Celem badań było zaproponowanie komputerowego narzędzia pomocnego w tym procesie. Model komputerowy akustycznego systemu aparatu słuchowego oparty jest na metodzie modelowania falowodowego. Algorytm oblicza i wykreśla charakterystykę częstotliwościową układu akustycznego. Możliwe jest zbadanie zależności pomiędzy zmianami wartości parametrów a odpowiadającym im zmianom charakterystyki częstotliwościowej. Pomimo tego, że na tym etapie badań zastosowano uproszczony model, porówanie charakterystyk modelu z charakterystykami pomiarowymi rzeczywistych elementów akustycznych aparatu słuchowego wykazało, że model odwzorowuje działanie rzeczywistego układu. W celu bardziej dokładnego odtworzenia procesu przetwarzania sygnału w aparacie słuchowym, do modelu dołączono blok dynamicznej regulacji poziomu sygnału. Przetwarzanie sygnału dokonywane jest niezależnie w czterech pasmach częstotliwości. Model komputerowy został zaimplementowany w systemie Matlab w postaci programu z graficznym interfejsem użytkownika. W celu weryfikacji poprawności działania modelu zostaną przeprowadzone testy odsłuchowe z udziałem osób z upośledzonym słuchem. Celem badań jest opracowanie pełnego komputerowego systemu służącego do projektowania akustycznych elementów aparatu słuchowego. Model ten będzie pomocny w procesie doboru aparatu słuchowego, pozwalając na dobranie elementów akustycznych aparatu najlepiej dopasowanych do potrzeb użytkownika aparatu. 

Entry No. 99 
Entry typejournal paper 
AuthorsA. Czyżewski 
English titleAutomatic Identification of Sound Source Position Employing Neural Networks and Rough Sets 
Polish titleAutomatyczna identyfikacja położenia źródła dźwięku z zastosowaniem sztucznych sieci neuronowych i zbiorów przybliżonych 
JournalPattern Recognition Letters  
Volume24 
Number 
Pages921 - 933 
AbstractMethods for the identification of direction of the incoming acoustical signal in the presence of noise and reverberation were investigated. Since the problem is a non-deterministic one, thus applications of two learning algorithms, namely neural networks and rough sets were developed to solve it. Consequently, two sets of parameters were formulated in order to discern target source from unwanted sound source position and then processed by learning algorithms. The applied feature extraction methods are discussed, training processes are described and obtained sound source localizing results are demonstrated and compared.  
StreszczeniePrzebadano metody identyfikacji kierunku napływania sygnałów akustycznych w obecności szumu i pogłosu. Ponieważ w ten sposób postawiony problem jest zagadnieniem niedeterministycznym, dlatego zastosowano algorytmy inteligentne, w celu jego rozwiązania. Przdyskutowano i porównano metody ekstrakcji cech dystynktywnych zastosowane na etapie parametryzacji oraz uzyskane wyniki automatycznej klasyfikacji.  

Entry No. 100 
Entry typejournal paper 
AuthorsA. Czyżewski, A. Kaczmarek, B. Kostek 
English titleIntelligent Processing of Stuttered Speech 
Polish titleInteligentne przetwarzanie mowy osob jąkających się 
JournalJournal of Intelligent Information Systems 
Volume21:2 
Number 
Pages143 - 171 
AbstractThe process of counting stuttering events could be carried out more objectively through the automatic detection of stop-gaps, syllable repetitions and vowel prolongations. The alternative would be based on the subjective evaluations of speech fluency and may be dependent on a subjective evaluation method. Meanwhile, the automatic detection of intervocalic intervals, stop-gaps, voice onset time and vowel durations may depend on the speaker and the rules derived for a single speaker might be unreliable when trying to consider them as universal ones. This implies that learning algorithms having strong generalization capabilities could be applied to solve the problem. Nevertheless, such a system requires vectors of parameters, which characterize the distinctive features in a subject’s speech patterns. In addition, an appropriate selection of the parameters and feature vectors while learning may augment the performance of an automatic detection system. The paper reports on automatic recognition of stuttered speech in normal and frequency altered feedback speech. It presents several methods of analyzing stuttered speech and describes attempts to establish those parameters that represent stuttering event. It also reports results of some experiments on automatic detection of speech disorder events that were based on both rough sets and artificial neural networks.  
StreszczenieProces zliczania nieprawidłowo artykułowanych elementów mowy osób jakających się może być znacząco ułatwiony i zobiektywizowany poprzez zastosowanie automatycznej detekcji przerw, powtórzeń i przedłużeń. W artykule zaprezentowano kilka metod analizy i automatycznego zliczania potknięć artykulacyjnych, związanych z jąkaniem się, opartych na wykorzystaniu algorytmów uczących się - sztucznych sieci neuronowych i zbiorów przybliżonych.  

Entry No. 101 
Entry typeconference paper 
AuthorsA. Lorens, A. Czyżewski, H. Skarżyński 
English title 
Polish titleObiektywna metoda wyznaczania skuteczności systemów implantów ślimakowych 
ConferenceXIII Konferencja Biocybernetyki i Inżynierii Biomedycznej 
Preprint 
Number 
Volume 
Pages 
Conference siteGdańsk,  
Conference date11.9.2003- 13.9.2003 
StreszczeniePrzedmiotem pracy było opracowanie nowej metody wyznaczania skuteczności systemów implantów ślimakowych opartej o komputerowe symulacje słyszenia elektrycznego. W celu wykonania symulacji stworzono matematyczny model percepcji słuchowej pacjenta implantowanego. Opracowany model uwzględnia wybrane zjawiska psychofizyczne, zachodzące w elektrycznie stymulowanym układzie słuchowym odpowiedzialne za percepcję mowy, takie jak: zmiany w progu słyszenia, przebieg funkcji narastania wrażenia głośności oraz rozdzielczość częstotliwościową. Opracowana metoda została sprawdzona w oparciu o eksperymenty przeprowadzone z udziałem czterech implantowanych pacjentów. 

Entry No. 102 
Entry typejournal paper 
AuthorsA. Czyżewski 
English titleIntroduction to the Special Issue on Intelligent Systems to Aid the Handicapped 
Polish titleWprowadzenie do specjalnego wydania na temat zastosowań systemów inteligentnych do wspomagania osób niepełnosprawnych 
JournalJournal of Intelligent Information Systems 
Volume21:2 
Number 
Pages103 - 104 
AbstractA number of artificial intelligence and database technologies applications include those that aid handicapped people. In fact, for every new computer technology, the academic community is quick to use it to improve communication of people with disabilities or to aid them directly by e.g. mechanic controls using assistive technologies. Artificial intelligence, soft computing, domotics and intelligent agents follow similar trends. Multimedia technology combined with artificial intelligence and database technologies yields some very interesting results. A token of this is automatic interpretation of sign language for deaf people and more and more complex systems to aid the visually impaired where visual information is converted into acoustic information; examples are numerous. Until now there have been very few publications on the subject and the ones available usually came as conference proceedings, some of which were published by e.g. Springer-Verlag as part of the Lecture Notes in Computer Science series or IEEE Computer Society Workshops and various robotics conference proceedings. Moreover, there is a Special Interest Group on Computers and the Physically Handicapped (ACM SIGCAPH) that organizes international Conferences on Assistive Technologies. The subject in question has had extensive coverage as part of European Framework Programs projects and national research grants in many countries and in numerous patent applications. Few journals, however, have used their special issues to address the application of artificial intelligence and database technologies to aid the handicapped which has consequently led to the publication of this paper.  
StreszczenieWśród wielu zastosowań sztucznej inteligencji i technologii bazodanowych pojawiają się zastosowania wspierające osoby niepełnosprawne. Właściwie, z chwilą pojawienia się każdej nowej technologii komputerowej świat naukowy niezwłocznie proponuje zastosowania tej technologii do celu poprawy komunikacji z osobami niepełnosprawnymi bądź technologie wspierające te osoby bezpośrednio, np. poprzez sterowanie mechanicznymi urządzeniami dla osób niepełnosprawnych. Znane są wydawnictwa pokonferencyjne, które ukazywały się przykładowo w wydawnictwie Springer-Verlag, w jego serii z serii Lecture Notes in Computer Science lub jako proceedings of IEEE Computer Society Workshops. Istnieje także Special Interest Group on Computers and the Physically Handicapped (ACM SIGCAPH) organizująca międzynarodowe Conferences on Assistive Technologies i in. Tematyka, o której mowa jest ponadto przedmiotem licznych projektów w ramach European Framework Programs oraz grantów w wielu krajach świata i licznych aplikacji patentowych. Niniejsze wydanie specjalne czasopisma Journal of Intelligent Information Systems uzupełnia wydawnictwa, które ukazywały się do tej pory w tej dziedzinie.  

Entry No. 103 
Entry typeconference paper 
AuthorsP. Odya, A. Czyżewski 
English title 
Polish titleSystem ekspercki do oceny stopnia nasilenia wady jąkania 
ConferenceXII Konferencja Naukowo-Szkoleniowa Sekcji Foniatrycznej Polskiego Towarzystwa Otolaryngologów Chirurgów Głowy i Szyi 
Preprint 
Number 
Volume 
Pages 
Conference siteKajetany, Polska 
Conference date6.6.2003- 8.6.2003 
StreszczenieW związku z rozwojem metod terapii mowy osób jąkających się, w tym metod elektronicznej korekcji mowy i opracowaniem urządzeń do tego celu, rosną potrzeby w zakresie dokonywania obiektywnej oceny wyników terapii. W praktyce zliczanie błędnie artykułowanych elementów mowy jest dokonywane na podstawie testu sylabowego, jednak prowadzenie tego testu wymaga od pacjenta wysoce nienaturalnego sposobu artykułowania mowy. Z kolei zliczanie przedłużeń samogłosek, raptownych przerw a fonacji oraz powtórzeń jest procesem żmudnym a ponadto nie w pełni obiektywnym. Próby takiego zliczania dokonywanego jednocześnie przez kilka osób, ujawniają najczęściej dość znaczny rozrzut wyników. Z tego względu proponowane jest zastosowanie do tego celu komputerowej analizy mowy z zaburzeniami. Nawet jeśli program komputerowy nie sklasyfikuje potknięć artykulacyjnych w pełni poprawnie, to jednak będzie on działał za każdym razem jednakowo, umożliwiając szybkie ujęcie ilościowe postępów terapii. W procesie realizacji badań zostaną wykorzystane możliwości wynikające z udostępnienia cyfrowych korektorów mowy poradniom psychologiczno-pedagogicznym na terenie kraju, w zamian za nadsyłanie wyników badań, w tym nagrań magnetofonowych osób jąkających się. Na tej podstawie zostanie utworzona baza nagrań wypowiedzi obarczonych różnego typu zaburzeniami artykulacyjnymi, a następnie jej zawartość zostanie przeanalizowana przy wykorzystaniu opracowanych narzędzi komputerowych. W referacie zostaną omówione uzyskane wyniki i sformułowane wnioski na temat możliwości wynikających z zastosowania narzędzi komputerowych do badania mowy osób jąkająych się. 

Entry No. 104 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus 
English titleEmploying Modern Teleinformation Technology for General Diagnostics of Noise Hazards 
Polish titleTechnologie informacyjne w zastosowaniu do powszechnej diagnostyki hałasu 
ConferenceFirst International ICSC Symposium „Information Technologies in Environmental Engineering” (ITEE’2003) 
Preprint 
Number 
Volume 
Pages77 
Conference siteGdansk, Poland 
Conference date24.6.2003- 27.6.2003 
AbstractThe principal objective of the project currently being realized at the Sound and Vision Engineering Department of the Gdansk University of Technology is reduction of frequency of hearing disease occurrence, whereby such diseases are caused by excessive industry, urban and traffic noise and objectionable sounds of other kind that occur in everyday life. Such an aim will be achieved as a result of implementation of solutions that will be developed within the project, whereby such solutions will be based on innovatory ideas and ways of evaluating noise and vibration nuisance and its negative impact on psychosomatic and vegetative system. The latest technological advances of teleinformatics will be used in the course of project realization. Implementation of an all-Polish noise telemonitoring system will contribute to the increase in consciousness of society and authorities concerning impact of noise on health and can turn to be an essential factor in changing the situation for better. 
StreszczenieNadrzędnym celem projektu realizowanego aktualnie w Katedrze Inżynierii Dźwięku i Obrazu Politechniki Gdańskiej jest zmniejszenie częstości występowania chorób słuchu powodowanych nadmiernym hałasem przemysłowym, urbanistycznym, komunikacyjnym i innego rodzaju niepożądanymi dźwiękami, które występują w życiu codziennym. Cel ten będzie osiągany w wyniku wdrożenia rozwiązań opracowanych w ramach projektu, które opierają się na nowatorskich koncepcjach i sposobach szacowania stopnia dokuczliwości hałasu oraz wibracji i ich negatywnego wpływu na słuch oraz na układy psychosomatyczny i wegetatywny. W toku realizacji projektu zostaną wykorzystane najnowsze osiągnięcia technologiczne z dziedziny teleinformatyki. Wdrożenie ogólnokrajowego systemu telemonitoringu hałasu przyczyni się do wzrostu stopnia uświadomienia przez społeczeństwo i władze problematyki wpływu hałasu na zdrowie i może stać się istotnym czynnikiem przyszłej poprawy sytuacji w tym zakresie. 

Entry No. 105 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus 
English titleComputer Diagnostics of Hearing and of Environmental Noise 
Polish titleDiagnostyka słuchu i zagrożeń hałasowych 
ConferenceVI Krajowa Konferencja Naukowo-Techniczna „Diagnostyka Procesów Przemysłowych” 
Preprint 
Number 
Volume 
Pages43 - 52 
Conference siteWładysławowo, Polska 
Conference date15.9.2003- 17.9.2003 
AbstractThe implemented system for screening testing of hearing is described. The noise telemonitoring system, developed at the Sound and Vision Engineering Department is discussed, aimed at environmental noise level monitoring. Apart from the global system characteristic, detailed system presentation was provided, consisting of descriptions of a mobile measurement unit, a computer noise measuring software, a USB sound interface with a measurement microphone and an Internet application. The results of audiometric and noise measurements were compared to those obtained with a professional noise measuring devices. The pair of engineered applications may help to diminish hearing diseases occurrence caused by environmental & industrial noise. 
StreszczenieW pierwszej części referatu przedstawiono opracowaną w Katedrze Inżynierii Dźwięku i Obrazu przesiewową metodę diagnostyki słuchu. Szczegółowo opisano różne rodzaje stosowanych testów przesiewowych. Zamieszczono dyskusję zastosowanej audiometrii mowy w szumie. Podano charakterystykę opracowanej metody diagnostyki słuchu. W drugiej części przedstawiono aktualnie opracowywany system zdalnego monitorowania zagrożeń hałasowych. Oprócz ogólnej charakterystyki systemu, przedstawiono szczegółowy opis jego poszczególnych elementów składowych, którymi są: komputerowy program do analizy hałasu, przystawka dźwiękowa USB wraz z mikrofonem pomiarowym, serwis informacyjny poświęcony hałasowi oraz mobilne urządzenie pomiarowe, dokonujące analizy hałasu w dowolnie wybranych punktach pomiarowych. Przykładowe wyniki pomiarów porównano z wynikami uzyskanymi za pomocą profesjonalnego miernika poziomu dźwięku. W zamierzeniu autorów oba uzupełniające się systemy powinny przyczynić się do poprawy sytuacji w zakresie profilaktyki chorób słuchu powodowanych hałasem, przede wszystkim przemysłowym i komunikacyjnym. 

Entry No. 106 
Entry type 
AuthorsA. Czyżewski 
English titleSystem and solution for speech correction  
Polish titleSystem do korekcji mowy i sposób korekcji mowy 
Notesscedowany na PG decyzją U.Pat. RP w dniu 6 grudnia 2012 r. 
AbstractThe patent describes a solution for correcting stuttered speech and specifications of the technical means for implementing the solution. 
StreszczenieW patencie opisano rozwiązanie do korygowania niepłynnej mowy, szczególnie przydatne osobom jąkającym się oraz środki techniczne techniczne przeznaczone do realizacji tego rozwiązania.  

Entry No. 107 
Entry typebook 
AuthorsA. Czyżewski 
English titleChapter 20. Intelligent Acquisition of Audio Signal Employing Neural Network and Rough Set Algorithms 
Polish titleRozdział 20. Inteligentna akwizycja sygnałów fonicznych z zastosowaniem sieci neuronowych i zbiorów przybliżonych 
EditorRough-Neural Computing. Techniques for Computing with Words. Springer. 
Pages521 - 541 
AbstractThe algorithms stemming from the neuro-rough computing approach were applied to digital acquisition of audio signals with regard to automatic localization of sound sources with the presence of noise and parasite echo. The application of neural networks to the automatic detection of sound arrival direction was tested first, then it was followed by some experiments employing rough sets and finally the neuro-rough approach to this problem solving was examined. The output of each tested algorithm was supposed to provide information about the direction of arriving sound. In the case of the neuro-rough algorithm the result of its action can be also available in the form of words defining the direction of arriving sound. Some details of the engineered systems and results of their experimental verification are compared and discussed.  
StreszczenieAlgorytmy oparte na sztucznych sieciach neuronowych i metodzie zbiorów przybliżonych zostały zastosowane do lokalizacji sygnałów fonicznych obarczonych pasożytniczym szumem i rewerberacjami. Informacja o kierunku napływania dźwięku była uzyskiwana na wyjściach tyhc algorytmów na podstawie reprezentacji parametrycznej. Przedstawiono wyniki eksperymentalne i przeprowadzono ich dyskusję.  

Entry No. 108 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus 
English titleApplication of teleinformation technology to universal diagnostic of noise threats 
Polish titleZastosowanie technologii teleinformatycznych do powszechnej diagnostyki zagrożeń hałasem 
ConferenceI Krajowa Konferencja „Technologie Informacyjne” 
Preprint 
Number
Volume 
Pages175 - 182 
Conference siteGdańsk, Polska 
Conference date18.5.2003- 21.5.2003 
StreszczenieNadrzędnym celem projektu realizowanego aktualnie w Katedrze Inżynierii Dźwięku i Obrazu Poli-techniki Gdańskiej jest zmniejszenie częstości występowania chorób słuchu powodowanych nad-miernym hałasem przemysłowym, urbanistycznym, komunikacyjnym i innego rodzaju niepożądany-mi dźwiękami, które występują w życiu codziennym. Cel ten będzie osiągany w wyniku wdrożenia rozwiązań opracowanych w ramach projektu, które opierają się na nowatorskich koncepcjach i spo-sobach szacowania stopnia dokuczliwości hałasu oraz wibracji i ich negatywnego wpływu na słuch oraz na układy psychosomatyczny i wegetatywny. W toku realizacji projektu zostaną wykorzystane najnowsze osiągnięcia technologiczne z dziedziny teleinformatyki. Wdrożenie ogólnokrajowego systemu telemonitoringu hałasu przyczyni się do wzrostu stopnia uświadomienia przez społeczeństwo i władze problematyki wpływu hałasu na zdrowie i może stać się istotnym czynnikiem przyszłej poprawy sytuacji w tym zakresie. 

Entry No. 109 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, P. Suchomski 
English titleAutomatic Assesment of the Hearing Aid Dynamics Based on Fuzzy Logic  
Polish titleAutomatyczna ocena dynamiki aparatu słuchowego z zastosowaniem logiki rozmytej 
Conference3rd IASTED International Conference Artificial Intelligence and Applications 
Preprint 
Number 
Volume 
Pages 
Conference siteBenalmadena, Hiszpania 
Conference date8.9.2003- 10.9.2003 
AbstractSome principles of the fuzzy logic-based hearing fitting system are shown. A discussion on how to process loudness scaling results is presented. Then, details related to approximation of the membership functions corresponding to hearing sensation are discussed. Conclusions are also drawn. 
StreszczeniePrzedstawiono podstawy koncepcyjne systemu dopasowania protez słuchu opartego na logice rozmytej. Przeprowadzono dyskusje na temat metody skalowania głośności. Następnie podano szczegóły procesu aproksymacji funkcji przynależności odzwierciedlających słuchowe wrażenia głośności. Załączono wnioski. 

Entry No. 110 
Entry typejournal paper 
AuthorsA. Wieczorkowska, A. Czyżewski 
English titleRough Set Based Automatic Classification of Musical Instrument Sounds  
Polish titleAutomatyczna klasyfikacja instrumentów muzycznych z zastosowaniem metody zbiorów przybliżonych  
JournalElectronic Notes in Theoretical Computer Science 
Volume82 
Number
Pages1 - 12 
AbstractThis paper addresses the problem of automatic recognition of musical instrument sounds, applying rough set based techniques as a tool of classification. Instruments representing wind and string families were used in the experiments. Since the main problem in case of audio data is the proper parameterization, we also investigated issues regarding various parameterization methods. Fourier transform and wavelet analysis were applied as parameterization tools. The obtained feature vectors were tested using rough set tools. The analyzed data represent singular sounds of full musical range of 11 musical instruments, played with various articulation techniques. Results of experiments are presented and discussed in this paper. We summarize our paper with conclusions on musical signal representation for timbre classification purposes.  
StreszczenieReferat dotyczy problemu automatycznego rozpoznawania indtrumentów muzycznych, rozwiązywanego z zastosowaniem inteligentnych algorytmów decyzyjnych. Instrumenty muzyczne należące do rodziny dętych i strunowych zostały poddane procesowi parametryzacji z zastosowaniem analizy falkowej. Otrzymane dane stanowią reprezentację pełnej skali muzycznej 11 instrumentów, zarejestrowanych z uwzględnieniem artykulacji muzycznej. Wnioski zawarte w referacie dotyczą reprezentacji sygnałów muzycznych, która jest przydatna w procesie automatycznej klasyfikacji barwy dźwięku.  

Entry No. 111 
Entry typeconference paper 
AuthorsA. Czyżewski 
English title 
Polish titleZastosowania inżynierii dźwięku i obrazu w biomedycynie 
ConferenceXIII Konferencja Biocybernetyki i Inżynierii Biomedycznej 
Preprint 
Number 
Volume 
Pages 
Conference siteGdańsk,  
Conference date11.9.2003- 13.9.2003 
StreszczenieWynikiem opracowań, które powstały w Katedrze Inżynierii Dźwięku i Obrazu Politechniki Gdańskiej (obecnie: Katedra Systemów Multimedialnych) we współpracy z Instytutem Fizjologii i Patologii Słuchu w Warszawie jest zestaw narzędzi komputerowych do badania słuchu oraz rozwiązanie systemowe masowych badań przesiewowych słuchu, mowy i wzroku oparte na zastosowaniu współczesnych technologii teleinformatycznych. Ponadto, celem usprawnienia procesu dopasowywania aparatów słuchowych i wszczepów ślimakowych dla potrzeb pacjentów, opracowano nowe metody wykorzystujące m. in. wnioskowanie rozmyte i komputerowy model słuchu elektrycznego. Niektóre wdrożone aplikacje i systemy z dziedziny diagnostyki słuchu, mające w znacznej mierze charakter oryginalny, zostały pokrótce przedstawione w niniejszym referacie wraz z ich podstawami koncepcyjnymi.  

Entry No. 112 
Entry typejournal paper 
AuthorsB. Kostek, A. Czyżewski 
English titleProcessing of Musical Metadata Employing Pawlak’s Flow Graphs 
Polish titlePrzetwarzanie meta danych w oparciu o metodę grafów przepływowych 
JournalTransactions on Rough Sets I 
VolumeLNCS 3100 
Number
Pages279 - 298 
AbstractThe objective of the presented research is enabling music retrieval based on intelligent analysis of metadata contained in musical databases. A database was constructed for the purpose of this study including textual data related to approximately 500 compact discs representing various categories of music. The description format of musical recordings stored in the database is compatible to the format of the widely-used CDDB database available in the Internet. An advanced query algorithm was prepared employing the concept of inference rule derivation from flow graphs introduced recently by Pawlak. The created database searching engine utilizes knowledge acquired in advance and stored in flow graphs in order to enable searching CD records.  
StreszczenieW artykule przedstawiono problemy wyszukiwania informacji muzycznej. W eksperymentach posłużono się meta opisem oraz wykorzystano metodę grafów przepływowych Pawlaka. Opisano skonstruowaną bazę nagrań muzycznych. Słowa kluczowe: meta opis, wyszukiwanie informacji muzycznej, baza danych muzycznych 

Entry No. 113 
Entry typeconference paper 
AuthorsA. Walkowiak, A. Czyżewski, A. Lorens, B. Kostek 
English titleNew Techniques Assisting Cochlear Implants Fitting 
Polish titleTechniki wspomagania procesu dopasowania implantów ślimakowych 
Conference117 Audio Eng. Society Convention 
Preprint6287 
Number 
Volume 
Pages1 - 4 
Conference siteSan Francisco, USA 
Conference date28.10.2004- 31.10.2004 
AbstractMeasurement of Spread of Excitation (SoE) provides a potential method of assessment of cochlear implant users' benefit. To provide maxiumum benefit for the cochlear implant useres the speech processor should be fitted to the patients' need. One objective method that could deliver important information for fitting is Neural Response Telemetry (NRT). This method helps to estimate an amplitude of electrical current that is required to elicit hearing sensation via cochlear implant. 
StreszczenieW referacie przedstawiono metodę telemetrii odpowiedzi neuronalnej (SoE), którą zastosowano w celu oceny amplitudy sygnału, która będzie wywoływała percepcję słuchową poprzez pobudzenie elektrod implantu ślimakowego. Jest to obiektywna metoda wyznaczania skuteczności systemów implantów ślimakowych. 

Entry No. 114 
Entry typejournal paper 
AuthorsA. Czyżewski, A. Kaczmarek, P. Maziewski, P. Odya, P. Szczuko, H. Krzyżniewski 
English title 
Polish titleBadanie jakości transmisji mowy w sieciach IP 
JournalZeszyty Naukowe Wydziału ETI PG 
Volume 
Number
Pages439 - 446 
AbstractThe paper contains a description of an experiment investigating the relation between a subjective speech rating and an objective quality of a telephone channel VoIP. An Internet packet transmission conditions were simulated. Listening tests were carried out based on non-sense syllable lists and a set of common speech sentences. The statistical processing of results allowed to draw-out and to present some general conclusions concerning the influence of transmission channel parameters on the subjective assessment of speech quality. 
StreszczeniePraca zawiera opis eksperymentu mającego na celu zbadanie relacji pomiędzy oceną subiektywną sygnału mowy a jakością transmisji tego sygnału w kanale telefonicznym VoIP. Wykorzystano symulacje transmisji pakietowej sygnału w sieci IP. Wykonano serie testów odsłuchowych opartych na listach logatomowych i odpowiednio dobranych zdaniach. Do interpretacji wyników zastosowano analizę statystyczną. 

Entry No. 115 
Entry typejournal paper 
AuthorsA. Czyżewski, J. Kotus 
English titleUNIVERSAL SYSTEM FOR DIAGNOSING ENVIRONMENTAL NOISE 
Polish titleUNIWERSALNY SYSTEM TELEMONITORINGU HAŁASU ŚRODOWISKOWEGO 
JournalJOURNAL of MANAGEMENT OF ENVIRONMENTAL QUALITY 
Volume15 
Number
Pages294 - 305 
AbstractA concept of a multimedia computer system for monitoring of environmental noise is presented in the paper. The system is connected with a vital part of the project of reduction of hearing disease occurrence frequency, realized at the Sound and Vision Engineering Department, Gdansk University of Technology. Such diseases are caused by excessive industry, urban-and traffic noise and objectionable sounds of other kind that occur in everyday life. Reduction of hearing disease occurrence will be achieved as a result of implementation of solutions that will be developed within the project. It is emphasized that these solutions will be based on innovatory ideas and ways of evaluating noise and vibration nuisance and its negative influence on a psychosomatic and vegetative system. The latest technological advances in information technology will be used in the course of the project realization. Implementation of an all-Polish noise telemonitoring system will contribute to the increase in consciousness of society and authorities concerning influence of noise on health. Furthermore, it can turn to be an essential factor in changing the situation for better. 
StreszczenieW publikacji przedstawiono projekt multimedialnego systemu komputerowego do monitoringu hałasu środowiskowego. Opracowywany system jest powiązany z aktualnie realizowanym w Katedrze Inżynierii Dźwięku i Obrazu Politechniki Gdańskiej projektem, którego celem jest redukcja częstości występowania niedosłuchu. Niedosłuch często jest wywołany przez nadmierny hałas przemysłowy, komunikacyjny lub innego rodzaju niepożądane dźwięki, towarzyszące człowiekowi. Wdrożenie systemu telemonitoringu hałasu przyczyni się do wzrostu stopnia świadomości społeczeństwa i władz wzakresie problematyki wpływu hałasu na zdrowie. 

Entry No. 116 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus, B. Kostek 
English titleComparing Noise Levels and Audiometric Testing Results Employing IT Based Diagnostic Systems 
Polish title Porównanie poziomów hałasu z wynikami przesiewowych testów audiometrycznych w oparciu o Internetowe systemy diagnostyczne 
ConferenceThe 33rd International Congress and Exposition on Noise Control Engineering INTERNOISE 2004 
Preprint 
Number 
Volume 
Pages 
Conference sitePrague, Czech Republic 
Conference date22.8.2004- 24.8.2004 
AbstractThe implemented Internet system for screening testing of hearing is described. The noise environmental noise telemonitoring system is briefly discussed. The pair of engineered applications may help to diminish hearing diseases occurrence caused by environmental & industrial noise. The results of audiometric tests and of noise measurements were compared on the basis of both systems database contents. The analysis of data captured by both systems allows a discussion included in the paper concerning the influence of excessive noise levels on the status of hearing sensitivity of large populations living or working in the areas endangered by noise. 
StreszczenieW referacie przedstawiono Internetowy system przeznaczony do przeprowadzania przesiewowych testów słuchu. Zaprezentowano również system informacyjny przeznaczony do monitorowania hałasu środowiskowego. Obie Internetowe aplikacje mogą być pomocne w zmniejszaniu częstości występowania chorób słuchu powodowanych przez hałas środowiskowy i przemysłowy. Porównano wyniki testów audiometrycznych z pomiarami hałasu na podstawie zawartości baz danych obu systemów. Na podstawie analizy danych zgromadzonych przez oba systemy omówiono również problem dotyczący wpływu nadmiernych poziomów hałasu na wrażliwość słuchową u dużych grup osób żyjących lub pracujących na obszarach zagrożonych hałasem. 

Entry No. 117 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus 
English titleWeb Based Acoustic Noise Measurement System 
Polish titleInternetowy System do Pomiarów Hałasu Środowiskowego 
Conference116th AES Convention 
Preprint 
Number 
Volume 
Pages 
Conference siteBerlin, Germany 
Conference date8.5.2004- 11.5.2004 
AbstractA concept and an implementation of the multimedia computer system for the monitoring of environmental noise threats is presented. The principal aim of the project is to improve the effectiveness of prophylaxis of hearing diseases. It allows to receive, store, analyze and visualize a noise data coming from noise measurement equipments and from electronic questionnaires accessible through the Internet. A new concept of the USB noise meter with GPS is also presented. 
StreszczenieW referacie przedstawiono projekt multimedialnego systemu przeznaczonego do monitorowania zagrożeń hałasem środowiskowym. Nadrzędnym celem realizowanego projektu jest zwiększenie efektywności profilaktyki chorób słuchu. Opracowywany system umożliwia odbiór, przechowywanie danych, analizę i wizualizację wyników pomiarów hałasu pozyskanych od urządzeń pomiarowych za pośrednictwem Internetu. Przedstawiono również opracowanie miernika hałasu zintegrowanego z odbiornikiem sygnału GPS, działającego w oparciu o interfejs USB. 

Entry No. 118 
Entry typejournal paper 
AuthorsA. Czyżewski, J. Kotus, B. Kostek, K. Kochanek, H. Skarżyński 
English titleIT- Enabled Comparison of Environmental Noise Levels and Noise-Evoked Hearing Impairments 
Polish titlePorównanie poziomów hałasu środowiskowego z uszkodzeniami słuchu wywołanych hałasem z wykorzystaniem systemów teleinformatycznych 
JournalMechanika 
Volume23 
Number
Pages143 - 154 
AbstractThe noise telemonitoring system, developed at the Multimedia Systems Department of the Gdansk University of Technology is discussed, aimed at environmental noise level monitoring. Apart from the global system characteristic, a more detailed system presentation was provided. The presentation covers descriptions of a mobile measurement unit, a computer noise measuring software, a USB sound interface with a measurement microphone, and an Internet application allowing for the automatic creation of noise maps on the basis of data received from computers or mobile phones employed to noise data acquisition. The implemented Internet system for screening testing of hearing is also described. The pair of engineered applications may help to diminish hearing diseases occurrence caused by environmental & industrial noise. The results of audiometric tests and of noise measurements will be compared systematically, on the basis of both systems database contents. The analysis of data captured by both systems underlies a discussion included in the paper, concerning the influence of excessive noise levels on the status of hearing sensitivity of large populations living or working in the areas endangered by noise. 
StreszczenieTematem pracy jest telemetryczny system monitorowania hałasu, opracowany w katedrze Systemów Multimedialnych Politechniki Gdańskiej, przeznaczony do zdalnego monitorowania poziomów hałasu środowiskowego. Oprócz ogólnej charakterystyki systemu zaprezentowano również szereg szczegółów implementacyjnych. Przedstawiono m.in. mobilne urządzenie pomiarowe, oprogramowanie do pomiarów hałasu, dźwiękowy interfejs USB wyposażony w mikrofon pomiarowy oraz Internetową aplikację, umożliwiającą automatyczne tworzenie prostych map hałasu w oparciu o dane pozyskane z urządzeń pomiarowych za pośrednictwem komunikacji bezprzewodowej. W artykule opisano również Internetowy system do przesiewowego badania słuchu. Oba prezentowane systemy mogą przyczynić się do zmniejszenia częstości występowania chorób słuchu, powodowanych prze nadmierny hałas, głównie środowiskowy i przemysłowy. Wyniki uzyskane przez poszczególne systemy będą systematycznie porównywane na podstawie danych zawartych w dedykowanych baz danych. Na podstawie analizy wyników pozyskanych przez oba systemy przeprowadzono dyskusję dotyczącą wpływu nadmiernego hałasu na wrażliwość na hałas dla dużej populacji osób zamieszkującej lub pracującej na obszarach zagrożonych hałasem. 

Entry No. 119 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus 
English title 
Polish titleMULTIMEDIALNY SYSTEM MONITOROWANIA HAŁASU 
ConferenceIII Kongres Technologiczny 
Preprint 
Number 
Volume 
Pages 
Conference siteWarszawa, Polska 
Conference date5.10.2004 

Entry No. 120 
Entry typeconference paper 
AuthorsA. Czyżewski, H. Skarżyński, P. Odya, B. Kostek 
English titleA Model of Digital Hearing Aid for the Implanted Patients Revealing Residual Acoustic Hearing 
Polish titleProjekt i realizacja modelu subminiaturowego cyfrowego aparatu słuchowego dla osób implantowanych zachowujących resztki słuchowe 
ConferenceII Międzynarodowa Konferecja Telemedycyny i Telekomunikacji Multimedialnej 
Preprint 
Number 
Volume 
Pages 
Conference siteKajetany, Polska 
Conference date8.10.2004- 9.10.2004 
Notesplakat 
AbstractSome recently published papers by Skarzynski et al., present a compelling demonstration of efficacy for a new treatment of severe hearing loss. The treatment combines electrical stimulation of the basal part of one cochlea, paired with acoustical stimulation of residual, low-frequency hearing on either the implanted side or both sides. Consequently, a need occurred to amplify and shift downwards frequency scale high-frequency acoustic signals, including speech consonants. Taking advantage of the recent progress in Digital Signal Processor (DSP) developments, a portable and reprogrammable digital hearing aid has been designed and implemented for shifting the speech frequency down to a lower frequency range with an algorithm based on a special resampling technique. Consequently, owing to hybrid signal processors it was possible to perform complex algorithms of signal processing at the same time providing a chance to make use of what is left of the hearing ability which has been out of reach of the hearing aids being used so far. The audio signal is proportionally transposed downwards the frequency scale by dividing each frequency component by a factor. This process compresses the speech spectrum in order to introduce as much information as possible into the limited audible frequency range of the hearing impaired listener. The developed digital hearing aid to be used by the implanted patients revealing residual hearing will be demonstrated in the poster paper.  

Entry No. 121 
Entry typejournal paper 
AuthorsA. Czyżewski, B. Kostek, J. Kotus 
English title 
Polish titleZastosowanie środków teleinformatycznych do diagnostyki zagrożeń hałasowych i chorób słuchu Część II – Multimedialny system monitorowania hałasu 
JournalPrzegląd Telekomunikacyjny i Wiadomości Telekomunikacyjne 
Volume 
Number8-9 
Pages330 - 337 
StreszczenieOpisano koncepcję i implementację multimedialnego systemu powszechnego monitorowania hałasu. Celem opisywanego projektu jest przede wszystkim poprawa profilaktyki zdrowotnej w zakresie szumów usznych i dolegliwości psychosomatycznych, które dotyczą populacji przebywającej na obszarach zagrożonych hałasem. Opracowany system pozwala na pomiar hałasu i transmisję danych do serwera, który umożliwia ich analizę i wizualizację, m.in. w postaci map akustycznych. Ponadto, opracowany system pozwala na zbieranie subiektywnych opinii na temat hałasu i na analizę danych uzyskiwanych tym sposobem. 

Entry No. 122 
Entry typeconference paper 
AuthorsA. Czyżewski, A. Kaczmarek, J. Kotus, A. Pawlik, A. Rypulak, P. Żwan 
English titleA System for Multitask Noisy Speech Enhancement 
Polish titleSystem poprawy zrozumiałości mowy w szumie 
Conference116th AES Convention 
Preprint 
Number 
Volume 
Pages 
Conference siteBerlin, Germany 
Conference date8.5.2004- 11.5.2004 
AbstractA general characteristic of the engineered speech signal registration and restoration system is presented in the paper. It contains a concise description of specific components of the system, the system being a set of advanced tools for registration, analysis and reconstruction of speech, existing in the form of computer software. The tools included allow for prompt search of desired fragments of recordings and for the improvement of their quality through noise, distortion and interference reduction. A brief information concerning selected speech reconstruction algorithms is presented also, the use of which allowed for an especially significant increase of processed speech comprehension. 
StreszczenieW artykule przedstawiono ogolną charakterystyke opracowanego systemu rejestracji i rekonstrukcji mowy. Artykuł zawiera opis składników systemu, ktory jest oprogramowaniem zawierającym zaawansowane narzędzia służące poprawie zrozumiałości mowy. Zaimplementowane narzędzia systemu umożliwiają wyszukiwanie nagrań dźwiękowych i ich obróbkę przy pomocy zaimplementowanych pluginów. W artykule przedstawione wykorzystane w systemie algorytmy poprawy zrozumiałości mowy w szumie wraz z oceną ich skuteczności. 

Entry No. 123 
Entry typeconference paper 
AuthorsA. Czyżewski, M. Dziubiński 
English titleNoise Reduction in Audio Employing Spectral Unpredictability Measure and Neural Net 
Polish title 
ConferenceKnowledge-Based Intelligent Information and Engineering Systems: 8th International Conference, KES 2004 
Preprint 
Number 
Volume 
Pages743 - 750 
Conference siteWellington, New Zealand 
Conference date20.9.2004- 25.9.2004 
AbstractImprovements of the recently presented noise reduction algorithm, based on perceptual coding of audio are revealed. Enhancements of the spectral Unpredictability Measure parameter calculation, which is one of the significant elements in the applied psychoacoustic model are discussed. A learning decision algorithm based on a neural network is employed for determining input signal useful components acting as maskers of the spectral components classified as noise. A new iterative algorithm for calculating the masking pattern is presented. The results of experiments carried out employing the modified algorithm are discussed and conclusions are added. 
StreszczenieW pracy przedstawione zostało rozwinięcie ostatnio przedstawionem metodody redukcji szumu, działającej w oparciu o kodowanie perceptualne dźwięku. Ulepszenia parametru widmowej miary nieprzewidywalności, który stanowi ważny element w wykorzystanym modelu psychoakustycznym zostały przedyskutowane. Uczący się algorytm decyzjny, działający w opraciu o sztuczną sieć neuronową wykorzystany został w klasyfikacji składowych na pasożytnicze i użyteczne. Przedstawiona została również nowa iteracyjna procedura obliczania progu maskowania. W pracy zawarte zostały wyniki eksperymentów, oraz konkluzje odnoszące się do przedstawionych algorytmów. 

Entry No. 124 
Entry typejournal paper 
AuthorsA. Czyżewski, A. Kaczmarek, J. Kotus, A. Pawlik, A. Rypulak, P. Żwan 
English titleSpeech Archiving & Restoration System for Military Aviation Applications 
Polish titleCyfrowy System Rejestracji I Rekonstrukcji Sygnału Mowy Dla Potrzeb Lotnictwa Wojskowego 
JournalZeszyty Naukowe Wydziału ETI PG 
Volume 
Number
Pages135 - 142 
AbstractThe speech received by radio communication from jet pilots can be severely degraded by noise and various distortions. A system was developed for multi-channel recording of voice communication with jet pilots extended with a toolbox containing some advanced DSP algorithms for speech enhancement. Moreover, some innovative solutions were adopted, including the method for synchronizing transmission received from many radio stations in order to produce surround sound enabling additional perceptual filtration of speech. Some selected components of the engineered multi-task speech enhancement system are presented in the paper. 
StreszczenieW referacie przedstawiono ogólną charakterystykę opracowanego systemu rejestracji i rekonstrukcji sygnału mowy. Zamieszczono opis poszczególnych składników systemu, które stanowi zestaw zaawansowanych narzędzi do rejestracji, analizy i rekonstruowania mowy, zrealizowany w formie oprogramowania komputerowego. Narzędzia te pozwalają na szybkie wyszukiwanie pożądanych fragmentów nagrań oraz poprawę ich jakości na drodze redukcji szumów, zniekształceń i zakłóceń. W skrajnie trudnych lub szczególnie istotnych przypadkach analizy zapisu, możliwe jest wykorzystanie większej liczby (do pięciu) wersji tego samego nagrania zarejestrowanego w poszczególnych naziemnych stacjach kontroli lotu, dzięki specjalnie opracowanej metodzie synchronizacji zapisu i jego odtwarzania w fonicznym zestawie wielokanałowym. Przedstawiono również opis wybranych algorytmów rekonstrukcji mowy w odniesieniu do wyników ich działania. 

Entry No. 125 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus 
English title 
Polish titleW jaki sposób hałas i głośna muzyka wpływają na słuch ? Eksperymenty i pomiary 
ConferenceII Bałtycki Festiwal Nauki na WETI  
Preprint 
Number 
Volume 
Pages 
Conference site 
Conference date29.5.2004 
StreszczenieW ramach prezentacji uczestnicy zostaną zapoznani ze sposobami pomiaru hałasu zarówno przy pomocy specjalistycznego sprzętu pomiarowego, jak i przy wykorzystaniu do tego celu komputera rozszerzonego o przystawkę pomiarową i opracowany w Politechnice Gdańskiej multimedialny system tworzenia map akustycznych. Na podstawie prowadzonych pomiarów będą mogli zorientować się jaki hałas wytwarzają różnego typu źródła i w jakim stopniu jest on uciążliwy dla organizmu. Ponadto, uczestnicy pokazu będą mogli pomierzyć poziomy głośności muzyki i dowiedzieć się, przy jakich poziomach głośności słuchanie muzyki może wpływać negatywnie na słuch. 

Entry No. 126 
Entry typeconference paper 
AuthorsJ. Kotus, A. Czyżewski, H. Skarżyński 
English titleComparing Noise Levels and Audiometric Testing Results Employing IT Based Diagnostic Systems 
Polish titleZestawienie wyników pomiarów hałasu z wynikami testów audiometrycznych oparte o diagnostyczne systemy teleinformatyczne 
Conference2nd International Conference on Telemedicine and Multimedia Communication 
Preprint 
Number 
Volume 
Pages 
Conference siteKajetany, Poland 
Conference date8.10.2004- 9.10.2004 
AbstractA concept and an implementation of the multimedia computer system for the monitoring of environmental noise is presented in the paper. The system provides an extension to the Internet-based system for testing hearing which was engineered and launched in 1999. A considerable portion of hearing diseases is caused by excessive industry, urban and traffic noise or any unwanted sounds occurring in everyday life. Consequently, it is expected that a reduction of hearing diseases occurrence will be achieved as a result of implementation of the solutions that have been developed within the project scope. The latest technological advances in information technology were used in the course of the project realization. Consequently, it is shown in the paper that the presented solutions are based on some innovative ideas and inexpensive technical means for measuring noise and vibration allowing fast evaluation of its influence on the psychosomatic and the vegetative system. It is expected that implementation of the noise telemonitoring system covering whole country will contribute to rising awareness of society and authorities with regard of the influence of noise on health. Furthermore, it turns out to be an essential factor in the future improvement of the environmental noise conditions. 
StreszczenieW referacie przedstawiono projekt i realizację multimedialnego, komputerowego systemu monitorowania hałasu. Prezentowany system stanowi uzupełnienie do Internetowego systemu przeznaczonego do przesiewowych badań słuchu, opracowanego i wdrożonego w 1999 r. Znaczna część chorób słuchu jest powodowana przez hałas przemysłowy, nadmierny hałas w miastach oraz różnego rodzaju uciążliwe dźwięki występujące w życiu codziennym. W związku z tym oczekuje się, że wprowadzane rozwiązania przyczynią się do zmniejszenia częstości występowania chorób słuchu. W toku realizacji prezentowanego projektu wykorzystano najnowsze rozwiązania technologiczne z dziedziny informatyki i telekomunikacji. Prezentowane rozwiązania są oparte o nowatorskie pomysły umożliwiające prowadzenie diagnostyki hałasu przy niskich nakładach, ponadto umożliwiają szybką ocenę negatywnego wpływu hałasu na układ psychosomatyczny i wegetatywny. Oczekuje się, że wdrożenie systemu telemonitoringu hałasu obejmie obszar całego kraju, przez co przyczyni się do zwiększenia świadomości społeczeństwa odnośnie negatywnego wpływu hałasu na zdrowie człowieka. Ponadto, upowszechnienie prezentowanych rozwiązań może okazać się istotnym czynnikiem przyszłej poprawy warunków w zakresie hałasu środowiskowego. 

Entry No. 127 
Entry typeconference paper 
AuthorsP. Suchomski, B. Kostek, A. Czyżewski 
English titleA System for Fast & Precise Hearing Aids Fitting  
Polish titleKomputerowy system szybkiego i dokładnego dopasowania protez słuchu 
ConferencePrezentacja plakatowa na II Międzynarodowej Konferecji Telemedycyny i TeleKomunikacji Multimedialnej 
Preprint 
Number 
Volume 
Pages 
Conference siteKajetany, Polska 
Conference date8.10.2004- 9.10.2004 
AbstractMost prosthetics practitioners determine the preliminary characteristics of the hearing aid using simple calculation procedures. Experience shows that similar methods allow assessing the characteristics of the searched hearing aid in a relatively straightforward and intuitive way, but they do not guarantee finding optimum settings of the compression algorithms. Moreover, it requires some additional tuning of the determined characteristics using other methods of adjusting hearing aids. The difficulty in determining hearing characteristics on the basis of known LGOB test results lies primarily in converting the subjective scale of loudness sensation into the objective scale of sound level expressed in dB. The widely used method of determining hearing characteristics (the standard method) implicitly projects the subjective scale of categories onto the space of real numbers from the closed range from 0 to 6, and subsequently calculates the difference between the results of loudness scaling for regular hearing and those for the tested case. This problem was solved alternatively by the authors using a method that converts the results of the loudness-scaling test to the category domain in a natural way, i.e. determines the difference between regular and impaired loudness scaling in a way similar to that of a human expert, using a set of categories like e.g. very small difference, small difference, medium difference, big difference and very big difference. Subsequently, a proper interpretation of these categories is required to determine the correct sound level in the dB SPL scale. These requirements are met by the engineered and implemented method employing fuzzy logic-based processing. The poster will demonstrate the method of fast and accurate hearing aids fitting and the developed computer program making possible to use this method by audiologists. 
StreszczenieWiększość protetyków słuchu wyznacza wstępną charakterystykę aparatu słuchowego na podstawie prostych obliczeń, których zasadniczym parametrem jest zmierzony próg słyszenia pacjenta.. Doświadczenie pokazuje, że takie metody pozwalają w stosunkowo krótkim czasie wyznaczyć charakterystykę poszukiwanej protezy słuchu, jednak nie gwarantują one optymalnego ustawienia algorytmu kompresji dynamiki.. Ponadto metody te wymagają dodatkowych procedur optymalizujących ustawienie protezy słuchu. Trudność wyznaczenia charakterystyki protezy słuchu w oparciu o wyniki znanego testu LGOB polega na konieczności konwersji subiektywnej skali oceny wrażenia głośności do postaci obiektywnej skali poziomu dźwięku, wyrażonej w dB. Standardowa metoda wyznaczania charakterystyki protezy słuchu konwertuje skalę kategorii oceny wrażenia głośności do postaci liczb rzeczywistych z przedziału od 0 do 6, a następnie oblicza różnicę między uśrednionymi wynikami skalowania głośności dla słuchu prawidłowego i wynikami skalowania głośności danego pacjenta.. Alternatywnym, zaproponowanym przez autorów, sposobem wyznaczenia charakterystyki dynamiki uszkodzonego słuchu jest wykorzystanie logiki rozmytej do określenia różnicy w skalowaniu głośności danego pacjenta i osób o słuchu prawidłowym. Różnice te również wyrażone są w skali kategorii np. brak, bardzo mała, mała, średnia, duża, bardzo duża. Następnie za pomocą przetwarzania rozmytego następuje interpretacja otrzymanych różnic, a w konsekwencji wyznaczenie charakterystyki dynamiki uszkodzoengo słuchu wyrażonej w skali dB SPL. Ten plakat ilustruje opracowaną metodę szybkiego I precyzyjnego dopasowania protez słuchu oraz prezentuje oprogramowanie, które jest implementacją przedstawionej metody. 

Entry No. 128 
Entry typejournal paper 
AuthorsA. Czyżewski, M. Szczerba, B. Kostek 
English titleMusical Phrase Representation and Recognition by Means of Neural Networks and Rough Sets 
Polish titleRozpoznawanie fraz muzycznych w oparciu o sztuczne sieci neuronowe i metodę zbiorów przybliżonych 
JournalTransactions on Rough Sets I 
VolumeLNCS 3100 
Number
Pages254 - 278 
AbstractThis paper discusses various musical phrase representations. Musical phrase analysis plays an important role in music information retrieval domain. In the paper various representations of a musical phrase are described and analyzed. Also the experiments were designed to facilitate pitch prediction within a musical phrase by means of entropy-coding of music. We used the concept of predictive data coding introduced by Shannon. Encoded music representations, stored in the database, are then used for automatic recognition of musical phrases by means of Artificial Neural Networks (ANN) and rough sets (RS). A discussion on obtained results is carried out and conclusions are included. 
StreszczenieW artykule przedstawiono podstawowe definicje dotyczące frazy muzycznej. W eksperymentach posłużono się zapisem parametrycznym. W celu wzmocnienia procesu rozpoznawania wykorzystano kodowanie entropijne muzyki. W eksperymentach klasyfikacji oparto się o sztuczne sieci neuronowe i metodę zbiorów przybliżonych. Słowa kluczowe: fraza muzyczna, klasyfikacja, sztuczne sieci neuronowe, metoda zbiorów przybliżonych 

Entry No. 129 
Entry typejournal paper 
AuthorsA. Czyżewski 
English title 
Polish titlePortal www.etelwelfare.com finalistą konkursu eEurope Awards for eHealth 
Journal 
Volume 
Number3/77 
Pages12 - 13 
StreszczenieArtykuł przedstawia wybrane projekty telemedyczne prezentowane w finale konkursu eHealth w Irlandii. Wśród nominowanych znalazł się nominowany projekt Katedry Systemów Multimedialnych Politechniki Gdańskiej i Instytutu Fizjologii i Patologii Słuchu w Warszawie. System ten został pokrótce omówiony. UKD:elektronika w medycynie audiologia 

Entry No. 130 
Entry typeconference paper 
AuthorsH. Skarżyński, A. Czyżewski 
English title2nd International Conference on Telemedicine and Multimedia Communication 
Polish titleCele 2 Międzynarodowej Konferencji Telemedycyny i Telekomunikacji Multimedialnej 
Conference2nd International Conference on Telemedicine and Multimedia Communication 
Preprint 
Number 
Volume 
Pages 
Conference siteKajetany, Polska 
Conference date8.10.2004- 9.10.2004 
AbstractTelemedicine is one of the most important and fastest developing technologies of knowledge-based society. Although there are thousands of telemedical systems the number of the ones which offer more than just the ability of reaching the information on physiology, pathology and therapeutic methods is insufficient. 
StreszczenieAutorzy zestawili główne cele konferencji, wskazując na fakt, że telemedycyna jest jedną z najszybciej rozwijających się technologii społeczeństwa informacyjnego. Pomimo iż istnieje wiele aplikacji telemedycznych, większość z nich ogranicza się prezentacji informacji. Dlatego istnieje potrzeba tworzenia i prezentacji serwisów telemedycznych oferujących np. badania przesiewowe czy informacje z zakresu terapii medycznej. UKD:elektronika w medycynie audiologia 

Entry No. 131 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski 
English titleMusic Archive Metadata Processing Based on Flow Graphs 
Polish titlePrzetwarzanie meta opisu plików muzycznych z zastosowaniem grafów przepływowych 
Conference116th Audio Engineerig Society 
Preprint6138 
Number 
Volume 
Pages1 - 7 
Conference siteBerlin, Niemcy 
Conference date8.5.2004- 11.5.2004 
AbstractThe paper addresses the capabilities that should be expected from intelligent Web search tools in order to respond properly to user's music information retrieval needs. An advanced query algorithm was engineered employing a concept of inference rule derivation from flow graphs with regard to semantic data processing. This concept, introduced recently by Pawlak, is used for mining knowledge in databases. The created database searching engine utilizes knowledge acquired in advance and stored in flow graphs in order to enable searching in musical repositories. Results obtained show that employing the implemented method the resulting search matches are ranked optimally, thus metada related to recorded sound can be retrieved efficiently with the use of this algorithm. 
StreszczenieW referacie zaproponowano metodykę wyszukiwania informacji muzycznej w bazach internetowych w oparciu o meta opis. Skonstruowany algorytm wykorzystuje grafy przepływowe Pawlaka. Słowa kluczowe: wyszukiwanie informacji, grafy przepływowe 

Entry No. 132 
Entry typeconference paper 
AuthorsA. Czyżewski, P. Maziewski, M. Dziubińki, A. Kaczmarek, B. Kostek 
English titleWow detection and compensation employing spectral processing of audio 
Polish titleDetekcja i kompensacja zniekształceń drżenia dźwięku 
Conference117 Konferencja AES 
Preprint6212 
Number1/2 
Volume53 
Pages91 
Conference siteSan Francisco, CA, USA 
Conference date28.10.2004- 31.10.2004 
Notesabstrakt dostępy w JAES 
AbstractThe engineered algorithms are presented for the detection of parasitic frequency modulation in audio originating from irregularities of sound carrier velocity. The algorithms were developed with special regard to non-periodic frequency modulation effects found in old movie sound tracks. The proposed algorithms consider the influence of the wow disturbance on the location of formants in time-frequency representation. The dynamic analysis of formant structures behavior underlies discriminating between parasitic frequency changes and natural frequency fluctuations. The compensation of the detected wow-related frequency modulation is accomplished basing on the non-uniform resampling algorithm, driven by the discerned parasite modulation patterns. The details of the proposed wow detection and compensation techniques are presented and achieved results are discussed. 
StreszczeniePraca zawiera opis opracowanych algorytmów detekcji i kompensacji pasożytniczych modulacji częstotliwości wynikających z nierównomiernego przesuwu nośnika dźwięku. Proponowane metody opracowano ze szczególnym uwzględnieniem przypadkowych zniekształceń drżenia obecnych w archiwalnych filmowych ścieżkach dźwiękowych. Dodatkowo algorytmy badają wpływ zniekształceń na strukturę formantową sygnałów. Analiza zmian położenia formantów umożliwia rozróżnienie naturalnych i pasożytniczych wahań częstotliwości. Kompensacja zniekształceń następuje dzięki metodzie nierównomiernego próbkowania sygnału. W kolejnych paragrafach pracy przedstawiono szczegółowy opis poszczególnych metod oraz uzyskane wyniki.  

Entry No. 133 
Entry typejournal paper 
AuthorsA. Czyżewski 
English title 
Polish titleInterdyscyplinarne ujęcie problemu szumów usznych i wynikające z niego technologie elektronicznego wspomagania diagnostyki i terapii 
JournalAudiofonologia 
Volume 
Number25 
Pages27 - 34 
Noteswydanie ukazało się w 2005 r.  
AbstractTinnitus generating process explanation based on signal quantization theory was proposed. Current work was presented concerning an ultrasound Tinnitus device employing dither noise as a masker. The device is engineered at the Gdansk University of Technology in a close co-operation with the Institute of Physiology and Pathology of Hearing.  
StreszczenieZaproponowano interpretację zjawiska powstawania szumów usznych w oparciu o teorię kwantowania sygnału fonicznego. Wskazano na realizowane aktualnie prace nad skonstruowaniem urządzenia opartego na generowaniu szumu maskującego typu dither, pracującego na częstotliwościach ponadsłyszalnych (ultradźwiękowych). Urządzenie tego typu jest aktualnie projektowane w Politechnice Gdańskiej we współpracy z Instytutem Fizjologii i Patologii Słuchu.  

Entry No. 134 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus, G. Szwoch, M. Dziubiński, A. Rypulak, A. Pawlik 
English titleMultitask Noisy Speech Enhancement System 
Polish titleWielozadaniowy system poprawy zrozumiałości mowy 
ConferenceAES 26th International Conference 
Preprint4-1 
Number 
Volume 
Pages95 - 103 
Conference siteDenver, Colorado, USA 
Conference date7.7.2005- 9.7.2005 
AbstractThe paper includes a general characteristic of the designed and implemented Multitask Noisy Speech Enhancement System providing specialized software suite designed for recording speech and for improving quality and intelligibility of recorded speech signal basing on some advanced digital signal processing algorithm applications. The software suite consists of the following applications: Restorer, Recorder and Browser. The software may be used in all cases when speech intelligibility is important, but it is not possible to obtain high quality speech recordings. 
StreszczenieW referacie opisano Wielozadaniowy System Poprawy Jakości Sygnału Mowy. Jest to wyspecjalizowany pakiet oprogramowania przeznaczony do rejestrowania sygnału mowy i do poprawy jego jakości oraz zrozumiałości mowy, przy użyciu zaawansowanych procedur cyfrowego przetwarzania sygnału. Pakiet oprogramowania składa się z programów: Rejestrator, Przeglądarka oraz Rekonstruktor. Oprogramowanie to może być użyte w przypadkach, gdy zrozumiałość mowy ma istotne znaczenie, a nie jest możliwe zarejestrowanie sygnału o odpowiedniej jakości. 

Entry No. 135 
Entry typeconference paper 
AuthorsA. Czyżewski, M. Dziubiński, A. Ciarkowski, M. Kulesza, P. Maziewski, J. Kotus 
English titleNew Algorithms for Wow and Flutter Detection and Compensation in Audio 
Polish titleNowe algorytmy detekcji i redukcji drżenia dźwięku 
Conference118 Konferencja AES 
Preprint6353 
Number7/8 
Volume53 
Pages669 
Conference siteBarcelona, Hiszpania 
Conference date28.5.2005- 31.5.2005 
Notesabstrakt dostępy w JAES 
AbstractNew algorithms were developed for discriminating wow from natural musical effects, such as: periodicity detection by means of autocorrelation signal, algorithm employing AR model for power line hum frequency detection and algorithm for estimating pitch variation curve employing wow tracking based on recording bias detection in magnetic recordings. Moreover, non-uniform resampling routine was implemented and applied to wow compensation. The developed algorithms were studied using real audio examples allowing a comparison of their effectiveness. 
StreszczenieW referacie przedstawiono nowe metody dyskryminacji naturalnych efektów muzycznych i pasożytniczych zniekształceń drżenia dźwięku. Dodatkowo, opisano w nim metody wyznaczania przebiegu zniekształceń drżenia. Wśród nich znajdują się: detekcja okresowości sygnału w poszczególnych ramkach czasowych, śledzenie zmian przydźwięku sieciowego wykorzystujące modelowane AR widma sygnału, śledzenie zmian wysokoczęstotliwościowego prądu podkładu. W referacie zawarto również opis metod nierównomiernego przepróbkowywania sygnału, wykonywanego w celu redukcji zniekształceń. Opisane algorytmy testowano na autentycznych archiwalnych próbkach dźwiękowych. 

Entry No. 136 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus, M. Kulesza 
English titlePROJECT AND DEVELOPMENT OF THE AUTOMATIC STATION FOR ENVIRONMENTAL NOISE MONITORING 
Polish titlePROJEKT I REALIZACJA AUTOMATYCZNEJ STACJI MONITOROWANIA HAŁASU ŚRODOWISKOWEGO 
ConferenceXI Międzynarodowe Sympozjum Reżyserii i Inżynierii Dźwięku i Obrazu 
Preprint 
Number 
Volume 
Pages53 - 60 
Conference siteKraków, Polska 
Conference date23.6.2005- 25.6.2005 
AbstractThe engineered device is a part of the Universal System for Diagnosing Environmental Noise which was developed in the Multimedia System Department, Gdansk University of Technology. The overall structure of automatic station for environmental noise measurements is described, as well as its basic functionality. Furthermore, features related to GPRS wireless communication bringing an opportunity to transmit measurement data and also to configure the device remotely are characterized. The main drawback of the classic approach to noise measurements is that the noise maps which are created as static ones, and do not depict the changes of noise levels. The proposed measuring station is integrated with a GPS receiver allowing linking the information about noise level with the information on the geographic position. Utilizing the multimedia system with proposed device, it is possible to decrease the time necessary for map creation and to increase reliability of noise threads representation. Principles of operation of the software providing full functionality to the user are also discussed. Short summary and electric parameter tests related to the EU regulations are also included. 
StreszczenieW referacie przedstawiono projekt i realizację automatycznej stacji monitorowania hałasu środowiskowego. Stanowi ona jeden z elementów tworzonego w Katedrze Systemów Multimedialnych Politechniki Gdańskiej Multimedialnego Systemu Monitorowania Hałasu. Przedstawiono ogólną budowę stacji pomiarowej oraz omówiono jej podstawową funkcjonalność. Obszerniej opisano dodatkowe możliwości stacji, do których należą: komunikacja z wykorzystaniem transmisji GPRS oraz możliwość określania pozycji geograficznej dzięki zastosowaniu odbiornika sygnału GPS. Bezprzewodowa transmisja danych, umożliwią zarówno natychmiastowe wysłanie aktualnych wyników pomiarów jak również zdalny nadzór nad działaniem stacji. Informacja o lokalizacji pomiarów hałasu może znacząco przyspieszyć i uprościć sposób tworzenia map zagrożeń hałasem na analizowanym obszarze. Przedstawiono ponadto strukturę oprogramowania zastosowanego w omawianej stacji pomiarowej. Podano również wyniki przeprowadzonych badań opracowanej stacji pomiarowej w odniesieniu do obowiązujących norm.  

Entry No. 137 
Entry typeconference paper 
AuthorsA. Czyżewski 
English titleApplications of Perceptual Masking and Dither Noise in Audiology 
Polish titleZastosowanie zjawiska maskowania i ditheringu w audiologii 
Conference7th International Workshop on Mathematical Methods in Scattering Theory and Biomedical Engineering, Nymphaio, Grecja,  
Preprint 
Number 
Volume 
Pages12 
Conference siteNymphaio, Grecja 
Conference date8.9.2005- 11.9.2005 
Notes8.9.2005- 11.9.2005. 
AbstractPerceptual properties of human hearing have already been investigate in the field of noise reduction, but the author's proposal is different. Another problem concerning hearing impaired people is the narrow dynamic range of hearing sensitivity. The treat Tinntus, therapists recommend behind-the-ear generators (maskers). The purpose of using maskers is not to provide an extra gain on the signal which is the task of the hearing aid, but to generate noise. The idea is to continuously excite the ear. meanwhile, dithering is a process that adds broadband noise to the acoustic signal. As demonstrated in the paper, understanding the existing links between dithering technique and Tinnitus masking may lead to some vital improvements in Tinnitus therapy. 
StreszczeniePraca przedstawia zagadnienia związane ze zjawiskiem szumów usznych i propozycja interpretacji tego zjawiska w oparciu o teorię kwantowania sygnału fonicznego. Szumy uszne często pojawiają się w sytuacji podniesienia progu słyszenia, związanego z ubytkiem słuchu, powodowanym przez choroby ucha wewnętrznego. Przyczyną tego stanu rzeczy może być degeneracja zewnętrznych komórek rzęsatych, która powoduje, że aktywacja neuronów ma miejsce dla sygnałów o wyższym poziomie, niż normalny. W sytuacji takiej mamy, zatem, do czynienia z pojawieniem się układu progowego o podwyższonym progu zadziałania. W związku z tym, dochodzi do wtrącenia dodatkowego mechanizmu kwantyzacji progowej słabych bodźców akustycznych, co jest powodowane podniesieniem progu aktywacji słuchowych komórek nerwowych. Istniejące w audiologii teorie, mające na celu wyjaśnienie tego zjawiska, nie uwzględniają bezpośrednio mechanizmów kwantyzacji sygnału, która ma miejsce w związku z istnieniem charakterystyki progowej w układzie transmisyjnym. Interpretacja taka staje się możliwa dopiero wówczas, jeżeli skorzysta się z wiedzy związanej z dziedziną przetwarzania sygnałów elektrycznych, rozwiniętej w innych dyscyplinach nauki, np. na gruncie cyfrowego przetwarzania sygnałów.  

Entry No. 138 
Entry typebook 
AuthorsA. Czyżewski, B. Kostek, H. Skarżyński 
English titleIntelligent System for Environmental Noise Monitoring 
Polish titleInteligentny System Monitorowania Środowiska 
EditorAdvances in Soft Computing, Springer Verlag 
Pages397 - 410 
Notesrozdział w książce zagranicznej 
AbstractThe telemonitoring system, developed at the Multimedia Systems Department of the Gdansk University of Technology is discussed, aimed at environmental noise levels monitoring. Apart from the global system characteristic, a detailed system presentation was provided, consisting of descriptions of the following elements: mobile measurement unit, computer noise measuring software, USB sound interface with a measurement microphone, Internet multimedia application and a soft computing algorithm applied to the analysis of the system database content. The results of noise measurements were compared to those obtained with professional noise measuring devices. The engineered intelligent application may help in diminishing hearing diseases occurrence caused by environmental & industrial noise. 
StreszczenieW rozdziale przedstawiono projekt i realizację automatycznej stacji monitorowania hałasu środowiskowego. Stanowi ona jeden z elementów tworzonego w Katedrze Systemów Multimedialnych Politechniki Gdańskiej Multimedialnego Systemu Monitorowania Hałasu. Przedstawiono ogólną budowę stacji pomiarowej oraz omówiono jej podstawową funkcjonalność. Obszerniej opisano dodatkowe możliwości stacji, do których należą: komunikacja z wykorzystaniem transmisji GPRS oraz możliwość określania pozycji geograficznej dzięki zastosowaniu odbiornika sygnału GPS. Bezprzewodowa transmisja danych, umożliwią zarówno natychmiastowe wysłanie aktualnych wyników pomiarów jak również zdalny nadzór nad działaniem stacji. Informacja o lokalizacji pomiarów hałasu może znacząco przyspieszyć i uprościć sposób tworzenia map zagrożeń hałasem na analizowanym obszarze. Przedstawiono ponadto strukturę oprogramowania zastosowanego w omawianej stacji pomiarowej. Podano również wyniki przeprowadzonych badań opracowanej stacji pomiarowej w odniesieniu do obowiązujących norm. Słowa kluczowe: monitoring środowiska, hałas, metody inteligentne, system GPS, stacje pomiarowe 

Entry No. 139 
Entry typeconference paper 
AuthorsA. Czyżewski, G. Szwoch, P. Żwan 
English titleCOPSIMO - new technologies for multimedia distribution 
Polish titleProjekt COPSIMO - nowe technologie dystrybucji multimediów 
ConferenceKrajowe Sympozjum Telekomunikacji 2005 
PreprintA-TM.01 
Number 
Volume 
Pages233 - 236 
Conference siteBydgoszcz, Polska 
Conference date7.9.2005- 9.9.2005 
StreszczenieW komunikacie przedstawiono założenia, realizowanego z udziałem Katedry Systemów Multimedialnych, projektu europejskiego COPSIMO, którego celem jest opracowanie sieci typu peer-to-peer, umożliwiającej wymianę nagrań multimedialnych na terenie krajów Unii Europejskiej. Sieć ta będzie zbudowana z wykorzystaniem architektury niewykorzystującej serwerów centralnych i wyposażona w mechanizmy zabezpieczające prawa autorskie twórców.  

Entry No. 140 
Entry typeconference paper 
AuthorsA. Czyżewski 
English titlePerceptual Masking and Dithering to Ease Communication with Audiology Patients 
Polish titleZastosowanie zjawiska maskowania i metody ditheringu w przypadku pacjentów z szumami usznymi 
Conference3rd International Conference on Telemedcicine and Multimedia Communication 
Preprint 
Number 
Volume 
Pages30 
Conference siteWarszaw, Kajetany, Polska 
Conference date21.10.2005- 22.10.2005 
AbstractPerceptual properties of human hearing have already been investigate in the field of noise reduction, but the author's proposal is different. Another problem concerning hearing impaired people is the narrow dynamic range of hearing sensitivity. The treat Tinntus, therapists recommend behind-the-ear generators (maskers). The purpose of using maskers is not to provide an extra gain on the signal which is the task of the hearing aid, but to generate noise. The idea is to continuously excite the ear. meanwhile, dithering is a process that adds broadband noise to the acoustic signal. As demonstrated in the paper, understanding the existing links between dithering technique and Tinnitus masking may lead to some vital improvements in Tinnitus therapy. 
StreszczenieW referacie przedstawiono zagadnienia związane ze zjawiskiem szumów usznych i propozycję interpretacji tego zjawiska w oparciu o teorię kwantowania sygnału fonicznego. Podano też rozwiązania technologiczne wspierające pacjentów z szumami usznymi. 

Entry No. 141 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Klejsa 
English titleTinnitus Diagnosis and Therapy Method Employing Ultrasound Dithering 
Polish titleDiagnozowanie i terapia szumów usznych z zastosowaniem ultradźwiękowego szumu typu dither 
ConferenceMathematical Methods in Scattering Theory and Biomedical Engineering 
Preprint 
Number 
Volume 
Pages277 - 296 
Conference siteNymphaio, Greece 
Conference date8.9.2005- 11.9.2005 
NotesWydawnictwo książkowe typu Proceedings 
AbstractTinnitus generating process explanation based on signal quantization theory was proposed. Current work was presented concerning an ultrasound Tinnitus device employing dither noise as a masker. The device is being engineered at the Gdansk University of Technology in a close co-operation with the Institute of Physiology and Pathology of Hearing. 
StreszczenieZaproponowano interpretację sposobu powstawania szumów usznych w oparciu o teorię kwantyzacji sygnału. Przedstawiono stan prac nad urządzeniem ultradźwiękowym do maskowania szumów usznych, opartym na tej teorii.  

Entry No. 142 
Entry typeconference paper 
AuthorsB. Kostek, P. Dalka, A. Czyżewski 
English titleAudiovisual speech recognition for training hearing impaired patients 
Polish titleAudiowizualne rozpoznawanie mowy na potrzeby treningu osób z wadami słuchu 
Conference7th International Workshop on Mathematical Methods in Scattering Theory and Biomedical Engineering 
Preprint 
Number 
Volume 
Pages335 - 347 
Conference siteNymphaio, Grecja 
Conference date8.9.2005- 11.9.2005 
AbstractThis study presents isolated phoneme recognition system combining both visual and acoustical data. The Active Shape Model method is used for extracting visual speech features from the shape and movement of the lips. This method consists in a model-based approach for extracting speech information from image sequences. Its advantage over the image-based approach stems from the fact that important features are represented in a low-dimensional space and are normally invariant to translation, rotation, scaling and illumination. The Mel Frequency Cepstral Coefficients (MFCCs) are used as the acoustic speech features in the speech recognition system. MFCCs are based on the short-term spectrum. The power spectrum bins are grouped and smoothed according to the perceptually motivated Mel frequency scaling. Then the spectrum is segmented into critical bands. Finally, a discrete cosine transform is applied to the logarithm of the filter bank output signal resulting in vectors of decorrelated MFCCs features. A three-layer feed-forward artificial neural network (ANN) is used in the experiments related to speech recognition. Feature vectors extracted combine both modalities of the human speech. A matrix, containing feature vectors calculated during the utterance, forms an input to the ANN. To make the results of speech classification robust against the changes in the utterance duration, an interpolation is used to compute feature vectors. Additional experiments with the degraded acoustical information are carried out in order to test the system robustness against various distortions affecting the signals. The system engineered utilizing only the visual information correctly classifies properly nearly 80% of the speech utterances. This result is very satisfying taking into account a huge similarity between lip movements during articulation of vowels and a great diversity of lip shapes originating from the anatomical features and the way of speaking. Results of classification based on the acoustical information are much better than the ones based on the visual information. However, utilizing both modalities in the speech recognition system further improves the effectiveness. Moreover this makes the system much more robust against distortions in the audio signal. A software is prepared employing above mentioned algorithms to be used by cochlear implanted patients in the process of speech training. An interactive application was conceived making possible organizing the interactive speech training sessions without any assistance from speech therapists. 
StreszczeniePraca przedstawia system rozpoznawania izolowanych głosek mowy wykorzystujący dane wizualne i akustyczne. Modele Active Shape Models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na współczynnikach melcepstralnych. Sieć neuronowa została użyta do rozpoznawania wymawianych głosek na podstawie wektora cech zawierającego oba typy parametrów. Dodatkowo zbadano odporność systemu na zakłócenia w sygnale dźwiękowym.  

Entry No. 143 
Entry typeconference paper 
AuthorsA. Czyżewski, A. Ciarkowski, R. Kaliakine, R. Kamiński 
English titleThe Project DESYME – Development System for Mobile Services 
Polish titleProjekt DESYME - środowisko do tworzenia usług mobilnych 
ConferenceKrajowe Sympozjum Telekomunikacji KST'2005 
Preprint 
Number 
Volume 
Pages 
Conference siteBydgoszcz, 2005 
Conference date7.9.2005- 9.9.2005 
AbstractThe note depicts goals, technical aspects and the structure of European DESYME Project. In order to emphasize the usefulness of future project’s results, a short analysis of current state of the art is also presented, together with description of common problems faced by enterprises attempting to make use of mobile technologies. Next, potential profits coming from implementation of the DESYME project’s results are introduced. Short description of the architecture of proposed solution is also included and potentially useful existing technologies are inspected. The structure of the project is presented and the role of Multimedia Systems Department is explained. An example of mobile service, whose realization will confirm the usefulness of the project’s results summarizes the paper. 
StreszczeniePrzedstawiono cele, aspekty techniczne i strukturę programu europejskiego DESYME. Przeanalizowano aktualny stan techniki i trudności, na jakie napotykają podmioty usiłujące wykorzystać techniki mobilne w swych przedsięwzięciach. Przedstawiono potencjalne korzyści płynące z implementacji w tych warunkach wyników projektu DESYME. Skrótowo przedstawiono architekturę proponowanych rozwiązań oraz wykorzystywane techniki. Przedstawiono strukturę projektu oraz wyjaśniono rolę w jego realizacji Katedry Systemów Multimedialnych Politechniki Gdańskiej. Przytoczono przykład usługi mobilnej, której skuteczna implementacja będzie potwierdzeniem przydatności wyników opisywanego projektu. 

Entry No. 144 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski 
English titleModeling of Perceptual Masking and its Applications to Hearing Aids 
Polish titleModelowanie maskowania perceptualnego i jego zastosowania w protetyce słuchu 
ConferenceXVII Krajowe Sympozjum Audiologiczne 
Preprint 
Number 
Volume 
Pages 
Conference siteCetniewo, PL 
Conference date29.9.2005- 1.10.2005 
StreszczenieModelowanie zjawisk perceptualnych obejmuje badanie zależności między odchyleniem błony podstawnej narządu Cortiego a amplitudą i częstotliwością bodźca akustycznego. Zjawiska te dotyczą makromechaniki ślimaka widzianej jako proces przyporządkowania grupom częstotliwości sygnału akustycznego różnych miejsc na błonie podstawnej, w których zachodzi jej maksymalne odchylenie. Pasma filtrów słuchowych nazwano pasmami krytycznymi słuchu. Parametry filtrów zwanych filtrami słuchowymi można wyznaczyć w oparciu o różne badania psychoakustyczne. W celu dokładniejszego określenia parametrów filtrów słuchowych, a zwłaszcza ich kształtu, można posłużyć się modelem zjawiska maskowania. Zjawisko maskowania występuje w przypadku jednoczesnego istnienia dźwięku w obecności innego dźwięku lub szumu, przy założeniu, że dźwięk zagłuszany i zagłuszający leżą w pobliskich pasmach krytycznych. Wskutek pobudzania przez dźwięk nie tylko odpowiadającego mu odcinka błony podstawnej, lecz również obszaru obejmującego częstotliwości większe, inny dźwięk pobudzający ten obszar staje się słabiej słyszalny, a nawet może przestać być słyszalny. Aby dźwięk maskowany stał się ponownie słyszalny, należy zwiększyć jego natężenie. W ten sposób jego dolna granica słyszalności została przesunięta i wartość tego przesunięcia określa miarę zagłuszania. Stwierdzono także, że: zagłuszanie jest największe w sąsiedztwie tonu zagłuszającego, zmniejszenie zagłuszania przy częstotliwościach odpowiadających harmonicznym tonu zagłuszającego związane jest z istnieniem tonów subiektywnych, tony o dużych natężeniach zagłuszają wszystkie dźwięki o częstotliwościach większych, natomiast dźwięki o częstotliwościach mniejszych - tylko w bezpośrednim swoim sąsiedztwie, łatwiej są maskowane tony wyższe przez silny ton niski. Wykorzystując powyższe założenia, dokonano implementacji modelu słyszenia w postaci algorytmicznej. Następnie model ten, zaimplementowany w formie oprogramowania wykorzystano w torze eksperymentalnej protezy słuchu, uzyskując znaczącą poprawę separacji użytecznych składowych dźwięku od niepożądanych szumów i zakłóceń.  

Entry No. 145 
Entry typeconference paper 
AuthorsA. Czyżewski, M. Dziubiński, Ł. Litwic, P. Maziewski 
English titleIntelligent Algorithms for Optical Track Audio Restoration 
Polish titleInteligentne algorytmy redukcji zniekształceń dźwięku w optycznych ścieżkach fonicznych 
Conference10th International Conference on Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing 
Preprint 
Number 
Volume3642 
Pages283 - 293 
Conference siteRegina, Kanada 
Conference date31.8.2005- 3.9.2005 
Notesdostępne w Lecture Notes in Artificial Intelligence  
AbstractThe Unpredictability Measure computation algorithm applied to psychoacoustic model-based broadband noise attenuation is discussed. A learning decision algorithm based on a neural network is employed for deter-mining audio signal useful components acting as maskers of the spectral com-ponents classified as noise. An iterative algorithm for calculating the sound masking pattern is presented. The routines for precise extraction of sinusoidal components from sound spectrum were examined, such as estimation of pitch variations in the optical track audio affected by parasitic frequency modula-tion. The results obtained employing proposed intelligent signal processing al-gorithms will be presented and discussed in the paper. 
StreszczenieW referacie przedstawiono dwa algorytmy dedykowane redukcji pasożytniczych zniekształceń dźwięku spotykanych w optycznych ścieżkach dźwiękowych. Pierwszy algorytm umożliwia redukcję szerokopasmowego szumu w nagraniach fonicznych. Wykorzystano w nim psycho-akustyczny model słuchu oparty o miarę nieprzewidywalność sygnału (ang. Unpredictability Measure). Ocena jakości redukcji szumu została wykonana z wykorzystaniem metod inteligentnych. Drugi algorytm dedykowany jest zniekształceniom kołysania dźwięku. Wykorzystano w nim informacje o zmianach w czasie składowych tonalnych dźwięku. W referacie umieszczono wyniki obrazujące sposób działania obu algorytmów. 

Entry No. 146 
Entry typeconference paper 
AuthorsP. Szczuko, Ł. Kosikowski, A. Czyżewski 
English titleVirtual Hearing Aid – the Computer Application for Education Purposes 
Polish titleWirtualny Aparat Słuchowy - aplikacja komputerowa do celów edukacyjnych 
Conference8th International Conference Advances in Diagnosis and Treatmentof Auditory Disorders 
Preprint 
Number 
Volume 
Pages 
Conference siteKajetany, Polska 
Conference date19.5.2005- 21.5.2005 
AbstractThe purpose of the elaborated application is to demonstrate the principles of hearing aid operation. It enables a normal hearing person familiarizing with hearing problems and hearing aid operation principles. The application is provided with an intuitive interface. The interactive hearing aid is presented on a diagram extended with some selectable options related to sound source, noise type, and hearing aid settings. The sound examples are included making possible listening tests performed by the application user. The application is also accompanied by the education material concerning anatomy of human ear and typical hearing impairment cases. The application details will be discussed during the paper presentation and a demonstration of its principles of operation will be included. 
StreszczenieZrealizowano aplikację komputerową demonstrującą zasady działania aparatów słuchowych. Osoba z dobrym słuchem ma możliwość zapoznania się z problemem niedosłuchu i działaniem aparatu. Aplikacja wyposażona jest w intuicyjny interfejs, który przedstawia elementy aparatu słuchowego na schemacie blokowym z opcjami dotyczącymi źródła dźwięku, typu szumu oraz ustawień aparatu. Aplikacja wzbogacona jest o materiały dydaktyczne, opisujące anatomię ludzkiego ucha oraz typowe zaburzenia słuchu. 

Entry No. 147 
Entry typeconference paper 
AuthorsA. Czyżewski, H. Skarżyński 
English titleTheory of Tinnitus Generation and its Therapeutic Application 
Polish titleInterpretacja sposobu powstawania szumów usznych i jej wykorzystanie terapeutyczne 
ConferenceXVII Krajowe Sympozjum Audiologiczne 
Preprint 
Number 
Volume 
Pages 
Conference siteCetniewo, PL 
Conference date29.9.2005- 1.10.2005 
StreszczenieSzumy uszne często pojawiają się w sytuacji podniesienia progu słyszenia, związanego z ubytkiem słuchu, powodowanym przez choroby ucha wewnętrznego. Przyczyną tego stanu rzeczy może być degeneracja zewnętrznych komórek rzęsatych, która powoduje, że aktywacja neuronów ma miejsce dla sygnałów o wyższym poziomie, niż normalny. W sytuacji takiej mamy, zatem, do czynienia z pojawieniem się układu progowego o podwyższonym progu zadziałania. W związku z tym, dochodzi do wtrącenia dodatkowego mechanizmu kwantyzacji progowej słabych bodźców akustycznych, co jest powodowane podniesieniem progu aktywacji słuchowych komórek nerwowych. Istniejące w audiologii teorie, mające na celu wyjaśnienie tego zjawiska, nie uwzględniają bezpośrednio mechanizmów kwantyzacji sygnału, która ma miejsce w związku z istnieniem charakterystyki progowej w układzie transmisyjnym. Interpretacja taka staje się możliwa dopiero wówczas, jeżeli skorzysta się z wiedzy związanej z dziedziną przetwarzania sygnałów elektrycznych, rozwiniętej w innych dyscyplinach nauki, np. na gruncie cyfrowego przetwarzania sygnałów. W związku z tym, została zaproponowana interpretacja zjawiska powstawania szumów usznych w oparciu o teorię kwantowania sygnału fonicznego. Ponadto, na gruncie cyfrowego przetwarzania sygnałów wypracowano metodykę eliminacji szumu powstającego w procesie kwantyzacji progowej, zwaną techniką ditheringu. Technika ta polega na dodawaniu do sygnałów użytecznych o niskim poziomie pewnej porcji szumu, co w efekcie zatrzymuje proces samorzutnej generacji szumu w torze, powodowany przez istnienie charakterystyki progowej. W tym kontekście łatwo można dostrzec, że w podobny sposób zwalczane są również szumy uszne w audiologii, tzn. stosuje się szum maskujący, który dostarczany jest przez specjalne urządzenia, zwane maskerami. Powszechnie znana skuteczność tego rodzaju technik eliminacji zarówno szumów usznych, jak i szumów kwantyzacji, powstających samorzutnie w układach elektronicznych, wskazuje na zasadność interpretacji szumów usznych jako bezpośredniej konsekwencji kwantowania słabych sygnałów fonicznych w układach progowych. Aktualnie w Instytucie Fizjologii i Patologii Słuchu we współpracy z Politechniką Gdańską trwają prace nad skonstruowaniem urządzenia opartego na generowaniu szumu maskującego typu dither, pracującego na częstotliwościach ponadsłyszalnych (ultradźwiękowych). W konstrukcji tego urządzenia wykorzystuje się bezpośrednio założenia teoretyczne dotyczące zjawisk powstających na etapie kwantyzacji sygnałów akustycznych. 

Entry No. 148 
Entry typeconference paper 
AuthorsA. Czyżewski 
English titleComputer modeling of perceptual masking and its audiology applications 
Polish title 
Conference8th International Conference on Advances in Diagnosis and Treatment of Auditory Disorders 
Preprint 
Number 
Volume26 
Pages 
Conference siteKajetany, PL 
Conference date19.5.2005- 21.5.2005 
NotesAudiofonologia-Supl., str. 5 
AbstractA common exploitation of perceptual models in contemporary audio coding standards, their efficiency and robustness allow for compressing audio data without a noticeable loss in the subjective quality. 
StreszczenieW referacie zaprezentowano podstawy perceptualne słyszenia pozwalające na stworzenie nowych modeli kodowania dźwięku, w szczególności do zastosowania w protezach słuchu. 

Entry No. 149 
Entry typeconference paper 
AuthorsA. Ciarkowski, A. Czyżewski, M. Kulesza, P. Maziewski 
English titleDSP Techniques in Wow Defect Evaluation 
Polish titleMetody DSP wykorzystywane do określenia przepisu drżenia dźwięku 
ConferenceIEEE Signal Processing’2005 Workshops, Chapter Circuits and Systems, Polish Section 
Preprint 
Number 
Volume 
Pages103 - 108 
Conference sitePoznań, Polska 
Conference date30.9.2005 
Notesdostepne w Proc. Signal Processing‘2005 Workshop 
AbstractTwo methods for evaluation of the wow distortion characteristics are presented in this paper. Both approaches are based on the analysis of parasite artefacts. Chosen artefacts are the recorded power line hum and the high frequency bias. Precise frequency variations are computed using standard STFT and AR mode-based spectral representation of audio. Experiments demonstrating the results of both method applications are included. 
StreszczenieReferat przedstawia dwie metody określania przebiegu pasożytniczego drżenia dźwięku. Obie wykorzystują analizę pasożytniczych artefaktów. Wybrane artefakty to: przydźwięk sieciowy i wysokoczęstotliwościowy prąd podkładu. Precyzyjny przebieg zniekształcenia kołysania oblicza się wykorzystując informacje zawarte w widmie sygnałów, a uzyskane poprzez STFT lub modelowanie AR. Referat zawiera opis eksperymentów i uzyskane wyniki. 

Entry No. 150 
Entry typejournal paper 
AuthorsA. Czyżewski, A. Ciarkowski, R. Kaliakine, R. Kamiński 
English titleThe Project DESYME – Development System for Mobile Services 
Polish titleProjekt DESYME - środowisko do tworzenia usług mobilnych 
JournalPrzegląd Telekomunikacyjny i Wiadomości Telekomunikacyjne 
Volume 
Number8-9 
Pages 
AbstractThe note depicts goals, technical aspects and the structure of European DESYME Project. In order to emphasize the usefulness of future project’s results, a short analysis of current state of the art is also presented, together with description of common problems faced by enterprises attempting to make use of mobile technologies. Next, potential profits coming from implementation of the DESYME project’s results are introduced. Short description of the architecture of proposed solution is also included and potentially useful existing technologies are inspected. The structure of the project is presented and the role of Multimedia Systems Department is explained. An example of mobile service, whose realization will confirm the usefulness of the project’s results summarizes the paper. 
StreszczeniePrzedstawiono cele, aspekty techniczne i strukturę programu europejskiego DESYME. Przeanalizowano aktualny stan techniki i trudności, na jakie napotykają podmioty usiłujące wykorzystać techniki mobilne w swych przedsięwzięciach. Przedstawiono potencjalne korzyści płynące z implementacji w tych warunkach wyników projektu DESYME. Skrótowo przedstawiono architekturę proponowanych rozwiązań oraz wykorzystywane techniki. Przedstawiono strukturę projektu oraz wyjaśniono rolę w jego realizacji Katedry Systemów Multimedialnych Politechniki Gdańskiej. Przytoczono przykład usługi mobilnej, której skuteczna implementacja będzie potwierdzeniem przydatności wyników opisywanego projektu.  

Entry No. 151 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus, A. Kaczmarek, A. Rypulak, A. Pawlik 
English titleAdvanced Speech Archiving And Restoration System For Aviation Applications 
Polish titleZaawansowany System Rejestracji i Rekonstrukcji Mowy dla potrzeb lotnictwa 
ConferenceFirst IEEE International Conference on Technologies for Homeland Security and Safety TEHOSS 2005 
Preprint 
Number 
Volume 
Pages333 - 342 
Conference siteGdańsk, Polska 
Conference date28.9.2005- 30.9.2005 
AbstractThe engineered Speech Archiving and Restoration System for Aviation Applications is presented in the paper. The system provides a multichannel and a multitask system for recording, storing, transmitting and for intelligibility improving of speech radio communication content. The principal aim of the system is recording and restoring of radio communication between aircraft pilots and ground control stations - extremely important in case of plane hijacking or crash accident investigating. The elaborated system is based on some innovative solutions presented in the paper. It concerns among others synchronous recording of the same speech signal versions received from different radio stations. Another feature is restoration process based on multi-channel analysis of the same recordings obtained from different ground control stations. Moreover, some selected digital speech processing algorithms implemented to the engineered multi-task speech enhancement system are also discussed in the paper and results of their application are demonstrated.  
StreszczenieW referacie przedstawiono opracowany System Rejestracji I Rekonstrukcji Mowy dla potrzeb lotnictwa. System ten umożliwia jednoczesny zapis, archiwizację i poprawę zrozumiałości sygnału mowy pochodzącego z wielu różnych kanałów komunikacji radiowej. Głównym celem systemu jest rejestracja i rekonstrukcja komunikatów słownych wymienianych drogą radiową pomiędzy pilotem samolotu a stacją kontroli lotów – jest to niezwykle istotne w przypadku porwania samolotu lub przy prowadzeniu ekspertyzy powypadkowej. Opisany system opiera się na innowacyjnych rozwiązaniach, przedstawionych dokładniej w niniejszym referacie. Pierwsze z nich dotyczy zapewnienia synchronizacji pomiędzy tą samą wypowiedzią zarejestrowaną na różnych stacjach radiowych. Następne obejmuje wykonywanie procesu rekonstrukcji sygnału w oparciu o wielokanałową analizę tej samej wypowiedzi pochodzącej z różnych naziemnych stacji radiowych. Zaprezentowano ponadto wybrane algorytmy cyfrowego przetwarzania sygnału, zaimplementowane w wielozadaniowym systemie poprawy zrozumiałości mowy. Zaprezentowano ich zastosowanie na wybranych przykładach. 

Entry No. 152 
Entry typeconference paper 
AuthorsP. Dalka, A. Czyżewski 
English titleSpeech recognition system for hearing impaired people 
Polish titleSystem rozpoznawania mowy dla osób niedosłyszących 
Conference8th International Conference Advances in Diagnosis and Treatmentof Auditory Disorders 
Preprint 
Number 
Volume 
Pages 
Conference siteKajetany, Polska 
Conference date19.5.2005- 21.5.2005 
AbstractThe paper presents research results in the domain of speech recognition providing assistance to hearing impaired people. The system being engineered combines both visual and acoustic data to recognize speech in order to facilitate speech training of cochlear implant patients and other patients revealing serious hearing impairments. The Active Shape Model method is used for extracting visual speech features from the shape and movement of lips. The acoustic features extraction involves mel-cepstral analysis. Both modalities of speech are combined in the feature vectors extracted. An artificial neural network is employed as a classifier allowing recognition of speech utterances. 
StreszczeniePraca przedstawia wyniki badań z zakresu rozpoznawania mowy. Tworzony system wykorzystujący dane wizualne i akustyczne będzie ułatwiał trening poprawnego mówienia dla osób po operacji transplantacji ślimaka i innych osób wykazujących poważne uszkodzenia słuchu. Active Shape models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na współczynnikach melcepstralnych. Sieć neuronowa została wykorzystana do rozpoznawania wymawianych głosek na podstawie wektora cech zawierającego oba typy parametrów. 

Entry No. 153 
Entry typeconference paper 
AuthorsA. Walkowiak, A. Czyżewski 
English title 
Polish titleTelemetria odpowiedzi neuronalnych jako metoda wspomagająca dobór parametrów stymulacji przez implant ślimakowy 
ConferenceKrajowe Sympozjum Telekomunikacji 
Preprint 
Number 
Volume 
Pages248 - 253 
Conference siteBydgoszcz, PL 
Conference date7.9.2005- 9.9.2005 
StreszczenieDzięki pomiarom odpowiedzi neuronalnych i możliwości wyznaczenia na tej podstawie tendencji rozkładu progów stymulacji można lepiej zaprogramować procesor mowy. Jest to niezwykle cenne zwłaszcza u pacjentów nie współpracujących podczas badań (na przykład u małych dzieci). W przypadku takich pacjentów tradycyjne, psychoakustyczne metody doboru parametrów stymulacji przez implant często zawodzą. Natomiast gdy audiolog dysponuje prawdopodobną mapą progów stymulacji wyznaczoną z pomiaru odpowiedzi neuronalnych, może szybciej i łatwiej określić parametry pobudzeń dla każdej z elektrod.  

Entry No. 154 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, H. Skarżyński 
English titleInternet-Based Automatic Hearing Assessment System 
Polish titleSystem badania słuchu w Internecie 
Conference119 Audio Engineering Society Convention  
Preprint6626 
Number 
Volume 
Pages 
Conference siteNew York, USA 
Conference date7.10.2005- 10.10.2005 
AbstractIn the paper the Internet-based system that allows for automatic testing of hearing is described. Hearing impairment is one of the fastest growing diseases of modern society. Therefore it is very important to organize mass screening tests to identify people suffering from this kind of impairment. The described application provides a test that uses automatic questionnaire analysis, standardized audiometric tone test procedures, and assessment of speech intelligibility in noise. When all the testing is completed, the system automatically analyzes the results for each person examined. Based on the number of incorrect answers, the decision is made automatically by the expert system. Persons whose hearing impairment is confirmed are referred to treatment in rehabilitation centers. All these centers are connected via the Internet and are provided with special distributed database access allowing them to automatically register and track the patient discovered during the remote screening. 
StreszczenieCelem referatu jest prezentacja systemu przesiewowego badania słuchu w oparciu o Internet. Wady słuchu stanowią jedną z najszybciej postępujących chorób we współczesnym społeczeństwie. W tym kontekście ważne staje się umożliwienie przeprowadzania masowych testów wykrywających ubytki słuchu. Przedstawiona aplikacja zawiera audiometryczny test tonalny, test ilustrowany dla dzieci oraz test rozumienia mowy w szumie. Po zakończeniu testów system automatycznie analizuje wyniki dla każdej badanej osoby. Osoby z wykrytą wadą słuchu kierowane są do specjalistycznych centrów rehabilitacyjnych na dalsze badania.  

Entry No. 155 
Entry typeconference paper 
AuthorsA. Czyżewski, P. Maziewski, M. Dziubiński, A. Kaczmarek, M. Kulesza, A. Ciarkowski 
English titleMethods for Detection and Removal of Parasitic Frequency Modulation in Audio Recordings 
Polish titleMetody detekcji i usuwania pasożytniczej modulacji częstotliwości w nagraniach fonicznych 
ConferenceAES 26th International Conference 
Preprint 
Number
Volume53 
Pages440 
Conference siteDenver, USA 
Conference date7.7.2005- 9.7.2005 
Notesabstrakt dostępy w JAES 
AbstractSeveral methods devoted to wow defect evaluation and compensation are discussed in the paper. The presented algorithms utilize time- and spectrally-based audio processing routines. The newly proposed time-domain algorithm takes an advantage of an autocorrelation analysis of short-term pitch variations. The spectrally based methods employ: spectral peak picking techniques, analysis of spectral center of gravity, and some routines for tracking high-frequency bias in magnetic recordings. Additionally, an algorithm utilizing AR-modeling of the signal was employed to track residual hum recorded on some archive media. Several interpolation methods for wow defect reduction were studied and compared. The researched algorithms were tested employing some archival audio samples allowing their effectiveness evaluation. 
StreszczenieW referacie przedstawiono metody ewaluacji i redukcji pasożytniczego kołysania dźwięku. Prezentowane algorytmy do określenia charakterystyki zniekształcenia działają zarówno w dziedzinie widma jak i w dziedzinie czasu. Nowatorski algorytm przetwarzania sygnału w dziedzinie czasu bazuje na analizie funkcji autokorelacji. W skład opisanych metod widmowych wchodzą: przetwarzanie tonalnych komponentów dźwięku, badanie środka ciężkości widma, śledzenie wysokoczęstotliwościowego prądu podkładu. Dodatkową metodą jest algorytm śledzenia zmian przydźwięku sieciowego wykorzystujący model AR widma sygnału. Do redukcji zniekształcenia wykorzystano różne metody interpolacji. Działanie opisanych algorytmów zbadano na autentycznych archiwalnych próbkach dźwiękowych.  

Entry No. 156 
Entry typeconference paper 
AuthorsP. Odya, A. Czyżewski 
English titleApplication of hybrid signals processors to speech and hearing aids 
Polish titleZastosowanie hybrydowych procesorów sygnałowych w protezach mowy i słuchu 
ConferenceVIII Międzynarodowa Konferencja "Postępy w diagnostyce i leczeniu zaburzeń słuchu"  
Preprint 
Number 
Volume 
Pages41 
Conference siteKajetany, Polska 
Conference date19.5.2005- 21.5.2005 
NotesAbstrakt: Audiofonologia, 2005 - Suplement  
AbstractOwing to recent progress in Digital Signal Processor (DSP) developments it has been possible to build subminiature speech and hearing aids. Furthermore, despite the small dimensions, these devices can execute complex algorithms and can be easily reprogrammed. The paper placed emphasis on issues related to the design and implementation of algorithms applicable to speech and hearing aids. For example, frequency shifting or delaying the audio signal are often used for speech fluency improvement. In turn, the speech spectrum compression process can help the hearing impaired person. Some additional algorithms which can improve the quality of the audio signal are described. The basic information about the developed device is also presented in the paper. 
StreszczenieDzięki postępowi w technice Cyfrowych Procesorów Sygnałowych (ang. DSP) stało się możliwe budowanie miniaturowych protez słuchu i mowy. Mimo niewielkich wymiarów procesory te są w stanie wykonywać złożone algorytmy. Ich dodatkową zaletą jest łatwość zmiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. W pracy skupiono się na zagadnieniach związanych z projektowanie i implementacją algorytmów mających zastosowanie w protezach słuchu i mowy. Przykładowo opóźnienie sygnału mowy bądź jego przesunięcie na skali częstotliwości często powoduje wzrost płynności mowy u osób jąkających się. Widmowa kompresja widma może zaś pomóc osobom korzystającym z implantów ślimakowych. W pracy zawarto także opisy dodatkowych algorytmów zwiększających jakość przetwarzanych sygnałów dźwiękowych oraz informacje na temat stworzonej protezy. 

Entry No. 157 
Entry typejournal paper 
AuthorsA. Czyżewski, G. Szwoch, P. Żwan 
English titleCOPSIMO - new technologies for multimedia distribution 
Polish titleProjekt COPSIMO - nowe techniki dystrybucji multimediów 
JournalPrzegląd Telekomunikacyjny 
Volume 
Number8-9 
Pages306 - 308 
StreszczeniePrzedstawiono założenia, realizowanego z udziałem Katedry Systemów Multimedialnych, projektu europejskiego COPSIMO, którego celem jest opracowanie sieci typu peer-to-peer, umożliwiającej wymianę nagrań multimedialnych na terenie krajów Unii Europejskiej. Sieć ta będzie zbudowana z wykorzystaniem architektury niewykorzystującej serwerów centralnych i wyposażona w mechanizmy zabezpieczające prawa autorskie twórców. 

Entry No. 158 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, K. Kochanek, M. Kulesza, P. Dalka, P. Suchomski 
English titleHearing Aid Operating in Acoustical Free Field 
Polish titleAparat słuchowy działający w polu swobodnym 
ConferenceXLII Krajowy Zjazd Polskiego Towarzystwa Otorynolaryngologów Chirurgów Głowy i Szyi 
Preprint 
Number 
Volume 
Pages 
Conference sitePoznań, Polska 
Conference date7.6.2006- 10.6.2006 
Notesplakat 
AbstractIt is well known that language development through home intervention for hearing-impaired infant should start in the early months of a newborn baby. In the poster, a concept of a contactless digital hearing aid designed for infants is presented. In contrast to the typical wearable hearing aid solutions (ITC, ITE, BTE) the device proposed is mounted in the infant's bed. Any part of the hearing aid set-up contacts the infant's body. Processed speech signal is emitted by the low-power loudspeakers placed near the infant's head. The hearing aid architecture employs a digital signal processor based on Texas Instruments technology. Since one of the main problems is related to acoustic feedback between microphone and loudspeakers, therefore methods for acoustic feedback elimination are implemented in the hearing aid. 
StreszczenieJest wiadome, że korekcję wady słuchu nowo narodzonego dziecka należy rozpocząć jak najwcześniej w celu umożliwienia prawidłowego rozwoju ośrodka mowy. Plakat ten prezentuje koncepcję bezkontaktowego aparatu słuchowego przeznaczonego dla niemowląt. W przeciwieństwie do typowych rozwiązań montowanych za uchem bądź w kanale usznym dziecka (ITC, ITE, BTE) prezentowane urządzenie jest montowane w łóżeczku dziecka i żadna jego część nie styka się z jego ciałem. Przetworzony sygnał mowy jest emitowany przez miniaturowe głośniki umieszczone w pobliżu główki dziecka. W konstrukcji aparatu wykorzystano cyfrowy procesor sygnałowy firmy Texas Instruments. Ponieważ jednym z głównych problemów związanych z aparatami słuchowymi jest występowanie sprzężenia zwrotnego głośnikami i mikrofonem, aparat wykorzystuje również algorytmy eliminacji pasożytniczych sprzężeń akustycznych 

Entry No. 159 
Entry typeconference paper 
AuthorsG. Szwoch, M. Kulesza, A. Czyżewski 
English titleTransient detection algorithms for speech coding applications  
Polish titleAlgorytmy detekcji transjentów do zastosowań w kodowaniu mowy 
Conference4th Joint Meeting of the Acoustical Society of America 
Preprint3pSP37 
Number 
Volume 
Pages 
Conference siteHonolulu, HI, USA 
Conference date28.12.2006- 2.12.2006 
AbstractWe proposed a new speech codec architecture for Voice over IP applications that enhances subjective signal quality. This poster presents method for extraction of transients from the speech signal. 
StreszczenieZaproponowano nową architekturę kodeka do zastosowań w telefonii internetowej. W plakacie zaprezentowano metodę ekstrakcji transjentów w sygnale mowy. Słowa kluczowe: kodeki mowy; ekstrakcja transjentów; telefonia internetowa  

Entry No. 160 
Entry typebook 
AuthorsA. Czyżewski, B. Kostek, H. Skarżyński 
English titleIT Applications for the Remote Testing of Hearing 
Polish titleAplikacje technologii informacyjnych w badaniu słuchu przez Internet 
EditorSpringer Verlag 
Pages225 - 247 
Notesrozdział w książce zagranicznej w Information Technology Soultions for Healthcare; K. Zielinski, M. Duplaga, D. Ingram, Eds. 
AbstractTelemedicine can play an important role in diagnosing and treating hearing losses. This fact is associated, among others, with the methodology of audiometric measurements and with supporting hearing through hearing aids and cochlear implants. Current problems related to treating hearing impairments and total deafness pose a distinct challenge for science, which must provide ever more effective methods for application in diagnostics and audiology as well as otolaryngology practice. Advances in teleinformatics as well as its wide employment in recent years have opened new possibilities for conducting mass screening of hearing, tinnitus (ear noises), speech and vision. Diagnostic and recovery systems associated with the interactive medical portal Telezdrowie (www.telewalfare.com) designed by the institutions mentioned in the header of this paper serve as an example of how simple diagnostic methods employed in screening tests can be mass-deployed thanks to teleinformatics, this defining a new diagnostic of communication senses. 
StreszczenieTelemedycyna odgrywa coraz wiekszą rolę w diagnostyce i leczeniu osób z ubytkami słuchu. Jest to związane m.in. ze specyfiką badań audiometrycznych. Postęp technologiczny w dziedzinie aparatów słuchowych i implantów ślimakowych wymusza nowe metody diagnozy w audiologii, jak również w praktyce otolaryngologicznej. Serwis "Telezdrowie", w którym zaimplementowano liczne testy przesiewowe jest przykładem prowadzenia diagnostyki w zakresie zmysłów komunikacji na odległość. Słowa kluczowe: telemedycyna, portal medyczny, implanty ślimakowe, aparaty słuchowe, dopasowanie protez słuchu 

Entry No. 161 
Entry typeconference paper 
AuthorsA. Czyżewski, P. Odya, B. Kostek 
English titleNew generation aids for laryngectomy patients 
Polish titlePomoce nowej generacji dla pacjentów po laryngektomii 
Conference4th Joint Meeting of the Acoustical Society of America 
Preprint5aSCa26 
Number 
Volume 
Pages 
Conference siteHonolulu, HI, USA 
Conference date28.11.2006- 2.12.2006 
Noteswyd. Journal Acoust. Soc. Am., 120 (5), Pt. 2, Nov. 2006, 3351 
AbstractThe aim of this project is to help laryngectomees. There are two different approaches to solve this task. The first one focuses on the artificial larynx. Some major improvements in the construction of the device might be easily introduced. First of all, digital signal processing should result in decreasing unwanted noise. The artificial larynx engineered is equipped with digital processor and amplifier. The spectral subtraction algorithm of noise reduction is used. The second approach uses PDA to generate speech. 
StreszczenieCelem prezentowanego projektu było opracowanie elektronicznych pomocy dla osób po laryngektomii. Zastosowano wiele usprawnień, które wykorzytują cyfrowy procesor sygnałowy wbudowany w urządzenie. Usprawnienia dotyczą tłumienia niepożądanych zakłoceń i eliminacji pasożytniczych akustycznych sprzężeń zwrotnych. Kolejne opracowanie obejmuje syntetyzer mowy oparty na komputerze klasy PDA. Słowa kluczowe: laryngektomia; bezgłos; protezy mowy; seynetza mowy; sztuczna krtań 

Entry No. 162 
Entry typejournal paper 
AuthorsM. Kulesza, G. Szwoch, A. Czyżewski 
English titleImproving signal quality of speech codecs using perceptual coding 
Polish titlePoprawa jakości sygnału w kodekach mowy za pomocą kodowania perceptualnego 
JournalZeszyty Naukowe Wydziału ETI PG 
Volume 
Number10 
Pages399 - 406 
AbstractSpeech coding algorithm which aiming at better subjective signal quality that is provided by currently used speech codecs, was described in the paper. A higher signal quality may be achieved by discerning transient states, voiced and unvoiced components of a speech signal and encoding the signal using different approach for each component type. Unvoiced signal components are encoded using standard parametric coding algorithm, while for voiced parts of the signal, a perceptual coding algorithm is applied. Subjective quality of the signal encoded using the proposed algorithm was compared to signal quality achieved by standard speech codecs. 
StreszczenieW komunikacie opisano algorytm kodowania sygnału mowy, którego celem jest uzyskanie wyższej oceny jakości zakodowanego sygnału niż w przypadku algorytmów stosowanych do tej pory. W tym celu wyodrębniane są stany transjentowe oraz fragmenty dźwięczne i bezdźwięczne sygnału. Fragmenty te są następnie kodowane w odmienny sposób: składowe bezdźwięczne są kodowane tradycyjną metoda parametryczną, natomiast do składowych dźwięcznych wykorzystano algorytm kodowania perceptualnego. Jakość sygnału mowy kodowanego zgodnie z proponowaną metodą porównano z jakością możliwą do uzyskania w przypadku powszechnie stosowanych obecnie kodeków mowy. 

Entry No. 163 
Entry typeconference paper 
AuthorsM. Kulesza, G. Szwoch, A. Czyżewski 
English titleHigh quality speech coding using combined parametric and perceptual modules 
Polish titleKodowanie sygnału mowy z zachowaniem wysokiej jakości przy wykorzystaniu modułu parametrycznego i perceptualnego 
Conference13th World Enformatika Conference 
Preprint 
Number 
Volume13 
Pages244 - 249 
Conference siteBudapeszt, Węgry 
Conference date26.5.2006- 28.5.2006 
AbstractA novel approach to speech coding using the hybrid architecture is presented. Advantages of parametric and perceptual coding methods are utilized together in order to create a speech coding algorithm assuring better signal quality than in traditional CELP parametric codec. Two approaches are discussed. One is based on selection of voiced signal components that are encoded using parametric algorithm, unvoiced components that are encoded perceptually and transients that remain unencoded. The second approach uses perceptual encoding of the residual signal in CELP codec. The algorithm applied for precise transient selection is described. Signal quality achieved using the proposed hybrid codec is compared to quality of some standard speech codecs. 
StreszczenieW komunikacie zaprezentowano nową metodę hybrydowego kodowania sygnału mowy. Techniki kodowania parametrycznego oraz perceptualnego zostały wykorzystane w celu zapewnienia wysokiej jakości kodowania sygnału mowy. Przedstawiono wyniki badań dla dwóch architektur kodeka. Jedna z nich bazuje na algorytmie pozwalajacym wyodrębnić składowe dźwięczne, bezdźwięczne oraz transjenty. Składowe dźwięczne kodowane są metodą perceptualną, bezdźwięczne metodą parametryczną, zaś transjenty przesyłane są do dekodera w formacie bezstratnym. W drugim z proponowanych algorytmów część dźwięczna sygnału rezydualnego kodeka CELP poddawana jest dodatkowemu kodowaniu perceptualnemu. Jakość sygnału mowy uzyskana dzięki dwom zaproponowanym metodą jest porównana z jakością uzyskiwaną z wykorzystaniem standardowych metod kodowania sygnału mowy.  

Entry No. 164 
Entry typeconference paper 
AuthorsA. Ciarkowski, P. Żwan, G. Szwoch, A. Czyżewski 
English titleMutlimedia Mobile Services for the Semantic Web 
Polish titleMultimedialne usługi mobilne dla sieci semantycznej 
ConferenceTechnologie Informacyjne 2006 
Preprint 
Number 
Volume10 
Pages389 - 398 
Conference siteGdańsk, Polska 
Conference date21.5.2006- 24.5.2006 
AbstractThis document describes the methodology of creating semantically-enriched multimedia mobile services using tools and service enablers provided by the DeSyME project. A brief introduction to the Semantic Web is presented along with the explanation of its relation to the subject of Web Services. Next, the description of the DeSyME Framework is included. Finally, examples of multimedia mobile services developed at Gdańsk University of Technology are presented to illustrate possible utilities of described technologies. 
StreszczenieDokument przedstawia metodologię tworzenia semantycznie-rozszerzonych multimedialnych usług mobilnych z wykorzystaniem narzędzi i ułatwień oferowanych przez projekt DESYME. Zaprezentowano zwięzły wstęp do tematyki Sieci Semantycznej wraz z wyjaśnieniem jej związku z zagadnieniami Web Services. Następnie przedstawiono opis projektu DESYME. Przedstawiono również przykładowe usługi multimedialne, które są opracowywane w Katedrze Systemów Multimedialnych WETI PG, jako ilustrację możliwych zastosowań opisywanych technologii. 

Entry No. 165 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, P. Odya 
English titleDigital Hearing Aid with Time and Spectral Transposition 
Polish titleCyfrowy aparat słuchowy z transpozycją czasową i widmową dźwięku 
ConferenceXLII Krajowy Zjazd Polskiego Towarzystwa Otorynolaryngologów Chirurgów Głowy i Szyi 
Preprint 
Number 
Volume 
Pages 
Conference sitePoznań, Polska 
Conference date7.6.2006- 10.6.2006 
Notesplakat 
AbstractRecent screening hearing tests, which have been carried out in Poland, showed that many people suffer from hearing loss. Worse still, typical hearing aids are not able to help some particular groups of patients, e.g. newborn infants, people working in a noisy environment, aircraft pilots or patients with cochlear implants. Taking advantage of the recent progress in Digital Signal Processor (DSP) developments, a portable and reprogrammable digital hearing aid can be easily designed. Furthermore, taking into account the-state-of-the-art in the research in the digital signal processing domain, it is possible to produce in Poland a sophisticated hearing aid in which complex algorithms of signal processing will be implemented. Owing to hybrid signal processors, it was possible to implement algorithms of spectral and time transposition. The first method is designed for persons with corner-audiograms, who may retain residual hearing in a low frequency band. The latter method may be used in case of patients with time resolution problem. The aim of this poster is to present information about the hearing aid developed, algorithms engineered and to comment preliminary experiment results. 
StreszczenieNastępstwem uruchomienia w Polsce, prowadzonych na szeroką skalę, badań przesiewowych słuchu jest konieczność zaoferowania pomocy osobom cierpiącym na niedosłuch poprzez leczenie i protetykę słuchu. Tymczasem, aktualnie oferowane rozwiązania aparatów słuchowych nie są w stanie sprostać niektórym specjalistycznym potrzebom aparatowania, m. in.: najmłodszych dzieci, osób pracujących w hałasie, pilotów wojskowych oraz osób korzystających z implantów ślimakowych, u których dzięki zastosowaniu odpowiedniej techniki mikrochirurgicznej, zachowane zostały resztki słuchowe, dające możliwość dodatkowego wykorzystania stymulacji akustycznej i in.. Likwidacja barier importowych w dziedzinie technologii mikroelektronicznej umożliwiła nielimitowany dostęp do tej technologii w naszym kraju, co stwarza techniczną możliwość opracowywania rodzimej konstrukcji cyfrowych aparatów słuchowych o wysokim stopniu nowoczesności i miniaturyzacji. Stan rozwoju krajowych badań naukowych z dziedziny cyfrowego przetwarzania sygnałów akustycznych jest na tyle zaawansowany, że praktycznie nie istnieją bariery, które w ograniczałyby od strony technicznej możliwości opracowywania i wdrażania rodzimych konstrukcji cyfrowych aparatów słuchowych. Dostęp do tej technologii zminiaturyzowanych procesorów cyfrowych gwarantuje realizację podstawowego zadania, jakim jest opracowanie eksperymentalnego modelu wewnątrzusznego aparatu cyfrowego wraz z systemem jego dopasowania do potrzeb pacjenta przy wykorzystaniu oprogramowania komputerowego. Przedmiotem prezentacji jest dokonane opracowanie i wstępne próby kliniczne algorytmów cyfrowego przetwarzania sygnałów fonicznych do zastosowań w specjalnych protezach słuchu, takich jak: transpozycja widmowa i transpozycja czasowa dźwięku. Pierwszy rodzaj transpozycji jest przydatny dla pacjentów zachowujących resztkową czułość słuchu w postaci audiogramu narożnego, zaś transpozycja skali czasu jest pomocna pacjentom o pogorszonej rozdzielczości czasowej słuchu.  

Entry No. 166 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kozłowski, M. Kulesza, P. Odya, A. Szkiełkowska 
English titleNew Digital Aids for Patients after Laryngectomy  
Polish titleNowe pomoce elektroniczne dla osób po laryngektomii 
ConferenceXLII Krajowy Zjazd Polskiego Towarzystwa Otorynolaryngologów Chirurgów Głowy i Szyi 
Preprint 
Number 
Volume 
Pages 
Conference sitePoznań, Polska 
Conference date7.6.2006- 10.6.2006 
Notesplakat 
AbstractThe laryngectomy is a standard therapy for patiens with advanced laryngeal cancer. The operation consist in surgical removal of the larynx. As a result, patients lose ability to produce their own voice. Some laryngectomees use so-called esophageal or tracheosophageal speech to communicate with other people. Both methods require an arduous training and, furthermore, only a minority of laryngectomees are able to learn these kind of speech production. The rest of the patients have to use an electronic device, known as the artificial larynx. The artificial larynx has many disadvantages. The produced speech is monotonous and very artificial. In addition, intelligibility is poor. The major problem is a background noise, which is caused by the device. In fact, the artificial larynx is only a simple vibrator, a construction of which has been almost unchanged since 1950s. The aim of this project is to help laryngectomees. There are two different approaches to solve this task. The first one focuses on the artificial larynx. Some major improvements in the construction of the device might be easily introduced. First of all, digital signal processing should result in decreasing unwanted noise. The artificial larynx engineered will be equipped with digital processor and amplifier. The spectral subtraction algorithm of noise reduction will be used. The second approach uses PDA to generate speech. 
StreszczeniePowrót do prawidłowej komunikacji z otoczeniem pacjentów po laryngektomii jest możliwy poprzez wykształcenie zastępczej mowy przełykowej lub gardłowej a w pozostałych przypadkach, kiedy się to nie udaje, poprzez zastosowanie elektronicznych protez (wibratorów szyjnych) wprowadzających w drgania tkanki dna jamy ustnej i szyi. Nawet, gdy dochodzi do wykształcenia mowy zastępczej, jakość mowy artykułowanej przełykowo jak i artykułowanej z zastosowaniem wibratorów elektromechanicznych na ogół znacznie odbiega od oczekiwań. Dostępne na rynku wibratory wykonane są według przestarzałych nieaktualnych koncepcji, z zastosowaniem technologii. Wynikiem tego są duże rozmiary sztucznych krtani i zła jakość tworzonego głosu. Realizowany projekt zakłada skonstruowanie aparatu z zastosowaniem najnowszych komponentów i technik komputerowych, co spowoduje miniaturyzację urządzenia a ponadto poprawi w sposób zasadniczy jakość wytwarzanego głosu. Założono dwa sposoby tworzenia głosu – bezpośredni i pośredni. Pierwszy wykorzystuje małe urządzenie wibracyjne do wzbudzania głosu oraz specjalnie skonstruowany zminiaturyzowany wzmacniacz z cyfrowym przetwarzaniem mowy w jego torze. Zastosowanie cyfrowego przetwarzania mowy umożliwi znaczącą poprawę jej jakości poprzez odfiltrowanie niepożądanych zakłóceń pochodzących od wibracji, szumów i świstów oraz chrypienia. Pomocniczy sposób tworzenia głosu będzie wykorzystywał komputery typu palmtop, dla których przygotowano program syntezy mowy. Poprawę diagnostyki przed i pooperacyjnej oraz procesu rehabilitacji pacjentów, umożliwia opracowane oprogramowania do komputerowej analizy mowy. W konsekwencji opracowywane pomoce elektroniczne umożliwią chorym szybszą rehabilitację i naturalną komunikację werbalną z otoczeniem. Projekt jest realizowany przez d zespół specjalistów z Politechniki Gdańskiej we współpracy z Instytutem Fizjologii i Patologii Słuchu oraz Akademią Medyczną w Gdańsku.  

Entry No. 167 
Entry typeconference paper 
AuthorsM. Kulesza, G. Szwoch, A. Czyżewski, Ł. Litwic 
English titleTransient detection algorithms for hybrid speech codec 
Polish titleMetody detekcji transjentów do zastosowań w hybrydowym kodeku mowy 
ConferenceXII Krajowe Sympozjum Telekomunikacji i Teleinformatyki (KSTiT) 
Preprint 
Number 
Volume 
Pages 
Conference siteBydgoszcz, Polska 
Conference date13.9.2006- 14.9.2006 
AbstractThe report presents the architecture of the proposed speech codec for VoIP applications. This codec uses a hybrid approach: both parametric and perceptual coding methods were used for encoding unvoiced and voiced parts of speech signal, respectively. Transient are processed separately. Several simple transient detection algorithms for speech signal are assessed for their application in speech codec. The aim of the proposed codec is to improve subjective signal quality in comparison with currently used codecs. 
StreszczenieW pracy przedstawiono architekturę proponowanego kodeka mowy do zastosowań np. w telefonii VoIP. Kodek ten charakteryzuje się hybrydowym podejściem do kodowania mowy – zastosowane zostało zarówno kodowanie parametryczne (do bezdźwięcznych fragmentów sygnału), jak i perceptualne (do fragmentów bezdźwięcznych). Ponadto osobno traktowane są transjenty w sygnale. Przebadano kilka prostych algorytmów detekcji transjentów w sygnale mowy i oceniono możliwość ich zastosowania w kodeku mowy. Celem opisywanego kodeka hybrydowego jest poprawa jakości zakodowanego sygnału mowy w porównaniu do stosowanych obecnie kodeków parametrycznych. 

Entry No. 168 
Entry typeconference paper 
AuthorsM. Kulesza, G. Szwoch, A. Czyżewski 
English titleImproving signal quality in speech codec using hybrid perceptual-parametric algorithm 
Polish titlePoprawa jakości sygnału w kodekach mowy przy użyciu hybrydowego, parametryczno-perceptualnego algorytmu kodowania 
Conference5th International Conference on Multimedia & Network Information Systems (MISSI 2006) 
Preprint 
Number 
Volume 
Pages181 - 192 
Conference siteWrocław, Polska 
Conference date21.9.2006- 22.9.2006 
Notesjęzyk publikacji: angielski 
AbstractA hybrid parametric-perceptual speech codec architecture is presented. The basic CELP parametric codec structure is enhanced using the perceptual coding method. The aim of the codec hybridization is obtaining significant improvement in perceived signal quality. Two hybrid architectures are proposed. The first one encodes perceptually voiced parts in the CELP residual signal. The second one divides the signal into voiced signal components that are encoded using the perceptual algorithm, unvoiced components that are encoded parametrically and transients that remain unencoded. Signal quality achieved using the hybrid codec is compared to the quality of some standard speech codecs. 
StreszczeniePrzedstawiono hybrydową, parametryczno-perceptualną architekturę kodeka. Podstawowa struktura kodeka parametrycznego CELP została wzbogacona o kodowanie perceptualne. Celem hybrydyzacji kodeka jest uzyskanie znaczącej poprawy subiektywnej jakości zdekodowanego sygnału. Zaproponowano dwie hybrydowe struktury. Pierwsza polega na perceptualnym kodowaniu dźwięcznych elementów sygnału rezydualnego kodeka CELP. Druga metoda dzieli sygnał mowy na części dźwięczne (kodowane perceptualnie), bezdźwięczne (kodowane parametrycznie) i transjenty (obecnie nie kodowane). Jakość sygnału uzyskanego przy pomocy hybrydowego kodeka jest porównana z jakością uzyskiwaną w standardowych kodekach mowy. 

Entry No. 169 
Entry typejournal paper 
AuthorsA. Czyżewski, B. Kostek, P. Maziewski, Ł. Litwic 
English titleAccidental Wow Defect Evaluation Using Sinusoidal Analysis Enhanced by Artificial Neural Networks 
Polish titleWyznaczanie przebiegu przypadkowych zniekształcenia kołysania przy wykorzystaniu analizy sinusoidalnej i sztucznych sieci neuronowych 
JournalLecture Notes in computer Science: Rough Set and Knowledge Technology 
Volume4062/2006 
Number 
Pages389 - 395 
AbstractA method for evaluation of parasitic frequency modulation (wow) in archival audio is presented. The proposed approach utilizes sinusoidal components tracking as their variations correspond with the wow defect. The sinusoidal modeling procedures are used to extract the tonal components from severely distorted and significantly modulated audio signals. A prediction module based on neural networks is proposed to improve the tonal components tracking.  
StreszczenieArtykuł przedstawia metodę do wyznaczania charakterystyki pasożytniczych modulacji częstotliwości (kołysanie) obecnych w archiwalnych nagraniach dźwiękowych. Prezentowane podejście wykorzystuje śledzenie zmian sinusoidalnych komponentów dźwięku które odzwierciedlają przebieg kołysania. Analiza sinusoidalna wykorzystana jest do ekstrakcji składowych tonalnych ze zniekształconych nagrań dźwiękowych. Dodatkowo, w celu zwiększenia skuteczności śledzenia, wykorzystano predykator działający na bazie sieci neuronowej.  

Entry No. 170 
Entry typeconference paper 
AuthorsM. Kulesza, G. Szwoch, A. Czyżewski 
English titleA Hybrid Speech Codec Employing Parametric and Perceptual Coding Techniques 
Polish titleHybrydowy kodek sygnału mowy wykorzystujący kodowanie parametryczne i perceptualne 
Conference121st Audio Engineering Society Convention 
Preprint6956 
Number 
Volume 
Pages1 - 12 
Conference siteSan Francisco, USA 
Conference date5.10.2006- 8.10.2006 
AbstractA hybrid speech codec for VoIP telephony applications is presented employing combined parametric and perceptual coding techniques. The signal is divided into voiced signal components that are encoded using the perceptual algorithm, unvoiced components that are encoded parametrically and transients that are not encoded with a lossy method. The codec architecture where voiced part of the CELP residual signal is perceptually encoded and transmitted to the decoder along with the CELP main bit stream is also examined. Various methods for transient detection in the speech signal are discussed. The results of experiments revealing the improved subjective quality of the transmitted speech are also presented. 
StreszczenieW referacie przedstawiono hybrydowy kodek mowy dla zastosowan w komunikacji VoIP wykorzystujący kodowanie parametryczne i percetualne. Sygnał mowy jest dzielony na składowe dźwięczne, które podlegają kodowania perceptualnemu, składowe bezdźwięczne, które kodowane są metodą parametryczną oraz transjenty, które nie są kodowane żadną stratną metodą. Dodatkowo przedstawiono architekturę kodeka, w której perceptualnie kodowana i przesyłana do dekodera jest dźwięczna część sygnału rezydualnego kodeka CELP. Przedstawiono kilka algorytmów detekcji transjentów w sygnale mowy. Wyniki ekspermentów wskazują, iż obie zaproponowane metody pozwalają na kodowanie sygnału mowy z wysoką jakością. 

Entry No. 171 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kozłowski, M. Kulesza, P. Odya, A. Szkiełkowska 
English titleNew digital aids for pateints after laryngectomy 
Polish titleNowe pomoce elektroniczne dla osób po laryngektomii 
ConferenceI Konferencja Audiologiczno-Foniatryczna 
Preprint 
Number 
Volume 
Pages 
Conference siteWarszawa, Polska 
Conference date10.9.2006- 12.9.2006 
NotesAbstrakt w Audiofonologii, Suplement, 2006, str. 12 
AbstractThe laryngectomy is a standard therapy for patiens with advanced laryngeal cancer. The operation consist in surgical removal of the larynx. As a result, patients lose ability to produce their own voice. The aim of this project is to help laryngectomees. There are two different approaches to solve this task. The first one focuses on the artificial larynx. Some major improvements in the construction of the device might be easily introduced. First of all, digital signal processing should result in decreasing unwanted noise. The artificial larynx engineered will be equipped with digital processor and amplifier. The spectral subtraction algorithm of noise reduction will be used. The second approach uses PDA to generate speech. 
StreszczeniePowrót do prawidłowej komunikacji z otoczeniem pacjentów po laryngektomii jest możliwy poprzez wykształcenie zastępczej mowy przełykowej lub gardłowej a w pozostałych przypadkach, kiedy się to nie udaje, poprzez zastosowanie elektronicznych protez (wibratorów szyjnych) wprowadzających w drgania tkanki dna jamy ustnej i szyi. Nawet, gdy dochodzi do wykształcenia mowy zastępczej, jakość mowy artykułowanej przełykowo jak i artykułowanej z zastosowaniem wibratorów elektromechanicznych na ogół znacznie odbiega od oczekiwań. Dostępne na rynku wibratory wykonane są według przestarzałych nieaktualnych koncepcji, z zastosowaniem technologii. Wynikiem tego są duże rozmiary sztucznych krtani i zła jakość tworzonego głosu. Realizowany projekt zakłada skonstruowanie aparatu z zastosowaniem najnowszych komponentów i technik komputerowych, co spowoduje miniaturyzację urządzenia a ponadto poprawi w sposób zasadniczy jakość wytwarzanego głosu. Założono dwa sposoby tworzenia głosu – bezpośredni i pośredni. Pierwszy wykorzystuje małe urządzenie wibracyjne do wzbudzania głosu oraz specjalnie skonstruowany zminiaturyzowany wzmacniacz z cyfrowym przetwarzaniem mowy w jego torze. Zastosowanie cyfrowego przetwarzania mowy umożliwi znaczącą poprawę jej jakości poprzez odfiltrowanie niepożądanych zakłóceń pochodzących od wibracji, szumów i świstów oraz chrypienia. Pomocniczy sposób tworzenia głosu będzie wykorzystywał komputery typu palmtop, dla których przygotowano program syntezy mowy. Poprawę diagnostyki przed i pooperacyjnej oraz procesu rehabilitacji pacjentów, umożliwia opracowane oprogramowania do komputerowej analizy mowy. W konsekwencji opracowywane pomoce elektroniczne umożliwią chorym szybszą rehabilitację i naturalną komunikację werbalną z otoczeniem. Projekt jest realizowany przez zespół specjalistów z Politechniki Gdańskiej we współpracy z Instytutem Fizjologii i Patologii Słuchu oraz Akademią Medyczną w Gdańsku.  

Entry No. 172 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, P. Odya 
English titleDigital Hearing Aid with time and spectral transposition 
Polish titleCyfrowy aparat słuchowy z transpozycją czasową i widmową 
ConferenceI Konferencja Audiologiczno-Foniatryczna 
Preprint 
Number 
Volume 
Pages 
Conference site 
Conference date10.9.2006- 12.9.2006 
NotesAbstrakt w Audiofonologii, Suplement, 2006, str. 11 
AbstractRecent screening hearing tests, which have been carried out in Poland, showed that many people suffer from hearing loss. Worse still, typical hearing aids are not able to help some particular groups of patients, e.g. newborn infants, people working in a noisy environment, aircraft pilots or patients with cochlear implants. Taking advantage of the recent progress in Digital Signal Processor (DSP) developments, a portable and reprogrammable digital hearing aid can be easily designed. Furthermore, taking into account the-state-of-the-art in the research in the digital signal processing domain, it is possible to produce in Poland a sophisticated hearing aid in which complex algorithms of signal processing will be implemented. Owing to hybrid signal processors, it was possible to implement algorithms of spectral and time transposition. The first method is designed for persons with corner-audiograms, who may retain residual hearing in a low frequency band. The latter method may be used in case of patients with time resolution problem. The aim of this poster is to present information about the hearing aid developed, algorithms engineered and to comment preliminary experiment results.  
StreszczenieNastępstwem uruchomienia w Polsce, prowadzonych na szeroką skalę, badań przesiewowych słuchu jest konieczność zaoferowania pomocy osobom cierpiącym na niedosłuch poprzez leczenie i protetykę słuchu. Tymczasem, aktualnie oferowane rozwiązania aparatów słuchowych nie są w stanie sprostać niektórym specjalistycznym potrzebom aparatowania, m. in.: najmłodszych dzieci, osób pracujących w hałasie, pilotów wojskowych oraz osób korzystających z implantów ślimakowych, u których dzięki zastosowaniu odpowiedniej techniki mikrochirurgicznej, zachowane zostały resztki słuchowe, dające możliwość dodatkowego wykorzystania stymulacji akustycznej i in.. Likwidacja barier importowych w dziedzinie technologii mikroelektronicznej umożliwiła nielimitowany dostęp do tej technologii w naszym kraju, co stwarza techniczną możliwość opracowywania rodzimej konstrukcji cyfrowych aparatów słuchowych o wysokim stopniu nowoczesności i miniaturyzacji. Stan rozwoju krajowych badań naukowych z dziedziny cyfrowego przetwarzania sygnałów akustycznych jest na tyle zaawansowany, że praktycznie nie istnieją bariery, które w ograniczałyby od strony technicznej możliwości opracowywania i wdrażania rodzimych konstrukcji cyfrowych aparatów słuchowych. Dostęp do tej technologii zminiaturyzowanych procesorów cyfrowych gwarantuje realizację podstawowego zadania, jakim jest opracowanie eksperymentalnego modelu wewnątrzusznego aparatu cyfrowego wraz z systemem jego dopasowania do potrzeb pacjenta przy wykorzystaniu oprogramowania komputerowego. Przedmiotem prezentacji jest dokonane opracowanie i wstępne próby kliniczne algorytmów cyfrowego przetwarzania sygnałów fonicznych do zastosowań w specjalnych protezach słuchu, takich jak: transpozycja widmowa i transpozycja czasowa dźwięku. Pierwszy rodzaj transpozycji jest przydatny dla pacjentów zachowujących resztkową czułość słuchu w postaci audiogramu narożnego, zaś transpozycja skali czasu jest pomocna pacjentom o pogorszonej rozdzielczości czasowej słuchu. 

Entry No. 173 
Entry typejournal paper 
AuthorsP. Dalka, B. Kostek, A. Czyżewski 
English titleVowel Recognition Based On Acoustic And Visual Features 
Polish titleRozpoznawanie samogłosek bazujące na parametrach akustycznych i wizualnych 
JournalArchives of Acoustics 
Volume31 
Number
Pages275 - 288 
AbstractThe aim of the research work presented is to show a system that may facilitate speech training for hearing impaired people. The system engineered combines both acoustic and visual vowel data acquisition and analysis modules. The acoustic feature extraction involves mel-cepstral analysis. The Active Shape Model method is used for extracting visual speech features from the shape and movement of the lips. Artificial Neural Networks (ANNs) are utilized as the classifier, feature vectors extracted combine both modalities of the human speech. The system is validated with the recordings of speakers that were not used for the lip model creating and for the ANN training. Additional experiments with the degraded acoustic information are carried out in order to test the system robustness against various distortions affecting speech utterances. 
StreszczenieW artykule zaprezentowano metodę, która może ułatwić naukę mowy dla osób z wadami słuchu. Opracowany system rozpoznawania samogłosek wykorzystuje łączną analizę parametrów akustycznych i wizualnych sygnału mowy. Parametry akustyczne bazują na współczynnikach mel-cepstralnych. Do wyznaczenia parametrów wizualnych z kształtu i ruchu ust zastosowano Active Shape Models. Jako klasyfikator użyto sztuczną sieć neuronową. Działanie systemu zostało przetestowane z wykorzystaniem nagrań mówców, które nie były wykorzystane ani do tworzenia modelu ust, ani do treningu sieci neuronowej. Dodatkowo zbadano wpływ zakłócania informacji akustycznej na uzyskiwane wyniki. 

Entry No. 174 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, K. Kochanek, M. Kulesza, P. Suchomski 
English titleHearing aid operating in acoustical free field 
Polish titleAparat słuchowy działający w wolnym polu akustycznym 
ConferenceI Konferencja Audilogiczno-Foniatryczna 
Preprint 
Number 
Volume 
Pages11 
Conference siteWarszawa, Polska 
Conference date10.9.2006- 12.9.2006 
NotesAudiofonologia-Suplement, str. 11 
StreszczenieAparatowanie bardzo małych dzieci (od 5 miesiąca życia) za pomocą standardowych protez słuchu natrafia na wiele trudności natury praktycznej. Dotyczy to procesu dopasowania aparatu słuchowego, czyli doboru jego ustawień stosownie do aktualnych charakterystyk ubytku słuchu dzieci. Tymczasem wczesne aparatowanie jest zagadnieniem o ogromnym zanczeniu dla rozwoju słuchu, mowy i ogólnej inteligencji dziecka. Referat prezentuje uzyskane wyniki praktycznych prób i eksperymentów w tym zakresie, które otwierają drogę do opracowania bezkontaktowego aparatu słuchowego. 

Entry No. 175 
Entry typejournal paper 
AuthorsM. Kulesza, B. Kostek, P. Dalka, A. Czyżewski 
English titleContactless hearing aid for infants 
Polish titleBezkontaktowy aparat słuchowy dla niemowląt 
JournalArchives of Acoustics 
Volume31 
Number
Pages431 - 437 
AbstractIt is a well known fact that language development through home intervention for a hearing-impaired infant should start in the early months of a newborn baby's life. The aim of this paper is to present a concept of a contactless digital hearing aid designed especially for infants. In contrast to all typical wearable hearing aid solutions (ITC, ITE, BTE), the proposed device is mounted in the infant’s bed with any parts of its set-up contacting the infant’s body. A processed speech signal is emitted by low-power loudspeakers placed near the infant’s head. The hearing aid architecture employs a digital signal processor based on Texas Instruments technology. Since one of the main problems is the acoustic feedback between the microphone and the loudspeakers, the methods of its elimination are also briefly reviewed in this article. The first of the discussed methods employs an adaptive algorithm, the second alters the frequency response of the entire instrumentation through the use of notch filter banks, and the third incorporates a microphone array and beam-forming techniques. The paper also includes descriptions of some algorithmic solutions engineered by the authors in purpose to eliminate acoustic feedbacks. All the conclusions introduced in this article have been derived based on the simulations of an experimental contactless hearing aid set-up. 
StreszczeniePowszechnie wiadomo, iż korekcja wad słuchu niemowląt powinna się rozpoczynać już w pierwszych miesiącach życia dziecka. Pozwala to uniknąć zaburzenia rozwoju mowy dziecka. W publikcji przedstawiono koncepcję cyfrowego, bezkontaktowego aparatu słuchowego dla niemowląt. W przeciwieństwie do typowych aparatów słuchowych (noszonych za uchem lub wewnątrz kanału słuchowego), proponowane urządzenie umieszczane jest w łóżeczku dziecka i żaden jego element nie styka się z jego ciałem. Cyforowo przetworzony sygnał mowy emitowany jest przez miniaturowe głośniki umieszczone w okolicach głowy dziecka. Aparat zbudowany został w oparciu o procesor sygnałowy Texas Instruments. Jako że jednym z głównych problemów w takiej konfiguracji są pasożytnicze sprzężenia zwrotne w artykule przedstawiono metody ich eliminacji. Pierwsza z omawianych metod wykorzystuje algorytm adaptacyjny, druga natomiast bank filtrówe wycinających. Trzecia metoda wykorzystuje matryce mikrofonów oraz algorytm filtracji przestrzennej. Artykuł zawiera również opis rozwiązań związanych z eliminacją sprzęzeń proponowanych przez autorów. Wnioski z badań wyciągnięto na podstawie przeprowadzonych eksperymentów. 

Entry No. 176 
Entry typejournal paper 
AuthorsM. Kulesza, G. Szwoch, Ł. Litwic, A. Czyżewski 
English titleHigh quality speech codec employing sines+noise+transients model 
Polish title 
JournalArchives of Acoustics 
Volume31 
Number
Pages356 - 356 
NotesStreszczenie 
AbstractA method of high quality wideband speech signal representation employing sines+transients+noise model is presented. The need for a wideband speech coding approach as well as various methods for analysis and synthesis of sines, residual and transient states of speech signal is discussed. The perceptual criterion is applied in the proposed approach during encoding of sines amplitudes in order to reduce bandwidth requirements and to preserve high quality of speech. Therefore, the psychoacoustic model devised for perceptual speech coding is presented. The experimental results reveal that method for tonality estimation employed in the psychoacoustic model has a significant impact on perceptual coding accuracy. Various methods for tonality estimation are presented and compared. 
StreszczenieW artykule przedstawiono szerokopasmową metodę kodowania sygnału mowy wysokiej jakości z wykorzystaniem reprezentacji sygnału w postaci sumy składników sinusoidlanych, szumowych oraz transjentów. Poddano dyskusji potrzebę szerokopasmowego kodowania sygnału mowy jak również różne metody ekstrakcji oraz syntezy składowych sinusoidalnych, szumowych oraz transjentów. W celu redukcji wymagań co do przepływności strumienia bitowego kryterium psychoakustyczne zostało wykorzystane do kodowania apmplitud składowych sinusoidalnych. Z tego powodu w artykule zaprezentowane model psychoakustyczny dla sygnału mowy. Wyniki eksperymentów wykazały, iż indeks tonalności wyznaczacny w modelu ma istotny wpływ na proces kodowania perceptualnego. Z tego powodu różne metody wyznaczania indeksu tonalności zostały zaprezentowane i porównane między sobą. 

Entry No. 177 
Entry typeconference paper 
AuthorsA. Ciarkowski, P. Żwan, G. Szwoch, A. Czyżewski 
English titleMultimedia Mobile Services for the Semantic Web 
Polish title 
Conference4th Conference on Information Technology  
Preprint 
Number 
Volume10 
Pages389 - 398 
Conference siteGdańsk, Polska 
Conference date21.5.2006- 24.5.2006 
AbstractThis document describes the methodology of creating semantically-enriched multimedia mobile services using tools and service enablers provided by the DeSyME project. A brief introduction to the Semantic Web is presented along with the explanation of its relation to the subject of Web Services. Next, the description of the DeSyME Framework is included. Finally, examples of multimedia mobile services developed at Gdańsk University of Technology are presented to illustrate possible utilities of described technologies. 

Entry No. 178 
Entry typeconference paper 
AuthorsA. Ciarkowski, A. Czyżewski 
English titleImplementing Multimedia Mobile Services with DESYME Framework 
Polish title 
Conference17th IEEE Conference on Personal, Indoor and Mobile Radio Communications 
Preprint 
Number 
Volume 
Pages 
Conference siteHelsinki, Finlandia 
Conference date11.9.2006- 14.9.2006 
NotesPozycja w druku 
AbstractMethodology of creating multimedia mobile services enriched with semantical description OWL attachment using DeSyME project tools is described. Introduction to the Semantic Web is presented and its relation to the subject of Web Services is explained. Also included is the description of the DeSyME Framework and tools. Real-life examples of multimedia mobile services developed at Gdańsk University of Technology are showcased as an illustration of described technologies’ applications 

Entry No. 179 
Entry typebook 
AuthorsB. Kostek, P. Dalka, A. Czyżewski 
English titleAudiovisual Speech Recognition for Training Hearing Impaired Patients 
Polish titleAutomatyczne rozpoznawanie mowy na potrzeby treningu osób z wadami słuchu 
EditorWorld Scientific 
Pages335 - 347 
Notesrozdział w książce zagranicznej Mathematical Methods in Scattering Theory And Biomedical Engineering: Proceedings of the Seventh International Workshop, D.I. Fotiadis, C., V. Massala, Eds. 
AbstractThis study presents isolated phoneme recognition system combining both visual and acoustical data. The Active Shape Model method is used for extracting visual speech features from the shape and movement of the lips. This method consists in a model-based approach for extracting speech information from image sequences. Its advantage over the image-based approach stems from the fact that important features are represented in a low-dimensional space and are normally invariant to translation, rotation, scaling and illumination. The Mel Frequency Cepstral Coefficients (MFCCs) are used as the acoustic speech features in the speech recognition system. MFCCs are based on the short-term spectrum. The power spectrum bins are grouped and smoothed according to the perceptually motivated Mel frequency scaling. Then the spectrum is segmented into critical bands. Finally, a discrete cosine transform is applied to the logarithm of the filter bank output signal resulting in vectors of decorrelated MFCCs features. A three-layer feed-forward artificial neural network (ANN) is used in the experiments related to speech recognition. Feature vectors extracted combine both modalities of the human speech. A matrix, containing feature vectors calculated during the utterance, forms an input to the ANN. To make the results of speech classification robust against the changes in the utterance duration, an interpolation is used to compute feature vectors. Additional experiments with the degraded acoustical information are carried out in order to test the system robustness against various distortions affecting the signals. The system engineered utilizing only the visual information correctly classifies properly nearly 80% of the speech utterances. This result is very satisfying taking into account a huge similarity between lip movements during articulation of vowels and a great diversity of lip shapes originating from the anatomical features and the way of speaking. Results of classification based on the acoustical information are much better than the ones based on the visual information. However, utilizing both modalities in the speech recognition system further improves the effectiveness. Moreover this makes the system much more robust against distortions in the audio signal. A software is prepared employing above mentioned algorithms to be used by cochlear implanted patients in the process of speech training. An interactive application was conceived making possible organizing the interactive speech training sessions without any assistance from speech therapists. This method consists in a model-based approach for extracting speech information from image sequences. Its advantage over the image-based approach stems from the fact that important features are represented in a low-dimensional space and are normally invariant to translation, rotation, scaling and illumination. MFCCs are based on the short-term spectrum. The power spectrum bins are grouped and smoothed according to the perceptually motivated Mel frequency scaling. Then the spectrum is segmented into critical bands. Finally, a discrete cosine transform is applied to the logarithm of the filter bank output signal resulting in vectors of decorrelated MFCCs features. A matrix, containing feature vectors calculated during the utterance, forms an input to the ANN. To make the results of speech classification robust against the changes in the utterance duration, an interpolation is used to compute feature vectors. Additional experiments with the degraded acoustical information are carried out in order to test the system robustness against various distortions affecting the signals. The system engineered utilizing only the visual information correctly classifies properly nearly 80% of the speech utterances. This result is very satisfying taking into account a huge similarity between lip movements during articulation of vowels and a great diversity of lip shapes originating from the anatomical features and the way of speaking. Results of classification based on the acoustical information are much better than the ones based on the visual information. However, utilizing both modalities in the speech recognition system further improves the effectiveness. Moreover this makes the system much more robust against distortions in the audio signal. A software is prepared employing above mentioned algorithms to be used by cochlear implanted patients in the process of speech training. An interactive application was conceived making possible organizing the interactive speech training sessions without any assistance from speech therapists. 
StreszczenieNiniejszy rozdział stanowi rozszerzenie referatu przedstawionego na konferencji 7th Mathematical Methods in Scattering Theory and Biomedical Engineering. Rozdział ten przedstawia system rozpoznawania izolowanych głosek mowy wykorzystujący dane wizualne i akustyczne. Modele Active Shape Models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na współczynnikach melcepstralnych. Sieć neuronowa została użyta do rozpoznawania wymawianych głosek na podstawie wektora cech zawierającego oba typy parametrów. Dodatkowo zbadano odporność systemu na zakłócenia w sygnale dźwiękowym.  

Entry No. 180 
Entry typejournal paper 
AuthorsA. Czyżewski, L. Litwic, M. Dziubiński, P. Maziewski 
English titleIntelligent Algorithms for Movie Sound Track Restoration  
Polish titleInteligentne algorytmy do rekonstruowania optycznych ścieżek dźwiękowych 
JournalLecture Notes in computer Science: Transaction on Rough Set V 
Volume
Number 
Pages123 - 145 
AbstractTwo algorithms for movie sound tracks restoration are discussed in the paper. The first algorithm is the unpredictability measure computation applied to the psychoacoustic model-based broadband noise attenuation. A learning decision algorithm, based on a neural network, is employed for determining useful audio signal components acting as maskers of the noisy spectral parts. An iterative method for calculating the sound masking pattern is presented. The second of presented algorithms is the routine for precise evaluation of parasite frequency modulations (wow) utilizing sinusoidal components extracted from the sound spectrum. The results obtained employing proposed intelligent signal processing algorithms, as well as the relationship between both routines, will be presented and discussed in the paper. 
StreszczenieW artykule przedstawiono dwa algorytmy do rekonstruowania optycznych ścieżek dźwiękowych. Pierwszy z nich jest zastosowaniem miary nieprzewidywalności do obliczeń parametrów modelu psychoakustycznego stosowanego do redukowania szumów. Drugi stanowi precyzyjną procedurę oceny pasożytniczej modulacji częstotliwości, opartej na analizie składowych harmonicznych. Wyniki zastosowania obu wymienionych algorytmów są zawarte w artykule. 

Entry No. 181 
Entry typejournal paper 
AuthorsA. Wieczorkowska, A. Czyżewski 
English titleRole of Various Parametres in Automatic Classification of Musical Instrument Sound 
Polish titleRola parametrów sygnału fonicznego w automatycznym rozpoznawaniu dźwięków instrumentów muzycznych 
JournalInternationa Transactions on Communication and Signal Processing (GESTS) 
Volume
Number
Pages146 - 159 
AbstractThis paper addresses the problem of automatic classification of musical instrument sounds, especially, how various sound parameters and their evolution in various sound stages contribute to the recognition process. The parameterized data represented singular sounds of musical scale of contemporary orchestral string instruments, woodwinds, and brass. The proposed parameterization methods are based on Fourier analysis and time domain of sounds, using feature vectors consisting of 14 and 62 parameters. Authors compare classifica-tion quality and discernibility of instruments on the basis of various sound fea-tures, observed at various stages of sound. The quality of the proposed parame-terizations have been tested using decision trees and rough set based algorithms.  
StreszczenieArtkuł dotyczy problemu automatycznej klasyfikacji dźwięków instrumentów muzycznych, w tym głównie wpływu indywidualnych parametrów na proces automatycznego rozpoznawania instrumentów. Parametryzacja wykorzystuje wdirmo Fourierowskie i analizę czasową dźwięków do formowania 14 i 62-parametrowych wektorów cech dystynktywnych. Autorzy porównują jakość rozpoznawania i rozróźnialność instrumentów. Przy ocenach tego typu stosowano drzewa decyzyjne i metodę zbiorów przybliżonych.  

Entry No. 182 
Entry typeconference paper 
AuthorsA. Czyżewski, E. Pływaczewski, Z. Rau, W. Ziółkowski 
English titlePolish Internal Security Platform, Pomeranian Special Economic Zone @ Gdansk Security Centre. Concept, organization and cooperation 
Polish titlePolska Platforma Bezpieczeństwa Wewnętrznego, Pomorska Specjalna Strefa Ekonomiczna i Gdańskie Centrum Technologii Bezpieczeństwa 
ConferenceTRANSIS 2006 
Preprint 
Number 
Volume 
Pages55 - 70 
Conference siteGdańsk, Polska 
Conference date6.10.2006 
AbstractFundamental issuses were presented with regards to the following initiatives related to security, namely: Polish Internal Security Platform, Pomeranian Special Economic Zone @ Gdansk Security Centre. Concept, organization and cooperation.  
StreszczeniePrzedstawiono informacje na temat szeregu incicjatyw związanych z bepieczeństwem obywateli i biznesu, takich jak: Polska Platforma Bezpieczeństwa Wewnętrznego, Pomorska Specjalna Strefa Ekonomiczna i Gdańskie Centrum Technologii Bezpieczeństwa.  

Entry No. 183 
Entry typebook 
AuthorsA. Czyżewski 
English titleApplications of Knowledge Technologies to Sound and Vision Engineering 
Polish titleZastosowania technologii wiedzy w inżynierii dźwięku i obrazu 
EditorSpringer-Verlag Lecture Notes in Computer Science 
Pages 
NotesVolume 4062/2006 (abstrakt) 
AbstractSound and Vision Engineering as an interdisciplinary branch of science should quickly assimilate new methods and new technologies. Meanwhile, there exist some advanced and well developed methods for analyzing and processing of data or signals that are only occasionally applied to this domain of science. These methods emerged from the artificial intelligence approach to image and signal processing problems. In the paper the intelligent algorithms, such as neural networks, fuzzy logic, genetic algorithm and the rough set method will be presented with regards to their applications to sound and vision engineering. The paper will include a practical demonstration of results achieved with intelligent algorithms applications to: bi-modal recognition of speech employing NN-PCA algorithm, perceptually-oriented noisy data processing methods, advanced sound acquisition, GA algorithm-based digital signal processing for telecommunication applications and others.  
StreszczenieSpecjalność Inżynieria Dźwięku i Obrazu jest ukierunkowana przede wszystkim na aplikacje praktyczne metod rejestracji i przetwarzania sygnałów fonicznych i wizyjnych we współczesnej telekomunikacji i w multimediach. W związku z tym, specjalność ta wykorzystuje również wiedzę z obszaru akustyki, psychofizjologii percepcji a także estetyki muzycznej. W zastosowaniach multimedialnej technologii informatycznej w telekomunikacji, w przesyłaniu i przetwarzaniu sygnałów a także w akustyce fonicznej, w technice rejestracji nagrań i w technologii studyjnejcoraz częściej pojawiają się inteligentne metody obliczeniowe. W referacie przedstawiowo zastosowania, takie jak: bi-modalne rozpoznawanie mowy, perceptualna redukcję szumów, algorytm genetyczny w zastosowaniu do eliminacji echa w torach telekomunikacyjnych i in.  

Entry No. 184 
Entry typeconference paper 
AuthorsA. Walkowiak, B. Kostek, A. Lorens, A. Czyżewski, A. Obrycka, A. Wąsowski 
English titleSimulation of electric hearing - influence of simulation parameters on quality of output signal 
Polish titleWpływ wybranych parametrów symulacji słuchu elektrycznego na jakość sygnału mowy 
ConferenceI Konferencja Audiologiczno-Foniatryczna 
Preprint 
Number 
Volume 
Pages98 
Conference siteWarszawa, Polska 
Conference date10.9.2006- 12.9.2006 
NotesAudiofonologia-Suplement, str. 98 
StreszczenieW środowisku programistycznym Matlab stworzono symulację słuchu elektrycznego pacjenta implantowanego. W symulacji zastosowano algorytm przetwarzania wykorzystywany w komercyjnych systemach implantów ślimakowych - CIS (Continuous Interleaved Sampling). W pracy zbadano wpływ ilości kanałów, jak i innych parametrów sygnałów wyjściowych przy zastosowaniu sygału mowy jako sygnału wejściowego symulacji. Słowa kluczowe: audiologia, implant ślimakowy, algorytmy przetwarzania 

Entry No. 185 
Entry typejournal paper 
AuthorsM. Kulesza, Ł. Litwic, G. Szwoch, A. Czyżewski 
English titleHigh Quality Speech Codec Employing Sines+Noise+Transients Model 
Polish titleKodek wysokiej jakości sygnału mowy wykorzystujący model sinusy+szum+transjenty 
JournalArchives of Acoustics 
Volume31 
Number
Pages183 - 188 
AbstractA method of high quality wideband speech signal representation employing sines+transients+noise model is presented. The need for a wideband speech coding approach as well as various methods for analysis and synthesis of sines, residual and transient states of speech signal is discussed. The perceptual criterion is applied in the proposed approach during encoding of sines amplitudes in order to reduce bandwidth requirements and to preserve high quality of speech. Therefore, the psychoacoustic model devised for perceptual speech coding is presented. The experimental results reveal that method for tonality estimation employed in the psychoacoustic model has a significant impact on perceptual coding accuracy. Various methods for tonality estimation are presented and compared. 
StreszczenieZaprezentowano metodę kodowania szerokopasmowego sygnału mowy wykorzystującą model sinusy+szum+transjenty. Potrzeba kodowania szerokopasmowego sygnału mowy jak również różne metody analizy i syntezy komponentów sinusoidalnych, szumowych oraz transjentów zostały poddane dyskusji. W celu redukcji przepływności bitowej w procesie kodowania amplitud komponentów sinusoidalnych zastosowano kryterium psychoakustyczne. Z tego powodu w artykule przedstawiono model psychoakustyczny do zastosowania w kodowaniu sygnału mowy. Wyniki eksperymentów wskazują, iż metoda wyznaczania tonalności komponentów widma ma istotny wpływ na jakość kodowania perceptualnego. Różne metody określania tonalności komponentów widma zostały przedstawione i porównane.  

Entry No. 186 
Entry typeconference paper 
AuthorsA. Czyżewski 
English titleApplications of Knowledge Technologies to Sound and Vision Engineering 
Polish titleZastosowanie technologii opartych na wiedzy w inżynierii dźwięku i obrazu 
ConferenceRough Sets and Knowledge Technology 
Preprint 
Number 
Volume 
Pages 
Conference siteChongquing, Chiny 
Conference date24.7.2006- 26.7.2006 
Notesreferat plenarny - na zaproszenie organizatorów konferencji 
AbstractSound and Vision Engineering as an interdisciplinary branch of science should quickly assimilate new methods and new technologies. Meanwhile, there exist some advanced and well developed methods for analyzing and processing of data or signals that are only occasionally applied to this domain of science. These methods emerged from the artificial intelligence approach to image and signal processing problems. In the paper the intelligent algorithms, such as neural networks, fuzzy logic, genetic algorithm and the rough set method will be presented with regards to their applications to sound and vision engineering. The paper will include a practical demonstration of results achieved with intelligent algorithms applications to: bi-modal recognition of speech employing NN-PCA algorithm, perceptually-oriented noisy data processing methods, advanced sound acquisition, GA algorithm-based digital signal processing for telecommunication applications and others. 
StreszczenieInżynieria dźwięku i obrazu jako interdyscyplinarna dziedzina nauki i techniki szybko asymiluje nowe metody i technologie. W referacie zaprezentowano wyniki szeregu prac badawczych i eksperymentów naukowych z tej dziedziny, uzyskanych z zastosowaniem metod obliczeniowych, takich jak inteligencja obliczeniowa i soft computing. Słowa kluczowe: inzynieria dźwieku i obrazu; inżynieria wiedzy; metody inteligentne 

Entry No. 187 
Entry typeconference paper 
AuthorsA. Czyżewski, Ł. Litwic, P. Maziewski 
English titleComputational Intelligence Approach to Archival Musical Recordings 
Polish titlePodejście oparte na inteligencji obliczeniowej do zagadnień archiwizacji nagrań muzycznych 
Conference4th Joint Meeting of the Acoustical Society of America 
Preprint 
Number 
Volume 
Pages 
Conference siteHonolulu, HI, USA 
Conference date28.11.2006- 2.12.2006 
AbstractAn algorithmic approach to wow defect estimation in archival musical recordings is presented. The wow estimation is based on the simultaneous analysis of many sinusoidal components, which are assumed to depict the defect. The rough determination of sinusoidal components in analysed musical recording is performed by standard sinusoidal modeling procedures employing magnitude and phase spectra analysis. Since archival recordings tend to contain distorted tonal structure the basic sinusoidal modeling approach is often found insufficient resulting in audible distortions in the restored signal. It is found that the standard sinusoidal modeling approach is prone to errors especially when strong frequency or amplitude variations of sinusoidal components occur. It may result in gaps or inappropriately matched components leading to incorrect estimation of the wow distortion. Hence, some refinements to sinusoidal component analysis including interpolation and extrapolation of tonal components are proposed. As it was demonstrated in experiments, due to nonlinear nature of wow distortion, the enhancement of sinusoidal analysis can be performed by means of a neural network. The paper demonstrates implemented algorithms for parasite frequency modulation in archival recordings together with obtained results. The work was supported by the Commission of the European Communities, within the Integrated Project No. FP6-507336: “PRESTOSPACE”.  
StreszczeniePrzedstawiono algorytmy estymacji zakłóceń polegających na kołysaniu dźwięku w nagraniach. W szczególności dyskutowane podejście polega na równoczesnej analizie komponentów harmonicznych. Wykazano, że zastosowanie sieci neuronowej może poprawić efektywność działania algorytmu opartego na analizie wielu składowych harmonicznych dźwięku obarczonego pasożytniczą modulacją czestotliwościową. Słowa kluczowe: rekonstruowanie nagrań; pasożytnicze modulacje; kołysanie dźwięku 

Entry No. 188 
Entry typeconference paper 
AuthorsA. Czyżewski, H. Skarżyński, B. Kostek 
English title"I Can Hear" - a system for universal hearing screening 
Polish title"Słyszę..." - system badań przesiewowych słuchu 
ConferenceInter Noise 2006. The 35th International Congress and Exposition on Noise Control Engineering 
Preprint 
Number 
Volume 
Pages 
Conference siteHonolulu, USA 
Conference date3.12.2006- 6.12.2006 
AbstractHearing impairment is one of the fastest growing diseases of modern society. This kind of impairment is often introduced by excessive noise. Therefore it is important to organise mass scale screening tests to identify people suffering from this kind of impairment. "I Can Hear…" provides a Web-based test that uses automatic questionnaire analysis, audiometric tone test procedures, and assesses speech intelligibility in noise. When all the testing is completed, "I Can Hear…" automatically analyses the results for each person examined. Based on the number of incorrect answers, the decision is made automatically by the expert system: does the person have normal hearing or does he or she have hearing problems and require to be examined in one of the consulting centres. Those whose hearing impairment is confirmed will be referred to treatment.  
StreszczenieSystem "Słyszę..." jest usługą dostępną w Internecie, która służy do prowadzenia przesiewowych badań słuchu. Wykorzystywane są trzy rodzaje badań: ankieta eleketroniczna, testy audiometryczne i testy zrozumiałości mowy w szumie. W wyniku analizy odpowiedz pacjentów, system ekspercki podejmuje decyzję o zakwalifikowaniu badanej osoby do grupy osób nie mających problemów ze słuchem lub do grupy osób cierpiących na niedosłuch. Słowa kluczowe: badanie słuchu; audiometria 

Entry No. 189 
Entry typeconference paper 
AuthorsP. Dalka, A. Czyżewski 
English titleSpeech recognition based on visual features applicable in the logopedics. 
Polish titleRozpoznawanie mowy z wykorzystaniem cech wizualnych do zastosowań w terapii logopedycznej 
ConferenceKonferencja Fundacji na rzecz Nauki Polskiej "Nauki techniczne jako źródło innowacji?" 
Preprint 
Number 
Volume 
Pages 
Conference siteWrocław, Polska 
Conference date19.5.2006- 20.5.2006 
Notesplakat 
StreszczenieIstniejące systemy rozpoznawania mowy bazują z reguły na informacji akustycznej. Z tego względu są bardzo wrażliwe na szumy otoczenia i często zawodzą w przypadku, gdy wiele osób mówi jednocześnie. W procesie percepcji mowy ludzie podświadomie wykorzystują informacje wizualne pochodzące bezpośrednio od mówcy, takie jak ruchy ust, pozycja języka i widoczność zębów. Celem prowadzonych badań jest stworzenie systemu pomocnego w terapii logopedycznej osób z wadami słuchu. 

Entry No. 190 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, K. Kochanek, H. Skarżyński 
English titleDithering Strategy Applied to Tinnitus Masking 
Polish titleNowe podejście do maskowania szumów usznych 
Conference120th Audio Eng. Society Convention 
Preprint6856 
Number 
Volume 
Pages1 - 8 
Conference siteParis, Francja 
Conference date20.5.2006- 23.5.2006 
NotesJ. Audio Eng. Soc., vol. 54, 7/8, 738-739  
AbstractThe hypothesis on the existence of a parasitic quantization, that accompanies hearing loss has been formulated in this work, and then related to other existing theories on causes of Tinnitus. Some preliminary experiments have been carried out, that targeted at verifying the correctness of the proposed interpretation of applied maskers employing dither theory. An effective method of providing a masking signal that uses bone conductivity was derived for the purpose of these experiments. The results of the experiments initially confirm the analogy between the threshold phenomena occurring in the digital audio circuits and ear noises origin. The presented results may induce the elaboration of more effective ear therapies based on high-frequency dither having specially formed spectral characteristics. 
StreszczenieW referacie przedstawiono teorię wyjaśniającą zjawisko szumów usznych na gruncie akustyki, elektroniki i telekomunikacji. Spostrzeżenie, że słuch jest w istocie akustycznym układem transmisyjnym, skłania do poszukiwania interpretacji powstawania szumów usznych w ogólnej teorii spontanicznego generowania szumu w układach transmisyjnych. Sformułowana hipoteza wskazuje na istnienie pasożytniczej kwantyzacji, która pojawia się w sytuacji wystąpienia ubytku słuchu, dlatego została ona powiązana z teoriami, dotyczącymi przyczyn powstawiania szumów usznych. W ramach prac badawczych zostały przeprowadzone wstępne badania, mające na celu weryfikację zasadności zaproponowanej interpretacji sposobu działania maskera. Dla celów realizacji eksperymentów została opracowana skuteczna metoda podawania sygnału maskującego z wykorzystaniem kostnego przewodnictwa dźwięku. Wyniki przeprowadzonych badań potwierdzają występowanie analogii pomiędzy zjawiskami progowymi, które występują w elektronicznych układach transmisji sygnałów fonicznych z kwantyzacją i zjawiskami związanymi ze slyszeniem i powstawaniem szumów usznych, co może prowadzić do stworzenia bardziej skutecznych metod terapii. Słowa kluczowe: audiologia, szumy uszne, ultradźwięki, audiometria, słuch, efekt maskowania, dither, pasożytnicza kwantyzacja, układ transmisyjny 

Entry No. 191 
Entry typeconference paper 
AuthorsP. Maziewski, Ł. Litwic, A. Czyżewski 
English titleAccidental Wow Evaluation Based on Sinusoidal Modeling and Neural Nets Prediction 
Polish titleOkreślenie Przebiegu Przypadkowych Zniekształceń Kołysania przy Wykorzystaniu Modelowania Sinusoidalnego i Predykcji Sieciami Neuronowymi 
Conference120 Konferencja AES 
Preprint6769 
Number 
Volume 
Pages 
Conference siteParyż, Francja 
Conference date20.5.2006- 23.5.2006 
Notesabstrakt w J. Audio Eng. Soc., vol. 54, 7/8, 709 
AbstractIn this paper an algorithmic approach to the wow defect characteristic evaluation is presented. The approach is based on a sinusoidal analysis comprising both amplitude and phase spectra processing. The frequency trajectories depicting the distortion are built on a basis of amplitude, frequency and phase dependencies and are further used for wow characteristic evaluation. Additionally the experiments concerning the neural-network-based prediction applied to the characteristic are performed. The obtained results are compared to linear-prediction. 
StreszczenieReferat przedstawia opis algorytmu do określenia charakterystyki zniekształcenia kołysania dźwięku. Prezentowane podejście wykorzystuje sinusoidalną analizę dźwięku bazującą zarówno na amplitudowym jak i fazowym widmie sygnału fonicznego. Trajektorie poszczególnych składowych tonalnych, obrazujące zniekształcenie kołysania, określane są na podstawie analizy ich chwilowych amplitud, częstotliwości i faz. Dodatkowo referat przedstawia wyniki eksperymentów w których wykorzystano sieci neuronowe do predykcji przebiegu charakterystyki zniekształcenia. Otrzymane w ten sposób wyniki porównane są z liniową predykcją.  

Entry No. 192 
Entry typejournal paper 
AuthorsG. Szwoch, M. Kulesza, A. Czyżewski 
English titleTransient Detection for Speech Coding Applications 
Polish titleAlgorytm detekcji transjentów do zastosowania w aplikacjach kodowania sygnału mowy 
JournalInternational Journal of Computer Science and Network Security 
Volume
Number12 
Pages320 - 325 
AbstractSignal quality in speech codecs may be improved by selecting transients from speech signal and encoding them using a suitable method. This paper presents an algorithm for transient detection in speech signal. This algorithm operates in several frequency bands. Transient detection functions are calculated from energy measured in short frames of the signal. The final selection of transient frames is based on results of detection in all frequency bands. Performance of the algorithm is evaluated and some enhancements are proposed. The algorithm described here allows for accurate transient detection in speech and is suitable for use in practical speech coding applications 
StreszczeniePoprawa jakości kodowania sygnału mowy jest możliwa dzięku ekstrakcji fragmentów zawierających transjenty i odpowiednie ich kodowanie. W artykule przedstawiono algorytm detekcji transjentow, który bazuje na analizie sygnału mowy w kilku podpasmach. Funkcje detekcji transjentów w poszczególnych pasmach uzyskiwane są poprzez analizę wahań energi w poszczególnych podpasmach. Ostateczna klasyfikacja następuje z uwzględnieniem wyników detekcji w podpasmach. Przetestowano efektywność algorytmu jak również zaproponowano pewne jego usprawnienia. Opisany algorytm pozwala na detekcję transjentów w sygnale mowy i może być wykorzystany w aplikacjach kodowania sygnału mowy. 

Entry No. 193 
Entry typeconference paper 
AuthorsA. Ciarkowski, P. Mroczkiewicz, A. Czyżewski 
English titleDistributed Multimedia Processing in Mobile Networks using Semantically-enriched Web Services 
Polish title 
Conference5th International Conference on Multimedia & Network Information Systems MISSI 
Preprint 
Number 
Volume 
Pages 
Conference siteWrocław, Polska 
Conference date21.9.2006- 22.9.2006 
NotesDane preprintu zostaną uzupełnione 
AbstractThis paper introduces the concept of distributed multimedia processing services within mobile networks as a mean to overcome hardware limitations of portable devices. A brief introduction to the DeSyME Project - an important element in presented service architecture - is included. The semantic layer provided by The DeSyME is described. Finally, practical examples of Multimedia Mobile Services realized within the portrayed architecture are presented. 

Entry No. 194 
Entry typeconference paper 
AuthorsB. Kostek, J. Kotus, A. Czyżewski 
English titleNoise Threat Impact on Hearing in Schools and Students' Music Clubs 
Polish titleBadania zagrożeń hałasowych i ich wpływu na słuch w szkołach i klubach studenckich 
ConferenceInter-Noise 2006 
Preprint 
Number 
Volume 
Pages 
Conference siteHonolulu, Hawaii, USA 
Conference date3.12.2006- 6.12.2006 
AbstractThe study aimed at showing results of a survey on noise threat which was conducted in schools and students' music clubs. The measurements of the acoustic climate employed engineered telemetry stations for continuous noise monitoring. At the same time, physiological effects of noise were measured among pupils and students. Hearing tests were performed twice, before and after noise exposure. For this purpose otoacoustic emission method (DPOAE) was utilized. The obtained results of the noise measurements revealed that an unfavorable noise climate was found in the examined schools and music clubs. This was also confirmed by the subjective examination results. The noise dose analysis taking into consideration an average time spent by pupils in schools was also performed. It revealed that noise at schools didn't constitute a risk for hearing system of the pupils, however it may be considered as an essential source of annoyance. On the other hand, noise in music clubs surpassed all permitted noise limits, thus could be treated as dangerous to hearing. Hearing tests conducted revealed changes in cochlea activity of students' examined, also Tinnitus effect was experienced temporarily. New noise annoyance & noise threat criteria were proposed and verified based on the acquired and analyzed data. 
StreszczenieW referacie przedstawiono wyniki badań zagrożeń hałasowych w szkołach i muzycznych klubach studenckich. Pomiary klimatu akustycznego przeprowadzono za pomocą opracowanej, telemetrycznej stacji do ciągłego monitorowania hałasu oraz w formie ankiet. Badania słuchu przeprowadzono dwukrotnie, przed i po ekspozycji na hałas. Wykorzystano metodę otoemisji akustycznych produktów nieliniowych ślimaka (DPOAE). W czasie ekspozycji na hałas mierzono również subiektywne efekty psychologiczne wśród uczniów i studentów. Uzyskane wyniki pomiarów hałasu ujawniły niesprzyjający klimat akustyczny, który występował w szkołach i klubach. Wyniki badań obiektywnych zestawiono z subiektywnymi wynikami uzyskanymi za pomocą ankiet. Przedstawiono również analizę dozymetryczną z uwzględnieniem średniego czas przebywania uczniów w szkole oraz studentów w klubach. Uzyskane wyniki wykazały, że hałas w rozpatrywanych szkołach nie stanowi zagrożenia dla słuchu uczniów, jednak może być uznany za istotne źródło uciążliwości. Z kolei hałas panujący w klubach znacznie przekraczał poziomy dopuszczalne, może zatem stanowić zagrożenie dla słuchu. Uzyskane wyniki pomiarów słuchu wykazały istotne zmiany w aktywności ślimaka u badanych studentów. Dodatkowo osoby badane sygnalizowały wystąpienie czasowego szumu usznego (Tinnitus) w następstwie ekspozycji na hałas. Zaproponowano nowe kryteria oceny uciążliwości i zagrożenia hałasem, a także zweryfikowano je w oparciu o uzyskane wyniki pomiarów. 

Entry No. 195 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, J. Kotus, M. Szczodrak, P. Dalka 
English titleMultimedia Noise Monitoring System  
Polish titleMultimedialny System Monitorowania Hałasu 
Conference56 Brussels Eureka 2007 
Preprint 
Number 
Volume 
Pages34 - 35 
Conference siteBruksela, Belgia 
Conference date23.11.2007- 27.11.2007 
AbstractA concept and an implementation of the Multimedia Noise Monitoring System (MNMS) is presented in the application. Nowadays, environmental pollution caused by noise is extremely high, especially in cities and rises systematically. Because of the wide range of noxious effects of noise on a human organism, noise level monitoring is very important. The system developed constitutes a significant improvement in the domain of continuous monitoring of noise and accelerates the process of city acoustical map creation. The principal aim of the project is to improve the effectiveness of prophylaxis of hearing diseases. It allows to receive, store, analyze and visualize noise data coming from noise measurement equipments and from electronic questionnaires accessible through the Internet. The MNMS has a functionality to determine the noise emission level for selected kinds of noise sources (for road and rail noise sources). Moreover, the MNMS contains a new kind of the authors’ concept of the psychoacoustic noise dosimetry. The designed noise dosimeter enables asessing temporary threshold shift (TTS) during noise exposure. In this way it is possible to monitor the hearing threshold shift continuously for people who stay in the harmful noise conditions. 
StreszczenieW zgłoszeniu przedstawiono Multimedialny System Monitorowania Hałasu (MSMH). Projekt jest internetowym serwisem poświęconym monitorowaniu zagrożeń hałasem. Współcześnie zanieczyszczenie hałasem, szczególnie w miastach, jest niezwykle wysokie i wciąż systematycznie wzrasta. Ze względu na szeroki zakres niekorzystnego oddziaływania hałasu na organizm człowieka bardzo istotne jest monitorowanie poziomu hałasu. Opracowany system stanowi istotny krok w dziedzinie usprawniania ciągłego pomiaru hałasu i znacząco przyspiesza proces tworzenia map akustycznych miast. Jego nadrzędnym celem jest zwiększenie skuteczności w zakresie profilaktyki chorób słuchu. Umożliwia pobieranie, gromadzenie, analizę i wizualizację danych dotyczących hałasu, pobieranych ze zdalnych urządzeń pomiarowych oraz elektronicznych ankiet dostępnych przez Internet. MSMH posiada funkcjonalność umożliwiającą określanie poziomów emisyjnych wybranych rodzajów źródeł hałasu (źródło hałasu drogowego i kolejowego). Ponadto MSMH zawiera autorską koncepcję psychoakustycznego dozymetru hałasowego. Dozymetr ten umożliwia wyznaczenie czasowego przesunięcia progu słyszenia podczas trwania ekspozycji na hałas. Możliwe jest dzięki temu ciągłe monitorowanie progu słyszenia osób przebywających w warunkach szkodliwego oddziaływania hałasu. 

Entry No. 196 
Entry typeconference paper 
AuthorsM. Kulesza, A. Czyżewski 
English titleSpeech codec enhancements utlizing time compression and perectual coding 
Polish titleMetody poprawy jakości kodowania sygnału mowy z wykorzystaniem techniki kompresji czasowej oraz kodowania perceptualnego 
Conference122nd Audio Engineering Society 
Preprint7004 
Number 
Volume 
Pages1 - 14 
Conference siteWiedeń, Austria 
Conference date5.5.2007- 8.5.2007 
AbstractA method for encoding wideband speech signal employing standardized narrowband speech codecs is presented as well as experimental results concerning detection of tonal spectral components. The speech signal sampled with a higher sampling rate than it is suitable for narrowband coding algorithm is compressed in order to decrease the amount of samples. Next, the time-compressed representation of a signal is encoded using a narrowband speech codec. The time expansion procedure is applied to the speech signal after transmission and decoding in order to restore original time relations. Finally, the wideband speech signal is presented to the user. The method for spectral envelope estimation involving perceptual criteria is described. The algorithms for tonal components detection were evaluated and compared during experiments carried-out. 
StreszczenieMetoda kodowania szerokopasmowego sygnału mowy z wykorzystaniem ustandaryzwanych algorytmów wąskopasmowych jak również wyniki eksperymentów dotyczących nowego algorytmu detekcji komponentów tonalnych widma. Sygnał mowy próbkowany z wyższą częstotliwością próbkowania niż to jest przyjęte w przypadku stardowych kodeków owy poddawany jest kompresji czasowej w celu zmniejszenia ilości próbek. Nastepnie jest on kodowany i transmitowany. W odbiorniku przeprowadzana jest ekspansja czasowa sygnału po jego zdekodowaniu i sygnał mowy jest prezentowany rozmówcy. Omowiono również metodę do detekcji obwiedni widma wykorzystującą kryteria psychoakustyczne. Przedstawiono wyniki badań związanych z nowę metodą detekcji komponentów tonalnych widma.  

Entry No. 197 
Entry typeconference paper 
AuthorsA. Czyżewski, P. Dalka, M. Kulesza, Ł. Kosikowski, B. Kostek, P. Suchomski 
English titleContactless Hearing Aid 
Polish titleBezkontaktowy aparat słuchowy 
ConferenceTechnicon 
Preprint 
Number 
Volume 
Pages 
Conference siteGdańsk, Polska 
Conference date23.10.2007- 25.10.2007 
Notesplakat 
AbstractIt is essential to correct the infants hearing loss as soon as possible in order to prevent disturbing of speech development process. Commonly used hearing aids weared in ear canal are not suitable for infants. The novel approach to corection of hearing loss for infants in first months of life is presented. None part of the device contact the infants body. 
StreszczenieKorekcję wady słuchu niemowlęcia należy rozpocząć jak najwcześniej w celu umożliwienia prawidłowego rozwoju ośrodka mowy. Typowe rozwiązania aparatów montowanych za uchem bądź w kanale usznym dziecka nie najlepiej nadają się do terapii niemowląt (duże rozmiary, zakłócenie wzrostu i rozwoju ucha zewnętrznego i kanału słuchowego). Zaprezentowano aparat dla niemowląt, który nie wymaga kontaktu z ciałem i może wspomóc rozwój dziecka w pierwszych miesiącach życia. 

Entry No. 198 
Entry typeconference paper 
AuthorsA. Czyżewski, P. Odya, Ł. Kosikowski, P. Szczuko, A. Szkiełkowska 
English titleNew Generation Aids for Laryngectomy Patients 
Polish titleNowe pomoce elektroniczne dla osób po laryngektomii 
ConferenceII Konferencja Audiologiczno-Foniatryczna 
Preprint 
Number 
Volume 
Pages 
Conference siteBiałystok, Polska 
Conference date6.9.2007- 9.9.2007 
Notesplakat 
AbstractThe artificial larynx has many disadvantages. The produced speech is monotonous and sounds artificially. In addition, produced speech intelligibility is usually poor. The major problem is a background noise caused by the device. In fact, the artificial larynx is only a simple vibrator, a construction of which has been almost unchanged since the 1950s. The aim of the presented project is to design a new generation of devices for laryngectomy patients. There are two different approaches to solve this task. The first one focuses on the artificial larynx. Some major improvements in the construction of the device might be easily introduced. Hence, the artificial larynx engineered was equipped with a digital processor and an amplifier. The spectral subtraction algorithm for noise reduction was used. In this method, an average signal spectrum and average noise spectrum are estimated and subtracted from each other, thus average signal-to-noise ratio SNR is improved. The main problem to be solved was that both the noise and the speech signal have the same excitation source and consequently are strongly correlated for voiced sounds. The second approach uses a PDA portable digital assistant to generate synthetic speech. The proposed new generation devices helping laryngectomy patients are presented in the paper.  
StreszczenieCelem badań opisanych w pracy było opracowanie urządzeń nowej generacji dla osób laryngektomowanych. Typowa sztuczna krtań ma wiele wad. Najpoważniejszym problemem jest warkot generowany przez urządzenie. Zaproponowane zostały dwa rozwiązania majace na celu wyeliminowania tego problemu. Pierwsze skupia się na zmianach w konstrukcji sztucznej krtani. Opracowane urządzenie zostało dodatkowo wyposażone w cyfrowy procesor i wzmacniacz. W celu redukcji zakłóceń wykorzystano dwa algorytmy: odejmowanie widmowe i filtrację grzebieniową. Drugie rozwiązanie bazuje na komputerze typu PDA służącym do generowania mowy. Wykorzystano algorytmy syntezy mowy, co pozwala na odtwarzanie dowolnych wypowiedzi.  

Entry No. 199 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, Ł. Kosikowski 
English titleVirtual hearing aid – a computer application for simulating hearing aids performance 
Polish titleWirtualna proteza słuchu – komputerowa aplikacja do symulacji działania protez słuchu 
Conference122nd Convention 
Preprint 
Number 
Volume 
Pages 
Conference siteWiedeń, Austria 
Conference date5.5.2007- 8.5.2007 
AbstractThe virtual hearing aid is a computer application allowing an approximate simulation of hearing aid performance. The computer application implements algorithms simulating band-pass filters, compressors and also the perceptual masking strategies for audio signal processing. Individual persons' hearing characteristics were taken into account for this purpose. The experimental part comprises verification of engineered algorithms implemented to virtual hearing prosthesis. The paper contains also results of examinations of patients aimed at verifying the applicability of the proposed signal processing strategy to the domain of hearing prosthesis. 
StreszczenieWirtualna proteza słuchu to komputerowa aplikacja umożliwiająca symulację działania protezy słuchu. Aplikacja zawiera algorytmy filtracji pasmowej, kompresji dynamiki, a także koncepcje maskowania perceptualnego. W wirtualnej protezie słuchu wykorzystano rzeczywiste charakterystyki słyszenia wybranych osób. W części eksperymentalnej przedstawiono weryfikację zaproponowanych algorytmów. W referacie zamieszczono także wyniki badań pacjentów przerowadzone w celu sprawdzenia zaproponowanej strategii cyfrowego przetwarzania sygnałów do zastosowań w protezach słuchu. 

Entry No. 200 
Entry typejournal paper 
AuthorsA. Czyżewski, P. Dalka 
English titleVisual Traffic Noise Monitoring in Urban Areas 
Polish titleWizyjny monitoring halasu drogowego w aglomeracjach miejskich 
JournalInternational Journal of Multimedia and Ubiquitous Engineering 
Volume
Number
Pages91 - 101 
AbstractThe paper presents an advanced system for railway and road traffic noise monitoring in metropolitan areas. This system is a functional part of a more complex solution designed for environmental monitoring in cities utilizing analyses of sound, vision and air pollution, based on a ubiquitous computing approach. The system consists of many autonomous, universal measuring units and a multimedia server, which gathers, processes and presents data obtained from the distributed measuring units. The results are visualized on numerical maps. The paper contains a functional and technical description of the monitoring system. It describes also the algorithm for moving vehicle detection in video sequences based on a pixel-level difference among the image frames and a continually updated background model utilizing mixtures of Gaussians. The experiments carried out involve the implemented algorithm to the detection of vehicles in the recorded video sequences. The results obtained are illustrated with some examples and discussed. 
StreszczenieArtykuł prezentuje zaawansowany system do monitorowania hałasu drogowego i kolejowego w obszarach miejskich. System ten stanowi część funkcjonalną większego rozwiązania przeznaczonego do monitorowania środowiska w miastach, obejmującego analizę dźwięku, obrazu i zanieczyszczenia środowiska i bazującego na wszechobecnym podejściu komputerowym. System składa się z wielu autonomicznych, uniwersalnych jednostek pomiarowych i serwera multimedialnego, który zbiera, przetwarza i prezentuje dane otrzymane z rozproszonych jednostek pomiarowych. Wyniki wizualizowane są na mapach numerycznych. Artykuł zawiera opis funkcjonalny i techniczny systemu monitorującego. Zawiera także opis algorytmu do detekcji ruchomych pojazdów w strumieniach wizyjnych, który bazuje na pikselowej różnicy pomiędzy ramkami obrazu a stale uaktualnianym modelu tła wykorzystującym sumę ważonych rozkładów normalnych. Przeprowadzone eksperymenty obejmują wykorzystanie zaimplementowanego algorytmu do detekcji pojazdów w nagraniach wizyjnych. Uzyskane wyniki są omówione i zilustrowane na przykładach. 

Entry No. 201 
Entry typeconference paper 
AuthorsA. Czyżewski, P. Dalka, M. Kulesza, Ł. Kosikowski, B. Kostek, P. Suchomski 
English titleContactless Hearing Aid 
Polish titleBezkontaktowy aparat słuchowy 
ConferenceZ okazji Międzynarodowego Dnia Niesłyszących 
Preprint 
Number 
Volume 
Pages 
Conference siteWarszawa, Polska 
Conference date28.9.2007- 28.9.2007 
Notesplakat 
AbstractIt is essential to correct the infants hearing loss as soon as possible in order to prevent disturbing of speech development process. Commonly used hearing aids weared in ear canal are not suitable for infants. The novel approach to corection of hearing loss for infants in first months of life is presented. None part of the device contact the infants body.  
StreszczenieKorekcję wady słuchu niemowlęcia należy rozpocząć jak najwcześniej w celu umożliwienia prawidłowego rozwoju ośrodka mowy. Typowe rozwiązania aparatów montowanych za uchem bądź w kanale usznym dziecka nie najlepiej nadają się do terapii niemowląt (duże rozmiary, zakłócenie wzrostu i rozwoju ucha zewnętrznego i kanału słuchowego). Zaprezentowano aparat dla niemowląt, który nie wymaga kontaktu z ciałem i może wspomóc rozwój dziecka w pierwszych miesiącach życia.  

Entry No. 202 
Entry typebook 
AuthorsA. Czyżewski, P. Dalka 
English titleData Acquisition And Processing For Diagnostics Of Urban Environment Utilizing Teleinformation Technology 
Polish titleTeleinformatyczna akwizycja i przetwarzanie danych dla potrzeb diagnostyki środowiska aglomeracji miejskich 
EditorPomorskie Wydawnictwo Naukowo-Techniczne 
Pages241 - 256 
NotesRozdzial 14 w książce "Inteligentne wydobywanie informacji w celach diagnostycznych" 
AbstractThe article presents the idea of a complex system for road traffic monitoring in urban areas. This system is a functional part of the more complex solution designed for environment monitoring in cities. The system consists of many autonomous, universal monitoring stations and the server, which gathers, processes and presents data obtained from the monitoring stations. Results are visualized with the use of numerical maps. The article contains also a functional and technical description of the monitoring system. It also describes the algorithm for moving vehicle detection in video sequences. The algorithm is based on a pixel-level difference among the image frames and a continually updated background model utilizing mixtures of Gaussians. The experiments carried out involve the implemented algorithm to detect vehicles in the recorded video sequences. The results obtained are illustrated and discussed. 
StreszczenieRozdział przedstawia koncepcję aktualnie opracowywanego systemu służącego do monitorowania hałasu i ruchu drogowego w aglomeracjach miejskich, stanowiącego funkcjonalną część szerszego rozwiązania dotyczącego monitorowania środowiska w miastach. System taki składa się z rozmieszczonych w mieście autonomicznych i uniwersalnych stacji monitorujących oraz serwera gromadzącego, przetwarzającego i prezentującego wyniki z wykorzystaniem map numerycznych. W rozdziale przedstawiono opis techniczny i funkcjonalny opracowywanego systemu. Zaprezentowano również i zbadano algorytm wydobywania cech obrazu poruszających się pojazdów w nagraniach wizyjnych. Wykrywanie pojazdów odbywa się poprzez porównanie bieżącej ramki obrazu z modelem tła tworzonym w oparciu o sumę ważonych funkcji Gaussowskich. Przeprowadzone eksperymenty obejmują wykorzystanie algorytmu do detekcji pojazdów w nagraniach wideo. Uzyskane wyniki zilustrowano na przykładach. 

Entry No. 203 
Entry typejournal paper 
AuthorsA. Czyżewski, A. Ciarkowski, A. Kaczmarek, J. Kotus, M. Kulesza, P. Maziewski 
English titleDSP Techniques for Determining "Wow" Distortions 
Polish titleTechniki CPS do określania charakterystyki kołysania dźwięku 
JournalJ. Audio Eng. Soc. 
Volume55 
Number
Pages266 - 284 
AbstractAlgorithms for determining the wow distortion characteristic are proposed. These are the power-line-hum tracking algorithm, the high-frequency-bias tracking algorithm, and the algorithm based on an adaptive analysis of the center of gravity of the spectrum of the distorted signal. All of the algorithms presented allow a hardware- or software-based implementation. 
StreszczenieArtykuł przedstawia opis algorytmów do wyznaczania charakterystyki zniekształceń kołysania dźwięku. Są to algorytmy: śledzenia przydźwięku sieciowego, śledzenia pozostałości magnetycznej prądu podkładu wielkich częstotliwości, adaptacyjnej analizy środka ciężkości widma dla wybranej części zniekształconego sygnału. Przedstawione algorytmy pozwalają na implementację programową i sprzętową. 

Entry No. 204 
Entry typejournal paper 
AuthorsA. Czyżewski, J. Kotus, B. Kostek 
English titleDETERMINING THE NOISE IMPACT ON HEARING USING PSYCHOACOUSTICAL NOISE DOSIMETER 
Polish titleOkreślenie wpływu hałasu na słuch przy użyciu psychoakustycznego dozymetru hałasowego 
JournalArchives of Acoustics 
Volume32 
Number
Pages203 - 217 
AbstractThis research study presents the designed noise dosimeter based on psychoacoustical properties of the human hearing system and, at the same time, evaluation of time and frequency characteristics of noise. The designed noise dosimeter enables assessing temporary threshold shift (TTS) in critical bands in real time. In this way it is possible monitoring the hearing threshold shift continuously for people who stay in the harmful noise conditions. Moreover, the psychoacoustical noise dosimeter (PND) provides the functionality which determines time causing an increase of the assumed hearing threshold shift along with time required for recovery of a hearing threshold toward its initial value. Noise exposure levels, its duration along with hearing examination have been first measured in the acoustically controlled environment. Pure-tone audiometry has been used for hearing examination. This has been conducted in constant time intervals, during noise exposure as well as during resting time (time required for hearing recovery). The examination aims at measuring hearing threshold at 4 kHz. The important part of this study is validation of the dosimeter performance in the real noise exposure situation. In this case the whole noise measurement scenario encompasses both noise exposure effects, and hearing examination before and after noise exposure. The hearing examination has been extended by the distortion products otoacoustic emission method (DPOAE). The measurement results obtained in real conditions have been compared with those which were computed by means of the presented psychoacoustical noise dosimeter. 
StreszczenieW pracy przedstawiono projekt i realizację nowego psychoakustycznego dozymetru hałasowego. Jego działanie jest oparte na uwzględnieniu własności psychoakustycznych słuchu oraz charakterystyki czasowej i częstotliwościowej hałasu. Opracowany dozymetr umożliwia estymację przesunięcia progu słyszenia w pasmach krytycznych w czasie rzeczywistym. Możliwe jest zatem ciągłe monitorowanie stanu słuchu osób przebywających w niekorzystnych warunkach akustycznych. Ponadto, opracowany dozymetr wyznacza czas niezbędny do odzyskania stanu słuchu sprzed ekspozycji. W pierwszej kolejności przedstawiono wyniki pomiarów wpływu hałasu na słuch uzyskane w warunkach laboratoryjnych. Badania słuchu wykonano za pomocą audiometrii tonalnej. W warunkach laboratoryjnych słuch badano w stałych interwałach czasowych, w czasie ekspozycji oraz w fazie odpoczynku. Wyznaczano próg słyszenia dla częstotliwości 4 kHz. Istotnym elementem pracy są badania porównawcze dotyczące poprawności działania psychoakustycznego dozymetru hałasowego w warunkach rzeczywistych. Badania te obejmowały ekspozycję na hałas, pomiary słuchu przed i po ekspozycji na hałas. Z kolei badania słuchu rozszerzono o badanie metodą otoemisji akustycznych produktów zniekształceń nieliniowych ślimaka (DPOAE). Wyniki uzyskane w warunkach rzeczywistych porównano z estymacją skutków ekspozycji na hałas, określoną przez opracowany dozymetr. 

Entry No. 205 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus, B. Kostek 
English titleDETERMINING THE NOISE IMPACT ON HEARING USING PSYCHOACOUSTICAL NOISE DOSIMETER 
Polish titleOkreślenie wpływu hałasu na słuch przy użyciu psychoakustycznego dozymetru hałasowego 
Conference14th International conference on noise control NOISE CONTROL 07 
Preprint 
Number 
Volume 
Pages 
Conference siteElbląg, Polska 
Conference date3.6.2007- 6.6.2007 
AbstractThis research study presents the designed noise dosimeter based on psychoacoustical properties of the human hearing system and, at the same time, evaluation of time and frequency characteristics of noise. The designed noise dosimeter enables assessing temporary threshold shift (TTS) in critical bands in real time. In this way it is possible monitoring the hearing threshold shift continuously for people who stay in the harmful noise conditions. Moreover, the psychoacoustical noise dosimeter (PND) provides the functionality which determines time causing an increase of the assumed hearing threshold shift along with time required for recovery of a hearing threshold toward its initial value. Noise exposure levels, its duration along with hearing examination have been first measured in the acoustically controlled environment. Puretone audiometry has been used for hearing examination. This has been conducted in constant time intervals, during noise exposure as well as during resting time (time required for hearing recovery). The examination aims at measuring hearing threshold at 4 kHz. The important part of this study is validation of the dosimeter performance in the real noise exposure situation. In this case the whole noise measurement scenario encompasses both noise exposure effects, and hearing examination before and after noise exposure. The hearing examination has been extended by the distortion products otoacoustic emission method (DPOAE). The measurement results obtained in real conditions have been compared with those which were computed by means of the presented psychoacoustical noise dosimeter. 
StreszczenieW pracy przedstawiono projekt i realizację nowego psychoakustycznego dozymetru hałasowego. Jego działanie jest oparte na uwzględnieniu własności psychoakustycznych słuchu oraz charakterystyki czasowej i częstotliwościowej hałasu. Opracowany dozymetr umożliwia estymację przesunięcia progu słyszenia w pasmach krytycznych w czasie rzeczywistym. Możliwe jest zatem ciągłe monitorowanie stanu słuchu osób przebywających w niekorzystnych warunkach akustycznych. Ponadto, opracowany dozymetr wyznacza czas niezbędny do odzyskania stanu słuchu sprzed ekspozycji. W pierwszej kolejności przedstawiono wyniki pomiarów wpływu hałasu na słuch uzyskane w warunkach laboratoryjnych. Badania słuchu wykonano za pomocą audiometrii tonalnej. W warunkach laboratoryjnych słuch badano w stałych interwałach czasowych, w czasie ekspozycji oraz w fazie odpoczynku. Wyznaczano próg słyszenia dla częstotliwości 4 kHz. Istotnym elementem pracy są badania porównawcze dotyczące poprawności działania psychoakustycznego dozymetru hałasowego w warunkach rzeczywistych. Badania te obejmowały ekspozycję na hałas, pomiary słuchu przed i po ekspozycji na hałas. Z kolei badania słuchu rozszerzono o badanie metodą otoemisji akustycznych produktów zniekształceń nieliniowych ślimaka (DPOAE). Wyniki uzyskane w warunkach rzeczywistych porównano z estymacją skutków ekspozycji na hałas, określoną przez opracowany dozymetr. 

Entry No. 206 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek 
English titleMicroelectronics applications to communication senses diagnostics and therapy 
Polish titleZastosowania mikroelektroniki do diagnostyki i terapii zmysłów komunikacji 
ConferenceIX Konferencja Naukowa - Technologia Elektronowa (ELTE) 
Preprint 
Number 
VolumeP-8 
Pages36 
Conference siteKraków, Polska 
Conference date4.9.2007- 7.9.2007 
AbstractTaking advantage of the recent progress in Digital Signal Processor (DSP) developments, a portable and reprogrammable digital hearing aid can be easily designed. Furthermore, taking into account the-state-of-the-art in the research in the microelectronics, it is possible to produce a sophisticated hearing aid in which complex algorithms of signal processing will be implemented. The hearing aid developed and algorithms engineered will be demonstrated in the course of this paper. Another microelectronic technology application to hearing aids is the proposed contactless hearing aid is designated to be attached to the infant’s crib for sound amplification in a free field. It consists of electret microphone matrix, and a prototype DSP board. The compressed speech is transmitted and amplified via miniature loudspeakers. Algorithms that are worked out deal with parasitic feedback, which occurs due to the small distance between microphone and monitors in terms of potentially high amplification required. Tinnitus (ear noises) are usually defined as perceived sound sensation without acoustic external stimuli. Utilizing ear noise maskers often brings desired effects in reducing bothersome effects of Tinnitus. The new approach to Tinnitus induces the invention of new more effective methods of diagnosing and treatment, which can be called as an “ear dithering”. The approach uses microelectronic technology to produce a small wearable ultrasound Tinnitus masker which will be discussed during the paper presentation. The method of transposition of speech frequency is applied to a digital speech corrector, also called SDSA (Subminiature Digital Speech Aid). The device has an ultra-compact digital signal processor DSP and is used for testing a number of algorithms for correcting stuttering. By using the DSP processor we can process the speech sound in real time. Thanks to this, the small device can hold more complicated methods of correction. The technology standing behind the device will be discussed in the course of the paper. Another microelectronic technology serving speech impaired patients is artificial larynx. The artificial larynx engineered was equipped with a digital processor and an amplifier. The spectral subtraction algorithm for noise reduction was utilized. In this method, an average signal spectrum and average noise spectrum are estimated and subtracted from each other, thus average signal-to-noise ratio (SNR) is improved. The second approach uses a PDA (portab1e digital assistant) to generate synthetic speech. Finally, state-of-the-art assistive technologies helping blind and visually impaired patients will be reviewed and demonstrated on the basis of some advanced research examples.  
StreszczeniePostępy technologiczne w dziedzinie cyfrowego przetwarzania sygnałów umożliwiają projektowanie reprogramowalnych cyfrowych protez słuchu, wykorzystujących złożone algorytmy przetwarzania sygnałów fonicznych. Referat prezentuje opracowane i zaiplementowane algorytmy cyfrowych protez słuchu. Innym tego typu zastosowaniem technologii mikroelektronicznych jest bezkontaktowa proteza słuchu, mocowana w łóżeczku niemowlęcia, będąca przedmiotem oryginalnego opracowania. Podstawowy problem techniczny, jakim jest eliminacja pasożytniczych sprzężeń zwrotnych w tego typu aplikacji jest rozwiązywany prze algorytm cyfrowego przetwarzania sygnałów zaimplementowany na skosntruowanym module procesora sygnałowego. Koleja część referatu dotyczy problematyki szumów usznych (Tinnitus). Dla potrzeb pacjentów cierpiących na ten rodzaj dolegliwości słuchowej opracowano aplikację wykorzystującą linearizację charakterystyki kwantyzacji sygnałów akustycznych na drodze słuchowej. Cyfrowe przetwarzanie sygnałów zastosowane w miniaturowym urządzeniu dla osób jąkających się o nazwie SDSA poprawia płynność mowy, zaś najnowsza aplikacja wykorzystująca przetwarzanie sygnału mowy jest wdrażana w postaci sztucznej krtani dla osób laryngektomowanych oraz syntetyzera mowy. Ostatnia część referatu dotyczy przeglądu zastosowań mikroelektroniki w protetyce osób ociemniałych. Słowa kluczowe: cyfrowe przetwarzanie sygnałów; aparaty słuchowe; korektor mowy; syntetyzer mowy; pomoce dla niewidomych 

Entry No. 207 
Entry typeconference paper 
AuthorsA. Czyżewski, P. Maziewski 
English titleSome Techniques For Wow Effect Reduction 
Polish titleWybrane techniki redukcji zniekształceń kołysania dźwięku 
ConferenceIEEE International Conference on Image Processing (ICIP) 
Preprint 
Number 
VolumeIV 
Pages29 - 32 
Conference siteSan Antonio, Texas, USA 
Conference date16.9.2007- 19.9.2007 
AbstractWow distortion reduction has not attracted an adequate scientific attention so far. Only few papers on the subject are available, concerning mostly archive gramophone records, wax cylinders, and magnetic tapes affected by wow. This paper outlines researched wow reduction algorithms concerning archive movie soundtracks, or more generally audio recordings accompanying archival visual contents. The methods presented here are based on the pilot tone tracking, on the spectral analysis of genuine audio components, and on non-uniform resampling. The paper provides only a short overview of the concepts founding those methods; other studied approaches to the wow processing, as well as a more detailed description of the presented ones, can be found in referenced papers. 
StreszczenieRedukcja kołysania dźwięku jest tematem, któremu do tej pory nie poświęcono wystarczającej uwagi. Niewielka liczba dostępnych opracowań koncentruje się na redukcji kołysania w nagraniach winylowych, fonograficznych oraz magnetycznych. Niniejsze opracowanie prezentuje algorytmy do redukcji kołysania w archiwalnych filmowych ścieżkach dźwiękowych. Prezentowane algorytmy wykorzystują zarówno technikę śledzenia tonów pilotujących jak i metody śledzenia składowych widmowych sygnału fonicznego. Ostateczna redukcja kołysania realizowana jest przy użyciu technik nierównomiernego przepróbkowania. Referat prezentuje jedynie krótki przegląd opracowanych algorytmów. Inne metody redukcji kołysania jak i bardziej szczegółowy opis tych zaprezentowanych w niniejszym referacie, można odnaleźć w materiałach wskazanych w bibliografii.  

Entry No. 208 
Entry typeconference paper 
AuthorsP. Odya, A. Czyżewski 
English titleSpecial Hearing Aid for Stuttering People 
Polish titleSpecjalne aparaty słuchowe dla osób jąkających się 
Conference123rd AES Convention 
Preprint7293 
Number 
Volume 
Pages 
Conference siteNowy Jork, USA 
Conference date5.10.20078.10 
AbstractOwing to recent progress in digital signal processors developments it has been possible to build a subminiature device combining speech and hearing aid. Furthermore, despite its small dimensions, the device can execute quite complex algorithms and can be easily reprogrammed. The paper puts an emphasis on issues related to the design and implementation of algorithms applicable to both speech and hearing aids. Frequency shifting or delaying the audio signal are often used for speech fluency improvement. The basic frequency altering algorithm (FAF) is similar to the sound compression algorithm used in some special hearing aid as above. Therefore, the experimental device presented in the paper provides a universal hearing & speech aid which may be used by hearing or by speech impaired persons or by persons suffering from both problems, simultaneously. 
StreszczenieDzięku postępowi w dziedzienie cyfrowego przetwarzania sygnałów możliwe stało zbudowanie subminiaturowego urządzenia łączącego funkcje aparatu słuchowego i korektora mowy. Takie urządzenie, mimo niewielkich rozmiarów, jest w stanie wykonywać skomplikowane alggorytmy a jego oprogramowanie może być łatwo zmieniane. W pracy skupiono się na zagadnieniach związanych z opracowniem prototypu i implementacją algorytmów korekcji słuchu i mowy. W celu poprawy płynności mowy stosuje się najczęściej transpozycję widmową mowy lub jej opóźnianie. Algorytmy transpozycji widmowej również mogą być wykorzystane w apratach słuchowych. Stąd opisywane w pracy prototypowe urządzenie może być wykorzystane zarówno przez osoby mające problemy ze słuchem, jak i jąkające się. 

Entry No. 209 
Entry typeconference paper 
AuthorsA. Czyżewski, P. Odya, B. Kostek, P. Szczuko 
English titleNew Generation Artificial Larynx 
Polish titleNowe narzędzia dla osób laryngektomowanych 
Conference 
Preprint7285 
Number 
Volume 
Pages 
Conference siteNowy Jork, USA 
Conference date5.10.2007- 8.10.2007 
AbstractThe aim of the presented paper is to show a new generation of devices for laryngectomy patients. The artificial larynx has many disadvantages. The major problem is a background noise caused by the device. There are two different approaches to solve this task. The first one focuses on the artificial larynx. The artificial larynx engineered was equipped with a digital processor and an amplifier. Two algorithms, namely spectral subtraction algorithm and the comb filter were proposed for noise reduction. The second approach employs PDA to generate speech. A speech synthesis is performed, allowing for playing back any sentence, therefore any text can be entered by a user, and played through PDA speaker. 
StreszczenieCelem badań opisanych w pracy było opracowanie urządzeń nowej generacji dla osób laryngektomowanych. Typowa sztuczna krtań ma wiele wad. Najpoważniejszym problemem jest warkot generowany przez urządzenie. Zaproponowane zostały dwa rozwiązania majace na celu wyeliminowania tego problemu. Pierwsze skupia się na zmianach w konstrukcji sztucznej krtani. Opracowane urządzenie zostało dodatkowo wyposażone w cyfrowy procesor i wzmacniacz. W celu redukcji zakłóceń wykorzystano dwa algorytmy: odejmowanie widmowe i filtrację grzebieniową. Drugie rozwiązanie bazuje na komputerze typu PDA służacym do generowania mowy. Wykorzystano algorytmy syntezy mowy, co pozwala na odtwarzanie dowolnych wypowiedzi. 

Entry No. 210 
Entry typejournal paper 
AuthorsA. Czyżewski, H. Skarżyński 
English titleMultimedia Applications for the Hearing Impaired 
Polish titleAplikacje multimedialne dla osób z uszkodzeniami słuchu 
JournalArchives of Acoustics 
Volume32 
Number
Pages491 - 504 
AbstractHearing impairment is one of the fastest growing diseases of modern society. Therefore it is very important to develop new methods for diagnosis and therapy of hearing disorders. Some of them were introduced to practice as a result of a co-operation between institutions mentioned in the header. The system for mass-scale hearing screening is one of multimedia programs for testing communication senses introduced by the authors. The further developments include among others an application of dithering theory to practical solutions for tinnitus patients and a method of fitting hearing aids employing soft computing. The implemented hearing diagnostic & therapy applications and systems with their underlying concepts are reviewed in this paper.  
StreszczenieJednym z elementów przeciwdziałania szybko narastającym zagrożeniom niedosłuchem są aplikacje oprate na nowoczesnych technologiach. W wyniku współpracy Katedry Systemów Multimedialnych PG z warszawskim Instytutem Fizjologii i Patologii Słuchu opracowano wdrożone na szeroką skale multimedialne systemy przesiewowych badań zmysłów komunikowania się. Ponadto, nowsze opracowania dotyczą maskowania szumów usznych z wykorzystaniem linearyzacji charakterystyki transmisyjnej słuchu z użyciem szumu. Multimedialne techniki dopasowania aparatów słuchowych do potrzeb pacjenta, wykorzystujące przy tym inteligentne techniki obliczeniowe stanowią jeszcze jedno pole aplikacji praktycznych, spośród tych, których przegląd stanowi temat artykułu. Słowa kluczowe: przesiewowe badania słuchu, szumy uszne, dopasowanie protez słuchu 

Entry No. 211 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, Ł. Kosikowski, L. Śliwa, H. Skarżynski 
English titleExamining possibilities of transmitting signals to inner ear employing bone-conductive ultrasound carrier  
Polish titleBadanie możliwości transmisji sygnałów do ucha wewnętrznego z wykorzystaniem przewodnictwa kostnego ultradźwięków. 
Conference6th European Congress of Oto-Rhino-Laryngology, Head and Neck Surgery  
Preprint 
Number 
Volume 
Pages 
Conference siteWiedeń, Austria 
Conference date30.6.2007- 4.7.2007 
Notesplakat 
AbstractThe ultrasound harmonic signal was modulated with some harmonic tones of various frequency and level. The „ultrasound audiogram” was determined on this basis revealing the possibility to transmit low-frequency modulation components to the inner ear basing on ultrasound bone conduction. The bone-conductive ultrasound transmission characteristics were estimated during the experiment in which 2 ultrasound transducers were utilized: the first one acting as an excitor and the second one as a monitor. It was found that the ultrasound bone conduction may influence shape of tonal audiograms. Therefore, the experimental results demonstrate the possibility to receive of ultrasounds by the cochlea through bone conduction. 
StreszczenieUltradźwiękowy sygnał harmoniczny został zmodulowany kilkoma tonami harmonicznymi o różnej czestotliwości i poziomie. Uzyskany na tej podstawie „audiogram ultradźwiękowy” ujawnia możliwość transmisji komponentów niskoczęstotliwoścowych do ucha wewnętrznego bazując na ultradźwiękowym przewodnictwie kostnym. Charakterystyki przenoszenia ultradźwięków poprzez przewodnictwo kostne wyznaczono z wykorzystaniem 2 przekaźników ultradźwiękowych: pierwszy pełnił funkcje pobudzającą, a drugi monitorującą. Zauważono, że przewodnictwo kostne ultradźwięków może wpływać na kształt audiogramów tonalnych. Wyniki eksperymentu demonstrują możliwości odbioru ultradźwięków przez ślimak drogą przewodnictwa kostnego. 

Entry No. 212 
Entry typejournal paper 
AuthorsP. Żwan, B. Kostek, P. Szczuko, A. Czyżewski 
English titleAutomatic Singing Voice Recognition Employing Neural Networks and Rough Sets 
Polish title 
JournalLecture Notes In Artificial Intelligence-proc. of Rough Sets and Intelligent Systems Paradigms  
Volume 
Number4585 
Pages793 - 802 
AbstractThe aim of the research study presented in this paper is the automatic singing voice recognition. For this purpose a database containing singers’ sample recordings has been constructed and parameters are extracted from recorded voices of trained and untrained singers of various voice types. Parameters, which are especially designed for the analysis of the singing voice are described and their physical interpretation is given. Decision systems based on artificial neutral networks and rough sets are used for automatic voice type/voice quality classification. Results obtained in the automatic classification performed by both decision systems are then compared and conclusions are derived. 
StreszczenieCelem prac opisanych w referacie jest automatyczne rozpoznawanie głosów śpiewaczych. Do tego celu utworzona została baza nagrań próbek śpiewu profesjonalnego i amatorskiego. Próbki poddane zostały parametryzacji parametrami zaproponowanymi przez autorów ściśle do tego celu. Sposób wyznaczenia parametrów i ich interpretacja fizyczna przedstawione są w referacie. Parametry wprowadzane są do systemów decyzyjnych, klasyfikatorów opartych o sztuczne sieci neuronowe oraz o zbiory przybliżone. Zadaniem klasyfikatorów jest określenie typu i jakości głosu. Zawarto porównanie wyników uzyskanych dla sieci neuronowych i zbiorów przybliżonych. Podano wnioski. 

Entry No. 213 
Entry typejournal paper 
AuthorsA. Czyżewski, J. Kotus, B. Kostek, M. Szczodrak 
English titleMultimedia Noise Monitoring System  
Polish titleMultimedialny System Monitorowania Hałasu 
JournalBezpieczeństwo Pracy 
Volume 
Number7-8 
Pages8 - 11 
AbstractA concept and an implementation of the multimedia computer system for the monitoring of environmental noise threats is presented. The principal aim of the project is to improve the effectiveness of prophylaxis of hearing diseases. It allows to receive, store, analyze and visualize a noise data coming from noise measurement equipments and from electronic questionnaires accessible through the Internet. Moreover a new kind of the authors’ concept of the psychoacoustic noise dosimetry was also presented in the paper. The designed noise dosimeter enables to assess temporary threshold shift (TTS) during noise exposure. In this way it is possible to monitor the hearing threshold shift continuously for people who stay in the harmful noise conditions. 
StreszczenieW artykule przedstawiono Multimedialny System Monitorowania Hałasu. Projekt jest sieciocentrycznym systemem dedykowanym monitorowaniu zagrożeń hałasem. Jego nadrzędnym celem jest zwiększenie skuteczności w zakresie profilaktyki chorób słuchu. Umożliwia pobieranie, gromadzenie, analizę i wizualizację danych dotyczących hałasu, pobieranych ze zdalnych urządzeń pomiarowych oraz elektronicznych ankiet dostępnych przez Internet. Ponadto w artykule przedstawiono autorską koncepcję psychoakustycznego dozymetru hałasowego. Dozymetr ten umożliwia wyznaczenie czasowego przesunięcia progu słyszenia podczas trwania ekspozycji na hałas. Możliwe jest dzięki temu ciągłe monitorowanie progu słyszenia osób przebywających w warunkach szkodliwego oddziaływania hałasu. 

Entry No. 214 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus, B. Kostek 
English titleApplication of the psychoacoustic noise dosimeter for the determination of noise impact on hearing 
Polish titleZastosowanie psychoakustycznej dozymetrii hałasowej do określenia wypływu hałasu na słuch 
ConferenceInter-Noise 2007 
Preprint 
Number 
Volume 
Pages10 
Conference siteIstanbuł, Turcja 
Conference date28.8.2007- 31.8.2007 
AbstractThe new research results regarding the noise impact on hearing applying the authors’ concept of the psychoacoustic noise dosimetry (PND) were presented in the paper. In the fist part the noise and hearing examination conducted in the acoustically controlled environment were shown. The noise level was equal to 88 dB(A). The band-pass white noise, limited to the range of 1–6 kHz was used as a stimulus signal. The hearing threshold was examined using pure-tone audiometry for 4 kHz only. This experiment depended on simultaneous measuring both noise and hearing. Firstly, hearing was examined directly before the noise exposure. Next, the noise exposure phase started. The hearing was examined every 10 minutes for particular person. The total time of noise exposure was equal to 30 minutes. The hearing examinations were conducted also during subjects’ resting time (time required for hearing recovery). The main aim of this research was to determine the time constant of the TTS effect disappearance. The results were used for the optimization of the designed PND performance. In the last part of the paper the validation of the PND was presented considering real noise exposure conditions. In the course of further research the noise impact on hearing for this purpose was carried-out. The hearing of attendees was examined twice in this case, directly before and immediately after the noise exposure. The pure-tone audiometry and the distortion products otoacoustic emission method (DPOAE) were used. The extended noise dose analysis was performed on the basis of the obtained results employing the PND algorithm. The presented PND algorithm reflects correctly the hearing temporary threshold shift (TTS) changes produced by the noise. The computing of such parameters as: a real time assessment of the TTS in critical bands, time required for recovery of a hearing threshold to its initial value enables a very precise determination of hearing abilities of subjects under noise exposure. 
StreszczenieW referacie przedstawiono nowe wyniki badań wpływu hałasu na słuch z zastosowaniem autorskiej koncepcji psychoakustycznej dozymetrii hałasowej. W pierwszej części pracy przedstawiono wyniki badań hałasu i słuchu przeprowadzone w warunkach laboratoryjnych. Poziom hałasu wynosił 88 dB(A). Sygnałem testowym był szum biały, odfiltrowany do przedziału częstotliwości 1000 – 6000 Hz. Próg słyszenia badano za pomocą audiometrii tonalnej dla częstotliwości 4 kHz. Eksperyment polegał na jednoczesnym pomiarze hałasu i charakterystyk słyszenia. W pierwszej kolejności zbadano słuch bezpośrednio przed ekspozycją na hałas. Następnie rozpoczęła się faza ekspozycji. Co 10 minut poszczególnych osobom badano słuch, zarówno w fazie ekspozycji jak i odpoczynku. Całkowity czas przebywania w hałasie wynosił 30 minut. Celem badań było wyznaczenie stałych czasowych zmian efektu czasowej zmiany progu słyszenia (TTS). Wyniki zostały wykorzystane do optymalizacji opracowanego psychoakustycznego dozymetru hałasowego. W ostatniej części pracy zamieszczono informacje na temat weryfikacji opracowanego dozymetru, przeprowadzonej w warunkach rzeczywistego narażenia na hałas. W tym celu przeprowadzono badania wpływu hałasu na próg słyszenia osób przebywających w klubach studenckich. W tym przypadku badania słuchu wykonano dwukrotnie, bezpośrednio przed i po ekspozycji na hałas. Wykorzystano metodę audiometrii tonalnej oraz badanie otoemisji akustycznej produktów zniekształceń nieliniowych ślimaka (DPOAE). Na podstawie uzyskanych wyników pomiarów przeprowadzono rozszerzoną analizę dozymetryczną z zastosowaniem dozymetru psychoakustycznego. Opracowany algorytm we właściwy sposób odzwierciedla zmiany progu słyszenia wywołane hałasem. Wyznaczanie takich parametrów jak: aktualne przesunięcie progu słyszenia, czas niezbędny do powrotu progu słyszenia do stanu początkowego, w czasie trwania ekspozycji umożliwia bardzo dokładną kontrolę stanu słuchu osób narażonych na hałas. 

Entry No. 215 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus 
English title 
Polish titleMONITORING STANU ŚRODOWISKA - NOWE SZANSE TECHNOLOGICZNE 
ConferenceI Pomorskia Konferencja JAKOŚĆ POWIETRZA 
Preprint 
Number 
Volume 
Pages32 - 36 
Conference siteGdańsk, Polska 
Conference date25.6.2007 

Entry No. 216 
Entry typejournal paper 
AuthorsM. Szczodrak, A. Czyżewski 
English title 
Polish titleZastosowanie superkomputera do tworzenia dynamicznych map hałasu 
JournalZeszyty Naukowe Wydziału ETI PG 
Volume16 
Number
Pages305 - 310 
StreszczenieW artykule przedstawiono koncepcję i implementację Modelu Dynamicznego Prognozowania Hałasu przeznaczonego do tworzenia map hałasu. Omówiony został cel wykonania powstałej aplikacji. Zawarto krótki opis użytego sprzętu. Omówiono poszczególne elementy Modelu Dynamicznego Prognozowania Hałasu oraz zastosowane metody. Przedstawiono zagadnienia związane z implementacją algorytmów na klastrze komputerowym. Zaprezentowano również rezultaty eksperymentów otrzymanych podczas eksploatacji modelu prognozowania hałasu. 

Entry No. 217 
Entry typeconference paper 
AuthorsA. Czyżewski, Ł. Kosikowski, M. Kurkowski, A. Szkiełkowska, K. Kochanek, H. Skarżyński 
English titleMobile multimedia hearing and speech screening applications 
Polish titleAplikacje do przesiewowego badania słuchu i mowy na urządzenia mobilne 
ConferenceIII Konferencja Naukowo-Szkoleniowa Sekcji Foniatrycznej i Sekcji Audiologicznej Polskiego Towarzystwa Otorynolaryngologów Chirurgów Głowy i Szyi  
Preprint 
Number 
Volume 
Pages 
Conference sitePoznań, Polska 
Conference date8.5.2008- 10.5.2008 
Notesplakat 
AbstractThe aim of the presented work was to elaborate and implement the mobile prototype version of the devices meant for speech and hearing screening tests. An essential feature of the presented systems is their ability to exmine hearing means of tonal audiometry, and to test speech perception in noise. The system can also evaluate: phonematic hearing, phonetic hearing, functioning of speech production organs motor, articulation, vocabulary and grammar correctness and others. 
StreszczenieCelem projektu było opracowanie i implementacja prototypowej wersji urządzeń mobilnych do badania przesiewowego słuchu i mowy. Główną cechą urządzenia jest możliwość wykonania badań słuchu z wykorzystaniem audiometrii tanalnej oraz badania zrozumiałości mowy w szumie. System umożliwia również badanie słuchu fonematycznego, fonetycznego, motoryki organów mowy, artykulacji, słownictwa, gramatyki i in. 

Entry No. 218 
Entry typeconference paper 
AuthorsG. Szwoch, P. Dalka, A. Czyżewski 
English titleObjects classification based on their physical sizes for detection of events in camera images 
Polish title 
ConferenceNTAV/SPA 2008 Signal Processing: Algorithms, Architectures, Arrangements, and Applications; New Trends in Audio and Video 
Preprint 
Number 
Volume 
Pages15 - 20 
Conference sitePoznań, Polska 
Conference date25.9.2008- 27.9.2008 
AbstractIn the paper, a method of estimation of the physical sizes of the objects tracked in the video surveillance system, and a simple module for object classification based on the estimated physical sizes, are presented. The results of object classification are then used for automatic detection of various types of events in the camera image. 

Entry No. 219 
Entry typejournal paper 
AuthorsM. Kulesza, A. Czyżewski 
English titleNovel approaches to wideband speech coding 
Polish titleNowe metody szerokopasmowego kodowania sygnału mowy 
JournalGESTS International Transactions on Computer Science and Engineering 
Volume44 
Number
Pages154 - 165 
AbstractTwo methods for encoding wideband speech are presented and discussed. In the first approach the pair of time compression and expansion procedures is employed in order to enable coding of the wideband speech signal using standardized narrowband coding algorithms. The proposed method is dedicated to adaptive speech coding algorithms operating in very low bit-rate modes, as it does not affect a codec bit-rate. The second investigated approach to wideband speech coding relies on an accurate spectrum envelope estimation procedure employing psychoacoustic criterion. As the spectrum envelope is estimated basing on appropriately selected set of an unmasked tonal and noise components, the novel algorithm for tonality detection is considered. The experimental results concerning the first presented method for wideband speech coding as well as promising results regarding tonality detection are presented and discussed. 
StreszczenieDwie metoda kodowania szerokopasmowego mowy zostały zaprezentowane. W pierwszej metodzie wykorzystano algorytm kompresji i ekspansji czasowej sygnału mowy, pozwalający na kodowanie szerokopasmowe sygnału mowy z wykorzystaniem ustandaryzowanych kodeków. Metoda ta jest przewidziana do zastosowania w adaptacyjnych algorytmach kodowania mowy. Drugie z proponowanych rozwiazan dotyczy nowej metody estymacji obwiedni widma sygnalu mowy wykorzystujacego kryteria psychoakustyczne. Ponieważ w metodzie tej obwiednia widma okreslana jest na podstawie odpowiednio dobranych słyszalnych komponentów tonalnych i szumowych zaproponowano nową metodę detekcji tych komponentów. Praca zawiera wyniki eksperymentów dotyczące pierwszej metody kodowania oraz związanych z zaproponowana metodą detekcji komponentów tonalnych w widmie sygnału mowy. 

Entry No. 220 
Entry typeconference paper 
AuthorsA. Czyżewski, P. Maziewski, A. Kupryjanow, M. Papaj 
English titleMethods for Reducing the Audio-Visual Distortions Developed in the European PrestoSpace Project 
Polish titleMetody korekcji zniekształceń dźwięku i obrazu opracowane w ramach europejskiego projektu PrestoSpace 
ConferenceKrajowa Konferencja Radiokomunikacji, Radiofonii i Telewizji 2008 
Preprint 
Number 
Volume 
Pages465 - 468 
Conference siteWrocław, Polska 
Conference date9.4.2008- 11.4.2008 
AbstractThis paper presents the overview of the research and development done within the PrestoSpace Project in the 6th framework programme of the European Union. Methods for audio distortion removal, such as broad-band noise and wow and flutter, were presented as well as methods for picture distortions corrections such as movie tape shrinkage. The developed algorithms were positively evaluated by the archivists which were using them to restore real-life archival audio-visual recordings. 
StreszczenieW referacie przedstawiono przegląd prac badawczo-wdrożeniowych wykonanych przez autorów w ramach projektu PrestoSpace w 6. Programie Ramowym Unii Europejskiej. Opisano metody i algorytmy korekcji zniekształceń fonicznych, takich jak szum szerokopasmowy oraz kołysanie i drżenie dźwięku, a także korekcji zniekształceń obrazu spowodowanych skurczem taśm filmowych. Wdrożone algorytmy zostały pozytywnie ocenione przez archiwistów stosujących je w odniesieniu do archiwalnych nagrań foniczno-wizyjnych. 

Entry No. 221 
Entry typeconference paper 
AuthorsP. Maziewski, A. Kupryjanow, A. Czyżewski 
English titleDrift, Wow and Flutter Measurement and Reduction in Shrunken Movie Soundtracks 
Polish titleWyznaczenie charakterystyki i redukcja dryfu, kołysania i drżenia w skurczonych taśmach filmowych 
Conference124 AES Convention 
Preprint7392 
Number 
Volume 
Pages 
Conference siteAmsterdam, Holandia 
Conference date17.5.2008- 20.5.2008 
AbstractThe paper presents the method and algorithms used to determine and reduce drift, wow and flutter in shrunken movie tapes. The idea behind the algorithms is to use image processing for calculating the local tape shrinkage which is one of the reasons for drift, wow and flutter. The shrinkage can be calculated via analyzing the image height of: a movie frame, sprocket hole, pitch or another standardized movie tape element; and then it can be expressed as the drift, wow and flutter characteristic. After the characteristic determination both the soundtrack and movie frames can be corrected. The paper presents the description of the image based drift, wow and flutter determination method and the experiments confirming the theoretical findings. 
StreszczenieReferat przedstawia metodę i algorytmy do oceny i redukcji dryfu, kołysania i drżenia w skurczonych taśmach filmowych. Przedstawione algorytmy działają w oparciu o przetwarzaniu obrazu taśmy filmowej w celu wyznaczenia jej lokalnego skurczu, który jest jednym z powodów powstawania dryfu, kołysania i drżenia. Lokalny skurcz taśmy można wyznaczyć dzięki analizie wysokości: ramki obrazu, perforacji, lub innego, standaryzowanego elementu taśmy. Następnie skurcz można przedstawić w formie charakterystyki dryfu, kołysania i drżenia. Po wyznaczeniu charakterystyki zarówno filmowa ścieżka dźwiękowa jak i klatki filmu mogą być skorygowane. Referat przedstawia opis metody wyznaczenia dryfu, kołysania i drżenia za pomocą algorytmów analizy obrazu taśmy filmowej oraz eksperymenty potwierdzające przedstawioną teorię. 

Entry No. 222 
Entry typeconference paper 
AuthorsP. Odya, A. Czyżewski 
English titleNew Generation Speech Aid for Stuttering People 
Polish titleKorektor mowy nowej generacji 
Conference55 Otwarte Seminarium z Akustyki 
Preprint 
Number 
Volume 
Pages463 - 468 
Conference siteWrocław-Piechowice, Polska 
Conference date8.9.2008- 12.9.2008 
AbstractModern Digital Signal Processors (DSP) may have small dimensions and very low current con-sumption, but they are able to execute complex algorithms. In addition, they can be easily reprogrammed using a standard PC computer. Taking advantage of these processors, it was possible to build a device, which can be used either as a speech aid or a hearing aid, or both. The paper placed emphasis on issues related to the implementation of algorithms applicable to speech aids. For example, spectral compression or delaying the audio signal are often used for speech fluency improvement, thus they are shortly reviewed in the paper. Some additional algorithms which can improve the quality of the audio signal are also described. Clinical tests proved that the SDSA improves speech fluency. A detailed description of tests carried out and of their results is included in the paper. 
StreszczenieWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów mających zastosowanie w korektorach mowy. Przykładowo, opóźnienie sygnału mowy bądź jego kompresja widmowa często powoduje wzrost płynności mowy u osób jąkających się. W referacie zawarto także opisy dodatkowych algorytmów zwiększających jakość przetwarzanych sygnałów dźwiękowych oraz informacje na temat stworzonego subminiaturowego korektora mowy. Testy kliniczne wskazują, że opracowane urządzenie poprawia płynność mowy osób jąkających się. Opis testów ich wyniki przedstawiono w referacie. 

Entry No. 223 
Entry typeconference paper 
AuthorsP. Suchomski, B. Kostek, A. Czyżewski 
English titleHEARING AID FITTING METHOD BASED ON FUZZY LOGIC PROCESSING 
Polish titlePRZETWARZANIE ROZMYTE W METODZIE DOPASOWANIA APARATÓW SŁUCHOWYCH 
Conference55 Otwarte Seminarium z Akustyki OSA 2008 
Preprint 
Number 
Volume 
Pages481 - 486 
Conference sitePiechowice, Polska 
Conference date8.9.2008- 12.9.2008 
AbstractOne of the most important steps in a hearing aids fitting procedure is determining hearing dynamic characteristics. The hearing dynamic characteristics are typically calculated on the basis of loudness scaling test results. The problem is that the loudness scaling test results are presented on a loudness category scale, but a hearing prosthesis requires numerical parameters to be fed. A fuzzy logic method is useful for processing parameters expressed in human natural language. In this paper a fuzzy logic-based system for loudness scaling result processing is shortly presented. On the basis of the developed fuzzy system a way to shorten the loudness scaling test was found out. 
StreszczenieWażnym etapem dopasowania współczesnych aparatów słuchowych jest wyznaczanie charakterystyki dynamiki słuchu. Charakterystyka ta wyznaczana jest na podstawie wyników testu skalowania głośności. Niestety wyniki te wyrażone są w skali kategorii głośności, natomiast aparaty słuchowe wymagają para-metrów numerycznych. Problem ten można rozwiązać za pomocą logiki rozmytej. W niniejszym referacie przedstawiono metodę przetwarzania rozmytego wyników testu skalowania głośności. Na bazie opraco-wanej metody pokazano również sposób skrócenia testu skalowania głośności. 

Entry No. 224 
Entry typejournal paper 
AuthorsG. Szwoch, A. Czyżewski, M. Kulesza 
English titleA low complexity double-talk detector based on the signal envelope 
Polish title 
JournalSignal Processing 
Volume88 
Number11 
Pages2856 - 2862 
AbstractA new algorithm for double-talk detection, intended for use in the acoustic echo canceller for voice communication applications, is proposed. The communication system developed by the authors required the use of a double-talk detection algorithm with low complexity and good accuracy. The authors propose an approach to doubletalk detection based on the signal envelopes. For each of three signals: the far-end speech, the microphone signal and the echo estimate, an envelope is detected. Next, using these envelopes, a detection function is determined and compared to the threshold. Additionally, a dynamic threshold is introduced in order to improve the accuracy of the algorithm. The results of the simulations presented in the paper proved that the accuracy of double-talk detection obtained using the proposed algorithm is higher than in the Geigel algorithm and comparable to the correlation-based methods, while the computational complexity of the proposed method remains at an acceptable level. The double-talk detection algorithm presented here may be used in voice communication systems having limited resources, allowing for accurate double-talk detection and, as a consequence, efficient acoustic echo cancellation. 

Entry No. 225 
Entry typeconference paper 
AuthorsM. Reiter, J. Kotus, A. Czyżewski 
English titleOptimizing localization of noise monitoring stations for the purpose of inverse engineering applications 
Polish title 
ConferenceAcoustics 08 
Preprint 
Number 
Volume 
Pages 
Conference siteParyż, Francja 
Conference date18.5.2008- 21.5.2008 
AbstractLong-term environmental monitoring of noise levels can be done using autonomous measurement stations. Because of the high cost of monitoring systems and management of these stations, it is essential to identify how many of measuring localization points are really required. In cases related to complex noise generation schemes, when there are various noise sources, the differences between calculations and measurements can be difficult to estimate. Therefore, it is vital to find some most appropriate locations for measurement stations which would ensure obtaining an adequate number of measurement results to be employed in the reverse engineering. These measurements can be then utilized to update dynamic noise maps. Furthermore, predictive noise models may be developed accordingly to certain local requirements. This could result in a better accuracy of dynamic noise maps. The paper focuses on defining the proper choice of the measurement points localizations. The experiments described include a comparison between real-life measurement results performed with the Multimedia Noise Monitoring System developed at the Multimedia Systems Department of the Gdansk University of Technology and the noise level prediction results. The optimization of the number and location of noise monitoring points with regard to the measurement accuracy is also discussed. 

Entry No. 226 
Entry typeconference paper 
AuthorsJ. Kotus, B. Kostek, A. Czyżewski 
English titleThe noise induced harmful effects assessment using psychoacoustical noise dosimeter 
Polish title 
ConferenceAcoustics 08 
Preprint 
Number 
Volume 
Pages 
Conference siteParyż, Francja 
Conference date29.6.2008- 4.7.2008 
AbstractA new way of assessment of noise-induced harmful effects on human hearing system was presented in the paper. Employing the developed psychoacoustical noise dosimeter the new indicators of noise harmfulness were verified on the basis of hearing examinations and noise measurement results. The indicators were based on some psychoacoustical properties of the human hearing system and, at the same time, on evaluation of the time and frequency characteristics of noise. Additionally, time properties of the Temporary Threshold Shift are calculated during the noise exposure. The evaluation of the proposed indicators were conducted on the basis of hearing examinations in the real noise exposure situations and also on the basis of simulation results employing standard test signals (such as: white, pink and brown noise). The standard noise dose analysis results were also presented for the purpose of comparison. The performed analysis and obtained results confirmed correctness and practical usefulness of the proposed indicators. 

Entry No. 227 
Entry typejournal paper 
AuthorsM. Kulesza, G. Szwoch, A. Czyżewski 
English titleImproving signal quality of a speech codec using hybrid perceptual-parametric algorithm 
Polish titlePoprawa jakości kodowania sygnału mowy z wykorzystaniem algorytmu perceptualno-parametrycznego 
JournalInt. J. of Intelligent Information and Database Systems 
Volume
Number
Pages354 - 369 
AbstractA hybrid parametric-perceptual speech codec architecture is presented. The basic CELP parametric codec structure is enhanced using the perceptual coding method. The objective of the codec hybridisation is obtaining significant improvement in the perceived signal quality. Two hybrid architectures are proposed. The first one encodes voiced parts perceptually in the CELP residual signal. The second one divides the signal into voiced signal components that are encoded using the perceptual algorithm, unvoiced components that are encoded parametrically and transients remaining unencoded. The signal quality achieved using the hybrid codec is compared to the quality of some standard speech codecs. 
StreszczenieW artykule zaprezentowano hybrydową architekturę parametryczno-perceptualną kodeka mowy. Jego podstawę stanowi kodek CELP, który wspomagany jest kodekiem perceptualnym. Celem zastosowania proponowanej metody jest uzyskanie poprawy jakości kodowania sygnału mowy. Badaniom poddano dwie architektury, z których w jednej dźwięczne części sygnału rezydualnego kodeka CELP kodowane są perceptualnie. Drugi z proponowanych kodeków dokonuje podziału sygnału na części dźwięczne które kodowane są perceptualnie, bedźwięczne kodowane parametrycznie oraz transjenty, które nie podlegają kompresji. Uzyskana jakość kodowania z wykorzystaniem proponowanych algorytmów została porównana z jakością wybranych algorytmów zaimplementowanych zgodnie ze standardami telekomunikacyjnymi. 

Entry No. 228 
Entry typejournal paper 
AuthorsP. Odya, A. Czyżewski 
English titleNew Generation Speech Aid for Stuttering People 
Polish titleKorektor mowy nowej generacji 
JournalArchives of Acoustics 
Volume33 
Number
Pages141 - 146 
AbstractModern Digital Signal Processors (DSP) may have small dimensions and very low current con-sumption, but they are able to execute complex algorithms. In addition, they can be easily reprogrammed using a standard PC computer. Taking advantage of these processors, it was possible to build a device, which can be used either as a speech aid or a hearing aid, or both. The paper placed emphasis on issues related to the implementation of algorithms applicable to speech aids. For example, spectral compression or delaying the audio signal are often used for speech fluency improvement, thus they are shortly reviewed in the paper. Some additional algorithms which can improve the quality of the audio signal are also described. Clinical tests proved that the SDSA improves speech fluency. A detailed description of tests carried out and of their results is included in the paper.  
StreszczenieWspółczesne Cyfrowe Procesory Sygnałowe (ang. DSP) mają niewielkie wymiary, ale są w stanie re-alizować złożone algorytmy. Ich dodatkową zaletą jest łatwość wymiany oprogramowania, a co za tym idzie łatwość zmiany dziedziny zastosowań. Wykorzystując możliwości procesów stało się możliwe budowanie miniaturowych protez słuchu i mowy. W referacie skupiono się na zagadnieniach związanych z projekto-wanie i implementacją algorytmów mających zastosowanie w korektorach mowy. Przykładowo, opóźnienie sygnału mowy bądź jego kompresja widmowa często powoduje wzrost płynności mowy u osób jąkających się. W referacie zawarto także opisy dodatkowych algorytmów zwiększających jakość przetwarzanych sygnałów dźwiękowych oraz informacje na temat stworzonego subminiaturowego korektora mowy. Testy kliniczne wskazują, że opracowane urządzenie poprawia płynność mowy osób jąkających się. Opis testów ich wyniki przedstawiono w referacie.  

Entry No. 229 
Entry typejournal paper 
AuthorsP. Suchomski, B. Kostek, A. Czyżewski 
English titleHEARING AID FITTING METHOD BASED ON FUZZY LOGIC PROCESSING  
Polish titlePRZETWARZANIE ROZMYTE W METODZIE DOPASOWANIA APARATÓW SŁUCHOWYCH 
JournalARCHIVES of ACOUSTICS 
Volume33 
Number
Pages153 - 158 
AbstractOne of the most important steps in a hearing aids fitting procedure is determining hearing dynamic characteristics. The hearing dynamic characteristics are typically calculated on the basis of loudness scaling test results. The problem is that the loudness scaling test results are presented on a loudness category scale, but a hearing prosthesis requires numerical parameters to be fed. A fuzzy logic method is useful for processing parameters expressed in human natural language. In this paper a fuzzy logic-based system for loudness scaling result processing is shortly presented. On the basis of the developed fuzzy system a way to shorten the loudness scaling test was found out.  
StreszczenieWażnym etapem dopasowania współczesnych aparatów słuchowych jest wyznaczanie charakterystyki dynamiki słuchu. Charakterystyka ta wyznaczana jest na podstawie wyników testu skalowania głośności. Niestety wyniki te wyrażone są w skali kategorii głośności, natomiast aparaty słuchowe wymagają para-metrów numerycznych. Problem ten można rozwiązać za pomocą logiki rozmytej. W niniejszym referacie przedstawiono metodę przetwarzania rozmytego wyników testu skalowania głośności. Na bazie opraco-wanej metody pokazano również sposób skrócenia testu skalowania głośności 

Entry No. 230 
Entry typeconference paper 
AuthorsA. Kupryjanow, A. Czyżewski 
English titleAutomatic system for audio-video material reconstruction and archiving 
Polish titleSystem automatycznej rekonstrukcji i archiwizacji nagrań audio-wideo 
ConferenceNTAV/SPA 2008 
Preprint 
Number 
Volume 
Pages173 - 176 
Conference sitePoznań, Polska 
Conference date25.9.2008- 27.9.2008 
AbstractThe paper presents model of audio-video materials automatic reconstruction and archiving system. The idea of this solution is to make process of restoration more human-independent. It will reduce costs of reconstruction of processed records. Because of great number of audio-video materials it is necessary to create system that will intelligently index this data. It will help with more effective material searching. 
StreszczenieReferat przedstawia propozycję modelu systemu automatycznej archiwizacji i rekonstrukcji nagrań audio-wideo. Założeniem tego rozwiązania jest uczynienie procesu rekonstrukcji nagrań bardziej niezależnym od człowieka. Ma to na celu redukcję kosztów rekonstrukcji przetwarzanych nagrań. Z powodu dużej liczby archiwalnych nagrań audio-wideo istnieje potrzeba stworzenia systemu który umożliwi automatyczną indeksację ich treści. Pomoże to w efektywniejszym znajdowaniu szukanych nagrań. 

Entry No. 231 
Entry typeconference paper 
AuthorsM. Szczodrak, A. Czyżewski, J. Ejsmont 
English titleRoad noise prediction results compared to real measurements in Gdansk surroundings 
Polish titlePorównanie wyników modelowania hałasu drogowego do rzeczywistych pomiarów w okolicach Gdańska 
ConferenceJoint Baltic-Nordic Acoustics Meeting 2008 
Preprint 
Number 
Volume 
Pages 
Conference siteReykjavik, Iceland 
Conference date17.8.2008- 19.8.2008 
AbstractThe comparison of noise levels obtained by model and measurement results is presented in this paper. The HARMONOISE road noise source prediction model and propagation method used for simulation are mentioned. The model implementation outcome is compared to measurement results. Inaccuracies, which are defined as differences between the results calculated by the model and the actual measurements under the same atmospheric conditions, are discussed. An attempt to analyze the error reasons is made. Consideration of possibility of employing road noise prediction model to dynamic noise mapping is also included. 

Entry No. 232 
Entry typejournal paper 
AuthorsM. Szczodrak, A. Czyżewski, J. Kotus 
English titleInvestigation of the road noise source employing an automatic noise monitoring station 
Polish titleBadanie modelu źródła hałasu drogowego z zastosowaniem automatyczej stacji pomiaru hałasu 
JournalArchives of Acoustics 
Volume33 
Number
Pages77 - 83 
AbstractThe paper presents a pilot investigation of noise source models in two selected localizations in the context of future dynamic noise map creation. The experiments were carried out using the automatic noise monitoring station engineered at the Multimedia Systems Departmentof the Gda´nsk University of Technology. The results of the noise measurements employing monitoring stations and its comparison to the reference values are depicted. Short- and longterm studies of noise level are also presented. The experiments described include a comparison between environmental measurement results and the noise level prediction results. Data obtained from the NMPB-96 (Nouvelle Méthode de Prévision du Bruit) and the Harmonoise model data provide the subject of the analysis. The proposed solution of permanent noisemonitoring system is also shortly described. 

Entry No. 233 
Entry typeconference paper 
AuthorsM. Szczodrak, A. Czyżewski, J. Kotus 
English titleRoad noise mapping in the city area: measurements compared to model-based estimations 
Polish titleOdwzorowanie hałasu drogowego w mieście: porównanie pomiarów z obliczeniami modeli 
Conference55 Otwarte Seminarium z Akustyki 
Preprint 
Number 
Volume 
Pages 
Conference siteWrocław, Polska 
Conference date8.9.2008- 12.9.2008 
AbstractThe paper presents an approach to the verification of noise prediction models in selected localization in the city of Gdansk. The experiments described include a comparison between environmentalmeasurement results performed in the terrain and the noise level prediction results. The NMPB-96 (Nouvelle Méthode de Prévision du Bruit) and Harmonoise models outcomes provide the subject ofthe analysis. The proposed solution of continuous noise monitoring system needed for validation of models is shortly described. 

Entry No. 234 
Entry typejournal paper 
AuthorsJ. Kotus, B. Kostek, A. Czyżewski 
English titlePSYCHOACOUSTICAL NOISE DOSIMETRY IN THE MULTIMEDIA NOISE MONITORING SYSTEM 
Polish titlePSYCHOAKUSTYCZNA DOZYMETRIA HAŁASOWA W MULTIMEDIALNYM SYSTEMIE MONITOROWANIA HAŁASU 
JournalZeszyty Naukowe Wydziału ETI PG 
Volume 
Number16 
Pages477 - 482 
AbstractThe results obtained by means of the Psychoacoustical Noise Dosimeter (PND) were presented in the paper. The developed algorithm provides a new way of the assessment of noise harmfulness. This method was developed on the basis of the available scientific knowledge followed by hearing and noise measurements carried out in laboratory conditions. Taking this knowledge into consideration the new indicators of the cumulative noise-induced harmfulness effects assessment were proposed. Their usefulness and correctness were confirmed on the basis of hearing examination conducted in the real noise exposure situation. Moreover, the PND algorithm was also implemented in the noise monitoring station. It provides an integral part of the teleinformation system for the noise threat monitoring, developed in the Multimedia System Department. The unique functionality of the station enables very precise evaluation of the acoustical conditions. Owing to that, it makes an essential tool supporting the noise-induced hearing loss prevention. 
StreszczenieW referacie przedstawiono wyniki działania Psychoakustycznego Dozymetru Hałasowego (PDH). Opracowany algorytm stanowi nowy sposób oceny szkodliwości hałasu. Metoda ta opiera się na wykorzystaniu wiedzy na temat właściwości słuchu dostępnej w literaturze oraz na wynikach badań słuchu i hałasu przeprowadzonych w warunkach laboratoryjnych. Na tej podstawie zaproponowano nowe wskaźniki oceny skumulowanych skutków słuchowych wywołanych ekspozycją na hałas. Poprawność działania opracowanego algorytmu i zaproponowanych wskaźników potwierdzono na podstawie badań w warunkach rzeczywistego narażenia na hałas. Algorytm PDH zaimplementowano ponadto w stacji monitorowania hałasu. Stanowi ona integralną część, opracowanego w Katedrze, teleinformatycznego systemu monitorowania zagrożeń hałasem. Unikatowa funkcjonalność stacji umożliwia dokładną ocenę warunków akustycznych pod względem ich potencjalnej szkodliwości dla słuchu. 

Entry No. 235 
Entry typejournal paper 
AuthorsJ. Kotus, A. Czyżewski, B. Kostek 
English titleEvaluation of Excessive Noise Effects on Hearing Employing Psychoacoustic Dosimetry 
Polish title 
JournalNoise Control Engineering Journal 
Volume 
Number 
Pages 
NotesW druku 
AbstractResearch results regarding the noise impact on hearing applying the concept of the Psychoacoustic Noise Dosimetry (PND) are presented. The general characteristics of the PND algorithm are discussed. Additionally, the results of hearing examinations conducted in the laboratory conditions are shown. The main objective of the research was to determine the time needed for the Temporary Threshold Shift to reverse. The results were used for the optimization of the designed PND performance. A validation of the PND algorithm was performed considering real noise exposure conditions. A new way of assessing noise-induced harmful effects on human hearing system was proposed employing the new indicators of noise harmfulness. The indicators are based on some psychoacoustical properties of the human hearing system and, simultaneously, on the time and frequency characteristics of noise. The correctness and the practical applicability of the newly proposed indicators were confirmed experimentally using hearing testing with real noise exposures and also on the basis of simulation results employing some standard test signals. 

Entry No. 236 
Entry typebook 
AuthorsA. Czyżewski, B. Kostek, J. Kotus 
English titleMultimedia Interactive Services in Intelligent Environments; Multimedia Services Applied to Noise and Hearing Monitoring and Measuring 
Polish title 
EditorSpringer 
Pages275 - 295 
NotesRozdział w książce 
AbstractThe goal of this chapter is to show a research study related to processing of data acquired by the multimedia services engineered at the multimedia systems department (MSD) of the Gdansk University of Technology. This concerns a survey on noise threat employing the multimedia noise monitoring system (MNMS) and hearing tests performed by the “I can hear. . . ” system. The obtained results of the noise measurements revealed that an unfavorable noise climate was found in the examined schools and music clubs. This was also confirmed by the hearing examination results. On the basis of data gathered by both systems it was possible to perform an analysis relating the hearing impairment and noise indicators. New noise annoyance and noise threat criteria were proposed and verified based on the data acquired and analyzed. The measurement results obtained under in situ conditions were compared with those computed by means of the proposed psychoacoustical noise dosimeter. 

Entry No. 237 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus, B. Kostek, K. Kochanek, H. Skarżyński 
English titleExtending the Universal Screening System "I can hear." with diagnosing influence of noise to hearing 
Polish titleRozbudowa systemu przesiewowego badań słuchu "Słyszę" o funkcje diagnozowania wpływu hałasu na słuch 
ConferenceXLIII Zjazd Polskiego Towarzystwa Otorynolaryngologów Chirurgów Głowy i Szyi 
Preprint 
Number 
Volume 
Pages 
Conference siteŁódź, Polska 
Conference date4.6.2008- 7.6.2008 
StreszczenieLiczne i alarmujące sygnały dotyczące stanu słuchu społeczeństwa, a zwłaszcza dzieci i młodzieży oraz klimatu akustycznego w kraju stanowiły motywację do rozszerzenia systemu powszechnych badań przesiewowych słuchu "SŁYSZĘ" o moduł do diagnozowania wpływu hałasu na słuch. W Katedrze Systemów Multimedialnych we współpracy z Instytutem Fizjologii i Patologii Słuchu, opracowano nowatorskie narzędzia diagnostyczne, umożliwiające przeprowadzenie wiarygodnych, przesiewowych testów słuchu. Nadmierny hałas występujący w środowisku (w tym również szkołach) może stanowić realne zagrożenie dla słuchu. Niezwykle potrzebne jest szerokie propagowanie walki z hałasem i zapobieganie negatywnym skutkom wywołanym ekspozycją na wysoki poziom hałasu. Jest to możliwe przez zastosowanie zaprojektowanych w tym celu urządzeń pomiarowych, które z automatyczny za pomocą komunikacji bezprzewodowej będą przekazywały aktualne informacje o zagrożeniu hałasem. Najnowsza wersja oprogramowania systemu "Słyszę" umożliwia przeprowadzanie testów przesiewowych słuchu przez Internet jak również za pomocą urządzeń typu PoketPC. 

Entry No. 238 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, A. Geremek, K. Kochanek, H. Skarżyński 
English titleContactless hearing aid 
Polish titleBezkontaktowy aparat słuchowy 
ConferenceXLIII Zjazd Polskiego Towarzystwa Otorynolaryngologów Chirurgów Głowy i Szyi  
Preprint 
Number 
Volume 
Pages 
Conference siteŁódź, Polska 
Conference date4.6.2008- 7.6.2008 
StreszczenieCelem prowadzonych prac jest wdrożenie cyfrowego bezkontaktowego aparatu słuchowego dla niemowląt. W ubiegłych latach opracowano model takiego urządzenia, który wykorzystano do uruchomienia algorytmów filtracji przestrzennej dźwięku, algorytmów eliminowania pasożytniczych sprzężeń akustycznych i metod kompresji oraz wzmacniania mowy. Model przetestowano w łóżeczku dziecięcym, z udziałem małych dzieci. Aktualnie prowadzone jest opracowanie praktycznego zestawu aparatu słuchowego, pracującego w swobodnym polu akustycznym oraz jego kolejne próby w warunkach klinicznych, w Klinice Audiologii IFPS. W toku badań zaprojektowany bezkontaktowy aparat słuchowy umiejscawiany jest w łóżeczku niemowlęcia. Aparat składający się z matrycy 4 mikrofonów oraz z prototypowej karty z procesorem DSP pracuje w polu akustycznym otaczającym głowę dziecka. Przetworzony sygnał mowy emitowany jest z wykorzystaniem miniaturowych głośników, w tym głośników kierunkowych o specjalnej konstrukcji. Opracowane algorytmy pozwalają na eliminację akustycznych sprzężeń zwrotnych, które mogą występować ze względu na niewielką odległość mikrofonów od głośników i potencjalnie wysokie wzmocnienie sygnału w polu akustycznym. Algorytm filtracji przestrzennej wykorzystuje nieliniową filtrację sygnału w dziedzinie widma. W toku prowadzenia eksperymentów wykorzystywana jest metodyka badań obiektywnych i metoda obserwacji behawioralnych z udziałem matek i ich dzieci. Badaniom poddawane zostają dzieci kilkumiesięczne. Reakcje obiektywnie mierzalne są badane przy użyciu urządzenia służącego do prowadzenia przesiewowych badań słuchu, z wykorzystaniem metod ABR (potencjały wywołane pnia mózgu) i TEOAE (otoemisja akustyczna wywołana trzaskiem) – Kuba Mikro. Ponadto, w zakres projektu, którego dotychczasowe rezultaty są przedmiotem referatu, wchodzi analiza i dyskusja wyników eksperymentalnych uzyskanych w powyżej określonych warunkach. Słowa kluczowe: audiometria, badanie słuchu, protezy słuchu 

Entry No. 239 
Entry typeconference paper 
AuthorsB. Kostek, A. Czyżewski, Ł. Kosikowski, K. Kochanek, H. Skarżyński 
English titleHearing-screening tests based on filtered sounds and on speech-in-noise intelligibility tests 
Polish titleAudiometria przesiewowa dedykowana dla dzieci przedszkolnych 
ConferenceAcoustics'2008 
Preprint2958 
Number 
Volume 
Pages 
Conference siteParis, France 
Conference date29.6.2008- 4.6.2008 
AbstractA hearing-screening system dedicated to small-children in pre-schools and primary schools is described in the paper. It uses as a hardware a palmtop computer supplemented with a small sound calibrating device. The described application provides tests that employ automatic questionnaire analysis, audiometric test procedures, and assessment of speech intelligibility in noise. In the speech-in-noise intelligibility tests, pictures are used for young children, and the screening tests are supervised by adults. Apart from the standardized audiometric tests, the screening tests employ environmental sounds filtered in audiometric frequency bands and calibrated as to their levels. When all the testing is completed, the system automatically analyzes the results for each child examined. The decision is made automatically by the expert system taking into account the number of incorrect answers. Children whose hearing impairment is confirmed are referred to treatment in rehabilitation centers. The project presented is a part of the large-scale ”I can hear...” screening tests program carried out in Poland for the last few years. This may help to increase awareness and inspire action against noise at a very early age. The methods employed for filtering and calibration environmental sounds and results achieved are presented in the paper. 
StreszczenieW referacie przedstawiono testy audiometrii dziecięcej przesiewowej, zaimplementowane na urządzeniu typu PDA. Przedyskutowano funkcjonalności tego typu audiometru i opisano przygotowane testy audiometrii przesiewowej. Słowa kluczowe: audiometria przesiewowa, audiometria mowy w szumie, testy audiometryczne, PDA 

Entry No. 240 
Entry typeconference paper 
AuthorsP. Kozielecki, A. Czyżewski 
English titleA Novel Dynamic Noise Maps Visualization Tool 
Polish titleNowe podejście do wykreślania dynamicznych map akustycznych 
ConferenceIT 2008. 1st International Conference on Information Technology  
Preprint 
Number 
Volume 
Pages245 - 248 
Conference siteGdańsk, Polska 
Conference date19.5.2008- 21.5.2008 
AbstractA concept and an implementation of the Novel Dynamic Noise Maps Visualization Tool is presented in this paper. The principal aim of the project is described. The first part depicts general features of the Tool. The main focus is put on presenting the innovative features of the Dynamic Noise Maps Visualization Tool in comparison to the commonly used software and hardware solutions. The software components applied are briefly presented. Furthermore, the project contribution into the field of dynamic noise maps visualization is introduced. All the application features are thoroughly described. The results of the Dynamic Noise Maps Visualization Tool performance, quality and ergonomics experiments are presented. 
StreszczenieW referacie przedstawiono aplikację realizujacą wizualizację dynamicznych map akustycznych zintegrowaną z multimedialnym systemem monitoringu hałasu. Moduł ten został oparty na nowym podejściu do wykreślania dynamicznych map, w referacie przedstawiono porównanie wyników uzyskanych metodami tradycyjnymi i zaproponowaną metodą. Słowa kluczowe: dynamiczne mapy, wizualizacja, monitoring, hałas, system GIS 

Entry No. 241 
Entry typeconference paper 
AuthorsP. Kozielecki, A. Czyżewski 
English titleAN APPLICATION FOR VECTOR-BASED DYNAMIC NOISE MAPS GENERATION 
Polish titleWizualizacja dynamicznych map hałasowych oparta na analizie wektorowej 
ConferenceJoint Baltic-Nordic Acoustic Meeting, BNAM 2008 
Preprint 
Number 
Volume 
Pages1 - 13 
Conference siteReykjavik, Iceland 
Conference date17.8.2008- 19.8.2008 
AbstractThe concept and the developed application for vector-based, dynamic noise maps generation is presented. General features of dynamic noise maps are described. The advantages of dynamic noise maps visualization, utilizing vector graphics and animation techniques, compared to the commonly used software solutions are discussed. The main focus is put on presenting authors’ concept of the algorithm for noise contour extraction and shape labeling. The implementation details of the application are presented. Furthermore, quality and fidelity of extracted noise contours are evaluated. 
StreszczenieW referacie przedstawiono koncepcję i metodę wykreślania dynamicznych map hałasowych opartą na analizie wektorowej. Podane zostały cechy metody oraz wyniki porównania metod wykreślania map dynamicznych. W referacie przedstawiono aplikację realizującą wizualizację map hałasowych ze szczególnym uwzględnieniem ekstrakcji konturów. Słowa kluczowe: hałas, dynamiczne mapy hałasowe, analiza wektorowa, animacja  

Entry No. 242 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Ejsmont 
English titleVALIDATION OF HARMONOISE/IMAGINE TRAFFIC NOISE PREDICTION MODEL BY LONG TERM NOISE AND TRAFFIC MONITORING 
Polish titleWalidacja modelu Harmonoise/Imagine do przewidywania hałasu drogowego na podstawie długotrwałego monitoringu hałasu i natężenia ruchu drogowego. 
ConferenceJoint Baltic-Nordic Acoustics Meeting 2008, 17-19 August 2008, Reykjavik, Iceland 
Preprint 
Number 
Volume 
Pages1 - 13 
Conference siteReykjavik, Iceland 
Conference date17.8.2008- 19.8.2008 
Notespublikacja elektroniczna, recenzowana 
AbstractIn June 2002, the European Directive on the Assessment and Management of Environmental Noise (2002/49/EC) was accepted and came into force. Under this Directive the member states were obliged to produce strategic noise maps of major roads, railways, airports and large agglomerations by 30th June 2007. During the first round of noise mapping the national prediction methods and so called interim methods were allowed. Nevertheless, already in 2001, under the 5th Framework Programme, the HARMONOISE project has been started with a goal to establish a common assessment method for noise mapping of road and railroad sources. A following project, called IMAGINE, was started in 2003 to refine methods proposed by HARMONOISE and to include modules dealing with airports and industrial sources. The basic principle of the so called "HARMONOISE/IMAGINE" model is to provide separate, but well harmonized, modules for sources' description (road traffic, railroad traffic, air traffic and industrial sources) and for propagation. This paper is however focused only on the module describing road traffic noise source. In 2005 the Technical University of Gdansk has built and started to operate a noise, traffic and weather monitoring station on one of the major roads close to Gdansk. Now the results for over 3 years of continuous monitoring are available. The follow up of the monitoring is carried out as a part of the national project sponsored by the Polish Ministry of Science and Higher Education that deals with noise monitoring of urban areas by means of tele-informatics and GIS. The paper presents validation of the model performed on the base of those results. Moreover, it contains also critical analysis of the data and procedures included in the model and suggestions of improvement. One of the problems with the HARMONOISE/IMAGINE model is the overestimation of propulsion noise of heavy trucks in comparison to the rolling noise. Another problem is the specific procedure for establishing correction factors during deceleration that is not accounting for the increase of rolling noise. 
StreszczenieW pracy przedstawiono model do przewidywania hałasu ruchu drogowego opracowany w projektach Unii Europejskiej Harmonoise i Imagine. Omówiono strukturę modelu, klasyfikację pojazdów, zastosowane zależności oraz wprowadzone czynniki korekcyjne. Zaprezentowano stację zainstalowaną w Chwaszczynie do monitoringu hałasu i natężenia ruchu drogowego oraz warunków pogodowych. Przedstawiono wyniki długotrwałych pomiarów wykonanych za pomocą tej stacji, które posłużyły do walidacji modelu do przewidywania hałasu ruchu drogowego. Słowa kluczowe: hałas drogowe, monitoring, model przewidywania hałasu, walidacja 

Entry No. 243 
Entry typejournal paper 
AuthorsP. Żwan, P. Szczuko, B. Kostek, A. Czyżewski 
English titleAutomatic Singing Voice Recognition Employing Neural Networks and Rough Sets 
Polish titleAutomatyczne rozpoznawanie głosów śpiewaczych przy pomocy sieci neuronowych i zbiorów przybliżonych 
JournalTransactions on Rough Sets 
Volume 
Number
Pages455 - 473 
AbstractThe aim of the research study presented in this paper is the automatic recognition of a singing voice. For this purpose, a database containing sample recordings of trained and untrained singers was constructed. Based on these recordings, certain voice parameters were extracted. Two recognition categories were defined – one reflecting the skills of a singer (quality), and the other reflecting the type of the singing voice (type). The paper also presents the parameters designed especially for the analysis of a singing voice and gives their physical interpretation. Decision systems based on artificial neutral networks and rough sets are used for automatic voice quality/ type classification. Results obtained from both decision systems are then compared and conclusions are derived. 
StreszczenieCelem badań jest automatyczne rozpoznawanie głosów śpiewaczych w kategorii rodzaju i jakości technicznej śpiewu. W artykule opisano stworzoną bazę danych głosów, która zawiera próbki głosu śpiewaków profesjonalnych i amatorskich. W dalszej części opisano parametry zdefiniowane w oparciu o zjawiska biomechaniczne w narządzie głosu podczas śpiewania. W oparciu o stworzone macierze parametrów wytrenowano i porównano automatyczne klasyfikatory śpiewu oparte o sieci neuronowe i zbiory rozmyte. 

Entry No. 244 
Entry type 
AuthorsA. Czyżewski, G. Szwoch 
English titleMethod and apparatus for acoustic echo cancellation in VoIP terminal 
Polish title 
NotesUSA: US20110002458 
AbstractA method of acoustic echo cancellation in the VoIP terminal using processing of the far-end signal with the digital adaptive filter in order to obtain the echo estimate that is subtracted from the microphone signal in which the far-end signal, before it is converted to the analog form and passed to the loudspeaker (4), is marked by embedding an encoded digital signature obtained from the signature generator (14) and then detection of the digital signature is performed in the signal collected by the microphone (7) and converted to digital form, depending on the result of the digital signature detection, adaptation of the digital adaptive filter (9) is stopped or resumed. A circuit for acoustic echo cancellation in VoIP terminal contain the digital adaptive filter with the control block situated between the far-end speech signal path and the near-end speech signal path, and the double-talk detector (11) that comprises the signature generator (14) connected by the signature encoder (15) to the signature embedding block (16) that is situated between the speech decoder (2) and the digital-to-analog converter (3) in the far-end speech signal path. The signature generator (14) is also connected to the signature decoder (17) which is connected to the output of the analog-to-digital converter (8) in the near-end speech signal path and the output of the signature decoder (17) is connected by the decision block (18) to the control block (10) of the digital adaptive filter (9). 

Entry No. 245 
Entry typeconference paper 
AuthorsA. Czyżewski, P. Dalka 
English titleExamining Kalman filters applied to tracking objects in motion 
Polish titleZastosowanie filtrów Kalmana do śledzenia ruchomych obiektów 
ConferenceNinth International Workshop on Image Analysis for Multimedia Interactive Services 
Preprint 
Number 
Volume 
Pages175 - 178 
Conference siteKlagenfurt, Austria 
Conference date7.5.2008- 9.5.2008 
Noteshttp://ieeexplore.ieee.org/xpls/abs_all.jsp?isnumber=4556857&arnumber=4556913&count=74&index=55 
AbstractKalman filters were used for establishing relations between objects moving in video frames to the real moving objects under analysis. As a result of applying some popular methods of moving objects detection, the objects were represented by rectangles. A two-dimensional colour histogram based on a chromatic space was used for each object in experiments. The objects coupling with adequate regions including the relation of many-to-many was studied experimentally employing Kalman filters. The implemented algorithm provides a part of an advanced audio-video surveillance system for security applications. 
StreszczenieFiltry Kalmana zostały wykorzystane do ustanowienia relacji między obiektami poruszającymi się w ramkach obrazu a rzeczywistymi ruchomymi obiektami podlegającymi analizie. W wyniku zastosowania popularnych metod detekcji ruchomych obiektów, obiekty te są reprezentowane przez prostokąty. Dwuwymiarowy histogram koloru bazujący na przestrzeni chromatycznej został wykorzystany w eksperymentach do opisu każdego obiektu. Eksperymentalnie zbadano sposoby powiązania obiektów z odpowiednimi regionami w ramce obrazu, uwzględniają relacje wiele-do-wielu, wykorzystujące filtry Kalmana. Zaimplementowany algorytm stanowi część zaawansowanego systemu do audio-wizualnego monitorowania bezpieczeństwa. 

Entry No. 246 
Entry typejournal paper 
AuthorsA. Czyżewski, P. Dalka 
English titleMoving Object Detection and Tracking for the Purpose of Multimodal Surveillance System in Urban Areas 
Polish titleDetekcja i śledzenie ruchomych obiektów na potrzeby multimodalnego systemu monitorowania bezpieczeństwa w aglomeracjach miejskich 
JournalNew Directions in Intelligent Interactive Multimedia, seria: Studies in Computational Intelligence 
Volume142 
Number 
Pages75 - 84 
NotesProc. of 1st International Symposium on Intelligent Interactive Multimedia Systems and Services, University of Piraeus, Greece 9-11 July 2008 
AbstractBackground subtraction method based on mixture of Gaussians was employed to detect all regions in a video frame denoting moving objects. Kalman filters were used for establishing relations between the regions and real moving objects in a scene and for tracking them continuously. The objects were represented by rectangles. The objects coupling with adequate regions including the relation of many-to-many was studied experimentally employing Kalman filters. The implemented algorithm provides a part of an advanced audio-video surveillance system for security applications which is described briefly in the paper. 
StreszczenieMetoda odejmowania tła wykorzystująca sumę ważonych rozkładów normalnych została użyta do wykrycia w bieżącej ramce obrazu wszystkich obszarów oznaczających ruchome obiekty. Filtry Kalmana zastosowano do określenia właściwych relacji pomiędzy obszarami, a rzeczywistymi obiektami poruszającymi się polu widzenia kamery oraz do ich ciągłego śledzenia. Obiekty są reprezentowane przez prostokąty. Zbadano eksperymentalnie sposoby powiązania odpowiednich regionów z obiektami z wykorzystaniem filtrów Kalmana i uwzględniając relacje wiele-do-wielu. Zaimplementowany algorytm stanowi część zaawansowanego systemu do audio-wizualnego monitorowania bezpieczeństwa, który krótko opisano w artykule. 

Entry No. 247 
Entry type 
AuthorsA. Czyżewski, G. Szwoch 
English title 
Polish titleMetoda i układ tłumienia echa akustycznego w terminalu VoIP wykorzystująca technikę znakowania sygnału 
StreszczenieWynalazek dotyczy zastosowania w terminalu klienckim systemu VoIP układu tłumienia echa akustycznego z zastosowaniem nowej metody wykrywania przypadku tzw. mowy równoczesnej (ang. double talk). Istotą wynalazku jest przy tym wykorzystanie techniki cyfrowego znakowania sygnału do oznaczenia sygnału przychodzącego od zdalnego klienta systemu VoIP, dzięki czemu możliwe jest późniejsze stwierdzenie występowania mowy równoczesnej i sterowanie procesem adaptacji filtru dokonującego obliczania estymaty echa, a w rezultacie stłumienie echa akustycznego. Zastosowanie wynalazku w systemie VoIP umożliwia uzyskanie skutecznego tłumienia echa akustycznego przy użyciu metody nie wprowadzającej istotnych opóźnień w transmisji danych, a w rezultacie poprawę jakości usługi VoIP. Wynalazek może być szczególnie użyteczny dla tych użytkowników systemów komunikacyjnych VoIP, którzy z różnych względów podczas komunikacji w systemie VoIP wykorzystują głośnik zamiast słuchawek. Zastosowanie metody według wynalazku zapobiega powstawaniu efektu echa akustycznego, który znacznie utrudnia prowadzenie rozmów i obniża jakość usługi. Proponowane rozwiązanie realizuje układ tłumienia echa akustycznego za pomocą adaptacyjnego filtru cyfrowego. Przetworzenie sygnału docierającego od drugiego mówcy przez filtr adaptacyjny powoduje uzyskanie estymaty echa akustycznego, która następnie jest odejmowana od sygnału zebranego przez mikrofon. Wynik tej operacji jest wykorzystywany do adaptacji (strojenia) filtru. Istotnym elementem opisywanego układu jest detektor tzw. mowy równoczesnej (ang. double talk detector). Jego zadaniem jest wykrycie przypadku mowy równoczesnej, gdy mikrofon przyłączony do terminala klienckiego odbiera użyteczny sygnał mowy pochodzący od mówcy bliskiego oraz jednocześnie sygnał echa od drugiego mówcy. Detektor mowy równoczesnej wykrywa taki przypadek i powoduje wstrzymanie procesu adaptacji filtru na okres występowania mowy równoczesnej. Zapobiega on w ten sposób rozstrojeniu filtru adaptacyjnego, co skutkowałoby zniekształceniem przetwarzanego sygnału. Schemat blokowy układu detekcji mowy równoczesnej oraz sterowanego przez niego układu tłumienia echa akustycznego będącego zasadniczą częścią terminala systemu VoIP, stanowiącego sobą urządzenie według wynalazku, przedstawiono na rysunku. Opisywany układ wykorzystuje technikę znakowania sygnału pobranego z wejścia terminala A, po jego przetworzeniu przez dekoder mowy. Generator znacznika 1 wytwarza ustaloną sekwencję bitów, nazywaną znacznikiem, dobraną w taki sposób, aby umożliwić późniejszą detekcję obecności znacznika w sygnale, który został zniekształcony podczas transmisji fal akustycznych pomiędzy głośnikiem i mikrofonem. Ponadto generator 1 wytwarza ustaloną sekwencję pseudolosową oraz sygnał nośny. W bloku kodowania znacznika 2 następuje mnożenie znacznika przez sygnał nośny, a następnie przez sygnał pseudolosowy, aby uzyskać w ten sposób sygnał obejmujący szeroki zakres częstotliwości, odporny na zniekształcenia. Otrzymany w ten sposób zakodowany znacznik jest tłumiony i dodawany do właściwego sygnału w bloku zapisu znacznika 3. Sygnał z zapisanym znacznikiem jest przekazywany na wyjście układu B. Z kolei sygnał odebrany przez mikrofon trafia na wejście C opisywanego układu i jest sprawdzany pod kątem występowania znacznika. Opisywana metoda detekcji mowy równoczesnej opiera się na spostrzeżeniu, że w przypadku braku mowy równoczesnej w sygnale odebranym przez mikrofon obecny będzie tylko sygnał echa oraz ewentualnie szum i inne zakłócenia, możliwe będzie zatem wykrycie obecności znacznika. Natomiast w przypadku gdy w analizowanym sygnale jest obecny również sygnał mowy wprowadzony przez użytkownika terminala, znacznik zawarty w sygnale echa zostanie stłumiony przez użyteczny sygnał mowy, przez co blok detektora znacznika stwierdzi brak znacznika w sygnale. Blok dekodowania znacznika 4 dokonuje wstępnego przetwarzania sygnału, obejmującego m.in. normalizację i synchronizację z sygnałem kodowanym, a następnie sygnał jest mnożony przez sygnał pseudolosowy uzyskany z generatora 1, po czym przeprowadzana jest detekcja treści znacznika. Odczytany znacznik jest następnie porównywany ze znacznikiem uzyskanym z generatora 1, wprowadzonym wcześniej do sygnału, po czym blok decyzyjny 5 na podstawie wyniku próby odczytu znacznika określa czy znacznik ten był obecny w analizowanym sygnale i odpowiednio włącza lub wyłącza blok 6 sterujący adaptacją filtru 7. Blok decyzyjny 5 dostarcza binarną informację: jeżeli znacznik nie został wykryty, oznacza to konieczność zatrzymania procesu adaptacji filtru 7 przez blok sterujący 6, natomiast jeżeli znacznik zostanie wykryty, oznacza to brak mowy równoczesnej, zatem adaptacja filtru 7 powinna zostać wznowiona. Niezależnie od wyniku detekcji znacznika, estymata echa uzyskana przy użyciu filtru 7 zostaje odjęta od sygnału wejściowego, po czym wynik tej operacji jest przetwarzany przez procesor dynamiki 8, dokonujący tłumienia tzw. echa resztkowego, a następnie sygnał przekazywany jest na wyjście układu D. Istotną różnicą wprowadzoną w omawianej metodzie, odróżniającą proponowany wynalazek od typowych zastosowań techniki znakowania sygnałów, jest wykrywanie samej obecności znacznika, a nie odczytywanie jego treści. Z tego względu sygnał znacznika został dobrany w taki sposób, aby jego obecność w sygnale była możliwa do stwierdzenia pomimo zniekształcenia sygnału zawierającego znacznik na skutek pogłosu wprowadzonego w pętli akustycznego sprzężenia zwrotnego oraz szumu i innych zakłóceń zewnętrznych, a zarazem aby sygnał mowy użytkownika terminala powodował stłumienie znacznika uniemożliwiające jego wykrycie, pozwalając w ten sposób stwierdzić przypadek występowania mowy równoczesnej. Opisana metoda tłumienia echa akustycznego, z wykorzystaniem znakowania sygnału w celu detekcji mowy równoczesnej, może zostać zaimplementowana w terminalu klienta systemu VoIP, który może mieć postać sprzętową lub programową. Wykorzystanie wynalazku umożliwia skuteczne tłumienie niekorzystnego efektu echa akustycznego bez zwiększania opóźnień w komunikacji, które mógłby spowodować bardziej złożony układ detekcji mowy równoczesnej. Z powyższych względów opisywany wynalazek może znaleźć szczególne zastosowanie w tych terminalach klienckich VoiP, w które nie dysponują dużą mocą obliczeniową. Wykorzystanie wynalazku prowadzi do podwyższenia jakości usług telekomunikacyjnych w systemach VoIP. ZASTRZEŻENIA PATENTOWE 1. Terminal kliencki systemu VoIP znamienny tym, że wykorzystuje układ tłumienia echa akustycznego zawierający detektor mowy równoczesnej zrealizowany w oparciu o znakowanie sygnału przychodzącego za pomocą ustalonego znacznika oraz stwierdzenie obecności znacznika w sygnale przesyłanym do sieci w celu określenia czy występuje mowa równoczesna i czy występuje konieczność zatrzymania procesu adaptacji układu tłumienia echa akustycznego. 2. Metoda detekcji mowy równoczesnej znamienna tym, że wykorzystuje technikę znakowania sygnału w sposób podany w zastrzeżeniu 1.  

Entry No. 248 
Entry type 
AuthorsA. Czyżewski, P. Odya 
English title 
Polish titlePisak ekranowy zwłaszcza do tabletu 
NotesWzór użytkowy nadany w 2014 r. (konwersja ze zgłoszenia patentowego) 

Entry No. 249 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kunka, M. Kurkowski, R. Branchat 
English titleComparison of developed gaze point estimation methods 
Polish titlePorównanie metod wyznaczania punktu fiksacji wzroku 
ConferenceNTAV/SPA 2008 
Preprint 
Number 
Volume 
Pages133 - 136 
Conference sitePoznań, Polska 
Conference date25.9.2008- 27.9.2008 
Notespublikacja w materiałach konferencyjnych oraz na płycie CD 
AbstractThis paper presents the software part of an inexpensive hands-free eye tracking system. The system works using infrared illumination like most of the available eye trackers. Two methods allowing estimation the gaze point on computer screen are compared. Research on effectiveness of these methods is discussed and the better one is indicated.  
StreszczeniePublikacja prezentuje część programową taniego bezkontaktowego systemu śledzenia punktu fiksacji wzroku na monitorze komputera. System pracuje przy wykorzystaniu oświetlenia podczerwienią jak większość dostępnych na rynku systemów tego typu. Zostały porównane dwie metody pozwalające wyznaczyć punkt fiksacji wzroku na monitorze komputerowym. Przedstawiono wyniki badań efektywności zaprezentowanych metod i wskazano lepszą z nich.  

Entry No. 250 
Entry typeconference paper 
AuthorsA. Czyżewski, Ł. Kosikowski, B. Kostek, A. Szkiełkowska, K. Kochanek, H. Skarżyński 
English titleA portable device for voice monitoring 
Polish titleUrządzenie przenośne do monitorowania głosu 
ConferenceIII Konferencja Naukowo-Szkoleniowa Sekcji Foniatrycznej i Sekcji Audiologicznej Polskiego Towarzystwa Otorynolaryngologów Chirurgów Głowy i Szyi 
Preprint 
Number 
Volume 
Pages 
Conference sitePoznań, Polska 
Conference date8.5.2008- 10.5.2008 
Notesplakat 
AbstractThe aim of the work was the elaboration of a prototype and, in the second step, the implementation of a portable voice monitoring device for the clinical practice. This device can be used at home, in the work etc. by people with a high risk of voice disorders, e.g. teachers or actors. Those people while speaking, often commit emission errors causing voice problems that can lead to future pathological changes in the larynx. 
StreszczenieCelem projektu było opracowanie i implementacja przenośnego urządzenia do monitorowania głosu. Urządzenie może być wykorzystywane w domu i pracy, przez osoby, u których występuję zwiększone ryzyko wystąpienia zaburzeń głosu np. nauczycieli i aktorów. Osoby te często popełniają błędy emisyjne, które mogą w przyszłości spowodować zmiany patologiczne w krtani. 

Entry No. 251 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus, M. Szczodrak, B. Kostek 
English titleOnline urban noise monitoring system 
Polish title 
Conference16 ICSV 
Preprint 
Number 
Volume 
Pages1 - 8 
Conference siteKraków, Polska 
Conference date5.7.2009- 9.7.2009 
AbstractConcepts and implementation of the Online Urban Noise Monitoring System are presented in this paper. The objectives of the realized project are described. The concept of the dynamic acquisition of the noise source parameters is introduced. The idea of noise modeling, based on noise emission and propagation simulations, was developed and practically utilized in the system. The practical implementation of noise maps generation and visualization is pre-sented, together with introduced improvements in the domain of continuous noise monitoring and acoustic maps creation. The results of tests performed using the system prototype are shown. 

Entry No. 252 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus, M. Szczodrak 
English title 
Polish titleModelowanie jakości powietrza w powiązaniu z modelem numerycznym miasta z wykorzystaniem oprogramowania działającego na platformie wieloprocesorowej 
ConferenceJakość powietrza 
Preprint 
Number 
Volume 
Pages1 - 9 
Conference siteGdańsk, Polska 
Conference date23.4.2009- 24.4.2009 
AbstractArtykuł przedstawia wyniki modelowania zanieczyszczenia powietrza dla wybranych źródeł drogowych. Obliczenia emisji i propagacji zanieczyszczeń powietrza dokonano za pomocą modelu AUSTAL2000, dostępnego w aplikacji CadnaA. Przedstawiono wyniki analiz dla następujących substancji: SO2, NOx, PM10, benzen. Dodatkowo zamieszczono łączne wyniki zanieczyszczeń powietrza i poziomy hałasu dla rozpatrywanych dróg. Zastosowanie platformy wieloprocesorowej do celów obliczeń numerycznych umożliwiło zredukowanie czasu uzyskania wyniku. 

Entry No. 253 
Entry typejournal paper 
AuthorsM. Kulesza, A. Czyżewski 
English titleTonality Estimation and Frequency Tracking of Modulated Tonal Components 
Polish titleEstymacja tonalności oraz śledzenie w dziedzinie częstotliwości modulowanych komponentów tonalnych 
JournalJ. Audio Eng. Soc. 
Volume57 
Number
Pages221 - 236 
AbstractA novel method for tonality estimation and frequency tracking of tonal components modulated in frequency and amplitude is presented. The algorithm detects the local maxima of magnitude spectra corresponding to three contiguous frames of a signal and matches them into the tonal track candidates. The magnitude-based and phase-based methods are used to estimate the frequency jumps between spectrum maxima belonging to the tonal track candidates. Verification of the candidate tonality is based on the distance between frequency jumps derived from the magnitude-based and phase-based estimators. The effectiveness of the proposed algorithm is compared with selected existing methods for tonality estimation used in psychoacoustic models. 
StreszczenieZaprezentowano nową metoda estymacji tonalności oraz śledzenia częstotliwości chwilowej modulowanych komponentów tonalnych. Algorytm dokonuje detekcji lokalnych maksimów widma w trzech następujących po sobie widma sygnału i przeprowadza proces formowania kandydatów do ścieżek tonalnych. Dla każdego z kandydatów określana jest zmiana częstotliwości chwilowej z wykorzystaniem metody bazującej na analizie widma amplitudowego i fazowego. Weryfikacja tonalności kandydatów następuje na podstawie różnicy estymat uzyskanych dwoma wspomnianymi metodami. Zaproponowany algorytm został porównany z wybranyi metodami estumacji tonalności stosowanymi w modelach psychoakustycznych.  

Entry No. 254 
Entry typeconference paper 
AuthorsM. Kulesza, A. Czyżewski 
English titleAudio codec employing frequency-derived tonality measure 
Polish titleKodek sygnałów fonicznych wykorzystujący miarę tonalności bazującą na analizie częstotliwości komponentów widma 
Conference127th Convention of Audio Engineering Society  
Preprint7877 
Number 
Volume 
Pages1 - 14 
Conference siteNowy Jork, USA 
Conference date9.10.2009- 12.10.2009 
AbstractA transform codec employing efficient algorithm for detection of spectral tonal components is presented. The tonality measure used in MPEG psychoacoustic model is replaced with the method providing adequate tonality estimates even if the tonal components are deeply frequency modulated. The reliability of hearing threshold estimated using psychoacoustic model with standardized tonality measure and the proposed one is investigated using objective quality testing methods. The proposed tonality estimator is also used as a basis for detector of noise-like signal bands. Instead of quantizing the noise-like signal components according to the usual transform coding scheme, the signal bands containing only noise-like components are filled with locally generated noise in the decoder. The results of the listening tests reveling usefulness of employed tonality estimation method for such a coding scenario are presented. 
StreszczenieZaprezentowano kodek sygnałów fonicznych wykorzystujący efektywny algorytm detekcji komponentów tonalnych sygnału. Miara tonalności stosowana w kodekach MPEG została zastąpiona metodą pozwalającą na efektywne określenie tonalności komponentów modulowanych częstotliwościowo. Zastosowano obiektywne metody porównawcze w celu określenia wiarygodności estymacji progów słyszenia uzyskiwanych przy pomocy modeli psychoakustycznych ze standardową miarą tonalności oraz miarą proponowaną przez autorów. Miara tonalności została również wykorzystana do detekcji pasm sygnału zawierających jedynie komponenty szumowe. Pasma szumowe nie są kodowane w typowy sposób, ale syntetyzowane lokalnie w dekoderze. Przedstawiono wyniki testów odsłuchowych potwierdzających użyteczność wykorzystanej metody estymacji tonalności w przypadku kodowania sygnałów fonicznych zgodnie z opisaną metodą. 

Entry No. 255 
Entry typeconference paper 
AuthorsM. Szczodrak, A. Czyżewski, J. Kotus 
English titleDynamic noise mapping in the city of Gdansk 
Polish title 
ConferenceEuronoise 2009 
Preprint 
Number 
Volume 
Pages 
Conference siteEdynburg, Wielka Brytania 
Conference date26.10.2009- 28.10.2009 
AbstractInvestigation results of the system for creating dynamic noise maps are presented. Brief description of the system engineered at the Multimedia Department of Gdansk University of Technology is introduced. The method for acquiring input data to the numerical model for computing the distribution of the acoustic field over urban area is described. Distribution in the city area of stations for road traffic volume and noise level monitoring is illustrated. Pilot series of experiments aiming at investigation of operating efficiency of dynamic noise maps is presented. The noise maps obtained as an output of algorithms implemented on the supercomputer are shown. The time needed for updating a map for a particular fragment of city is investigated. Moreover, the outcomes obtained by modeling and by measurements done in the places of station deployment are compared. 
StreszczenieW referacie przedstawiono wyniki badania systemu do tworzenia dynamicznych map hałasu. Zaprezentowano krótki opis systemu opracowanego w Katedrze Systemów Multimedialnych. Opisano metodę pobierania danych wejściowych do modelu numerycznego obliczającego rozkład pola akustycznego w obszarze miejskim. Przedstawiono próbną serię eksperymentów mających na celu zbadanie efektywności działania systemu. Pokazano mapy hałasu otrzymane w wyniku działania algorytmów zaimplementowanych na superkomputerze. Zbadano czas potrzebny do aktualizacji mapy dla wybranego obszaru miasta. Ponadto porównano wyniki otrzymane w procesie modelowania z pomiarami wykonanymi w miejscach rozlokowania stacji pomiarowych. 

Entry No. 256 
Entry typeconference paper 
AuthorsA. Czyżewski, P. Odya, A. Grabkowska, M. Grabkowski, B. Kostek 
English titleSmart Pen - new multimodal computer control tool for dyslexia therapy 
Polish titleInteligentny długopis - komputerowy interfejs przeznaczony do terapii dysleksji 
ConferenceSiggraph 2009 
Preprint 
Number 
Volume 
Pages 
Conference siteNowy Orlean, USA 
Conference date3.8.2009- 7.8.2009 
NotesPlakat 
AbstractSmart Pen is a tool for supporting the therapy of developmental dyslexia, with particular regard to dysgraphia. It comprises a display monitor equipped with a high-sensitivity touchpad and specially designed writing tool equipped with pressure sensors. 
StreszczenieInteligentny długopis jest narzędziem przeznaczonym do wspomagania terapii dysleksji, ze szczególnym uwzględnieniem dysgrafii. Interfejs składa się z monitora zintegrowanego z tabletem oraz długopisu wyposażonego w czujniki nacisku. 

Entry No. 257 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, P. Odya, H. Skarżyński, P. Skarżyński, P. Suchomski 
English titleNew Technology for Hearing Stimulation Employing the SPS-S Method 
Polish titleWykorzystanie nowych technologii do treningu słuchu z użyciem metody SPS-S 
Conference127th AES Convention 
Preprint7919 
Number 
Volume 
Pages 
Conference siteNowy Jork, USA 
Conference date9.10.2009- 12.10.2009 
AbstractA prototype of a the new Compact Audio Therapy Unit (CATU) is presented that can process any audio signal inside a very compact device working in real time, employing advanced digital filtration, signal keying, manipulating playback rate, various spectral modifications of the signal, repeating phrases and others. It was designed to provide a platform for the therapy with the new Method of the Aural Perception Stimulation (SPS-S). The design for wearability allows one to use the device effectively in normal everyday life conditions, e. g. outdoors. The compact and versatile processing device can potentially open a new era in patients and trainees mobility. 
StreszczenieIstotnym założeniem metody SPS-S jest możliwość stosowania treningu słuchowego w warunkach życia codziennego, a więc także poza gabinetami placówek terapeutycznych. Mobilne urządzenie – stymulator słuchu jest oparte na najnowszej technologii mikroelektronicznej, Oferuje on możliwość wykorzystywania wielu programów terapii, które przebiegają z zastosowaniem algorytmów cyfrowego przetwarzania dźwięku. Algorytmy te można podzielić na klasyczne, nawiązujące w swojej zasadzie działania do koncepcji tzw. „Elektronicznego ucha” i na w pełni oryginalne algorytmy, które przekształcają dźwięki w taki sposób, aby ich odsłuchiwanie powodowało poprawę w zakresie lateralizacji słuchowej. Wspomniane „Elektroniczne ucho” służy przede wszystkim poprawie motoryki mikromięśni ucha środkowego, podczas gdy algorytmy związane z poprawą lateralizacji, mogą być wykorzystywane do niwelowania licznych niekorzystnych objawów nieprawidłowej lateralizacji. Jak dowodzą badania naukowe, choć diagnozowane nieprawidłowości w tym zakresie dotyczą najczęściej lateralizacji słuchowej, to mogą one mieć również związek z jąkaniem się, z nie w pełni efektywnym widzeniem, a nawet z dysleksją. W komunikacie zostanie przedstawiona nowa metoda stymulacji sensorycznej i opracowane urządzenie mobilne umożliwiające tę stymulację. 

Entry No. 258 
Entry typeconference paper 
AuthorsA. Czyżewski, P. Odya, B. Kostek, H. Skarżyński 
English title 
Polish titleSPS-S - nowa metoda stymulacji słuchowej 
ConferenceISSET 2009 - XIII Międzynarodowe Sympozjum Inżynierii i Reżyserii Dźwięku 
Preprint 
Number 
Volume 
Pages37 - 44 
Conference siteWarszawa, Polska 
Conference date16.10.2009- 18.10.2009 
AbstractOne of the main objectives of the SPS-S method is the possibility of auditory training in conditions of everyday life, and therefore also outside the therapeutic institutions. A prototype of a new Compact Audio Therapy Unit (CATU) is presented that can process any audio signal inside a very compact device working in real time. The CATU offers the possibility of using multiple therapy programs, which run with the use of digital audio processing algorithms. It was designed to provide a platform for the therapy with the new Method of the Aural Perception Stimulation (SPS-S). The CATU and the SPS-S method will be described in the paper. 
StreszczenieIstotnym założeniem metody SPS-S jest możliwość stosowania treningu słuchowego w warunkach życia codziennego, a więc także poza gabinetami placówek terapeutycznych. Mobilne urządzenie – stymulator słuchu jest oparte na najnowszej technologii mikroelektronicznej, Oferuje on możliwość wykorzystywania wielu programów terapii, które przebiegają z zastosowaniem algorytmów cyfrowego przetwarzania dźwięku. Algorytmy te można podzielić na klasyczne, nawiązujące w swojej zasadzie działania do koncepcji tzw. „Elektronicznego ucha” i na w pełni oryginalne algorytmy, które przekształcają dźwięki w taki sposób, aby ich odsłuchiwanie powodowało poprawę w zakresie lateralizacji słuchowej. W komunikacie zostanie przedstawiona nowa metoda stymulacji sensorycznej i opracowane urządzenie mobilne umożliwiające tę stymulację. 

Entry No. 259 
Entry typeconference paper 
AuthorsJ. Kotus, B. Kostek, A. Czyżewski 
English titleA new methodological approach to the noise threat evaluation based on the selected physiological properties of the human hearing system 
Polish titleNowe metodologiczne podejście w ocenie zagrożeń hałasem oparte na wybranych fizjologicznych właściwościach słuchu 
Conference126th AES Convention 
Preprint 
Number 
Volume 
Pages 
Conference siteMunich, Germany 
Conference date7.5.2009- 10.5.2009 
AbstractA new way of assessment of noise-induced harmful effects on human hearing system is presented in the paper. The method takes into consideration properties of the selected physiological human hearing system. On the basis of the hearing examinations and noise measurements results and psychoacoustical noise dosimeter performance the new indicators of the noise harmfulness were proposed. The evaluation of the proposed indicators were conducted on the basis of hearing examination in the real noise exposure situations and also on the basis of the simulation results using standard test signals (such as: white, pink and brown noise). The performed analysis and obtained results confirmed the practical usefulness and correctness of the proposed indicators. 

Entry No. 260 
Entry typeconference paper 
AuthorsP. Maziewski, A. Kupryjanow, K. Kaszuba, A. Czyżewski 
English titleACCELEROMETER SIGNAL PRE-PROCESSING INFLUENCE ON HUMAN ACTIVITY RECOGNITION 
Polish titleWPŁYW PRZETWARZANIA WSTĘPNEGO SYGNAŁÓW PRZYSPIESZENIA NA JAKOŚĆ ROZPOZNAWANIA KATEGORII RUCHU CZŁOWIEKA  
ConferenceNTAV/SPA 2009 
Preprint 
Number 
Volume 
Pages95 - 99 
Conference sitePoznań, Polska 
Conference date24.9.2009- 26.9.2009 
AbstractA study of data pre-processing influence on accelerometer-based human activity recognition algorithms is presented. The frequency band used to filter-out the accelerometer signals and the number of accelerometers involved were considered in terms of their influence on the recognition accuracy 
StreszczenieW referacie przedstawiono analizę wpływu przetwarzania wstępnego sygnałów pochodzących z czujników przyspieszenia na sposób działania algorytmów rozpoznawania kategorii ruchu człowieka. Zbadano wpływ zmian częstotliwości odcięcia filtrów oraz ilości czujników przyspieszenia na skuteczność działania poszczególnych algorytmów rozpoznawania aktywności ruchowych. 

Entry No. 261 
Entry typeconference paper 
AuthorsA. Czyżewski, H. Skarżyński 
English title 
Polish titleMultimedialny System Monitorowania Hałasu 
ConferenceXVI giełda polskich wynalazków nagrodzonych na światowych targach wynalazczości w 2008 roku 
Preprint 
Number 
Volume 
Pages52 - 52 
Conference siteWarszawa, Polska 
Conference date9.3.2009- 15.3.2009 
StreszczeniePrezentowane rozwiązanie jest sieciocentrycznym serwisem poświęconym monitorowaniu zagrożeń hałasem. Umożliwia pobieranie, gromadzenie, analizę i wizualizację danych dotyczących hałasu i koncentracji zanieczyszczeń powietrza, pobieranych ze zdalnych urządzeń pomiarowych oraz elektronicznych ankiet dostępnych przez Internet. Bezobsługowe stacje pomiarowe, będące integralnym elementem systemu, umożliwiają automatyczne określanie parametrów wybranych modeli źródeł hałasu (droga, linia kolejowa). Funkcjonalność ta umożliwia automatyzację procesu tworzenia i weryfikowania map hałasu.  

Entry No. 262 
Entry typeconference paper 
AuthorsA. Czyżewski, H. Skarżyński 
English title 
Polish titleMultimedialny System szacowania wpływu hałasu na słuchz zastosowaniem środków teleinformatycznych 
ConferenceXVI giełda polskich wynalazków nagrodzonych na światowych targach wynalazczości w 2008 roku 
Preprint 
Number 
Volume 
Pages59 - 59 
Conference siteWarszawa, Polska 
Conference date9.3.2009- 15.3.2009 
StreszczeniePrezentowane rozwiązanie jest sieciocentrycznym serwisem poświęconym monitorowaniu zagrożeń hałasem. System zawiera unikatową i mająca bardzo duże znaczenie praktyczne, autorską koncepcję psychoakustycznego dozymetru hałasowego. Podstawową funkcją dozymetru jest szacowanie w czasie rzeczywistym skutków słuchowych, jakie wywołuje ekspozycja na hałas. Dzięki temu możliwe jest dokładne określenie zagrożeń słuchowych dla dowolnych warunków akustycznych. Specjalne procedury zawarte w systemie umożliwiają ponadto wyznaczenie częstotliwości, które stanowią największe zagrożenie dla słuchu. 

Entry No. 263 
Entry typeconference paper 
AuthorsH. SKARŻYŃSKI, P. BOGORODZKI, K. KOCHANEK, A. CZYŻEWSKI, J. KOTUS, P. SKARŻYŃSKI 
English titleA fMRI audio system for temporary hearing threshold shifts studies 
Polish title 
ConferenceEuropean Society for Magnetic Resonance in Medicine and Biology (ESMRMB) 2009 Congress 
Preprint 
Number 
Volume 
Pages300 - 300 
Conference siteAntalya, Turkey 
Conference date1.10.2009- 3.10.2009 
AbstractSeveral empirical studies have shown, that high level acoustic exposure may cause on humans effect called. Temporary Hearing Threshold Shift (TTParadigmDesigner tool for fMRI experiments, ESMRMB2006.S). A dB SPL expressed TTS value expresses a subject specific hearing level shift caused by an acoustic overload. The main aim of this project was to develop a MRI compatible audio system with the capabilities of: a)performing fMRI stimulation, b)measuring subject specific hearing levels, c)providing high level acoustic exposures. A mean 12 dB TTS effect on 3kHz was measured. The FMRI results with random effect analysis showed strong activations in different parts of auditory cortex (max. T-value left hemisphere 6.5, right hemisphere 6.3, all values with p<0.001) for both functional runs (before and after noise exposure). A cross-run comparisons we will be presented. The experimental data showed that proposed system can be used for more quantitative analysis of TTS effect. A possibility of auditory stimulation and hearing level measurements directly in magnet bore may open a new possibilities in this ara. 

Entry No. 264 
Entry typejournal paper 
AuthorsP. Dalka, A Ciarkowski, P. Szczuko, G. Szwoch, A. Czyżewski 
English titleSurveillance Camera Tracking of Geo positioned Objects 
Polish titleŚledzenie obiektów o znanej pozycji geograficznej za pomocą kamer PTZ 
JournalNew Directions in Intelligent Interactive Multimedia Systems and Services - 2, seria: Studies in Computational Intelligence, Springer 
Volume226 
Number 
Pages21 - 30 
Noteshttp://www.springerlink.com/content/c621777791653422/ 
AbstractA system for tracking moving objects with a known GPS position using a set of PTZ cameras with limited areas of coverage is presented. The basic idea of the system and its possible applications are discussed. The proposed camera calibra-tion technique is used to transform the GPS position to camera settings. The cur-rent position of the tracked object is predicted in order to compensate the trans-mission and processing delays. The distributed client-server system using mobile terminals and its application to tracking objects movement, with additional func-tionality such as showing the position of the objects on the map, is presented. The results of the tests performed in real-life conditions, as well as perspectives of a future development of the system, are discussed. 
StreszczenieRozdział opisuje system sterowania kamerami ruchomymi PTZ realizujący śledzenie poruszającego się obiektu o znanej pozycji GPS. Przedstawione są idea systemu oraz możliwości jego wykorzystania. Opisane są: procedura kalibracji pola widzenia kamery i sposób powiązania z danymi o lokalizacji, procedura predykcji ruchu w celu kompensacji opóźnień czasowych. Omówiony jest zaimplementowany system modułowy, w którego skład wchodzą: terminale mobilne, serwer centralny oraz aplikacja kliencka wizualizująca pozycję obiektów i kamer na mapie. Przedstawione są wyniki testów praktycznych oraz perspektywy rozwoju systemu. 

Entry No. 265 
Entry typeconference paper 
AuthorsA. Czyżewski 
English titleApplications of audio & video analysis to identifying of security threats 
Polish titleZastosowania analizy dźwięku i obrazu do identyfikacji zagrożeń 
ConferenceKonferencja Zespołu Naukowo-Przemysłowego przy Radzie Uzbrojenia MON 
Preprint 
Number 
Volume 
Pages 
Conference siteWAT, Warszawa, Polska 
Conference date13.5.2009 
Notesmateriał w formie prezentacji Power Point 
AbstractThe structure of a system of parallel analysis of sound and video data was presented. In particular algorithms concerning detection of the the following threats were discussed: entering a zone, traffci violation, abandoned luggage, gatherings, fights, monitoring camera assault.  
StreszczenieZaprezentowano strukturę systemu łącznej analizy danych pochodzących z analizy obrazu i dźwięku w zastosowaniu do monitorowania obszarów, w których zagrożone jest bezpieczeństwo. W szczególności skupiono się na następujących rodzajach zagrożeń: wkroczenie na niedozwolony obszar, naruszenie przepisów ruchu drogowego, bagaż pozostawiony bez nadzoru, zgromadzenia, bójki, próba uszkodzenia kamery. 

Entry No. 266 
Entry typeconference paper 
AuthorsA. Czyżewski 
English titleHigh technology innovations - examples of commercialisation of innovative products 
Polish titleInnowacje wysokich technologii - przykłady komercjalizacji produktów innowacyjnych 
ConferencePre-Event Globe Forum - Innovation Summit Conference 
Preprint 
Number 
Volume 
Pages 
Conference siteGdańsk, Polska 
Conference date27.10.2009 
AbstractPrzedstawiono i omówiono aplikacje opracowane w Katedrze Systemów Multimedialnych WETI Politechniki Gdańskiej, dotyczące następujących dziedzin: bezpieczeństwo, monitorowanie środowiska, telemedycyna, rejestracja dźwięku i obrazu, ochrona dziedzictwa kulturowego.  
StreszczenieSecurity & Safety applications, environmental monitoring, e-Health multimedia applications, sound & vision recording and mastering, cultural heritage applications elaborated in the Multimedia Systems Department of the Gdansk University of Technology were presented and discussed.  

Entry No. 267 
Entry typeconference paper 
AuthorsA. Czyżewski 
English titleMultimodal interfaces - new means of communicating with conputers 
Polish titleInterfejsy multimodalne –nowe sposoby komunikowania się z komputerem 
ConferenceXXV Jubileuszowe Jesienne Spotkania PTI 
Preprint 
Number 
Volume 
Pages 
Conference siteMrągowo, Polska 
Conference date12.10.2009- 16.10.2009 
AbstractA line of original (prepared by the Multimedia Systems Department together with a industrial partner) human-computer interaction (HCI) interfaces was presented that offers extended functionality beyond of a traditional computer mouse and keyboard and allows a user to work on a computer using movements and gestures. 
StreszczeniePrzedmiotem prezentacji były opracowane dotychczasowo w Katedrze Systemów Multimdialnych we współpracy z partnerem przemysłowym interfejsy multimodalne, które poszerzają możliwości komunikowania się użytkownika z komputerem ponad możliwości wynikające ze stosowania tracyjnej myszy i klawiatury komputerowej.  

Entry No. 268 
Entry typeconference paper 
AuthorsA. Czyżewski 
English titleMultimedia system supporting identification and combating crime and violence - project progress and hitherto results  
Polish titleMultimedialny system wspomagający identyfikację i zwalczanie przestępczości oraz terroryzmu - realizacja projektu i jego dotychczasowe wyniki 
ConferenceIV MIĘDZYNARODOWA KONFERENCJA POLICYJNA i WYSTAWA "EUROPOLTECH" 
Preprint 
Number 
Volume 
Pages 
Conference siteWarszawa, Polska 
Conference date22.4.2009- 24.4.2009 
AbstractZaprezentowano zestaw opracowanych algorytmów analizy zdarzeń w strumieniu multimedialnym. Przedstawiono ponadto oprogramowanie komunikacyjne, działające na przenośnych urządzeniach klasy PDA. Rozwiązanie oparte na technologiach GIS, które omówiono, pozwala na śledzenie ruchomych obiektów wykrywanych za pomocą kamer, na mapie numerycznej miasta. Ponadto, zaprezentowano nową generację algorytmów umożliwiających monitoring akustyczny aglomeracji przy wykorzystaniu opracowanych i zainstalowanych stacji węzłowych rozproszonego systemu monitoringowego.  
StreszczenieA set of engineered algorithms for analyzing events in the video stream acquired from monitoring cameras and microphones was developed. A communication software was elaborated enabling an effective multimedia communication using handheld PDA devices. A GIS-based solution was implemented allowing for positioning any object tracked by the monitoring cameras on the numerical maps of the city. A new generation of acoustic surveillance system was also developed, basing on the engineered “node stations” that can be installed in the urban agglomerations in order to acquire acoustical signals, to analyze them and to transmit resulting data to a central server.  

Entry No. 269 
Entry typeconference paper 
AuthorsA. Czyżewski 
English titleAdvanced monitoring projects realised at the Gdansk University of Technology 
Polish titleProjekty z dziedziny zaawansowanego monitoringu realizowane w PG 
Conference"Bezpieczeństwo – Innowacyjność – Gospodarka”  
Preprint 
Number 
Volume 
Pages 
Conference siteJurata, Polska 
Conference date25.8.2009- 29.8.2009 
AbstractThe engineered surveillance system consists of many input data sources (video cameras, microphones) and a central processing server. Video cameras are placed inside and around of a restricted zone in order to completely cover the monitored area. An array of microphones placed in the area supplements the unusual events recognition. 
StreszczenieBudowany system monitoringu obejmuje wiele źródeł danych do analizy (kamery wizyjne, mikrofony) i centralny serwer. Kamery wizyjne są sytuowane wewnątrz nadzrowanego obszaru i na jego obrzeżach, aby możliwa była pełna obserwacja terenu. Zestaw mikrofonowy umieszczony w nadzorowanej strefie uzupełnia rozwiązanie o detekcję neitypowych zdarzeń dźwiękowych.  

Entry No. 270 
Entry typeconference paper 
AuthorsM. Szwarc, A. Czyżewski 
English titleA genetic algorithms application to railway noise prediction 
Polish title 
ConferenceEURONOISE 2009 
Preprint 
Number 
Volume 
Pages 
Conference siteEdynburg, Wielka Brytania 
Conference date26.10.2009- 28.10.2009 
AbstractA proposition of a new innovative method for noise prediction based on Genetic Algorithms application is formulated. Genetic Algorithm principles are explained briefly. An explanation of how GeneticAlgorithms were used in the area of noise modeling is provided. Some results that were achieved with a prototype software created for the purpose of this paper are presented and discussed. Finally, some practical technical applications of the new method are pointed out. 

Entry No. 271 
Entry typeconference paper 
AuthorsA. Czyżewski 
English titleSelected double applications of multimedia technology 
Polish titleWybrane „podwójne” zastosowania technologii multimedialnych  
ConferenceBezpiecz. i wyrównywanie szans kierunkiem działań Unii Europejskiej w XXI wieku 
Preprint 
Number 
Volume 
Pages 
Conference siteOwińska k. Poznania, Polska 
Conference date6.12.2009- 9.12.2009 
AbstractResearch profile included: Multimedia Systems Department research profile, advanced security technologies for supporting impaired people, audio-video marking of objects, controlling computer by eye-tracking and lips movement, acoustic radar technology.  
StreszczeniePlan wystąpienia obejmował: profil badań Katedry Systemów Multimedialnych, zaawansowane technologie bezpieczeństwa jako podstawę do zastosowań w pomocach dla osób niepełnosprawnych, znakowanie wizyjno-foniczne obiektów i przedmiotów, sterowanie za pomocą ust i oczu, radar akustyczny.  

Entry No. 272 
Entry typeconference paper 
AuthorsP. Szczuko, B. Kostek, A. Czyżewski 
English titleNew method for personalization of avatar animation 
Polish titleNowa metoda personalizacji animacji wirtualnych postaci 
ConferenceInternational Conference on Man-Machine Interactions 
Preprint 
Number 
Volume 
Pages435 - 443 
Conference siteKocierz, Polska 
Conference date25.9.2009- 27.9.2009 
AbstractThe paper presents a method for creating a personalized animation of avatar utilizing fuzzy inference. First the user designs a prototype version of animation, with keyframes only for important poses, roughly describing the action. Then animation is enriched with new motion phases calculated by the fuzzy inference system using descriptors given by the user. Various degrees of motion fluency and naturalness are possible to achieve. The proposed algorithm of the animation enrichment based on fuzzy description is thoroughly presented. The first part consists of creating fuzzy rules for the algorithm using results of subjective evaluation of the animated movement, the second one utilizes input descriptors for new motion phases calculation, which are finally added to the animation. Results of subjective evaluation of obtained animations are presented. 
StreszczenieReferat przedstawia nową metodę tworzenia spersonalizowanych animacji wirtualnych postaci zwanych awatarami. Wykorzystuje ona wnioskowanie rozmyte. W pracy z przygotowanym systemem, animator projektuje prototypową wersję animacji, zawierającą klatki kluczowe dla najważniejszych póz postaci. Następnie animacja ta jest wzbogacana o nowe fazy, których parametry wyznaczane są w procesie wnioskowania rozmytego, z uwzględnieniem wartości opisowych zmiennych lingwistycznych podanych przez użytkownika. Możliwe jest uzyskiwanie ruchu o różnym stopniu płynności i naturalności, zgodnie z oczekiwaniami użytkownika. W referacie opisano sposób działania algorytmu. Pierwsza część wymaga analizy cech animacji ocenianych subiektywnie w celu wygenerowania bazy reguł. Następnie animacja prototypowa jest parametryzowana i w procesie wnioskowania rozmytego wyznaczane są nowe fazy ruchu, które są automatycznie wstawiane do animacji. Uzyskane w ten sposób animacje zostały poddane ocenie subiektywnej w celu potwierdzenia skuteczności modyfikacji charakteru animowanego ruchu. 

Entry No. 273 
Entry typejournal paper 
AuthorsG. Szwoch, A. Czyżewski, A. Ciarkowski 
English titleA Double-Talk Detector Using Audio Watermarking 
Polish titleDetektor mowy równoczesnej wykorzystujący znakowanie sygnałów fonicznych 
JournalJ. Audio Eng. Soc. 
Volume57 
Number11 
Pages916 - 926 
AbstractA novel approach to double-talk detection in the acoustic echo canceler is proposed. A hidden signature is embedded into the arriving signal, using the echo-hiding method. Next detection of the presence of this signature in the microphone signal is performed. The results of the signature detection may be used by the acoustic echo canceler to stop or restart the adaptation process. 

Entry No. 274 
Entry typejournal paper 
AuthorsG. Szwoch, P. Dalka, A. Czyżewski 
English titleEstimation of object size in the calibrated camera image 
Polish titleEstymacja rozmiaru obiektów w obrazach ze skalibrowanej kamery 
JournalElektronika 
Volume50 
Number
Pages10 - 13 
AbstractIn the paper, a method of estimation of the physical sizes of the objects tracked by the camera is presented. First, the camera is calibrated, then the proposed algorithm is used to estimate the real width and height of the tracked moving objects. The results of size estimation are then used for classification of the moving objects. Two methods of camera calibration are compared, test results are presented and discussed. The proposed estimation algorithm is intended to be used in the video surveillance system for automatic detection of events in the camera images. 

Entry No. 275 
Entry typereport 
AuthorsP. Szczuko, A. Czyżewski, P. Dalka, G. Szwoch, A. Ciarkowski, . et al 
English titleReport on the collection and analysis of user requirements 
Polish titleRaport podsumowujący gromadzenie i analizę wymagań użytkowników 
Report NumberINDECT/D1.1 
NotesProjekt INDECT. Nr umowy: 18188 
AbstractThe INDECT Project, dedicated to creation of Intelligent information system supporting observation, searching and detection for security of citizens in urban environment is the End- User driven enterprise. Therefore for WP1 first step is to name End-User requirements for functionality of the system, specifically for task of Intelligent Monitoring and Automatic Detection of Threats. For the purpose of End-User requirements analysis an End-User Questionnaire was established, created with cooperation of all INDECT Project Partners. This document, Deliverable D1.1., describes End-User Questionnaire structure, its purpose from the point of view of WP1, outcomes of analysis of answers related to WP1 work, and preliminary specification of functionality and hardware of the system fulfilling the requirements for intelligent monitoring and automatic detection of threats.  

Entry No. 276 
Entry typeconference paper 
AuthorsA. Kupryjanow, A. Czyżewski 
English title 
Polish titleZASTOSOWANIE SPOWALNIANIA WYPOWIEDZI W CELU POPRAWY ROZUMIENIA MOWY PRZEZ DZIECI W SZKOLE 
ConferenceXIII Międzynarodowe Sympozjum Reżyserii i Inżynierii Dźwięku ISSET 2009 
Preprint 
Number 
Volume 
Pages81 - 87 
Conference siteWarszawa, Polska 
Conference date16.10.2009- 18.10.2009 
AbstractThis paper presents a time-scale modification algorithms that could be used for hearing impairment therapy supported by real-time speech stretching. In this paper the OLA based algorithms and Phase Vocoder were described. In the experimental part usability of those algorithms for real-time speech stretching was discussed. 
StreszczenieW artykule przedstawiono algorytmy służące do modyfikacji czasu trwania dźwięku. Szczegółowo opisano algorytmy overlap and add, dwa rodzaje algorytmu synchronized overlap and add oraz algorytm phase vocodera. W części eksperymentalnej zbadano skuteczność działania algorytmów. Sprawdzono także czy możliwe jest przetwarzanie sygnału mowy w czasie rzeczywistym z wykorzystaniem opisanych algorytmów. 

Entry No. 277 
Entry typebook 
AuthorsA. Czyżewski, A. Ciarkowski, P. Dalka, P. Szczuko, G. Szwoch, P. Żwan 
English titleMultimodal system supporting identification and fight against crime and terrorism 
Polish titleMultimedialny system wspomagający identyfikację i zwalczanie przestępczości oraz terroryzmu 
EditorWolters Kluwer Polska 
Pages211 - 227 
NotesRozdział w monografi "Praktyczne elementy zwalczania przestępczości zorganizowanej i terroryzmu. Nowoczesne technologie i praca operacyjna" pod red. L. Paprzyckiego i Z. Rau 
AbstractDodatkowi autorzy rozdziału: W. Jędruch, P. Kozielecki. Artykuł zawiera przegląd zakresu prac badawczych, które prowadzone są w Politechnice Gdańskiej w ramach realizowanego projektu badawczo-rozwojowego. Opisany jest rozproszony system monitoringu i komunikacji multimedialnej, realizujący kompleksowe zarządzanie zasobami mobilnymi i komunikację multimedialną w czasie rzeczywistym pomiędzy elementami systemu. System realizuje równoczesną analizę obrazu, dźwięku i sygnałów pochodzących z dołączonych czujników w celu wykrywania określonych typów zdarzeń i automatycznego generowania alertów. Wyposażenie patroli w mobilne terminale multimedialne pozwala na ciągłe monitorowanie sytuacji w punkcie wystąpienia zdarzenia, również w trakcie przemieszczania się i przygotowania do interwencji. Na potrzeby wizualizacji statusu i pozycji jednostek odległych stworzony został system geoinformatyczny, przygotowany do pracy na jednostkach mobilnych, komputerach stacjonarnych oraz PDA. W dalszej części opisane są algorytmy analizy obrazu w celu wykrywania zdarzeń, metody klasyfikacji zdarzeń, przykłady zastosowań. Następnie przedstawione są algorytmy analizy i rozpoznawania dźwięków. Na zakończenie omówione są wyniki prac nad wykorzystaniem technologii RFID do lokalizacji i identyfikacji obiektów oraz przykłady zastosowań. 
StreszczenieAdditional authors: W. Jędruch, P. Kozielecki. Hitherto achieved results of research project conducted in the Gdańsk University of Technology are presented in the paper. A distributed monitoring communication system is being described allowing a management of mobile resources, the system extended with real-time multimedia transmission features. A simultaneous analysis of audio, video and data from various sensors is performed for detecting incidents and for automatic generation of alerts. Mobile patrols equipped with terminals will be able to continuously monitor events on site, also during translocation and intervention. For a clear and precise visualization of status and positions a geopositioning system was created compatible with desktops, notebooks and PDA-class computers. Algorithms for video analysis are described in the second part of the paper, and methods for detection of events and object classification are discussed. Sample applications are presented. Moreover, audio processing method is described, followed by sound classification methods brief description. The last part discusses results and applications of a RFID system made for localization and identification of objects. 

Entry No. 278 
Entry typeconference paper 
AuthorsP. Szczuko, B. Kostek, A. Czyżewski 
English titleEnhancement of computer character animation utilizing fuzzy rules 
Polish titlePoprawa jakości animacji komputerowych postacji z wykorzystaniem reguł w logice rozmytej 
ConferenceKES - Intelligent Interactive Multimedia Systems and Services 
Preprint 
Number 
Volume 
Pages 
Conference siteMogliano Veneto, Włochy 
Conference date16.7.2009- 17.7.2009 
AbstractA new method for processing of character animation is presented. It involves fuzzy inference with both rules and membership functions derived from results of subjective evaluation tests. During processing a new motion phases are added to an animation increasing its quality and changing fluidity and stylization of motion. Animation parameterization is presented, new parameters are designed, and the relation between coefficients proposed and subjective features of motion are established. Quality and fluidity increase are verified during subjective evaluation of animations processed by the created animation enhancement system. 
StreszczenieReferat przedstawia nową metodę przetwarzania komputerowych animacji postaci. Wykorzystuje ona wnioskowanie rozmyte, oparte na regułach i funkcjach przynależności uzyskanych w procesie analizy wyników testów subiektywnej oceny jakości animacji. W trakcie przetwarzania do animacji automatycznie dodawane są nowe fazy ruchu, co skutkuje poprawą jakości wizualnej oraz zmianą płynności i stylizacji ruchu w sposób zamierzony. W referacie opisano sposób parametryzacji animacji, zaproponowano nowe współczynniki, których wartości wykazały silną korelację z parametrami subiektywnymi animacji. Poprawa jakości i płynności ruchu zweryfikowane zostały w procesie testów oceny subiektywnej. 

Entry No. 279 
Entry typeconference paper 
AuthorsJ. Kotus, M. Szczodrak, A. Czyżewski, B. Kostek, H. Skarżyński 
English titleLong-term continuous complex acoustical climate evaluation in selected schools 
Polish title 
ConferenceEuronoise 2009 
Preprint 
Number 
Volume 
Pages 
Conference siteEdynburg, Wielka Brytania 
Conference date26.10.2009- 28.10.2009 
AbstractResults of the long-term continuous noise measurement in some selected schools are presented. The autonomous noise monitoring stations, engineered at the Multimedia Systems Department of the Gdansk University of Technology were used. A brief description of the measurement system including its main features is presented. The investigations of measured noise with a focus to the broadband and spectrum analysis both in 1/3 octave bands and critical bands are discussed. The harmfulness of the determined noise level, including the Temporary Threshold Shift simulation, is discussed. Additionally, measured air pollution is illustrated.  

Entry No. 280 
Entry typeconference paper 
AuthorsA. Czyżewski, A. Ciarkowski, P. Dalka, P. Szczuko, G. Szwoch, P. Żwan 
English titleAdvanced technologies for video and audio monitoring 
Polish titleZaawansowane technologie monitoringu wizyjnego i dźwiękowego 
ConferenceCyberspace 2009, Cyberprzestrzeń - zagrożenia i wyzwania 
Preprint 
Number 
Volume 
Pages 
Conference siteWarszawa,  
Conference date15.10.2009 
Notesmateriały w formie płyty CD-ROM 
AbstractReferat omawia najważniejsze cechy inteligentnego monitoringu wizyjnego i dźwiękowego, możliwość połączenia róznych mediów oraz perspektywy wykorzystania zintegrowanych systemów teleinformatycznych i telekomunikacyjnych w dziedzinie bezpieczeństwa. 
StreszczenieThe paper presents principal features of the intelligent audio-visual monitoring system, discusses issues of media convergence and prospects of applications of integrated teleinformation systems to security domain.  

Entry No. 281 
Entry typeconference paper 
AuthorsB. Kunka, A. Czyżewski, B. Kostek 
English titleConcentration tests. An application of gaze tracker to concentration exercises 
Polish titleZastosowanie systemu sledzenia punktu fiksacji wzroku w badaniach koncentracji uwagi 
Conference1st International Conference on Computer Supported Education 
Preprint 
Number 
Volume 
Pages66 - 66 
Conference siteLizbona, Portugalia 
Conference date23.3.2009- 26.3.2009 
Bibliographic No.
NotesDostepne streszczenie w Book of Abstracts 
AbstractThis paper presents different methods of concentration tests. Some existing methods are reviewed and more thoroughly described. The gaze tracking system developed at the Multimedia Systems Department of the Gdańsk University of Technology is presented and its principle of working is explained. Performed tests of the gaze tracker system show that it could make a useful system for concentration exercises. Some selected applications of the gaze tracker to concentration tests are also discussed in the paper.  
StreszczenieW artykule zostały przedstawione różne podejścia badania koncentracji uwagi. Wybrane istniejące metody zostały dokładniej opisane. W artykule przedstawiono system śledzenia punktu fiksacji wzroku opracowany w Katedrze Systemów Multimedialnych Politechniki Gdańskiej. Badania przeprowadzone z wykorzystaniem systemu śledzenia wzroku potwierdzają jego użyteczność w prowadzeniu tego typu eksperymentów.  

Entry No. 282 
Entry typeconference paper 
AuthorsM. Lech, B. Kostek, A. Czyżewski, P. Odya 
English titleGesture Recognition Framework for Multimedia Content Viewer Controlling 
Polish titleŚrodowisko rozpoznawania gestów dla zagadnienia przeglądania treści multimedialnych 
ConferenceSPA 2009 Poznań 
Preprint 
Number 
Volume 
Pages100 - 104 
Conference sitePoznań, Polska 
Conference date24.9.2009- 26.9.2009 
AbstractIn the paper a system for controlling a multimedia content viewer by hand gestures is presented. First, selected methods used for gesture recognition are described. Two different application cases of the system, i.e. for multimedia presentation purposes and for multimedia content viewing are outlined. Moreover, a proposal of improvement of the system combining these approaches is also given. The system work cycle is reviewed. The results of the system tests are provided. 
StreszczenieW referacie przedstawiono system obsługi za pomocą gestów rąk przeglądarek treści multimedialnych. W pierwszej części przedstawiono wybrane metody rozpoznawania gestów. Przedstawiono dwa różne zastosowania systemu, tj. do prowadzenia prezentacji multimedialnych oraz do przeglądania treści multimedialnych. Omówiony został cykl pracy systemu. W końcowej części przedstawiono wyniki testów systemu. 

Entry No. 283 
Entry typejournal paper 
AuthorsD. Ellwart, A. Czyżewski 
English titleInterfered speech intelligibility improvement using an adaptive filtering based algorithm  
Polish titlePoprawa zrozumiałości mowy w obecności zakłóceń z wykorzystaniem algorytmu opartego na filtracji adaptacyjnej  
JournalZeszyty naukowe WE PG 
Volume 
Number26/2009 
Pages33 - 36 
Bibliographic No.
AbstractThis paper describes a technique of improving the quality of speech signals recorded under interference (adaptive filter based algorithm). The whole idea of an algorithm is shown, and other possibilities – such as spectral subtraction – of sound processing are discussed. Results of the tests are presented. A way of integrating the elaborated method with an agglomeration acoustic monitoring system is proposed.  
StreszczenieW komunikacie opisano nowy sposób wykorzystania filtracji adaptacyjnej do poprawy jakości dźwięków użytecznych nagrywanych w obecności zakłóceń. Przedstawiono stworzony algorytm adaptacji, omówiono możliwości przetwarzania dźwięku dodatkowymi algorytmami, opisano przeprowadzone eksperymenty. Zamieszczono i omówiono wyniki eksperymentów. Zaproponowano sposób integracji opracowanej metody z systemami akustycznego monitorowania aglomeracji miejskiej.  

Entry No. 284 
Entry typeconference paper 
AuthorsA. Czyżewski, H. Skarżyński, Ł. Kosikowski, P. Odya, B. Kostek, G. Szwoch 
English title 
Polish titleMobline multimedialne systemy do badań przesiewowych słuchu u mowy na urządzenia klasy PDA 
ConferenceXVI giełda polskich wynalazków nagrodzonych na światowych targach wynalazczości w 2008 roku 
Preprint 
Number 
Volume 
Pages58 - 58 
Conference siteWarszawa, Polska 
Conference date9.3.2009- 15.3.2009 
StreszczenieProgram do diagnozy słuchu zawiera ankietę, w której pytania są podobne do tych zadawanych przez audiologa podczas typowej wizyty kontrolnej. Dodatkowo użytkownik ma możliwość wykonania dwóch testów. Pierwszy z nich bazuje na audiometrii tonalnej. Drugi oparty jest na audiometrii słownej w szumie. Po wypełnieniu ankiety i wykonaniu ćwiczeń, system ekspercki automatycznie podejmuje decyzję o tym, czy badana osoba nie ma problemów ze słuchem lub czy występują u niej zaburzenia słuchu i konieczna jest wizyta u audiologa. Program do diagnozy i terapii mowy zawiera ankietę, w której pytania są podobne do tych zadawanych przez foniatrę podczas typowej wizyty kontrolnej. System zawiera szereg interaktywnych testów dźwiękowych, umożliwiających detekcję potencjalnych dysfunkcji głosu i mowy m.in. ocenę słuchu fonemowego, ocenę motoryki narządów mowy, ocenę artykulacji, słownictwa i gramatyki. Na podstawie uzyskanych wyników system automatycznie generuje wynik. Cechami charakterystycznymi obu systemów jest duża mobilność oraz wyjątkowa prostota testów przy jednoczesnym zachowaniu wysokiej wiarygodności uzyskiwanych wyników. 

Entry No. 285 
Entry typeconference paper 
AuthorsP. Dalka, A. Czyżewski 
English titleLip movement and gesture recognition for a multimodal human-computer interface 
Polish titleRozpoznawanie ruchów i gestów wykonywanych ustami na potrzeby multimodalnego interfejsu komputerowego 
ConferenceInternational Multiconference on Computer Science and Information Technology, 2nd International Symposium on Multimedia – Applications and Processing 
Preprint 
Number 
Volume 
Pages365 - 369 
Conference siteMrągowo, Polska 
Conference date12.10.2009- 14.10.2009 
AbstractThis paper presents an algorithm for lip movement tracking and lip gesture recognition for the purpose of the multimodal human-computer interface (HCI) called LipMouse. This solution allows a user to work on a computer using movement and gesture made by his/her mouths only and is especially useful for severely disabled and paralyzed people. User face images are captured with a standard webcam. Face detection is based on a cascade of boosted classifiers using Haar-like features. A mouth region is located in the lower part of the face region and is used to track lip movements. Three lip gestures are recognized: mouth opening, sticking out the tongue and making the mouth into an „O” shape. Lip gesture recognition is performed by an artificial neural network and utilizes an accurate lip shape obtained by the means of lip image segmentation using fuzzy clustering. 
StreszczenieArtykuł przedstawia algorytm do śledzenia ruchu ust i rozpoznawania gestów wykonywanych ustami na potrzeby multimodalnego interfejsu komputerowego nazwanego Ustomysz. Rozwiązanie to pozwala użytkownikowi na pracę na komputerze z wykorzystaniem jedynie ruchów i gestów wykonywanych ustami i jest szczególnie przydatne dla osób niepełnosprawnych ruchowo. Obraz twarzy użytkownika jest przechwytywany za pomocą standardowej kamerki internetowej. Detekcja twarzy bazuje kaskadzie klasyfikatorów AdaBoost. Obszar ust lokalizowany jest w dolnej części znalezionej twarzy i wykorzystywany do śledzenia ruchów ust. Rozpoznawane są trzy gesty wykonywane ustami: otwarcie ust, wysunięcie języka i złożenie ust w dzióbek. Klasyfikacja gestu odbywa się za pomocą sztucznej sieci neuronowej i wykorzystuje dokładny obraz ust uzyskany za pomocą aproksymacji ich kształtu za pomocą elipsy. 

Entry No. 286 
Entry typejournal paper 
AuthorsM. Szczodrak, A. Czyżewski 
English titleSoftware for calculation of noise maps implemented on the supercomputer 
Polish title 
JournalTask Quarterly 
Volume13 
Number3-4 
Pages 
Notesw druku 
AbstractThis paper presents investigation results relevant to the implementation of the algorithms for the calculation of noise maps. The aim of the implementation of the algorithms on the computer cluster is explained. Selected implementation details of the software called the noise propagation model are described. The interaction of the software with the data acquisition system is presented. Noise maps obtained by exploitation of the described software are presented. A comparison between outcomes of implemented models and simulation results of the commercial program is presented. An analysis of the computation efficiency is also presented. The discussion concerning dynamic presentation of the noise maps is also presented. 

Entry No. 287 
Entry typeconference paper 
AuthorsP. Dalka, A. Czyżewski 
English titleLipMouse - Novel Multimodal Human-Computer Interaction Interface 
Polish titleUstomysz- nowatorki, multimodalny interfejs komputerowy 
ConferenceSIGGRAPH 
Preprint 
Number 
Volume 
Pages
Conference siteNew Orleans,  
Conference date3.8.2009- 7.8.2009 
NotesJednostronicowy opis posteru 

Entry No. 288 
Entry typeconference paper 
AuthorsA. Kupryjanow, A. Czyżewski 
English titleTIME-SCALE MODIFICATION OF SPEECH SIGNALS FOR SUPPORTING HEARING IMPAIRED SCHOOLCHILDREN 
Polish title 
ConferenceNTAV/SPA 2009  
Preprint 
Number 
Volume 
Pages159 - 162 
Conference sitePoznań, Polska 
Conference date24.9.2009- 26.9.2009 
AbstractA study of time scale modification algorithms applied to hearing impaired schoolchildren supporting is presented. Variety of algorithms are considered, namely: overlap and add, two variations of synchronized overlap and add, and the phase vocoder. Their effectiveness as well as real-time processing capabilities are examined. 
StreszczenieW referacie przedstawiono analizę użyteczności algorytmów modyfikacji czasu trwania nagrania do celów wspomagania rozumienia mowy przez dzieci z pogorszoną rozdzielczością czasową słuchu. Sprawdzono skuteczność działania oraz złożoność obliczeniową algorytmów OLA, SOLA i wokodera fazowego. 

Entry No. 289 
Entry typeconference paper 
AuthorsŁ. Kosikowski, A. Czyżewski 
English titleComputer Based System for Strabismus and Amblyopia Therapy 
Polish titleSystem komputerowy do terapii zeza i amblyopii 
ConferenceInternational Multiconference on Computer Science and Information Technology 
Preprint 
Number 
Volume 
Pages407 - 410 
Conference siteMrągowo, Polska 
Conference date12.10.2009- 14.10.2009 
AbstractDevelopment of the computer based system for strabismus and amblyopia therapy is discussed in the paper. In the case of amblyopia or 'lazy-eye' syndrome, the therapy is typically conducted in two ways: by wearing a patch over the non-amblyopic eye for several hours per day or blurring the vision in the good eye with penalizing drops or with extra power in the glasses. The disadvantage of this types of therapy is the lack of binocular vision. The proposed approach retains binocular vision. Parameters corresponded to strabismus can be measured much faster using the described system. Another advantage is that therapy may take place at user's home, without time-consuming visits to the clinic. 

Entry No. 290 
Entry typeconference paper 
AuthorsP. Maziewski, P. Suchomski, B. Kostek, A. Czyżewski 
English titleAn Intuitive Graphical User Interface for the Parkinson’s Disease Patients 
Polish titleIntuicyjny interfejs graficzny dla osób z chorobą Parkinsona 
Conference4th International IEEE EMBS Conference on Neural Engineering 
Preprint 
Number 
Volume 
Pages14 - 17 
Conference siteAntalya, Turcja 
Conference date29.4.2009- 2.5.2009 
AbstractIn this paper a discussion on the design and development of the graphical user interface (GUI) dedicated to Parkinson’s Disease (PD) patients is presented. The interface is intended for a group of PD patients with less severe motor symptoms, who are living at their home independently or with help of a caregiver. The GUI is designed to enable an interaction for the non-computer literate PD patients with a computer-based system. The system will allow for objectively recording the patient diaries, self assessments, taken medication confirmations and other features important for the diagnosis. This will enable physicians to prepare more accurate evaluation and better diagnostic decisions. 
StreszczenieW referacie przedstawiono projekt i przykładowe wdrożenie graficznego interesu użytkownika przeznaczonego dla osób z chorobą Parkinsona. Interfejs przeznaczony jest dla osób w mniej zaawansowanym stadium choroby – z mniejsza ilością symptomów, żyjących samodzielnie lub korzystających z pomocy opiekuna. Interfejs zaprojektowano w celu umożliwieni interakcji z komputerem osób nieposiadających wcześniejszych doświadczeń w pracy z tego typu urządzeniem. Interfejs pozwala na obiektywną rejestrację dzienniczków pacjenta, jego samoocen, potwierdzeń przyjęcia lekarstw jak i wielu innych danych potrzebnych w celu poprawnej diagnozy. Dzięki wynikom uzyskiwanym za pomocą interfejsu, lekarz prowadzący może opracować lepszą – bardziej dokładną – terapię. 

Entry No. 291 
Entry typeconference paper 
AuthorsM. Szczodrak, A. Czyżewski, P. Kozielecki 
English titleDynamic computation of acoustic field distribution in the city area employing a computer cluster 
Polish title 
ConferenceNOVEM 
Preprint 
Number 
Volume 
Pages1 - 6 
Conference siteOxford, Wielka Brytania 
Conference date5.4.2009- 8.4.2009 
AbstractNumerical computation of acoustic field distribution over the urban area employing the computer cluster are in focus. A method of gathering data for numerical model of the noise source, engineered at the Multimedia Systems Department, is introduced. A concept, assumptions and an implementation of the method of data acquiring needed for computations are then presented. Also, features of the computer cluster computation are discussed. The main idea of dynamic noise maps computation and visualization is thoroughly described. The system proposed by the authors used to noise data acquisition is also shown. Noise maps resulting from the algorithmical computations are compared to measured sound levels, leading towards an automated calibrating and updating noise maps. 

Entry No. 292 
Entry typejournal paper 
AuthorsM. Szczodrak, P. Dalka, A. Czyzewski 
English titlePerformance evaluation of video object tracking algorithm in autonomous surveillance system 
Polish title 
JournalIEEE ICIT 2010 
Volume 
Number 
Pages31 - 34 
AbstractResults of performance evaluation of a video object tracking algorithm are presented. The method of moving objects detection and tracking is based on background modelling with mixtures of Gaussians and Kalman filters. An emphasis is put on algorithm’s efficiency with regards to its settings. Utilized methods of performance evaluation based on comparison of algorithm output to manually prepared reference data are introduced. The experiments aimed at examining the performance achieved with various object detection algorithm parameter settings are presented and discussed. 

Entry No. 293 
Entry typeconference paper 
AuthorsG. Szwoch, P. Dalka, A. Czyżewski 
English title 
Polish titleRozwiązywanie konfliktów w śledzeniu obiektów ruchomych w celu automatycznej detekcji zdarzeń 
ConferenceXIII Sympozjum Nowości w Technice Audio i Wideo 
Preprint 
Number 
Volume 
Pages 
Conference siteSzczecin, Polska 
Conference date14.10.2010- 16.10.2010 
NotesMateriały konferencyjne na płycie CD 
AbstractPerformance of automatic event detection in video from monitoring cameras depends on accuracy of the low-level image analysis algorithms, such as detection and tracking of moving objects. The main problem in object tracking is related to situations in which relationship between detected moving objects and trackers is ambiguous. An algorithm for resolving such conflicts is presented in this paper. The algorithm utilizes predicted states calculated by Kalman filters for estimation of trackers position, then it uses color and texture descriptors in order to match moving objects with trackers. Problematic situations, such as splitting objects, are addressed. Test results are presented and discussed. The complete system is designed to extend functionality of current video monitoring systems by providing a solution for automatic detection of security threats. 
StreszczenieW referacie przedstawiono algorytm rozwiązywania konfliktów w śledzeniu obiektów ruchomych. Proponowana metoda wykorzystuje predykcję stanu obiektu obliczaną przez filtry Kalmana oraz dopasowuje wykryte obiekty do struktur śledzących ich ruch na podstawie deskryptorów koloru i tekstury. Omówiono specyficzne sytuacje powodujące konflikty, takie jak rozdzielanie obiektów. Przedstawiono wyniki testów. Algorytm może być zastosowany w systemie automatycznego wykrywania zagrożeń w monitoringu wizyjnym. 

Entry No. 294 
Entry typeconference paper 
AuthorsG. Szwoch, P. Dalka, A. Czyżewski 
English titleA Framework for Automatic Detection of Abandoned Luggage in Airport Terminal 
Polish titleFramework do automatycznej detekcji porzuconego bagażu w terminalu lotniczym 
ConferenceKES 2010, The 3rd International Symposium on Intelligent and Interactive Multimedia: Systems and Services 
Preprint 
Number 
Volume 
Pages13 - 23 
Conference siteBaltimore, USA 
Conference date28.7.2010- 30.7.2010 
Notesrozdział w książce G.A. Tsihrintzis et al. (Eds.): Intelligent Interactie Multimedia Systems and Services 
AbstractA framework for automatic detection of events in a video stream transmitted from a monitoring system is presented. The framework is based on the widely used background subtraction and object tracking algorithms. The authors elaborated an algorithm for detection of left and removed objects based on mor-phological processing and edge detection. The event detection algorithm collects and analyzes data of all the moving objects in order to detect events defined by rules. A system was installed at the airport for detecting abandoned luggage. The results of the tests indicate that the system generally works as expected, but the low-level modules currently limit the system performance in some problematic conditions. The proposed solution may supplement the existing monitoring sys-tems in order to improve the detection of security threats. 

Entry No. 295 
Entry typeconference paper 
AuthorsA. Ciarkowski, A. Czyżewski 
English titleRobustness Analysis of Watermarking-Based DTD Algorithm under Time-Variable Echo Conditions 
Polish title 
ConferenceMCSS 2010: IEEE International Conference on Multimedia Communications, Services and Security 
Preprint 
Number 
Volume 
Pages25 - 29 
Conference siteKraków, Poland 
Conference date6.5.2010- 7.5.2010 
NotesISBN 978-83-88309-92-2 
AbstractA novel double-talk detection (DTD) algorithm based on techniques similar to those used for audio signal watermarking was introduced by the authors. The application of the described DTD algorithm within acoustic echo cancellation system is presented. The problem of DTD robustness to time-varying conditions of acoustic echo path is discussed and explanation as to why such conditions occur in practical situations is provided. The environment and the procedure used for simulation of test conditions and evaluation of DTD algorithms are presented. Results of comparing performance of the introduced watermarking DTD with the well-established Geigel DTD algorithm are presented. 

Entry No. 296 
Entry typeconference paper 
AuthorsA. Ciarkowski, A. Czyżewski 
English titleAdvanced Surveillance and Operational Communication System Employing Mobile Terminals 
Polish title 
ConferenceMCSS 2010: IEEE International Conference on Multimedia Communications, Services and Security 
Preprint 
Number 
Volume 
Pages30 - 34 
Conference siteKraków, Poland 
Conference date6.5.2010- 7.5.2010 
NotesISBN 978-83-88309-92-2; Projekt INDECT. Nr umowy: 18188 
AbstractDistributed surveillance and operational communications system based on XMPP protocol is presented. Its architecture and assumptions leading to the depicted design are shown. Features of XMPP protocol are portrayed with the emphasis on those most important in the context of the application. Real-time multimedia transmission with the use of Jingle/XMPP extension is discussed. The use of PDA-class computers as mobile terminals is introduced. Technical aspects of multimedia communications session establishment in the presence of Network Address Translation devices and firewalls are presented. 

Entry No. 297 
Entry typeconference paper 
AuthorsA. Ciarkowski, A. Czyżewski 
English title 
Polish titleSystem eliminacji echa akustycznego bazujący na znakowaniu sygnałów fonicznych 
ConferenceUsługi i sieci teleinformatyczne następnej generacji - aspekty techniczne, aplikacyjne i rynkowe 
Preprint 
Number 
Volume 
Pages 
Conference siteWarszawa, Polska 
Conference date23.11.2010- 24.11.2010 
NotesProjekt PBZ-MNiSW-02/II/2007  
StreszczeniePrzedstawiono nowatorski algorytm detekcji mowy równoczesnej (DTD), bazujący na technikach związanych ze znakowaniem sygnałów akustycznych. Algorytmy DTD wykorzystywane są w systemach eliminacji echa akustycznego (EAC) do sterowania procesem adaptacji filtra estymującego odpowiedź toru echa. Typowo spotykane rozwiązania DTD stanowią pewien kompromis pomiędzy wysoką jakością detekcji i akceptowalnym kosztem obliczeniowym. Algorytm zaproponowany przez autorów wykorzystuje specyficzne rodzaj znakowania sygnałów cyfrowych (tzw. semi-fragile watermarking), dzięki czemu możliwe staje się osiągnięcie zadowalających wyników przy niewielkim obciążeniu numerycznym. Niezauważalna dla uczestników konwersacji sygnatura jest osadzana w sygnale pochodzącym od rozmówcy odległego, tuż przed odtworzeniem go w głośniku rozmówcy lokalnego. Następnie obecność sygnatury jest wykrywana w sygnale zarejestrowanym przez mikrofon rozmówcy lokalnego. Przy właściwym wyborze zastosowanej techniki znakowania znak wodny zostaje zatarty i staje się niewykrywalny w momentach, gdy odzywa się rozmówca lokalny. Pozwala to na precyzyjne określenie fragmentów sygnału, podczas których występuje zjawisko mowy równoczesnej. Zastosowanie metody znakowania poprzez ukrywanie echa (echo-hiding) pozwala spełnić wymogi algorytmu. Wyniki przeprowadzonych eksperymentów dowodzą skuteczności proponowanego algorytmu DTD.  

Entry No. 298 
Entry typeconference paper 
AuthorsA. Czyżewski, A. Ciarkowski 
English titleDouble talk detector based on audio watermarking 
Polish titleDetektor pasożytniczego echa w torach telekomunikacyjnych wykorzystujący znakowanie wodne sygnałów 
Conference2nd Pan-American/Iberian Meeting on Acoustics, Acoustical Soc. of America 
Preprint 
Number 
Volume 
Pages 
Conference siteCancun, Mexico 
Conference date15.11.2010- 19.11.2010 
Abstract2aSP13. Doubletalk detector based on audio watermarking. Session: Tuesday Morning, Nov 16 Time: 11:45 Author: Andrzej Czyzewski Location: Multimedia Systems Dept., Gdansk Univ. of Technol.,Narutowicza 1112, 80233 Gdansk, Poland, ac@pg.gda.pl Author: Andrzej Ciarkowski Location: Multimedia Systems Dept., Gdansk Univ. of Technol.,Narutowicza 1112, 80233 Gdansk, Poland, ac@pg.gda.pl Abstract: The doubletalk detection (DTD) algorithm is a vital part of an acousticecho cancellation system commonly used in the telecommunication applications. The role of the DTD algorithm is to stop the adaptation process of the adaptivefilter used for the estimation of echo path response in the presence of doubletalkcondition. The typically used DTD solutions are often a compromise betweenhigh efficiency and affordable computational cost. The algorithm introducedby the authors is based on a novel principle related to the socalled semifragilewatermarking, making it possible to achieve satisfactory performance withlimited processing burden. A hidden signature is embedded into the arrivingfarend speaker signal just before it is replayed to the nearend speaker.Consequently, the presence of that signature is detected in the signal recordedby the nearend speaker microphone. The appropriate choice of the employedwatermarking technique causes the signature to become undetectable duringthe nearend speaker’s talkspurts, precisely identifying the doubletalkperiods. The use of echohiding watermarking method allows fulfilling thealgorithm requirements. The results of performed experiments prove the goodperformance of the proposed DTD solution. [Research funded by the Polish Ministry of Science and Higher Education within Grant No. PBZMNiSW02II2007.]  
StreszczenieSłowa kluczowe: detekcja echa w kanałach telekomunikacyjnych; znakowanie wodne; filtracja adaptacyjna Algorytm detekcji i eliminacji echa jest istotnym składnikiem łańcucha przetwarzania sygnałów w torach telekomunikacyjnych. W zaproponowanym algorytmie kluczową rolę odgrywa znakowanie wodne sygnału mowy. Na tej podstawie wykrywane jest pasożytnicze echo a po jego wykryciu uaktywniany jest filtr adaptacyjny, który to echo usuwa.  

Entry No. 299 
Entry typejournal paper 
AuthorsŁ. Kosikowski, A. Czyżewski 
English title 
Polish titleBadanie i terapia zaburzeń widzenia obuocznego wspomagana przez bezkontaktowy system śledzenia punktu fiksacji wzroku 
JournalZeszyty Naukowe Wydziału Elektrotechniki i Automatyki PG 
Volume 
Number28 
Pages89 - 92 
StreszczenieNa rynku znajduje się klika systemów pozwalających na badanie lub trening syndromu leniwego oka z użyciem komputera PC. Niewiele z nich bazuje na wirtualnej rzeczywistości. Większość jedynie skupia się na terapii niedowidzenia bez mierzenia jakichkolwiek parametrów lub wykonuje tylko same pomiary. Proponowane rozwiązanie to kompletny system diagnostyczno - terapeutyczny do detekcji i terapii zaburzeń widzenia obuocznego – zwłaszcza zeza (małego i średniego stopnia) oraz syndromu leniwego oka. Aby zapewnić większy obiektywizm badań prowadzonych przy użyciu opracowanego systemu, zastosowano śledzenie punktu fiksacji wzroku. System śledzenia punktu fiksacji charakteryzuje się brakiem jakichkolwiek fizycznych elementów montowanych na ciele użytkownika, zaś detekcja punktu fiksacji bazuje na analizie odbić promieni w zakresie podczerwieni.  

Entry No. 300 
Entry typeconference paper 
AuthorsA. Kupryjanow, A. Czyżewski 
English title 
Polish titleAlgorytmy do korygowania zapisu dźwięku filmowego 
ConferenceUsługi i sieci teleinformatyczne następnej generacji - aspekty techniczne, aplikacyjne i rynkowe 
Preprint 
Number 
Volume 
Pages 
Conference siteWarszawa, Polska 
Conference date23.11.2010- 24.11.2010 
NotesPlakat 
StreszczenieW pracy przedstawiono system służący do automatycznej rekonstrukcji nagrań foniczno-wizyjnych. Pozwala on na analizę i rekonstrukcję zniekształcenia obrazu polegającego na niestabilności klatek filmowych. Filmowa ścieżka dźwiękowa rekonstruowana jest poprzez eliminację dwóch typów zniekształceń: szerokopasmowego szumu oraz drżenia i kołysania dźwięku. Przestawione algorytmy zostały opracowane w ten sposób, aby zminimalizować konieczność uczestnictwa człowieka w procesie digitalizacji i rekonstrukcji nagrań gromadzonych w repozytorium foniczno-wizyjnym. Korzystanie z opisanych metod rekonstrukcji możliwe jest poprzez serwis internetowy pozwalający na dodawanie i rekonstruowanie własnych nagrań do repozytorium oraz przeglądanie nagrań dodanych przez innych użytkowników. 

Entry No. 301 
Entry typejournal paper 
AuthorsA. Czyżewski, P. Maziewski, A. Kupryjanow 
English titleReduction of parasitic pitch variations in archival musical recordings 
Polish title 
JournalSignal Processing 
Volume 
Number90/2010 
Pages981 - 990 
Bibliographic No.23 
AbstractA new method for reducing parasitic pitchvariations in archival audio recordings is presented. The method is intended for analyzing movie soundtracks recorded in optical films. It utilizes image processing for calculating and reducing effects of tape shrinkage being one of the main reasons for parasitic pitch variations in audio accompanying moving images. As long as the film tape characteristics are known the new method can be easily tuned to analyze archival recordings. The new method is also compared to some previous approaches to pitch variation correction. 
StreszczenieW artykule przedstawiono nową metodę redukcji pasożytniczych modulacji częstotliwości w archiwalnych nagraniach dźwiękowych. Metoda ta jest przeznaczona do analizy filmowej optycznej dźwiękowej ścieżki. Wykorzystuje ona analizę obrazu w celu wyznaczenia oraz usunięcia efektów związanych ze skurczem taśmy takich jak pasożytnicze modulacje towarzyszące dźwiękowi w filmie. Skuteczność działania nowej metody została porównana z kilkoma innymi metodami redukcji pasożytniczych modulacji częstotliwości. 

Entry No. 302 
Entry type 
AuthorsA. Czyżewski, J. Smulko, M. Kotarski 
English title 
Polish titleSposób emisji substancji zapachowych 
Notespatent nadany w 2014 r.  
AbstractIstotą rozwiązania jest emiter kompozycji zapachowych programowany i sterowany za pomocą komputera, wykorzystujący zimną dyfuzję substancji aromatowych. 

Entry No. 303 
Entry typeconference paper 
AuthorsK. Łopatka, J. Kotus, A. Czyżewski 
English titleImproving automatic surveillance by sound analysis 
Polish titleWzbogacenia automatycznego nadzoru bezpieczeństwa o analizę dźwięku 
Conference5th Security research conference 
Preprint 
Number 
Volume 
Pages51 - 51 
Conference siteBerlin, Republika Federalna Niemiec 
Conference date7.9.2010- 9.9.2010 
Notesrozszerzone streszczenie opublikowane na płycie CD 
AbstractAn automatic surveillance system, based on event detection in the video image can be improved by implementing algorithms for audio analysis. Dangerous or illegal actions are often connected with distinctive sound events like screams or sudden bursts of energy. A method for detection and classification of alarming sound events is presented. Detection is based on the observation of sudden changes in sound level in distinctive sub-bands or in parameter values. Among the parameters, there are specially defined features connected with the energy ratio in certain sub-bands of the spectrum and the shape of the signal around transients. The parameter set is completed with MPEG-7 descriptors chosen on the basis of experiments and statistical analysis. For classification a Support Vector Machine classifier is implemented. The model is built using a test set of sounds recorded in real conditions. Separate classifiers are implemented for different classes of sound events. The length of the analysis frame and threshold values for event detection are set to fit the characteristics of a certain type of sound. The accuracy is then improved by the decision procedure. The final indication of the system is derived from decisions of all classifiers, compared in a number of adjacent analysis frames. The classifier yields high accuracy of detecting typical alarming sound events like gunshot, scream, explosion, broken glass or horn abuse. It also provides the possibility to retrain the model and add a new type of event to be recognized by the system. The described solution can be implemented in an automatic surveillance system together with image analysis. Processing both sound and image leads to a significant improvement of the event detection rate. The developed algorithms can be implemented to detect dangerous events in large public areas like stations, airports or stadiums. 
StreszczenieSystem automatycznego nadzoru bezpieczeństwa może być wzbogacony o algorytmy analizy danych fonicznych. Niebezpieczne lub niedozwolone sytuacje mogą być skojarzone z charakterystycznymi zdarzeniami dźwiękowymi, takimi jak krzyki lub nagłe emisje energii akustycznej. Przedstawiono metodę detekcji i klasyfikacji niepokojących zdarzeń dźwiękowych. Detekcja opiera się na obserwacji nagłych zmian poziomu dźwięku w charakterystycznych pasmach lub wartości parametrów. Wśród parametrów znajdują się parametry związane z energią sygnału oraz parametry zdefiniowane w standardzie MPEG-7. Zaimplementowano algorytmy klasyfikacji dostosowane do rozpoznawania różnych typów zdarzeń dźwiękowych. Końcowa decyzja jest podejmowana poprzez agregację wskazań klasyfikatorów. Klasyfikację cechuje wysoka skuteczność rozpoznawania sytuacji zagrażających bezpieczeństwu, takich jak wystrzał z broni, krzyk, wybuch, czy dźwięk tłuczonego szkła. Opisane rozwiązanie znajduje zastosowanie w systemie automatycznego nadzoru bezpieczeństwa, realizującego również funkcję rozpoznawania zdarzeń wizyjnych. Przetwarzanie współbieżne obu modalnośći prowadzi do zwiększenia skuteczności rozpoznawania niebezpiecznych sytuacji. Algorytmy mogą być zastosowane w nadzorze miejsc publicznych, takich jak dworce, lotniska i stadiony.  

Entry No. 304 
Entry typeconference paper 
AuthorsK. Łopatka, P. Suchomski, A. Czyżewski 
English titleTime-domain prosodic modifications for Text-to-speech synthesizer 
Polish titleModyfikacja prozodii wypowiedzi w dziedzinie czasu w systemie syntezy mowy 
ConferenceSignal Processing Algorithms, Architectures, Arrangements and Applications SPA 2010 
Preprint 
Number 
Volume 
Pages73 - 77 
Conference sitePoznań, Polska 
Conference date23.8.2010- 25.8.2010 
AbstractAn application of prosodic speech processing algorithms to Text-To-Speech synthesis is presented. Prosodic modifications that improve the naturalness of the synthesized signal are discussed. The applied method is based on the TD-PSOLA algorithm. The developed Text-To-Speech Synthesizer is used in applications employing multimodal computer interfaces. 
StreszczeniePrzedstawiono zastosowanie algorytmów przetwarzania sygnałów dla celów modyfikacji prozodii wypowiedzi w systemie syntezy mowy języka polskiego. Modyfikacja prozodii ma na celu zwiększenie naturalności generowanej wypowiedzi. Metoda oparta jest an algorytmie TD-PSOLA. Opracowane algorytmy znajdują zastosowanie w multimodalnych interfejsach komputerowych. 

Entry No. 305 
Entry typejournal paper 
AuthorsA. Kupryjanow, A. Czyżewski 
English titleREALTIME SPEECH STRECHING FOR SUPPORTING HEARING IMPAIRED SCHOOLCHILDREN 
Polish titleSpowalnianie mowy w czasie rzeczywistym w celu poprawy rozumienia mowy przez dzieci w szkole 
JournalELEKTRONIKA - KONSTRUKCJE, TECHNOLOGIE, ZASTOSOWANIA 
Volume 
Number3/2010 
Pages24 - 28 
AbstractA study of time scale modification algorithms applied to hearing impaired schoolchildren supporting is presented. Variety of algorithms are considered, namely: overlap and add, two variations of synchronized overlap and add, and the phase vocoder. Their effectiveness as well as real-time processing capabilities are examined. 
StreszczenieW artykule przedstawiono przegląd algorytmów służących do modyfikacji czasu trwania mowy oraz analizę możliwość ich zastosowania w celu wspomagania procesu rozumienia mowy u dzieci w szkole. Zbadano następujące algorytmu: overlap and add, dwie odmiany algorytmu synchronous overlap and add oraz wokoder fazowy. W części eksperymentalnej zbadano skuteczność działania algorytmów oraz ich złożoność obliczeniową. 

Entry No. 306 
Entry typeconference paper 
AuthorsA. Kupryjanow, A. Czyżewski 
English title Real-time speech-rate modification experiments 
Polish title 
ConferenceKonwencja AES 2010  
Preprint8052 
Number 
Volume 
Pages 
Conference siteLondyn, Wielka Brytania 
Conference date22.5.2010- 25.5.2010 
AbstractThe paper presents algorithm designed for real-time speech time scale modification (stretching). An algorithm is proposed, providing a combination of typical synchronous overlap and add based time scale modification algorithm and signal redundancy detection algorithms that allow to remove parts of the speech signal and replace them with the stretched speech signal fragments. Effectiveness as well as quality of signal processing algorithms are examined experimentally. 

Entry No. 307 
Entry typeconference paper 
AuthorsD. Ellwart, A. Czyżewski 
English titleCorrupted speech intelligibility improvement using adaptive filter based algorithm 
Polish titlePoprawa zrozumiałości mowy z wykorzystaniem algorytmu opartego o filtrację adaptacyjną 
ConferenceAudio Engineering Society, Audio Forensics 
Preprint 
Number 
Volume 
Pages97 - 100 
Conference siteHillerød, Dania 
Conference date17.6.2010- 19.6.2010 
NotesISBN: 978-0-937803-76-9 
AbstractA technique for improving the quality of speech signals recorded in strong noise is presented. The proposed algorithm employing adaptive filtration is described and additional possibilities of speech intelligibility improvement are discussed. Results of the tests are presented. 
StreszczenieW pracy przedstawiono metodę poprawy jakości sygnałów w towarzystwie zakłóceń o wysokim poziomie. Omówiono zaproponowany algorytm wykorzystujący filtrację adaptacyjną oraz odejmowanie widmowe. Opisano przeprowadzone eksperymenty oraz zaproponowano metody dalszej poprawy zrozumiałości mowy. 

Entry No. 308 
Entry typeconference paper 
AuthorsP. Marcinkowski, P. Szczuko, A. Czyżewski 
English title 
Polish titleAlgorytm ekstrakcji cech biometrycznych twarzy 
ConferenceVI Sympozjum Naukowe Techniki Przetwarzania Obrazu 2010 
Preprint 
Number 
Volume 
Pages 
Conference siteSerock, Polska 
Conference date18.11.2010- 20.11.2010 
StreszczenieW referacie zawarto opis metody automatycznej lokalizacji oraz parametryzacji punktów charakterystycznych w obrazie twarzy. Do lokalizacji punktów charakterystycznych wykorzystano zmodyfikowany algorytm EBGM (ang. Elastic Bunch Graph Matching). Algorytm ten pozwala lokalizować punkty w obrazie przy założeniu niezmienności topologii grafu połączeń między nimi. W referacie przedstawiono podstawy teoretyczne metody oraz zaimplementowany trójetapowy proces lokalizacji punktów: lokalizacja twarzy w obrazie za pomocą kaskadowego klasyfikatora Haara oraz nałożenie ogólnej reprezentacji grafu, pozycjonowanie ogólnej reprezentacji grafu względem wykrytych oczu, odkształcanie grafu w celu pokrycia węzłami odpowiednich punktów charakterystycznych nieznanej twarzy. Proces odkształcania grafu uwzględnia dodatkowe kryteria odległościowe, odzwierciedlające znajomość geometrii ludzkiej twarzy. Punkt charakterystyczny w obrazie, będący węzłem grafu, opisany jest zbiorem zespolonych współczynników (cech, ang. jet) wyliczanych jako seria dwuwymiarowych falek Gabora (40 zespolonych falek podzielonych na 5 skal i 8 orientacji). W opisywanych badaniach posługiwano się grafem środkowej części twarzy: ust, nosa i oczu. To podejście pozwoliło analizować obrazy twarzy en face oraz zniwelować przypadki zasłoniętych punktów charakterystycznych. Porównanie twarzy, dążące ostatecznie do weryfikacji osoby, zrealizowane zostało na poziomie wyliczonych parametrów jetów. Przyjęte są dwa podejścia: uwzględniające tylko amplitudy falek oraz dodatkowo fazy falek. Przedstawiono i skomentowano wyniki zrealizowanego eksperymentu rozpoznawania 80 osób sfotografowanych w pozycji en face (wykorzystano ogólnodostępną bazę FERET). Zamieszczono podsumowanie i wnioski. 

Entry No. 309 
Entry typeconference paper 
AuthorsT. Merta, A. Czyżewski 
English titleSuperresolution Algorithm to Video Surveillance System 
Polish title 
Conference7th International Conference on Multimedia & Network Information Systems 
Preprint 
Number 
Volume80 
Pages105 - 112 
Conference siteWrocław, Polska 
Conference date23.9.2010- 24.9.2010 
AbstractAn application of a multiframe SR (superresolution) algorithm applied to video monitoring is described. The video signal generated by various types of video cameras with different parameters and signal distortions which may be very problematic for superresolution algorithms. The paper focuses on disadvantages in video signal which occur in video surveillance systems. Especially motion estimation and its influence on superresolution effectiveness is analyzed. In proposed initial solution a proper frame shift estimation is shown. Tests of the proposed algorithm performed video frames from real surveillance system in which many described difficulties were found. Result image examples show image resolution enhancement with plate numbers. The improvement of image quality is discussed in reference to further plate recognition. 

Entry No. 310 
Entry typejournal paper 
AuthorsP. Szczuko, B. Kostek, A. Czyżewski 
English titleComparison between natural movements and automatically generated animated motion employing motion capture and fuzzy logic techniques 
Polish titlePorównanie pomiędzy ruchem naturalnym w animacji komputerowej a generowanym automatycznie z wykorzystaniem przechwytywania ruchu i logiki rozmytej 
JournalJ. Expert Systems 
Volume 
Number 
Pages 
NotesPo recenzjach i poprawkach (do uzupełnienia po wydaniu) 
AbstractThe paper describes a new method for automatic generation of animated motion with quality comparable to natural motion. First the reference motion data are gathered utilizing a motion capture system. Then these data are reduced and only main poses of the action are left. The resulting motion is simplified and its quality is considerably decreased. Then, utilizing the automatic motion enhancement system, ANIMATOR, a new version of the action is generated, based on input poses and subjective descriptors given by the user. Various degrees of motion fluency and naturalness are possible to achieve this way. The proposed algorithm of the animation enrichment is based on fuzzy description of motion parameters and motion subjective features. The first step consists in creating fuzzy rules for the algorithm based on subjective evaluation of the animated movement. The second stage utilizes input descriptors for the new motion phases calculation, which are finally added to the animation. It is assumed that such processing increases naturalness and quality of motion, and this is verified by subjective evaluation tests. Finally a comparison between the original and the recreated motion is performed. Scores obtained in evaluation tests suggest that a substantial increase in quality between reduced and recreated versions is obtained, matching the original one. The method for motion enhancement is useful for automatic motion generation and can be paired with motion data reduction procedure for regaining naturalness. Moreover the reduced version can easily be edited in the ANIMATOR system, and in this way a new action can be created 
StreszczenieReferat opisuje nową metodę automatycznego generowania animowanego ruchu postaci o jakości porównywalnej z rzeczywistym ruchem człowieka. W pierwszym etapie gromadzone są dane referencyjne rzeczywistego, przechwyconego ruchu (wykorzystany system Motion Capture), następnie dane te są poddawane redukcji do głównych póz składających się na akcję aktora. Wynikowy ruch jest uproszczony i pozbawiony cech indywidualnych osoby i jego subiektywna jakość jest znacząco obniżona. Następnie w celu poprawy jakości wykorzystywany jest autorski system wzbogacania animowanego ruchu ANIMATOR i, w oparciu o pozostałe pozy oraz parametry wejściowe, generowana jest nowa wersja ruchu. Użytkownik ma możliwość modyfikować subiektywną płynność i naturalność wynikowego ruchu. Zastosowane przetwarzanie wykorzystuje logikę rozmytą i rozmyte parametry opisu subiektywnych cech ruchu. Wynikowe animacje porównywane są w testach oceny subiektywnej z ruchem rzeczywistych aktorów. Uzyskane wyniki wskazują na istotną poprawę jakości pomiędzy animacją zredukowaną do samych póz, a także finalną jakość zbliżoną do nieredukowanego oryginału. Opracowana metoda może znaleźć zastosowanie do automatycznego generowania wielu wersji uproszczonego ruchu. Ponadto system ANIMATOR dostarcza narzędzi intuicyjnej i efektywnej edycji ruchu uproszczonego, na bazie którego wygenerowane mogą być nowe akcje o wysokiej jakości subiektywnej. 

Entry No. 311 
Entry typejournal paper 
AuthorsP. Dalka, A. Czyżewski 
English titleHuman-Computer Interface Based on Visual Lip Movement and Gesture Recognition 
Polish titleInterfejs do komunikacji człowieka z komputerem wykorzystujący ruchy i gesty wykonywane ustami 
JournalInternational Journal of Computer Science and Applications 
Volume
Number
Pages124 - 139 
AbstractThe multimodal human-computer interface (HCI) called LipMouse is presented, allowing a user to work on a computer using movements and gestures made with his/her mouth only. Algorithms for lip movement tracking and lip gesture recognition are presented in details. User face images are captured with a standard webcam. Face detection is based on a cascade of boosted classifiers using Haar-like features. A mouth region is located in the lower part of the face region. Its position is used to track lip movements that allows a user to control a screen cursor. Three lip gestures are recognized: mouth opening, sticking out the tongue and forming puckered lips. Lip gesture recognition is performed by an artificial neural network and utilizes various image features of the lip region. An accurate lip shape is obtained by the means of lip image segmentation using fuzzy clustering. 
StreszczenieArtykuł przedstawia interfejs komputerowy nazwany Ustomysz, który pozwala użytkownikowi na posługiwanie się komputerem jedynie za pomocą ruchów i gestów wykonywanych ustami. Szczegółowo opisano algorytmy śledzenia ruchów ust i rozpoznawania gestów. Obraz twarzy użytkownika jest pozyskiwany za pomocą zwykłej kamerki internetowej. Detekcja twarzy bazuje na kaskadzie klasyfikatorów AdaBoost. Obszar ust lokalizowany jest w dolnej części twarzy. Jego pozycja wykorzystywana jest do śledzenia ruchów ust, co pozwala użytkownikowi na sterowanie kursorem ekranowym. Rozpoznawane są trzy gesty wykonywane ustami: otwarcie ust, wysunięcie języka oraz złożenie ust w dzióbek. Gesty ust są klasyfikowane przez sieć neuronową, która bazuje na deskryptorach obrazu ust. Dokładny kształt ust uzyskuje się poprzez aproksymację ich kształtu za pomocą elipsy, wykorzystując grupowanie rozmyte.  

Entry No. 312 
Entry typeconference paper 
AuthorsŁ. Kulasek, B. Kunka, A. Czyżewski 
English titleFACE RECOGNITION BY HUMANS WITH GAZE-TRACKING SYSTEM CYBER-EYE 
Polish titleBADANIE ROZPOZNAWANIA TWARZY PRZEZ CZŁOWIEKA Z WYKORZYSTANIEM SYSTEMU ŚLEDZENIA FIKSACJI WZROKU CYBER-OKO 
ConferenceNew Trends in Audio and Video (NTiAV) 2010 
Preprint 
Number 
Volume 
Pages 
Conference siteSzczecin, Polska 
Conference date14.10.2010- 16.10.2010 
Bibliographic No.
Notesmateriały konferencyjne dostępne na płycie CD 
AbstractIn order to understand the way humans memorize and recognize faces, we conducted research experiments employing a group of 20 people using the previously prepared gaze-tracking system Cyber-Eye. Cyber-Eye’s dedicated software coupled with infrared diodes and a camera allow tracking sight focus on the screen. Every individual participating in the experiment was presented a few videos containing face images. Those videos were made separately for the two different stages: face memorizing and face recognition. Then, Cyber-Eye system rendered them with heat maps that presented the position of sight focus at every moment. The analysis of the videos showed which face regions are significant in recognizing and memorizing faces and in which order they are processed. The results of this paper can help to improve face recognition algorithms running on machines. 
StreszczenieW celu dokładniejszego zrozumienia sposobu rozpoznawania i zapamiętywania twarzy przez człowieka przeprowadzono doświadczenie na grupie 20 osób z wykorzystaniem wcześniej opracowanego systemu śledzenia fiksacji wzroku Cyber-Oko [3]. Wykorzystując diody i kamerę podczerwieni wraz z dedykowanym oprogramowaniem Cyber-Oko, które pozwala na śledzenie punktu skupienia wzroku na ekranie. Każdej osobie biorącej udział w doświadczeniu pokazano plik filmowy zbudowany w oparciu o zdjęcia twarzy osób. Filmy wideo zostały przygotowane oddzielnie dla etapów rozpoznawania i zapamiętywania twarzy. Następnie system Cyber-Oko umożliwił połączenie ich z mapami ciepła przedstawiającymi pozycję skupienia wzroku w danej chwili. Analizując otrzymane w ten sposób filmy wideo udało się zaobserwować które regiony twarzy są znaczące przy rozpoznawaniu i zapamiętywaniu twarzy przez człowieka, oraz w jakiej kolejności są analizowane. Wyniki niniejszej pracy mogą pozwolić na ulepszenie algorytmów rozpoznawania twarzy. 

Entry No. 313 
Entry typebook 
AuthorsP Żwan, P. Sobala, P. Szczuko, A. Czyżewski 
English titleAudio Content Analysis in the Urban Area Telemonitoring System 
Polish titleInteligentne usługi multimedialne: Analiza dźwięku w monitoringu miejskim 
EditorSpringer-Verlag Berlin Heidelberg 
Pages227 - 239 
Notesrozdział w książce G.A. Tsihrintzis et al. (Eds.): Multimedia Services in Inteligent Environments 
AbstractThe digital sound processing is commonly used in many application fields. It can also be applied in the domain of the modern monitoring systems, since the recorded audio stream can contain a valuable information for security purposes. The additional audio analysis can be important especially when the video cameras are not able to observe the scene due to the improper lighting circumstances or when a suspicious objects is hidden for the view of a camera. Similarly, as in the case of the video analysis, the problem is the amount of data needed to be analyzed. In the case of audio stream, is a particular problem, since one person can’t monitor multi audio streams. Some automatic detection methods must be introduced in order to perform the automatic recognition of events which are non typical and can be related to a danger for citizens. The chapter presents the algorithm which automatically detects events like a broken window, a gun-shot and a scream. The crucial part of the algorithm is the modified spectral subtraction performed in order to diminish the influence of the significant and not stable background noise for the system performance. The resulting differential signal is parameterized and automatically recognized by the linear decision system.  
StreszczenieArtykuł przedstawia możliwości rozwinięcie monitoringu miejskiego o automatyczną analizę dźwięku. Przedstawiono metody parametryzacji dźwięku, które możliwe są do zastosowania w takim systemie oraz omówiono aspekty techniczne implementacji. W kolejnej części przedstawiono system decyzyjny oparty na drzewach zastosowany w systemie. System ten rozpoznaje dźwięki niebezpieczne (strzał, rozbita szyba, krzyk) wśród dźwięków zarejestrowanych w warunkach miejskich (ruch uliczny). W drugiej części artykułu przedstawiono metody lokalizacji przestrzennej badanych dźwieków.  

Entry No. 314 
Entry typeconference paper 
AuthorsB. Kunka, R. Rybacki, K. Łopatka, A. Czyżewski, B. Kostek 
English titleVIRTUAL KEYBOARD CONTROLLED BY EYE GAZE EMPLOYING SPEECH SYNTHESIS  
Polish titleWIRTUALNA KLAWIATURA STEROWANA WZROKIEM, WYKORZYSTUJĄCA SYNTEZĘ MOWY 
ConferenceNew Trends in Audio and Video (NTiAV) 2010 
Preprint 
Number 
Volume 
Pages 
Conference siteSzczecin, Poland 
Conference date14.10.2010- 16.10.2010 
Bibliographic No.11 
Notesmateriały konferencyjne dostępne na płycie CD 
AbstractThe article presents the speech synthesis integrated into the eye gaze tracking system. This approach can significantly improve the quality of life of physically disabled people who are unable to communicate. The virtual keyboard (QWERTY) is an interface which allows for entering the text for the speech synthesizer. First, this article describes a methodology of determining the fixation point on a computer screen. Then it presents an algorithm of concatenative speech synthesis used in the engineered solution. Both modules of the system described were created by the Multimedia Systems Department. The work of the entire system was verified in real conditions. Conclusions focusing on the usefulness of this approach are provided. 
StreszczenieW artykule przedstawiono zastosowanie syntezy mowy w zintegrowanym w systemie śledzenia punktu fiksacji wzroku. Takie podejście w znaczący sposób może przyczynić się do poprawy jakości życia osób niepełnosprawnych fizycznie, które nie mają możliwości komunikowania się. Interfejsem umożliwiającym wprowadzanie do syntetyzera mowy tekstu jest wirtualna klawiatura z rozkładem klawiszy QWERTY. W pierwszej części artykułu przedstawiono sposób wyznaczania punktu fiksacji wzroku na monitorze komputerowym za pomocą stworzonego w Katedrze Systemów Multimedialnych systemu o nazwie Cyber-Oko. W drugiej części zaprezentowano algorytm syntezy mowy konkatenacyjnej, który jest wykorzystywany w zaproponowanym rozwiązaniu. Sprecyzowano odpowiednie wnioski na temat użyteczności takiego podejścia oraz zweryfikowano pracę systemu w warunkach rzeczywistych.  

Entry No. 315 
Entry typeconference paper 
AuthorsM. Szczodrak, P. Dalka, A. Czyżewski 
English titlePerformance Evaulation of Video Object Tracking Algorithm in Autonomous Surveillance System 
Polish titleOcena skuteczności działania algorytmu śledzenia ruchomych obiektu w autonomicznym systemie monitoringu 
Conference2nd International Conference on Information Technology ICIT'2010 
Preprint 
Number
Volume18 
Pages43 - 48 
Conference siteGdańsk, Polska 
Conference date28.6.2010- 30.6.2010 
AbstractResults of performance evaluation of a video object tracking algorithm are presented. The method of moving objects detection and tracking is based on background modelling with mixtures of Gaussians and Kalman filters. An emphasis is put on algorithm’s efficiency with regards to its settings. Utilized methods of performance evaluation based on comparison of algorithm output to manually prepared reference data are introduced. The experiments aimed at examining the performance achieved with various object detection algorithm parameter settings are presented and discussed. 

Entry No. 316 
Entry typeconference paper 
AuthorsJ. Kotus, K. Kopaczewski, M. Szczodrak, A. Czyżewski 
English title 
Polish titleAnaliza zachowań tłumu w multimedialnym systemie bezpieczeństwa 
ConferenceVI Sympozjum "Techniki Przetwarzania Obrazu" 
Preprint 
Number 
Volume 
Pages - 7 
Conference siteSerock, Polska 
Conference date18.11.2010- 20.11.2010 
StreszczenieW niniejszym referacie zawarto opis metody detekcji zachowań tłumu na podstawie analizy obrazu. Koncepcja docelowego wykorzystania to wspomaganie pracy operatorów w systemach monitoringu, w szczególności podczas imprez masowych, np. na stadionach wyposażonych w wiele kamer. Celem opracowanej metody jest wykrywanie normalnych oraz potencjalnie niebezpiecznych zachowań tłumu, takich jak: panika, kierunkowy ruch masy ludzi, czy gromadzenie się. Schemat blokowy metody przedstawiony jest na rysunku 1. Można zauważyć dwie główne ścieżki przetwarzania. Pierwszą jest przekazanie parametrów pozyskanych w czasie analizy obrazów do modelu zachowań tłumu wykorzystującego metodę sił społecznych, a następnie jego symulacji i predykcji. Drugą ścieżką jest klasyfikacja zachowań tłumu i decyzja o wszczęciu alarmu w sytuacji nietypowej. Opisywana metoda bazuje na analizie ruchu punktów szczególnych w obrazie określonych za pomocą algorytmu Sparse Optical Flow. Proponowana metoda służy do uzyskania z obrazu informacji o dynamice tłumu. Klasyfikacji zachowań tłumu jest realizowana za pomocą sztucznej sieci neuronowej. W opracowywaniu przedstawionej metody wykorzystano zbiór wysokiej jakości nagrań zachowań tłumu wykonanych przez autorów na terenie Politechniki Gdańskiej. W procesie treningu algorytmów decyzyjnych wyodrębniono zbiory treningowe i weryfikacyjne. 

Entry No. 317 
Entry typeconference paper 
AuthorsP. Dalka, A. Czyżewski 
English titleControlling Computer by Lip Gestures Employing Neural Network 
Polish titleSterowanie komputerem za pomocą gestów ust z wykorzystaniem sieci neuronowych 
Conference7th International Conference on Rough Sets and Current Trends in Computing (RSCTC 2010)  
Preprint 
Number 
Volume 
Pages80 - 89 
Conference siteWarszawa, Polska 
Conference date28.6.2010- 30.6.2010 
NotesISBN-10 3-642-13528-5 
AbstractResults of experiments regarding lip gesture recognition with an artificial neural network are discussed. The neural network module forms the core element of a multimodal human-computer interface called LipMouse. This solution allows a user to work on a computer using lip movements and gestures. A user face is detected in a video stream from a standard web camera using a cascade of boosted classifiers working with Haar-like features. Lip region extraction is based on a lip shape approximation calculated by the means of lip image segmentation using fuzzy clustering. ANN is fed with a feature vector describing lip region appearance. The descriptors used include a luminance histogram, statistical moments and co-occurrence matrices statistical parameters. ANN is able to recognize with a good accuracy three lip gestures: mouth opening, sticking out the tongue and forming puckered lips. 
StreszczenieArtykuł prezentuje eksperymenty z zakresu rozpoznawania gestów wykonywanych ustami przez sztuczną sieć neuronową. Moduł ten stanowi główny element multimodalnego interfejsu komputerowego zwanego Ustomysz. Rozwiązanie to pozwala na posługiwanie się komputerem jedynie za pomocą ruchów i gestów wykonywanych ustami. Twarz użytkownika jest wykrywana w strumieniu wizyjnym ze zwykłej kamery za pomocą kaskady klasyfikatorów AdaBoost. Obszar ust wyznaczany jest za pomocą aproksymacji kształtu ust za pomocą elipsy algorytmem bazującym na grupowaniu rozmytym. Sztuczna sieć neuronowa działa w oparciu o wektor parametrów opisujących wygląd ust. W jego skład wchodzą histogram luminancji, momenty statystyczne obrazu oraz parametry statystyczne macierzy współwystępowania. Sieć neuronowa jest w stanie rozpoznać z wysoką skutecznością trzy gesty wykonywane ustami: otwarcie ust, wysunięcie języka oraz złożenie ust w dzióbek. 

Entry No. 318 
Entry typeconference paper 
AuthorsJ. Kotus, M. Szczodrak, A. Czyżewski, B. Kostek 
English titleLong-term comparative evaluation of an acoustic climate in selected schools before and after the acoustic treatment 
Polish title 
ConferenceNoise Control 2010 
Preprint 
Number 
Volume 
Pages 
Conference siteWałbrzych, Polska 
Conference date6.6.2010- 9.6.2010 
AbstractResults of the long-term continuous noise measurement in two schools are presented in the paper. Noise characteristics are measured continuously at selected locations for approximately 16 months. The autonomous noise monitoring stations, engineered at the Multimedia Systems Department of Gdansk University of Technology are used for this purpose. 8 months since the beginning of the measurements, the acoustic treatment of the corridors has been done. A comparative evaluation of acoustic climate in selected schools before and after the acoustic treatment is performed based on these two periods of the continuous measurements. Investigations of measured noise, particularly its influence on hearing, based on spectrum analysis in critical bands are discussed. Effects of occupational noise exposure, including the Temporary Threshold Shift simulation, are determined. The results of the above discussed measurements correlated with the instantaneous noise levels are also presented. 

Entry No. 319 
Entry typeconference paper 
AuthorsM. Szczodrak, P. Dalka, A. Czyżewski 
English titleMoving object tracking algorithm evaluation in autonomous surveillance system 
Polish title 
ConferenceMCSS 2010: IEEE International Conference on Multimedia Communications, Services and Security 
Preprint 
Number 
Volume 
Pages219 - 223 
Conference siteKraków, Polska 
Conference date6.5.2010- 7.5.2010 
NotesISBN 978-83-88309-92-2 
AbstractResults of evaluation of video object tracking algorithm being a part of an autonomous surveillance system are presented. The algorithm was investigated employing a set of benchmarks recorded locally. The precision of object detection, evaluated with such metrics as fragmentation, object area recall and object precision, is in focus. The experiments aimed at examining the detection quality using various object detection algorithm parameter settings are described. The analysis of results of carried out experiments is included. 

Entry No. 320 
Entry typejournal paper 
AuthorsM. Lech, B. Kostek, A. Czyżewski, P. Odya 
English titleGesture-based Computer Control System 
Polish titleSystem Sterowania Komputerem za Pomocą Gestów 
JournalElektronika - Konstrukcje, Technologie, Zastosowania 
Volume 
Number3/2010 
Pages49 
AbstractIn the paper a system for controlling computer applications by hand gestures is presented. First, selected methods used for gesture recognition are described. The System hardware and a way of controlling a computer by gestures is presented. The architecture of the software along with hand gesture recognition methods and algorithms used is described. The set of basic gestures and, consisting of them, complex gestures recognized by the system is given. 
StreszczenieW artykule przedstawiono System Sterowania Komputerem za Pomocą Gestów Rąk. W pierwszej części dokonano przeglądu wybranych metod rozpoznawania gestów. Następnie zaprezentowano część sprzętową Systemu oraz metodykę sterowania. Opisano również architekturę oprogramowania wraz z metodami i algorytmami zastosowanymi przy rozpoznawaniu gestów rąk. W dalszej części udostępniono zestaw prostych gestów oraz bazujących na nich gestów złożonych, rozpoznawanych przez system. 

Entry No. 321 
Entry typejournal paper 
AuthorsB. Kunka, B. Kostek, M. Kulesza, P. Szczuko, A. Czyżewski 
English titleGaze-Tracking Based Audio-Visual Correlation Analysis Employing Quality of Experience Methodology 
Polish titleSystem sledzenia punktu fiksacji wzroku w badaniach korelacji sluchowo-wzrokowych uwzgledniajacych metodyke QoE 
JournalIntelligent Decision Technologies (IDT) Journal 
Volume 
NumberISSN 1872-4981/10 
Pages217 - 227 
Bibliographic No.32 
NotesDOI 10.3233/IDT-2010-0082 
AbstractThis paper investigates a new approach to audio-visual correlation assessment based on the gaze-tracking system developed at the Multimedia Systems Department (MSD) of Gdansk University of Technology (GUT). The gaze-tracking methodology, having roots in Human-Computer Interaction borrows the relevance feedback through gaze-tracking and applies it to the new area of interests, which is Quality of Experience. Results of subjective tests carried out at the MSD showed a strong dependency between video presented in the screen and the perceived audio. It has also been shown that the application of gaze-tracking to the audio-visual correlation analysis allows for the objectivization of results obtained in subjective tests. Therefore this research study concentrates on the possibility to apply this methodology to the area of Quality of Experience. 
StreszczenieW niniejszym artykule przedstawiono nowe podejście do badań korelacji wzrokowo-słuchowych z wykorzystaniem systemu śledzenia wzroku, opracowanego w Katedrze Systemów Multimedialnych (KSM) Politechniki Gdańskiej. Technika śledzenia wzroku wywodzącą się z technik HCI (ang. Human-Computer interactions) zostaje wykorzystana w nowym obszarze, jakim jest dziedzina Quality of Experience (QoE). Wyniki testów subiektywnych przeprowadzonych w KSM wskazują na silną zależność pomiędzy obrazem wizyjnym prezentowanym na ekranie a percypowanym bodźcem dźwiękowym. Pokazano również, że zastosowanie techniki śledzenia wzroku w analizie korelacji wzrokowo-słuchowych prowadzi do obiektywizacji wyników uzyskanych podczas testów subiektywnych. 

Entry No. 322 
Entry typejournal paper 
AuthorsA. Kupryjanow, K. Kaszuba, A. Czyżewski 
English titleINFLUENCE OF ACCELEROMETER SIGNAL PRE-PROCESSING AND CLASSIFICATION METHOD ON HUMAN ACTIVITY RECOGNITION 
Polish titleWpływ przetwarzania wstępnego i wyboru metody klasyfikacji na skuteczność rozpoznawania aktywności ruchowych 
JournalELEKTRONIKA - KONSTRUKCJE, TECHNOLOGIE, ZASTOSOWANIA 
Volume 
Number3/2010 
Pages18 - 23 
AbstractA study of data pre-processing influence on accelerometer-based human activity recognition algorithms is presented. The frequency band used to filter-out the accelerometer signals and the number of accelerometers involved were considered in terms of their influence on the recognition accuracy. In the test four methods of classification were used: support vector machine, decision trees, neural network, k-nearest neighbor.  
StreszczenieW artykule przedstawiono wpływ przetwarzania wstępnego sygnału przyspieszenia na skutecznością rozpoznawania aktywności ruchowych. Przeanalizowano zależność filtracji sygnałów oraz ilości zastosowanych czujników na skuteczność klasyfikacji. W badaniach wykorzystano cztery różne klasyfikatory: maszynę wektorów wsparcia, drzewa decyzyjne, sztuczne sieci neuronowe oraz klasyfikator najbliższego sąsiada. 

Entry No. 323 
Entry typebook 
AuthorsP. Dalka, G. Szwoch, P. Szczuko, A. Czyżewski 
English titleVideo Content Analysis in the Urban Area Telemonitoring System 
Polish titleAnaliza materiału wideo w miejskim systemie telemonitoringu 
EditorSpringer-Verlag Berlin Heidelberg 
Pages241 - 261 
Notesrozdział w książce G.A. Tsihrintzis et al. (Eds.): Multimedia Services in Inteligent Environments 
AbstractThe task of constant monitoring of video streams from a large number of cameras and reviewing the recordings in order to find a specified event requires a considerable amount of time and effort from the system operators and it is prone to errors. A solution to this problem is an automatic system for constant analysis of camera images being able to raise an alarm if a predefined event is detected. The chapter presents various aspects of video signals processing dedicated to detection and monitoring of threats in urban areas. First the video analysis methods are presented, then recognition algorithms are introduced for detection of important events, and finally obtained results are discussed. The section 2. is dedicated to basic video analysis algorithms aimed at detection, tracking and classification of moving object appearing in a camera field of view. First in section 2.1 moving object detection is presented. It employs background modelling and subtraction for determination of non-stationary objects detection. Then the problem of objects shadows is discussed, and finally a stage of image segmentation is presented. In Sec. 2.2 moving object tracking is described. This process entails a necessity of solving many problems regarding object occlusions. An approach utilizing changes in time of object state described by Kalman filter is discussed, which concludes low level processing of visual media. An outcome of low-level processing serves as a input to higher-level analysis, where it is determined whether they are actually dangerous situations. The high-level video processing is presented in Sec. 3. It starts with object classification (Sec 3.1), and then event recognition is performed (Sec. 3.2). Modern video surveillance systems contain multiple cameras, covering a wide area, some of which are able to pan, tilt and zoom view area (PTZ cameras). A technique for positioning of PTZ cameras is presented in Sec. 3.3, allowing tracking of moving object. 
StreszczenieCiągłe monitorowanie strumieni wideo z wielu kamer i przeglądanie nagrań w celu odnalezienia zadanego zdarzenia jest zadaniem wymagającym dla operatora systemu monitoringu. Rozwiązaniem może być system automatycznej analizy, rozpoznający predefiniowane zdarzenia. W rozdziale przedstawiony jest przegląd najważnejszych zagadnień z dziedziny analizy obrazu ruchomoego w celu wykrywania i monitorowania zagrożeń w aglomeracji miejskiej. 

Entry No. 324 
Entry typebook 
AuthorsA. Czyżewski, J. Kotus 
English titleAutomatic localization and continous tracking of mobile sound source using passive acoustic radar 
Polish title 
EditorMilitary University of Technology 
Pages441 - 453 
NotesConcepts and Implementations for Innovative Military Communications and Information Technologies, ISBN 978-83-61486-70-1 
AbstractA concept, practical realization and applications of the passive acoustic radar for localization and continuous tracking of fixed and mobile sound sources such as: cars, trucks, aircrafts and sources of shooting, explosions were presented in the paper. The device consists of the new kind of multi-channel miniature three dimensional sound intensity sensors invented by the Microflown company and a group of digital signal processing algorithms developed in the Multimedia System Department, Gdansk University of Technology. Contrarily to active radars, the passive acoustic radar does not emit any scanning beam but “listens to” surrounding sounds and in result it provides information about the directions of arriving acoustical waves. Hence, monitoring of the acoustic field in this way remains unnoticeable. For the sound source localization the two independent 3D sound intensity probes and triangulation technique were used. In order to increase accuracy of the sound source localization an additional algorithm of the resonant narrow-band filtration of acoustic signals was applied. The practical examinations of the sensitivity and accuracy of the developed PAR were conducted in an anechoic chamber and in typical reverberant conditions. The functionality and acoustic properties of the passive radar were examined in details using three types of signals for given environmental conditions: broadband sounds, pure-tones and impulsive sounds. Taking the obtained results of the realized experiments into consideration it was ascertained that even the inconsiderable value of the signal to noise ratio was sufficient to localize sound source suitably. The obtained measurement results including real sounds samples can be remotely sent to the control station. The passive radar can be operated both automatically as a stand-alone unit and in manual mode. The proposed technology can provide the operator with many essential data representing the activity of objects and targets in a given area. Moreover, the automatic and continuous tracking of the selected sound source movement is also possible. Additional procedures such as: sound source classification module or automatic control of the digital PTZ (Pan Tilt Zoom) camera can be used to extend the usefulness of the presented device. 

Entry No. 325 
Entry typeconference paper 
AuthorsP. Dalka, A. Czyżewski 
English titleVehicle Classification Based on Soft Computing Algorithms 
Polish titleKlasyfikacja typu pojazdu za pomocą inteligentnych algorytmów decyzyjnych 
Conference7th International Conference on Rough Sets and Current Trends in Computing (RSCTC 2010) 
Preprint 
Number 
Volume 
Pages70 - 79 
Conference siteWarszawa, Polska 
Conference date28.6.2010- 30.6.2010 
NotesISBN-10 3-642-13528-5 
AbstractExperiments and results regarding vehicle type classification are presented. Three classes of vehicles are recognized: sedans, vans and trucks. The system uses a non-calibrated traffic camera, therefore no direct vehicle dimensions are used. Various vehicle descriptors are tested, including those based on vehicle mask only and those based on vehicle images. The latter ones employ Speeded Up Robust Features (SURF) and gradient images convolved with Gabor filters. Vehicle type is recognized with various classifiers: artificial neural network, K-nearest neighbors algorithm, decision tree and random forest. 
StreszczenieArtykuł przedstawia eksperymenty i ich wyniki z zakresu klasyfikacji typu pojazdów. Trzy rodzaje pojazdów są rozróżniane: osobowe, samochody dostawcze/busy oraz samochody ciężarowe. System bazuje na kamerze z nieskalibrowanym polem widzenia, przez co nie wykorzystano bezpośrednio rozmiarów pojazdów. Przetestowano wiele deskryptorów obrazu pojazdów, w tym bazujące na tylko na kształcie pojazdu oraz takie bazujące na ich obrazie. Te ostanie wykorzystują lokalne deskryptory SURF oraz splot gradientu obrazu pojazdów z filtrami Gabora. Typ pojazdu jest klasyfikowany za pomocą sztucznych sieci neuronowych, algorytmu K najbliższych sąsiadów, drzewa decyzyjnego oraz lasu losowego (Random Forest) 

Entry No. 326 
Entry typeconference paper 
AuthorsJ. Kotus, A. Czyżewski 
English titleAUTOMATYCZNA LOKALIZACJA ŹRÓDŁA DŹWIĘKU W OBECNOŚCI ZAKŁÓCEŃ Z WYKORZYSTANIEM WEKTOROWYCH CZUJNIKÓW AKUSTYCZNYCH 
Polish titleAUTOMATIC SOUND SOURCE LOCALIZATION IN DISTURBING CONDITIONS USING ACOUSTIC VECTOR SENSORS 
ConferenceNOWOŚCI W TECHNICE AUDIO I WIDEO 
Preprint 
Number 
Volume 
Pages 
Conference siteSzczecin, Polska 
Conference date14.10.2010- 16.10.2010 
AbstractA concept, practical realization and applications of a passive acoustic radar to automatic localization and tracking of sound sources in disturbing conditions were presented in the paper. The device consists of the new kind of multichannel miniature sound intensity sensors and a group of digital signal processing algorithms. The sensitivity of the realized acoustic radar was examined in free sound field. Several kinds of sound signals were used, such as: pure tone from 125 to 16000 Hz, one third octave band noise in the same frequency range and impulsive sounds. As results from experiments, in some cases even the small value of the signal to noise ratio was sufficient to localize sound source correctly. A video PTZ (Pan Tilt Zoom) camera can be pointed automatically to the spot the detected acoustical source is localized. 
StreszczenieW referacie przedstawiono pomysł i praktyczną realizację pasywnego radaru akustycznego do automatycznego lokalizowania i śledzenia źródeł dźwięku w warunkach zakłóceń. Urządzenie składa się z nowego typu wielokanałowych miniaturowych czujników natężeniowych oraz algorytmów cyfrowego przetwarzania sygnałów. Czułość radaru akustycznego została zbadana w warunkach pola swobodnego. Użyto sygnałów testowych takich jak: sygnały tonalne z zakresu od 125 do 16 kHz, szumowe (w tym samym zakresie częstotliwości) oraz o charakterze impulsowym. Uzyskane wyniki pomiarów wskazują, że nawet niewielka wartość stosunku sygnału do szumu była wystarczająca do poprawnego zlokalizowania źródła dźwięku. Informacja o kierunku dobiegania dźwięku może być zastosowana do automatycznego sterowania cyfrową kamerą typu PTZ (Pan Tilt Zoom). 

Entry No. 327 
Entry typejournal paper 
AuthorsJ. Kotus, A. Czyżewski 
English titleAcoustic radar employing particle velocity sensors 
Polish title 
JournalAdvances in Multimedia and Network Information System Technologies 
Volume80 
Number 
Pages92 - 103 
AbstractA concept, practical realization and applications of a passive acoustic radar to automatic localization, tracking of sound sources were presented in the paper. The device consist of the new kind of multichannel miniature sound intensity sensors and a group of digital signal processing algorithms. Contrary to active radars, it does not emit the scanning beam but after receiving surroundings sounds it provide information about the directions of incoming acoustical signals. Practical examinations of the sensitivity and accuracy of the developed radar were also presented and discussed. The sensitivity of the realized acoustic radar was examined in free sound field. Several kinds of sound signals were used, such as: pure tone from 125 to 16000 Hz, one third octave band noise in the same frequency range and impulsive sounds. The obtained results for every kind of signal groups were presented and discussed. As results from experiments, in some cases even the small value of the signal to noise ratio was sufficient to localize sound source correctly. A video camera can be pointed automatically to the place the detected acoustical source is localized. Hence, the information about the sound event direction can be used to automatic and remote control of the PTZ (Pan Tilt Zoom) cameras. The automatic and continuous tracking in real time of the selected sound source movement is also possible. The proposed solution can significantly improve the functionality of the traditional surveillance monitoring systems. 

Entry No. 328 
Entry typeconference paper 
AuthorsJ. Kotus, B. Kunka, A. Czyżewski, P. Szczuko, P. Dalka, R. Rybacki 
English titleGaze-tracking and acoustic vector sensors technologies for PTZ camera steering and acoustic event detection 
Polish title 
Conference1st International Workshop: Interactive Multimodal Pattern Recognition in Embedded Systems (IMPRESS 2010) 
Preprint 
Number 
Volume 
Pages276 - 280 
Conference siteBilbao, Hiszpania 
Conference date1.9.2010- 1.9.2010 
NotesDEXA 2010 
AbstractAn innovative application of gaze-tracking and acoustic vector sensors (AVS) technologies for guidance of moving pan- tilt-zoom (PTZ) monitoring camera is presented. Gaze-tracking is used to steer and to zoom the camera to the gaze focus area. Additionally, it is combined with audio processing in two scenarios. First is called “audio slave”: directional acoustic monitoring is adjusted automatically to the camera direction. Second is called “audio master”: automatic detection of sound events directions is performed to take priority over user control and steer the camera towards sound source. An approach to gaze tracking is presented, utilizing new algorithmic methods for both image processing and PTZ camera steering. Then application of AVS for directional filtering of sound, and for detection of acoustic events direction is discussed. The implemented application is described, and user experience is reported. Finally, future work is discussed. 
StreszczenieW artykule przedstawione zostało innowacyjne zastosowanie techniki śledzenia wzroku i sondy akustycznej (AVS) w sterowaniu obrotowymi kamerami (PTZ) monitoringu wizyjnego. Śledzenie wzroku zostało wykorzystane do obrotu kamery i zmiany jej ogniskowej w obszarze skupienia wzroku. Dodatkowo, zastosowano dwa podejścia związane z przetwarzaniem dźwięku. Pierwsze, nazwane "audio slave" oznacza, że monitoring akustyczny jest automatycznie dostosowany do kierunku patrzenia kamery. Drugie, nazwane "audio master" oznacza, że wykrycie kierunków zdarzeń akustycznych prowadzi do automatycznego przejęcia kontroli nad kamerą i ukierunkowanie jej na źródło dźwięku. W artykule omówiono również zastosowania kierunkowej filtracji dźwięku oraz wykrywania zdarzeń akustycznych. Przedstawiono zaimplementowaną aplikację oraz opisano wrażania użytkowników systemu. W zakończeniu zaproponowano etapy przyszłych prac.  

Entry No. 329 
Entry typejournal paper 
AuthorsA. Kupryjanow, B. Kunka, A. Czyżewski 
English titleVIRTUAL TOUCHPAD – VIDEO-BASED MULTIMODAL INTERFACE  
Polish titleWirtualny TouchPad - interfejs multimodalny oparty na przetwarzaniu obrazu wizyjnego  
JournalZeszyty Naukowe Wydziału ETI PG 
Volume 
Number8/2010 
Pages219 - 224 
NotesTechnologie Informacyjne TOM 19 
AbstractA new computer interface named Virtual-Touchpad (VTP) is presented. The Virtual-Touchpad provides a multimodal interface which enables controlling computer applications by hand gestures captured with a typical webcam. The video stream is processed in the software layer of the interface. Hitherto existing video-based interfaces analyzing frames of hand gestures are presented. Then, the hardware configuration and software features of the Virtual-Touchpad are described.  
StreszczenieW referacie przedstawiono interfejs multimodalny o nazwie Wirtualny Touchpad. Umożliwia on sterowanie aplikacjami komputerowymi za pomocą gestów dłoni, wyekstrahowanych z obrazów przechwytywanych w czasie rzeczywistym z kamery wizyjnej. Opisano konfigurację sprzętową oraz warstwę oprogramowania interfejsu. Warstwa oprogramowania przetwarza strumień wizyjny, dokonuje detekcji i klasyfikacji określonych gestów oraz interpretuje je w celu wykonania odpowiednich akcji.  

Entry No. 330 
Entry typejournal paper 
AuthorsJ. Kotus, M. Szczodrak, A. Czyżewski, B. Kostek 
English titleLong-term comparative evaluation of an acoustic climate in selected schools before and after the acoustic treatment 
Polish title 
JournalArchives of Acoustics 
Volume35 
Number
Pages551 - 564 
AbstractThe results of long-term continuous noise measurements in two selected schools are presented in the paper. Noise characteristics were measured continuously there for approximately 16 months. Measurements started eight months prior to the acoustic treatment of the school corridors of both schools. An evaluation of the acoustic climates in both schools, before and after the acoustic treatment, was performed based on comparison of these two periods of continuous measurements. The autonomous noise monitoring stations, engineered at the Multimedia Systems Department of the Gdansk University of Technology were used for this purpose. Investigations of measured noise, especially its influence on hearing sense, assessed on ground of spectral analyses in critical bands, is discussed. Effects of occupational noise exposure, including the Temporary Threshold Shift simulation, are determined. The correlation of the above said measurement results with respective instantaneous noise levels is discussed, and concluding remarks are presented. Some additional indicators such as air pollution or video analysis aiming at the analysis of corridor occupancy are also measured. It should be remembered that excessive noise, or air pollution may be evidence of a dangerous event and may pose health risks. 

Entry No. 331 
Entry type 
AuthorsA. Czyżewski, B. Kostek, J. Kotus 
English title 
Polish titleSystem do identyfikacji i zwalczania szumów usznych 
NotesPatent przyznany przez UPRP w dniu 02.08.2019 
StreszczenieSposób identyfikacji i zwalczania szumów usznych zawierający etap pomiaru charakterystyk słuchowych oraz parametrów odczuwanego szumu usznego za pomocą urządzenia komputerowego oraz etap odtwarzania sygnałów dźwiękowych w przenośnym urządzeniu fonicznym charakteryzuje się tym, że zmienia się płynnie parametry sygnału testowego w czasie rzeczywistym przesuwając znacznik w dwuwymiarowym układzie współrzędnych na ekranie dotykowym (ED) połączonym z urządzeniem komputerowym (K) aż do uzyskania dopasowania generowanego na tej podstawie sygnału testowego do odczuwanego przez jego odbiorcę (OD) szumu usznego i w oparciu o uzyskane parametry ustala się widmo sygnału tłumienia odpowiadającego danemu szumowi usznemu, po czym tworzy się filtr komplementarny do tego widma i zgodnie z jego charakterystyką tłumi się lub wzmacnia wybrane pasma częstotliwości w sygnałach plików dźwiękowych odtwarzanych w przenośnym urządzeniu fonicznym (1). System składa się z urządzenia komputerowego oraz połączonego z nim za pomocą interfejsu komunikacyjnego przenośnego urządzenia fonicznego i charakteryzuje się tym, że urządzenie komputerowe (K) posiada ekran dotykowy (ED) oraz aplikacje programowe (A) do regulowania za ich pomocą sygnałów dźwiękowych z generatorów i filtrów sygnałów testowych (G, F), a przenośne urządzenie foniczne (1) wyposażone jest w procesor sygnałowy (5) z programowalnymi środkami filtracji (6) w bloku dekodera plików dźwiękowych (3). 

Entry No. 332 
Entry typereport 
AuthorsB. Kunka, R. Rybacki, A. Czyżewski, B. Kostek 
English title 
Polish titleOpracowanie aplikacji–przeglądarki wraz z nakładką umożliwiającą interakcję systemu śledzenia wzroku z treścią strony (wstępne koncepcje) 
Report NumberRaport 1 
StreszczenieRozwój systemów służących do analizy punktów fiksacji wzroku użytkownika otwiera szerokie perspektywy zastosowania takich systemów w typowych zadaniach użytkowych takich jak korzystanie z aplikacji internetowych. System do śledzenia punktu fiksacji wzroku mógłby stanowić typowe rozszerzenia aplikacji przeglądarki internetowej i w ten sposób umożliwiać interakcję wzrokową z treścią strony. Rangowanie materiałów przy wyszukiwaniu mogłoby opierać się nie tylko na tradycyjnych policzalnych informacjach, takich jak liczba uruchomień materiału, liczba kliknięć, liczba ściągnięć, ale również na danych zgromadzonych przez analizę interakcji wzrokowej. Wpływ na ocenę atrakcyjności danego materiału miałby również np. czas fiksacji wzroku użytkowników na odpowiednich elementach strony. 

Entry No. 333 
Entry typejournal paper 
AuthorsM. Kulesza, A. Czyżewski 
English titleFrequency based criterion for distinguishing tonal and noisy spectral components 
Polish titleKryterium częstotliwościowe pozwalające na klasyfikację komponentów widmowych na tonalne i szumowe 
JournalSignal Processing: An International Journal (SPIJ) 
Volume
Number
Pages1 - 16 
AbstractA frequency-based criterion for distinguishing tonal and noisy spectral components is proposed. For considered spectral local maximum two instantaneous frequency estimates are determined and the difference between them is used in order to verify whether component is noisy or tonal. Since one of the estimators was invented specially for this application its properties are deeply examined. The proposed criterion is applied to the stationary and nonstationary sinusoids in order to examine its efficiency. 

Entry No. 334 
Entry typejournal paper 
AuthorsP. Odya, A. Czyżewski, A. Grabkowska, M. Grabkowski 
English titleSmart Pen - new multimodal computer control tool for graphomotorical therapy 
Polish titleInteligentny długopis - nowe narzędzie do terapii zaburzeń grafomotorycznych 
JournalIntelligent Decision Technologies Journal 
Volume
Number
Pages197 - 209 
Bibliographic No.1872-4981 
AbstractNumerous researches indicate that dyslexia and dysgraphia are nowadays major problems in schools. Smart Pen is a tool for supporting the therapy of developmental dyslexia, with particular regard to dysgraphia. It comprises a display monitor equipped with a high-sensitivity touchpad and specially designed writing tool equipped with pressure sensors. The paper put emphasis on issues related to the design of the device and the development of software providing a vital part of the interface. The software allows monitoring some interface parameters that are important from the therapy point of view, such as pen grip or time taken to complete an activity being a part of an exercise. The interface designed allows interesting (play and learn) activities to be performed with kids (i.e. learning of proper handling writing tools, basic writing etc). Tests have been carried out to verify usability of the Smart Pen. The test results showed that children and therapists are keen on using the new tool. Furthermore, using Smart Pen it is possible to distinguish children without writing problems from those who have some motoric disruptions. A description of the tests carried out and of their results is included in the paper.  
StreszczenieLiczne badania wskazują, że dysleksja i dysgrafia są poważnym problemem utrudniającym edukację dzieci. Inteligentny długopis jest narzędziem wspomagającym terapię dzieci z dysleksją rozwojową. Składa się z monitora wyposażonego w wysokiej czułości tablet oraz specjalnie zaprojektowanego piórka wyposażonego w czujniki ścisku. Artykuł skupia się na zagadnienia związanych z projektowaniem urządzenia i tworzeniem oprogramowania, które pozwala na prowadzenie ćwiczeń w sposób atrakcyjny dla ucznia. Oprogramowanie umożliwia jednocześnie monitorowanie parametrów ważnych z punktu widzenia terapii, takich jak ścisk długopisu lub czas niezbędny do wykonania ćwiczenia. W celu sprawdzenia przydatności Inteligentnego długopisu przeprowadzono testy z udziałem dzieci. Stworzony w ramach projektu interfejs spotkał się z bardzo przychylną opinią terapeutów i dzieci. Testy pokazały, że przy pomocy interfejsu możliwe jest rozróżnienie dzieci, które nie mają problemów z prawidłowym pisaniem od tych, które mają zaburzenia grafomotoryczne. Opis testów oraz ich wyników również zawarto w artykule. 

Entry No. 335 
Entry typeconference paper 
AuthorsŁ. Kosikowski, P. Dalka, A. Czyżewski 
English titleMultimedia Browser Controlled by Head Movements 
Polish titlePrzeglądarka multimediów sterowana ruchami głowy 
ConferenceSIGGRAPH 
Preprint 
Number 
Volume 
Pages
Conference siteLos Angeles, USA 
Conference date25.7.2010- 29.7.2010 
AbstractA contactless multimedia content browser for personal computers is presented, where the user browses data using movements of his/her head only. The presented solution supports browsing static images, videos and music clips can be browsed subsequently and zoomed on demand. Video clips can be viewed and paused. Additionally, a user may fast-forward or rewind the content. The same functionality applies to listening audio files. Multimedia files are arranged in a multi-level, hierarchical structure. A user navigates through the structure and displays an element by moving the head up, down, left and right. Keeping the head in a tilted position for the longer time is also recognized. An action executed in the system depends on the type of the content a user is viewing (e.g. moving the head to the right selects the next picture or allows for fast-forwarding audio files). The content for the multimedia browser is chosen and organized with a separate configuration application that was also developed within the framework of the project. The application is especially suitable to standalone, multimedia terminals where users may get acquainted with a company or a store offer in the fast and convenient way. The application may also be used by disabled people.  
StreszczeniePrezentowane rozwiązanie wspomaga przeglądanie obrazów statycznych, filmów i plków dźwiękowych z użyciem interfejsu komputerowego sterowania komuterem za pomocą ruchów głowy. Aplikacja może zostać wykorzystana szczególnie w kioskach multimedialnych do prezentowania oferty sklepów z treścią multimedialną w przystępny dla użytkownika sposób. Z systemu mogą korzystać także osoby niepełnosprawne. 

Entry No. 336 
Entry typeconference paper 
AuthorsA. Czyżewski, K. Łopatka, B. Kunka, R. Rybacki, B. Kostek 
English titleSpeech synthesis controlled by eye gazing 
Polish titleSynteza mowy sterowana ruchami gałki ocznej 
Conference129th Convention of the Audio Engineering Society 
Preprint8165 
Number 
Volume 
Pages 
Conference siteSan Francisco, USA 
Conference date4.11.2010- 7.11.2010 
AbstractA method of communication based on eye gaze controlling is presented. Investigations of using gaze tracking have been carried out in various context applications. The solution proposed in the paper could be referred to as "talking by eyes" providing an innovative approach in the domain of speech synthesis. The application proposed is dedicated to disabled people, especially to persons in a so-called locked-in syndrome who cannot talk and move any part of their body. The paper describes a methodology of determining the fixation point on a computer screen. Then it presents an algorithm of concatenative speech synthesis used in the solution engineered. An analysis of working with the system is provided. Conclusions focusing on system characteristics are included. 
StreszczeniePrzedstawiono metodę komunikacji za pomocą ruchu gałek ocznych. Zaprezentowane rozwiązanie można rozumieć jako "mówienie oczami". Stanowi ono innowacyjne podejście do syntezy mowy. Zastosowanie jest przygotowane z myślą o ludziach niepełnosprawnych ruchowo, zwłaszcza dla osób z syndromem zamknięcia, którzy są niezdolni do mówienia i poruszania jakimikolwiek częściami ciał poza oczami. W referacie opisano metodę wyznaczania punktu fiksacji wzroku na ekranie komputera. Przy pomocy fiksacji wzroku wprowadzane są znaki, które są przekazywane modułowi syntezy mowy. Przedstawiono analizy jakości pracy z systemem. We wnioskach skupiono się na cechach systemu. 

Entry No. 337 
Entry typereport 
AuthorsP. Szczuko, A. Czyżewski, G. Szwoch, P. Dalka, . et al 
English titleCreation of event model in order to detect dangerous events 
Polish title 
Report NumberINDECT/D7.2 
AbstractIn the Deliverable a parametric model of event is proposed suitable for automatic analysis. The model comprises detected objects parameters and detected actions and interactions between these objects. An extensive set of parameters is presented and discussed, followed by outline of a methodology of event detection employing conditional rules. Automatic acquisition of objects parameters is facilitated with audio and video processing algorithms, which are developed within WP7 as well as in cooperating WP1. Systematic description of audio and video algorithms is here omitted as this Deliverable serves as a general road map for future research: focuses Work Package Partners on particular issues, presenting a research topics rather than complete solutions. Next deliverables, namely: D7.3 Biometric features analysis component based on video and image information (M23), D7.4 Biometric features analysis component based on audio information (M30), D7.5 Prototype of automatic event detection system (M37), and D7.7 Prototype of complex multimodal biometric features detection system (M52), will extend thoroughly the topics discussed here. 

Entry No. 338 
Entry typejournal paper 
AuthorsP. Żwan, A. Czyżewski 
English titleVerification of the Parameterization Methods in the Context of Automatic Recognition of Sounds Related to Danger 
Polish titleWeryfikacja metod parametryzacji w kontekście automatycznego rozpoznawania dźwięków związanych z niebezpieczeństwem 
JournalJournal of Digital Forensic Practice 
Volume
Number
Pages33 - 45 
AbstractDigital signal processing of the sound is a domain with numerous applications in the telecommunications and informatics. These well developed algorithms of the analysis of the sound can be also applied in the field of security systems, where the traditional monitoring is still based mainly on video cameras. The commonly used monitoring cameras can be equipped with additional microphones and the audio content can be analyzed by a monitoring program running on a dedicated hardware. This application can automatically detect in the audio stream events like a broken window, gun-shot, explosion or scream. One of the main parts of this system is a parameterization block. In the paper two parameterization methods are proposed for this purpose. First of them is based on the frequency analysis of the examples of the sound events. Second one is based on using a standardized set of audio MPEG-7 and cepstral descriptors. The feature vectors calculated by these two methods have been used for the training of two intelligent classifiers: a Support Vector Machines classifier (SVM) and a Neural Networks Perceptron (NNP). The classifiers have been verified by using of the cross validation method. The results have been compared and conclusion derived. The application of the results in a system working in real conditions is presented and discussed at the end of the paper. The work has been done in the frame of international project: “INDECT” (Intelligent Information System Supporting Observation, Searching and Detection for Security of Citizens in Urban Environment). 
StreszczenieW artykule opisano aplikację, która automatycznie wykrywa zdarzenia dźwiękowe takie jak: rozbita szyba, wystrzał, wybuch i krzyk. Opisany system składa się z bloku parametryzacji i klasyfikatora. W artykule dokonano porównania parametrów dedykowanych dla tego zastosowania oraz standardowych deskryptorów MPEG-7. Porównano też dwa klasyfikatory: Jeden oparty o Percetron (sieci neuronowe) i drugi oparty o Maszynę wektorów wspierających. Dokonano porównań wyników i przedyskutowano możliwości praktycznego zastosowania systemu. 

Entry No. 339 
Entry typeconference paper 
AuthorsJ. Kotus, K. Łopatka, K. Kopaczewski, A. Czyżewski 
English titleAutomatic Audio-Visual Threat Detection 
Polish titleAutomatyczna akustyczno-wizyjna detekcja zagrożeń 
ConferenceMCSS 2010: IEEE International Conference on Multimedia Communications, Services and Security 
Preprint 
Number 
Volume 
Pages140 - 144 
Conference siteKraków, Polska 
Conference date6.5.2010- 7.5.2010 
AbstractThe concept, practical realization and application of a system for detection and classification of hazardous situations based on multimodal sound and vision analysis are presented. The device consists of new kind multichannel miniature sound intensity sensors, digital Pan Tilt Zoom and fixed cameras and a bundle of signal processing algorithms. The simultaneous analysis of multimodal signals can significantly improve the accuracy of real-time automatic detection and classification of hazardous situations. 
StreszczenieW referacie zostały przedstawione koncepcja, realizacja praktyczna i zastosowanie systemu do automatycznej detekcji i klasyfikacji niebezpiecznych sytuacji na podstawie multimodalnej analizy danych foniczno-wizyjnych. System składa się z nowego rodzaju czujnika akustycznego - wielokanałowej sondy natężeniowej, cyfrowej kamery PTZ i kamery stacjonarnej wraz z odpowiednimi algorytmami przetwarzania sygnałów. Jednoczesna analiza obu modalności pozwala na automatyczną detekcję i klasyfikację zagrożeń w czasie rzeczywistym. 

Entry No. 340 
Entry type 
AuthorsA. Czyżewski, B. Kostek, J. Kotus 
English title 
Polish titleUkład do identyfikacji szumów usznych 
StreszczenieW zgłoszeniu ujawniono układ do identyfikacji szumów usznych. Uzupełniono zastrzeżenia patentowe.  

Entry No. 341 
Entry type 
AuthorsA. Czyżewski, B. Kostek, J. Kotus 
English title 
Polish titleUkład do zwalczania szumów usznych 
NotesZgłoszenie wydzielone ze zgłoszenia P.393167 
StreszczenieW zgłoszeniu ujawniono układ do identyfikacji szumów usznych. Zgłoszenie wydzielone ze zgłoszenia P.393167. Uzupełniono zastrzeżenia patentowe.  

Entry No. 342 
Entry typeconference paper 
AuthorsK. Łopatka, P. Żwan, A. Czyżewski 
English titleParametrization of sounds for recognizing hazarodus events 
Polish titleParametryzacja dźwieków w celu wykrywania zdarzeń niebezpiecznych 
ConferenceVIII Krajowa Konferencja Technologie Informacyjne 
Preprint 
Number 
Volume19 
Pages225 - 230 
Conference siteGdańsk, Polska 
Conference date28.6.2010- 30.6.2010 
AbstractModern surveillance systems employ both acoustic and video signal analysis for dangerous event detection. Calculation of parameters is the first stage of a sound recognition algorithm. The key to efficient sound classification is to define parameters, which accurately reflect the differences between recognized classes. A method for parametrization of sounds for recognizing hazardous sound events is presented. A set of 28 parameters is described, which contains dedicated signal features and MPEG-7 descriptors chosen on the basis of experiments and statistical analysis.. Methods for calculation of features are presented. A classifier using the described parameters is tested, yielding high accuracy results. 
StreszczenieNowoczesne systemy monitoringu działają na zasadzie automatycznego wykrywania niebezpiecznych zdarzeń na podstawie analizy obrazu z kamer i dźwięku z mikrofonów. W niniejszej publikacji skupiono się na pierwszym etapie rozpoznawania zdarzeń dźwiękowych, jakim jest parametryzacja dźwięku. Podstawą do skutecznego działania systemu jest znalezienie parametrów, których zmienność najlepiej odzwierciedla cechy charakterystyczne dźwięku związane ze zdarzeniami niebezpiecznymi. W tym celu stworzono zbiór 28 parametrów, w którym znajdują się parametry opisane w standardzie MPEG-7 i parametry zdefiniowane specjalnie dla tego zastosowania. Przedstawiono metody obliczania parametrów z postaci czasowej lub widmowej sygnału. Następnie zbiór ten został sprawdzony poprzez badanie skuteczności klasyfikacji przykładowych próbek dźwiękowych przy pomocy klasyfikatora opartego o maszynę wektorów wspierających (SVM). 

Entry No. 343 
Entry typeconference paper 
AuthorsK. Łopatka, P. Żwan, A. Czyżewski 
English titleDangerous sound event recognition using Support Vector Machine Classifiers 
Polish titleRozpoznawanie niebezpiecznych zdarzeń dźwiękowych z wykorzystaniem klasyfikatora SVM 
Conference7th International Conference on Multimedia & Network Information Systems (MISSI’10, Wrocław) 
Preprint 
Number 
Volume80 
Pages49 - 57 
Conference siteWrocław, Polska 
Conference date23.9.2010- 24.9.2010 
NotesPublikacja w "Advances in intelligent and soft computing" (Springer) 
AbstractA method of recognizing events connected to danger based on their acoustic representation through Support Vector Machine classification is presented. The method proposed is particularly useful in an automatic surveillance system. The set of 28 parameters used in the classifier consists of dedicated parameters and MPEG-7 features. Methods for parameter calculation are presented, as well as a design of SVM model used for classification. The performance of the classifier was tested on a set of 372 example sounds, yielding high accuracy 
StreszczenieReferat przedstawia metodę rozpoznawania zdarzeń akustycznych związanych z zagrożeniem poprzez zastosowanie do klasyfikacji algorytmu maszyny wektorów wspierających (SVM). Metoda znajduje zastosowanie w systemie automatycznego nadzoru bezpieczeństwa. Do klasyfikacji wykorzystano wektor 28 parametrów. Zaprezentowano metody obliczania cech sygnału oraz parametry modelu SVM. Działanie klasyfikatora zostało sprawdzone z użyciem zbioru 372 nagrań zdarzeń dźwiękowych, osiągając wysoką skuteczność. 

Entry No. 344 
Entry typeconference paper 
AuthorsD. Ellwart, A. Czyżewski 
English titleCamera angle invariant shape recognition in surveillance systems 
Polish titleRozpoznawanie kształtów w systemach monitoringu wizyjnego niezależne od kąta obserwacji sceny 
ConferenceKES 2010, The 3rd International Symposium on Intelligent and Interactive Multimedia: Systems and Services 
Preprint 
Number 
Volume
Pages33 - 40 
Conference siteBaltimore, USA 
Conference date28.7.2010- 30.7.2010 
NotesDOI: 10.1007/978-3-642-14619-0_4; rozdział w książce G.A. Tsihrintzis et al. (Eds.): Intelligent Interactie Multimedia Systems and Services 
AbstractA method for human action recognition in surveillance systems is described. Problems within this task are discussed and a solution based on 3D object models is proposed. The idea is shown and some of its limitations are talked over. Shape description methods are introduced along with their main features. Utilized parameterization algorithm is presented. Classification problem, restricted to binary cases is discussed. Support vector machine classifier scores are shown and additional step for improving classification is introduced. Obtained results are discussed and further research directions are discussed. 
StreszczenieW pracy opisano metodę rozpoznawania zachowania osób w obrazach z systemów monitoringu. Omówiono trudności napotkane w trakcie realizacji i przedstawiono proponowane rozwiązania. Krótko opisano istniejące metody opisu kształtu. Zaprezentowano wykorzystaną metodę deskrypcji. Przedstawiono zastosowane podejście do problemu klasyfikacji z wykorzystaniem Maszyny Wektorów Wspierających. Opisano przeprowadzone eksperymenty oraz omówiono otrzymane rezultaty. Przedstawiono dalsze możliwe kierunki prac w celu zwiększenia skuteczności proponowanej metody. 

Entry No. 345 
Entry typeconference paper 
AuthorsŁ. Kosikowski, A. Czyżewski 
English titleBinocular Vision Impairments Therapy Supported By Contactless Eye-gaze Tracking System 
Polish title 
Conference12th International Conference on Computers Helping People with Special Needs 
Preprint 
Number 
Volume 
Pages373 - 376 
Conference siteWiedeń, Austria 
Conference date14.7.2010- 16.7.2010 
NotesReferat na konferencji. Publikacja w Lecture Notes i Computer Science 6180. Computers Helping People with Special Needs. 
AbstractBinocular vision impairments often result in partial or total loss of stereoscopic vision. The lack of binocular vision is a serious vision impairment that deserves more attention. Very important result of the binocular vision impairments is a binocular depth perception. This paper describes also a concept of a measurement and therapy system for the binocular vision impairments by using eye-gaze tracking system. 
StreszczenieCzęściowa lub całkowita utrata widzenia streoskopowego często jest spowodowana przez zaburzenie widzenia obuocznego. Ubytek widzenia obuocznego jest bardzo poważną dolegliwością i wymaga zwiększonej uwagi. Bardzo ważną konsekwencją prawidłowego widzenia obuocznego jest percepcja odległości. Publikacja opisuje koncepcję badania i terapii widzenia obuocznego z wykorzystaniem systemu śledzenia punktu fiksacji wzroku.  

Entry No. 346 
Entry typebook 
AuthorsA. Czyżewski, J. Kotus, M. Szczodrak, B. Kostek, P. Dalka 
English title 
Polish titleLaureaci konkursu - Cudze chwalicie, swego nie znacie - Promocja osiągnięć nauki polskiej 
EditorInnovatio Press 
Pages85 - 102 
NotesNagroda Kapituły Konkursu - Nauki Techniczne - Program Operacyjny Kapitał Ludzki, IV, 4.2 
StreszczenieCelem projektu Multimedialny System Monitorowania Hałasu zrealizowanego w Politechnice Gdańskiej było opracowanie teleinformatycznego systemu monitorowania klimatu akustycznego, uwzględniając w szczególnym stopniu obrazowanie wpływu zagrożeń hałasowych na słuch. Rozwiązania wcześniej dostępne na rynku cechują wysokie koszty oraz ograniczone możliwości rozbudowy o nowe funkcje analizy sygnału akustycznego, ograniczenia technologiczne w zakresie transmisji danych, brak rozwiązań systemowych pozwalających na dynamiczne modelowanie hałasu na dużych obszarach. Obecny system pomiarowy został zaprojektowany w taki sposób, aby można było pzy jego zastosowaniu skompensować powyżej wspomniane niedobory oraz by zapewniał on maksymalną funkcjonalność przy stosunkowo niskich kosztach powielania. 

Entry No. 347 
Entry typejournal paper 
AuthorsK. Łopatka, A. Czyżewski 
English titleText-to-speech synthesizer employing automatic prosodic modification 
Polish titleSyntetyzer mowy uwzględniający prozodię wypowiedzi 
JournalZeszyty naukowe WE PG 
Volume 
Number28 
Pages89 - 92 
AbstractThe paper presents a Text-To-Speech synthesizer of Polish language employing automatic prosodic modification. The method used for synthesizing the speech signal is concatenative synthesis using constant-length segments – diphones. The subsequent modules of the synthesizer are introduced. Employed language analysis and signal processing techniques are described. The synthesized speech yields high intelligibility and naturalness, which is proved by auditory tests. The proposed system can be used in educational and therapeutic applications or multimodal interfaces for disabled people. 
StreszczeniePrzedstawiono system syntezy mowy polskiej uwzględniający w sposób automatyczny prozodię wypowiedzi. Zastosowano syntezę konkatenacyjną z wykorzystaniem jednostek o stałej długości – difonów. Opisano poszczególne moduły wchodzące w skład syntetyzera: przetwarzanie tekstu, bazę jednostek mowy oraz algorytmy związane z tworzeniem syntetyzowanego sygnału. Przeprowadzono testy subiektywne potwierdzające wysoką zrozumiałość generowanej mowy i skuteczność modyfikacji prozodycznych. Przedstawiono możliwość zastosowania opisanego systemu w aplikacjach edukacyjnych lub terapeutycznych oraz interfejsach multimodalnych przeznaczonych dla osób niepełnosprawnych. 

Entry No. 348 
Entry typeconference paper 
AuthorsA. Ciarkowski, A. Czyżewski 
English titlePerformance of Watermarking-based DTD Algorithm Under Time-varying Echo Path Conditions 
Polish title 
ConferenceKES 2010, The 3rd International Symposium on Intelligent and Interactive Multimedia: Systems and Services 
Preprint 
Number 
Volume 
Pages69 - 79 
Conference siteBaltimore, USA 
Conference date28.7.2010- 30.7.2010 
Notesrozdział w książce G.A. Tsihrintzis et al. (Eds.): Intelligent Interactie Multimedia Systems and Services 
AbstractA novel double-talk detection (DTD) algorithm based on techniques similar to those used for audio signal watermarking was introduced by the authors. The application of the described DTD algorithm within acoustic echo cancellation system is presented. The problem of DTD robustness to time-varying conditions of acoustic echo path is discussed and explanation as to why such conditions occur in practical situations is provided. The environment and the procedure used for simulation of test conditions and evaluation of DTD algorithms are presented. Results of comparing performance of the introduced watermarking DTD with the well-established Geigel DTD algorithm are presented. 

Entry No. 349 
Entry typeconference paper 
AuthorsA. Kupryjanow, A. Czyżewski 
English title 
Polish titleMetody i algorytmy modyfikacji sygnału do celu wspomagania rozumienia mowy przez uczniów z pogorszoną rozdzielczością czasową słuchu 
ConferencePolitechnika Gdariska - uniwersytet przedsigbiorczy XXI wieku 
Preprint 
Number 
Volume 
Pages 
Conference siteGdańsk, Polska 
Conference date24.5.2010- 25.5.2010 
NotesPlakat 
StreszczenieSzacuje się, że co najmniej u połowy dzieci z rozpoznanymi trudnościami w uczeniu się, dysleksją, zespołem zaburzeń uwagi i zachowania występują zaburzenia przetwarzania słuchowego. Zaburzenia te często objawiają się poprzez problemy z percepcją szybkiej mowy. Jak pokazują badania, modyfikacja czasu trwania mowy powoduje wzrost zrozumienia mowy przez osoby z pogorszoną rozdzielczością czasową słuchu. Opracowywane w ramach prac nad rozprawą doktorską algorytmy modyfikacja sygnału mowy, dzięki niewielkiej złożoności obliczeniowej a jednocześnie wysokiej jakości przetwarzania sygnału, staną się integralną częścią urządzenia służącego do wspomagania rozumienia mowy przez uczniów cierpiących na zaburzenia przetwarzania mowy związane z pogorszoną rozdzielczością słuchu. 

Entry No. 350 
Entry typeconference paper 
AuthorsŁ. Kulasek, J. Wolski, A. Czyżewski 
English title3D Morphable Models Application for Expanding Face Database Limited to Single Frontal Face Per Person 
Polish titleZastosowanie morfowalnych modeli 3D do rozszerzenia bazy wzorców składającej się z pojedynczych ujęć frontalnych 
ConferenceImage Processing & Communications 2010 
PreprintSpringer-Verlag 
Number 
Volume
Pages 
Conference siteBydgoszcz, Polska 
Conference date20.10.2010- 22.10.2010 
Abstract1. Publication dealed with research on expanding posesed face database (limited to one frontal image of the identity) with novel samples with variables angles of acquisition. These novel samples were created in process of reconstructing 3D head model for given identity, based on available 2D sample. Both face texture and web of the face fiducial points were layed on the average 3D head model. Next, angle of acquisition was simulated and 2D sample was made again. The method proved to be successful. 2. The conerence was held by University of Technology and Life Sciences in Bydgoszcz. 3. The article was published in: "Advances in Soft Computing Series book", vol.2, by Springer - Verlag. 
Streszczenie1. Zaprezentowany materiał dotyczył badań nad rozszerzeniem dysponowanej bazy wzorców wizerunków twarzy, o dodatkowe wzorce z wariacją w ustawieniu. Dodatkowe wzorce były usyskiwane poprzez przejście z wizerunku twarzy 2D na model 3D, zasymulowanie zadanego ustawienia i powrót do dziedziny 2D (poprzez rzutowanie 3D->2D). W fazie konstrukcji modelu 3D, z wizerunku 2D była ściągana zarówno tekstura twarzy jak i siatka punktów charakterystycznych. Do rekonstrukcji wykorzystano uśredniony model głowy. Przydatność opracowanej metody została zweryfikowana pozytywnie. 2. Konferencja była zorganizowana przez Uniwersytet Technologiczno - Przyrodniczy w Bydgoszczy. 3. Prezentowany materiał został włączony do publikacji: "Advances in Soft Computing Series book", vol.2, wydawnictwo Springer - Verlag.  

Entry No. 351 
Entry typebook 
AuthorsN. T Nguyen, A. Zgrzywa, A. Czyżewski 
English titleAdvances in Multimedia and Network Information System Technologies 
Polish titlePostępy w Dziedzinie Technologii Multimedialnych i Sieciowych Systemów Informacyjnych 
EditorSpringer-Verlag Berlin Heidelberg 
Pages 
NotesISBN 978-3-642-14988-7 
AbstractPreparing this book we have asked for cooperation many European research teams. In effect the monograph is a collection of carefully selected and the most representative - in our opinion - investigations, solutions, and applications presented by different scientific groups from nine countries. Content of the book has been divided into five parts: 1. Multimedia information technology 2. Data processing in information systems 3. Information system applications 4. Web systems and network technologies 5. E-learning methodologies and platforms  
StreszczenieSłowa kluczowe: technologie multimedialne; sieciowe systemy informacyjne; przetwarzanie danych W procesie przygotowywania tej książki zaproszono do współpracy przedstawicieli licznych europejskich zespołów badawczych. W efekcie, opracowana monografia zawiera reprezentatywne wyniki badań dziewięciu zespołów badawczych. Zawartość książki dotyczy następujących zagadnień: 1. Multimedialne technologie informacyjne 2. Przetwarzanie danych w systemach informacyjnych 3. Zastosowania dotyczące systemów informacyjnych 4. Technologie sieciowe 5. Metody i platformy zdalnego nauczania  

Entry No. 352 
Entry typeconference paper 
AuthorsM. Kulesza, A. Czyżewski 
English titleA novel tonality estimation method of spectral components for audio coding applications 
Polish titleNowa metoda estymowania tonalności składowych widmowych do zastosowań w kodowaniu sygnałów fonicznych 
Conference2nd Pan-American/Iberian Meeting on Acoustics, Acoustical Soc. of America 
Preprint 
Number 
Volume 
Pages 
Conference siteCancun, Mexico 
Conference date15.11.2010- 19.11.2010 
AbstractA novel algorithm providing adequate tonality estimates for constant and modulated sinusoidal components was developed. The proposed algorithm wascombined with the MPEG psychoacoustic model 2 in order to verify whether replacingthe standard tonality estimator with the proposed one leads to a more reliableestimate of hearing threshold. It was verified whether the proposed tonalityestimation algorithm may be used as a basis for detecting the signal bandscontaining only a noiselike component that can be encoded according to theperceptual noise substitution technique. Subsequently, it was proved thatit is possible to estimate the tonality of unmodulated or frequencymodulatedsinusoidal components of audio signals through the comparison of their instantaneousfrequency variations determined employing both an estimator processing spectralamplitude samples and an estimator processing spectral phase samples. It wasalso revealed that distortions introduced during perceptual audio coding maybe effectively limited employing the proposed tonality estimation algorithm.In order to fully explore the benefits of the proposed method for coding applications,the listening tests were performed in accordance with the ITUT BS.1534 recommendation.[Research partially funded by the Polish Ministry of Science and Higher Educationwithin Grants Nos. PBZMNiSW02II2007 and No. N N517 378736.]  
StreszczenieSłowa kluczowe: kodowanie sygnałów fonicznych; estymacja widma; tonalność widmowa W wyniku prac badawczych opracowano nowy algorytm estymacji tonalności komponentów widma do zastosowania w systemach perceptualnego kodowania sygnałów fonicznych. Zaproponowana metoda opera się o analizę widma amplitudowego oraz fazowego sygnałów fonicznych. W kolejnych widmach amplitudowych dokonywana jest detekcja ich maksimów lokalnych. Na podstawie określonych kryteriów maksima lokalne wykryte w trzech kolejnych widmach wykorzystane są do utworzenia trójelementowych ciągów, stanowiących kandydatów do ścieżek tonalnych. Dla każdego z utworzonych ciągów określane są zmiany częstotliwości chwilowych z wykorzystanie dwóch różnych estymatorów. Pierwszy z estymatorów zmian częstotliwości chwilowej bazuje na analizie widma amplitudowego. Drugi z estymatorów, specjalnie opracowany do zastosowania w proponowanym algorytmie, bazuje na trzech kolejnych widmach fazowych sygnału. Dla każdego maksimum widma wchodzącego w skład trójelementowego ciągu dokonywana jest najpierw estymacja częstotliwości chwilowej z wykorzystaniem metody parabolicznej. Na podstawie wyników tej analizy określana jest zmiana częstotliwości chwilowej danego kandydata do ścieżki tonalnej. Następnie ta sama zmiana częstotliwości chwilowej określana jest z wykorzystaniem metody bazującej na analizie widma fazowego.  

Entry No. 353 
Entry typeconference paper 
AuthorsP. Suchomski, P. Odya, J. Kotus, A. Czyżewski 
English titleAn Approach to Determining Tinnitus Acoustical Characteristic 
Polish titlePróba określenia parametrów akustycznych szumów usznych 
ConferenceInternational Conference on Man-Machine Interactions 
Preprint 
Number 
Volume 
Pages221 - 228 
Conference siteGliwice, Polska 
Conference date6.10.2011- 9.10.2011 
NotesReferaty konferencyjne wydane w Advances in Intelligent and Soft Computing 
AbstractFor many treatment methods, accurate estimation of Tinnitus(ringing in ears) concerning sound type, level, and bandwidth or frequency is inevitable. The proposed way of obtaining Tinnitus parameters is described in this paper. The method employs sound synthesis, aimed at obtaining sound which is closest to perceived Tinnitus. The proposed method assumes running a designed application on a multimedia PC provided with a special graphical user interface to facilitate sound generation and identification. Emphasis is put on issues related to the implementation of the proposed diagnostic procedure. The method was verified during preliminary tests in which people suering from Tinnitus participated. The obtained results are presented and discussed in this paper.  
StreszczenieW przypadku wielu metod terapii szumów usznych dokładne określenie ich parametrów, takich jak rodzaj, poziom, a także pasmo czy częstotliwość odgrywa bardzo ważną rolę. Zaproponowana metoda pozwala na oszacowanie tych parametrów z wykorzystaniem syntezy dźwięku. Syntetyzowany dźwięk ma być jak najbardziej zbliżony do odczuwanego przez pacjenta szumu usznego. Opracowana aplikacja wymaga do pracy multimedialnego komputera PC. Najważniejszym elementem aplikacji jest specjalnie zaprojektowany interfejs użytkownika pozwalający na generowanie dźwięku w intuicyjny sposób. W pracy położono nacisk na kwestie związane z implementacją zaproponowanej procedury diagnostycznej. Opracowana aplikacja była przetestowana z udziałem osób cierpiących na szumy uszne. W pracy zaprezentowano i przedyskutowano uzyskane wyniki. 

Entry No. 354 
Entry typejournal paper 
AuthorsK. Łopatka, P. Suchomski, A. Czyżewski 
English titleAutomatic prosodic modification in a Text-To-Speech synthesizer of Polish language 
Polish titleAutomatyczna modyfikacja prozodii w syntetyzerze mowy polskiej 
JournalElektronika 
Volume52 
Number
Pages106 - 110 
AbstractA Text-To-Speech synthesizer of Polish language with automatic prosodic modification is presented. The methods for automatic determination of accent and intonation are introduced. The application of prosodic speech processing algorithms to Text-To-Speech synthesis is presented. The impact of these modifications on the naturalness of the synthesized signal is discussed. The applied method is based on the TD-PSOLA algorithm. The developed Text-To-Speech Synthesizer is used in applications employing multimodal computer interfaces. 
StreszczeniePrzedstawiono system syntezy mowy polskiej z funkcją automatycznej modyfikacji prozodii wypowiedzi. Opisane zostały metody automatycznego wyznaczania akcentu i intonacji wypowiedzi. Przedstawiono zastosowanie algorytmów przetwarzania sygnału mowy w procesie kształtowania prozodii. Omówiono wpływ zastosowanych modyfikacji na naturalność brzmienia syntezowanego sygnału. Zastosowana metoda oparta jest na algorytmie TD-PSOLA. Opracowany system syntezy mowy znajduje zastosowanie w aplikacjach wykorzystujących multimodalne interfejsy komputerowe. 

Entry No. 355 
Entry typeconference paper 
AuthorsŁ. Kosikowski, P. Dalka, P. Odya, A. Czyżewski 
English titleMultimedia Interface Using Head Movements Tracking 
Polish titleKomputerowy interfejs multimedialny wykorzystujący śledzenie ruchów głowy 
Conference International Conference on Man-Machine Interactions 
Preprint 
Number 
Volume 
Pages41 - 47 
Conference siteGliwice, Polska 
Conference date6.10.2011- 9.10.2011 
NotesReferaty konferencyjne wydane w Advances in Intelligent and Soft Computing 
AbstractThe presented solution supports innovative ways of manipulating computer multimedia content, such as: static images, videos and music clips and others that can be browsed subsequently. The system requires a standard web camera that captures images of the user face. The core of the system is formed by a head movement analyzing algorithm that finds a user face and tracks head movements in real time. Head movements are tracked with a Finite State Machine. State transitions are triggered by various spatial and temporal conditions. Whenever a state of the machine changes, an event is sent to the GUI application supposed to react accordingly. The system is immune to the presence of many faces in a video stream; only one face is tracked. The application is especially suitable to standalone, multimedia terminals where users may get acquainted with a company profile, situation layout or a store offer in a fast and convenient way. The application may also be used by disabled people. 
StreszczeniePrzedstawione rozwiązanie dotyczy innowacyjnego sposobu przeglądania zasobów multimedialnych, takich jak: statyczne obrazy, filmy, pliki muzyczne i inne. System wymaga standardowej kamery, która rejestruje obrazy twarzy użytkownika.Sercem systemu jest algorytm analizujący obraz, w którym wyszukuje twarz użytkownika i śledzi ruchy głowy w czasie rzeczywistym. Aplikacja została opracowana z myślą o terminalach multimedialnych, przy pomocy których użytkownicy mogą zapoznać się z profilem firmy, lub ofertą sklepu w sposób szybki i wygodny. Opracowane oprogramowanie może być również stosowane przez osoby niepełnosprawne. 

Entry No. 356 
Entry typeconference paper 
AuthorsA. Ciarkowski, A. Czyżewski 
English titleQuality Evaluation of Novel DTD Algorithm Based on Audio Watermarking 
Polish titleOcena jakości nowatorskiego algorytmu DTD opartego na znakowaniu sygnałów dźwiękowych 
ConferenceInternational Conference on Signal Processing and Multimedia Applications SIGMAP 2011 
Preprint 
Number 
Volume 
Pages 
Conference siteSeville, Hiszpania 
Conference date18.7.2011- 21.7.2011 
Noteshttp://sigmap.icete.org/Abstracts/2011/SIGMAP_2011_Abstracts.htm 
AbstractEcho cancellers typically employ a doubletalk detection (DTD) algorithm in order to keep the adaptive filter from diverging in the presence of near-end speech signal or other disruptive sounds in the microphone signal. A novel doubletalk detection algorithm based on techniques similar to those used for audio signal watermarking was introduced by the authors. The application of the described DTD algorithm within acoustic echo cancellation system is presented. The comparison of the proposed algorithm with very common, but simple Geigel algorithm and representing current state-of-the-art Normalized Cross-Correlation algorithms is performed. Both objective (ROC) and subjective (listening tests) performance evaluation methods are employed to obtain exhaustive evaluation results in simulated real-world conditions. The evaluation results are presented and their relevance is discussed. An issue of algorithms’ computational complexity is emphasized and conclusions are drawn. 
StreszczenieAlgorytmy eliminacji echa zwykle wykorzystują blok detekcji mowy równoczesnej (DTD) w celu zapobieżenia "rozstrojeniu" się filtra adaptacyjnego w obecności mowy pochodzącej od mówcy bliskiego lub innych zakłóceń w sygnale pochodzącym z mikrofonu. Autorzy zaproponowali nowatorski algorytm DTD oparty na technice zbliżonej do znakowania sygnałów dźwiękowych. Przedstawiono zastosowanie algorytmu w systemie eliminacji echa akustycznego. Przeprowadzono porównanie algorytmu z prostym, ale popularnym algorytmem DTD Geigela oraz współczesnym algorytmem NCC. Przeprowadzono testy obiektywne (ROC) oraz subiektywne (odsłuchowe) w celu uzyskania wyczerpujących danych porównawczych w symulowanych warunkach rzeczywistych. Przedstawiono wyniki badań i przedyskutowano ich znaczenie. Podkreślono znaczenie złożoności obliczeniowej algorytmów i przedstawiono wnioski. 

Entry No. 357 
Entry typejournal paper 
AuthorsA. Ciarkowski, A. Czyżewski 
English titleCommunication Platform for Evaluation of Transmitted Speech Quality 
Polish titlePlatforma komunikacyjna do oceny jakości transmitowanej mowy. 
JournalJournal of Telecommunications and Information Technology 
Volume
Number 
Pages95 - 101 
AbstractA voice communication system designed and implemented is described. The purpose of the presented platform was to enable a series of experiments related to the quality assessment of algorithms used in the coding and transmitting of speech. The system is equipped with tools for recording signals at each stage of processing, making it possible to subject them to subjective assessments by listening tests or, objective evaluation employing PESQ or PSQM algorithms. The functionality for the simulation of distortions typical for voice communication over the Internet was implemented, making it possible to obtain reproducible, quantifiable results. An application of the presented platform for evaluation of acoustic echo canceler algorithm based on watermarking techniques, which was developed earlier is presented as an example of an effective deployment of the described technology. 
StreszczenieOpisano system komunikacji głosowej, który został zaprojektowany i wdrożony. Celem prezentowanej platformy było umożliwienie serii eksperymentów związanych z oceną jakości algorytmów wykorzystywanych w kodowaniu i transmisji mowy. System został wyekwipowany w narzędzia umożliwiające rejestrację sygnałów na każdym etapie przetwarzania, pozwalając na poddanie ich ocenie jakości za pomocą testów subiektywnych lub obiektywnych. Zaimplementowano funkcjonalność służącą do symulacji zniekształceń typowych dla komunikacji głosowej w sieci Internet, umożliwiając uzyskanie powtarzalnych, mierzalnych wyników badań. Przedstawiono zastosowanie omawianej platformy do oceny algorytmu AEC, który został opracowany przez autorów, jako przykład efektywnego wykorzystania systemu. 

Entry No. 358 
Entry typejournal paper 
AuthorsM. Kulesza, A. Czyżewski 
English titleFrequency based criterion for distinguishing tonal and noisy spectral components. 
Polish titleKryterium częstotliwościowe do celu rozróżniania tonalnych i szumowych składowych mowy 
JournalInternational Journal of Computer Science and Security 
Volume
Number
Pages1 - 16 
AbstractA frequency-based criterion for distinguishing tonal and noisy spectral components is proposed. For considered spectral local maximum two instantaneous frequency estimates are determined and the difference between them is used in order to verify whether component is noisy or tonal. Since one of the estimators was invented specially for this application its properties are deeply examined. The proposed criterion is applied to the stationary and non-stationary sinusoids in order to examine its efficiency. 
StreszczenieSłowa kluczowe: sygnał mowy; składowe tonalne; składowe szumowe W artykule zaproponowano nowe kryterium częstotliwościowe do celu rozróżniania tonalnych i szumowych składowych mowy. Dla lokalnego maksimum w reprezentacji widmowej obliczane są dwie estymaty chwilowe, zaś różnica pomiędzy nimi jest wykorzystywna do określania, czy dana składowa ma charakter tonalny, czy szumowy. Ponieważ jeden z tych estymatorów został zaproponowany specjalnie dla potrzeb tego zatsosowania, to jego właściwości zostały przebadane szczególnie dokładnie. Zaproponowane kryterium było stosowane w odniesieniu do zarówno sygnałów harmonicznych stacjonarnych, jak i niestacjonarnych.  

Entry No. 359 
Entry typejournal paper 
AuthorsM. Kotarski, J. Smulko, A. Czyżewski, S. Melkonyan 
English titleFluctuation-enhanced scent sensing using a single gas sensor. 
Polish titleUsprawnienie detekcji zapachów z zastosowaniem pojedynczego sensora gazu.  
JournalSensors and Actuators B: Chemical 
Volume 
Number 
Pages1 - 7 
NotesElsevier B.V; SNB-12962 
AbstractScent or aroma sensing during aromatherapy can be carried out by applying only a single resistance gas sensor (TGS – Taguchi Gas Sensors). This paper considers the efficiency of detection of essential oils by DC resistance and its fluctuations observed in TGS sensors. A detailed study has been conducted for scents emitted by five popular essential oils using three sensor types (TGS 2600, TGS 2602, TGS 823). The research was focused on the practical use in aromatherapy to assure the same intensity of scents which are sprayed by a glass nebulizer. The prepared system for scent emission and control of its intensity was presented as well. 
StreszczenieSłowa kluczowe: detekcja gazów; pomiar szumów; sensory gazowe; aromaterapia Zapach może być wykrywany w trakcie prowadzenia aromaterapii przy wykorzystaniu pojedynczego sensora gazowego (TGS – Taguchi Gas Sensors). W artykule skoncentrowano się na zagadnieniu detekcji wykrywania śladowych ilości olejków aromatycznych w powietrzu na podstawie obserwowania fluktuacji zmian rezystancji sensowrów gazowych różnych typów (TGS 2600, TGS 2602, TGS 823). Badania były nakierowane na zastosowania opracowanego urządzenia w aromaterapii.  

Entry No. 360 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek 
English titleIntelligent Multimedia Solutions Supporting Special Education Needs. 
Polish titleInteligentne aplikacje multimedialne w zastosowaniach wspomagających kształcenie osób ze specjalnymi potrzebami edukacyjnymi  
Conference19th International Symposium, ISMIS 2011, Foundations of Intelligent Systems, LNAI 6804 
Preprint 
Number 
Volume 
Pages1 - 15 
Conference siteWarszawa, Polska 
Conference date28.6.2011- 30.6.2011 
NotesISBN 978-3-642-21915-3 
AbstractThe role of computers in school education is briefly discussed. Multimodal interfaces development history is shortly reviewed. Examples of applications of multimodal interfaces for learners with special educational needs are presented, including interactive electronic whiteboard based on video image analysis, application for controlling computers with facial expression and speech stretching audio interface representing audio modality. Intelligent and adaptive algorithms application to the developed multimodal interfaces is discussed. 
StreszczenieSłowa kluczowe: komputeryzacja procesów dydaktycznych; interfejsy multimodalne; wirtualna tablica szkolna; spowalnianie mowy Artykuł w pierwszej części poświęcony jest dyskusji na temat roli komputerów w dydaktyce szkolnej. Następnie opisana jest krótko historia rozwoju interfejsów multimodalnych, w szczególności do zastosowań w edukacji osób niepełnosprawnych na przykłądzie m. in. opracowanej wirtualnej tablicy szkolnej, aplikacji do sterowania komputerami za pomocą gestów wykonywanych ustami, systemu do spowalniania mowy nauczyciela. Na zakończenie omówiona jest rola algorytmów adaptacyjnych i uczących się w rozwiązaniach opracowanych interfejsów multimodalnych.  

Entry No. 361 
Entry typejournal paper 
AuthorsA. Czyżewski, B. Kostek 
English titleIntelligent video and audio applications for learning enhancement. 
Polish titleInteligentne aplikacje wideofoniczne do celu wspomagania procesu edukacyjnego 
JournalJourn. of Intelligent Information Systems 
Volume 
Number 
Pages1 - 20 
NotesSpringer; ISSN 0925-9902 
AbstractThe role of computers in school education is briefly discussed. Multimodal interfaces development history is shortly reviewed. Examples of applications of multimodal interfaces for learners with special educational needs are presented, including interactive electronic whiteboard based on video image analysis, application for controlling computers with facial expression and speech stretching audio interface representing audio modality. Intelligent and adaptive algorithms applications to the developed multimodal interfaces are discussed. 
StreszczenieSłowa kluczowe: komputeryzacja procesów dydaktycznych; interfejsy multimodalne; wirtualna tablica szkolna; spowalnianie mowy Artykuł rozpoczyna krótka dyskusja na temat roli komputerów w procesie kształcenia,. Następnie przedmiotem rozważań jest historaia rozwoju technologii interfejsów multimodalnych i przykłady ich zastosowań w edukacji osób niepełnosprawnych oparte na zastosowaniu wirtualnej tablicy interaktywnej, interfesu do sterowania komputerem na podstawie analizy gestów wykonywanych ustami oraz interfejsu fonicznego, który umożliwia rozciąganie mowy w czasie rzeczywistym. Na zakończenie artykułu podkreśloni znaczenie algorytmów inteligentnych i uczących się w tego rodzaju zastosowaniach.  

Entry No. 362 
Entry typeconference paper 
AuthorsA. Czyżewski, H. Skarżyński, B. Kostek 
English titleTelemedical hearing and vision screening system employing iOS based devices. 
Polish titleTelemedyczne przesiewowe systemy badania słuchu i wzroku na platformie iOS 
Conference6th National Conference of the Audiology and Phoniatrics Sections of the Polish Society of Oto-Rhino-Laryngologists and Head and Neck Surgeons 
Preprint 
Number
Volume
Pages139 
Conference siteWarszawa, Polska 
Conference date22.6.2011- 25.6.2011 
Notesabstracts (U-38) - Journal of Hearing Science, 2011; ISSN 2083-389X 
AbstractA design and implementation of the hearing and vision screening system dedicated for the popular iOS (iPhone/iPad/iPod Operating System) based devices is presented. The aim of the system is to promote hearing and vision screening tests internationally and to analyze collected results. The examination consists of speech in noise and tone audiometry tests, color vision and contrast differentiation tests. Whenever a test is completed the system automatically evaluates user's answers and generates results.  
StreszczenieW referacie przedstawiono projekt i impementację przesiewowych systemów badania słuchu i wzroku przeznaczonego do wykorzystywania na popularnej platformie iOS (iPhone/iPad/iPod Operating System). Celem opracowanego systemu jest promowanie komputerowego badania zmysłów komunikacji. Badanie opiera się na testowaniu rozumienia mowy w szumie, postzregania barw i różnicowania kontrastu. Za kazdym razem, gdy test zostaje wykonany system automatycznie przetwarzania wyniki badań i podaje badanemu do wiadomości diagnozę.  

Entry No. 363 
Entry typeconference paper 
AuthorsM. Kurkowski, A. Czyżewski, H. Skarżyński, K. Kochanek 
English titleReal-time speech stretching for diagnosing and supporting speech and hearing impaired patients. 
Polish titleRozciąganie sygnału mowy w czasie rzeczywistym w celu wspomagania osób z zaburzeniami mowy i słuchu. 
Conference6th National Conference of the Audiology and Phoniatrics Sections of the Polish Society of Oto-Rhino-Laryngologists and Head and Neck Surgeons 
Preprint 
Number
Volume
Pages141 
Conference siteWarszawa, Polska 
Conference date22.6.2011- 25.6.2011 
Notesabstracts (U-42) - Journal of Hearing Science, 2011; ISSN 2083-389X 
AbstractModifying speech signal by stretching or shrinking it in the time-domain finds many interesting applications to adiology and speech therapy. A study of real time-scale modification algorithms applied to diagnosis and therapy of speech and hearing impaired patients including children and youth is presented. A variety of signal processing algorithms was considered, namely: the overlap-and-add and the phase vocoder. Their effectiveness as well as real-time processing capabilities were examined. The developed algorithm including an additional speech microstructure analysis was implemented to stationary and to mobile computer platforms. The digital speech time transposer device was engineered. Based on the performed test results it was shown that time stretching can influence speech understanding positively in children with hearing impairments. 
StreszczenieModyfikacje czasowe sygnału mowy w czasie rzeczywistym znajduje interesujące zastosowania w terapii logopedycznej i audiologicznej. Referat dotyczy badania zastosowań opracowanego algorytmu modyfikowania sklali czasowej mowy w diagnozowaniu i terapii dzieic i młodzieży mających problemy ze słyszeniem. Wzięto przy tym pod uwagę zróżnicowane algorytmy cyfrowego przetwarzania mowy, w tym: algorytm overlap-and-add i wokoder fazowy. Badano efektywność tych algorytmów i możliwośći ich stosowania dla czasu rzeczywistego. OPrcaowany algorytm analizuje strukturę sygnału mowy - został o zaimplementowany na komputerowej platformie mobilnej. N atej podstawie opracowano urządzneie - cyfrowy transpozer mowy. W oparciu o przeprowadzone badania testowe stwierdzono, że spowalnianie mowy w czasie rzeczywistym może wpływać na rozumienie mowy u dzieci z zaburzeniami słuchu.  

Entry No. 364 
Entry typejournal paper 
AuthorsM. Szwarc, A. Czyżewski 
English titleNew approach to railway noise modeling employing Genetic Algorithms 
Polish title 
JournalApplied Acoustics 
Volume72 
Number
Pages611 - 622 
NotesElsevier; ISSN 0003-682X 
AbstractMain goal of this paper was to describe an innovative method of noise prediction based on Genetic Algorithms. First part of the paper addresses the problem of growing noise, mainly in the context of a unified method for measuring noise. Further, Genetic Algorithms are described with regards to their fundamental features. Further a description is provided as to how Genetic Algorithms were used in the area of noise modeling. Next chapter shows results achieved with prototype software created for the purpose of research experiments. Finally, a practical technical application of this method is presented. 
StreszczenieGłównym celem artykułui jest prezentacja innowacyjnej metodyki predykcji hałasu kolejowego opartej na algorytmie genetycznym. Pierwsza część artykułu dotyczy problematyki narastających zagrożeń hałasowych w kotekście potrzeby stworzenia uniwersalnej metody pomiaru hałasu. W dalszej części zostały w skrócie zaprezentowane algorytmy genetyczne w zastsowoaniu do modelowania hałasu. Następnie artykuł prezentuje eksperymenty z użyciem prototypowego oprogramowania do modelowania i przewidywania hałasu z użyciem zaproponowanej metody, która ma wiele zastosowań praktycznych.  

Entry No. 365 
Entry typejournal paper 
AuthorsA. Czyżewski, J. Kotus, M. Szczodrak 
English titleCreating Acoustic Maps Employing Supercomputing Cluster 
Polish titleTworzenie Map Akustycznych z Zastosowaniem Superkomputera 
JournalArchives of Acoustics 
Volume36 
Number
Pages1 - 24 
AbstractThe implemented online urban noise pollution monitoring system is presented with regard to its conceptual assumptions and technical realization. A concept of the noise source parameters dynamic assessment is introduced. The idea of noise modeling, based on noise emission characteristics and emission simulations, was developer and practically utilized in the system. Furthermore, the working system architecture and the data acquisition scheme are described. The method for increasing the speed of noise map calculation employing a supercomputer is explained. The practical implementation of noise maps generation and visualization system is presented, together with introduced improvements in the domain of continuous noise monitoring and acoustic maps creation. Some results of tests performed using the system prototype are shown. The main focus is put on assessing the efficiency of the acoustic maps created with the discussed system, in comparison to results obtained with traditional methods. 
StreszczenieW artykule przedstawiono opracowanie koncepcyjne i realizację praktyczną systemu monitorowania hałasu środowiskowego. Przedsawiono również koncepcję tworzenia dynamicznych map hałasu. Podstawowa idea polegająca na połączeniu rzeczywistych wyników pomiarów hałasu z wynikami modelowania została opracowana w ramach jednego systemu. W artykule przedstawiono również opis architektury systemu oraz modułów akwizycji danych pomiarowych. Wyjaśniono również metody zwiększania szybkości tworzenia map akustycznych z wykorzystaniem superkomputera. Przedstawiono praktyczne aspekty implementacji modułu obliczającego wartości poziomów hałasu na danym obszarze oraz modułu wizualizacji wyników w połączeniu z systemem ciągłego monitorowania hałasu. Przedstawiono wyniki badań uzyskane za pomocą prototypowego systemu. Główny nacisk położono na ocenę dokładności stworzonej mapy hałasu w oparciu o porównanie z wynikami uzyskanymi za pomocą metod tradycyjnych. 

Entry No. 366 
Entry typeconference paper 
AuthorsA. Kupryjanow, A. Czyżewski 
English titleCOMPARISON OF VARIOUS SPEECH TIME-SCALE MODIFICARTION METHODS 
Polish titlePORÓWNANIE METOD MODYFIKACJI CZASU TRWANIA SYGNAŁU MOWY 
Conference14th International Symposium on Sound Engineering and Tonmeistering 
Preprint 
Number
Volume36 
Pages488 - 489 
Conference siteWrocław, Polska 
Conference date19.5.2011- 21.5.2011 
Bibliographic No.12 
AbstractThe objective of this work is to investigate the influence of the different time-scale modification (TSM) methods on the quality of the speech stretched up using the designed non-uniform real-time speech time-scale modification algorithm (NU-RTSM). The algorithm provides a combination of the typical TSM algorithm with the vowels, consonants, stutter, transients and silence detectors. Based on the information about the content and on the estimated value of the rate of speech (ROS), the algorithm adapts to the scaling factor value, and removes the redundant signal i.e. silence, stutter and transients. TSM algorithms named: SOLA, PSOLA and WSOLA were examined in order to assess the quality of the stretched speech, the complexity of the calculation and the possibility of their usage in the NU-RTSM algorithm. Subjective tests were performed in order to compare the quality of various time-scaling meth-ods. 
StreszczenieStreszczenie. Celem pracy jest zbadanie wpływu różnych metod modyfikacji czasu trwania sygna-łu mowy (ang. TSM -Time Scale Modification), na jakość mowy spowolnionej za pomocą algorytmu nierównomiernego spowalniania sygnału mowy w czasie rzeczywistym. Opracowany algorytm nie-równomiernego spowalniania sygnału jest połączeniem typowego algorytmu TSM, z detektorami: mowy, samogłosek, zająknięć oraz transjentów (głosek wybuchowych). Na podstawie informacji do-tyczących zawartości przetwarzanego sygnału (dostarczanej przez detektory) oraz estymowanego tempa przetwarzanej wypowiedzi, algorytm dobiera współczynnik spowalniania oraz usuwa nadmia-rową informację z sygnału t.j.: ciszę i zająknięcia. W celu dokonania oceny jakości spowolnionej mowy, złożoności obliczeniowej algorytmów oraz możliwości ich wykorzystania do nierównomier-nego spowalniania mowy w czasie rzeczywistym, przebadano następujące algorytmy: SOLA (ang. Synchronous Overlap and Add), WSOLA (ang. Wave Similarity Overlap and Add) oraz PSOLA (ang. Pitch-synchronous Overlap and Add). Ocena jakości mowy spowolnionej z wykorzystaniem wymie-nionych algorytmów, została uzyskana w wyniku testów subiektywnych. 

Entry No. 367 
Entry typeconference paper 
AuthorsA. Kupryjanow, A. Czyżewski 
English titleA NON-UNIFORM REAL-TIME SPEECH TIME-SCALE STRETCHING METHOD 
Polish titleMetoda nierównomiernej modyfikacji czasu trwania sygnału mowy działająca w czasie rzeczywistym 
ConferenceSIGMAP 
Preprint 
Number 
Volume 
Pages1 - 7 
Conference siteSewilla, Hiszpania 
Conference date18.7.2011- 21.7.2011 
Bibliographic No.16 
AbstractAn algorithm for non-uniform real-time speech stretching is presented. It provides a combination of typical SOLA algorithm (Synchronous Overlap and Add ) with the vowels, consonants and silence detectors. Based on the information about the content and the estimated value of the rate of speech (ROS), the algorithm adapts the scaling factor value. The ability of real-time speech stretching and the resultant quality of voice were analysed. Subjective tests were performed in order to compare the quality of the proposed method with the output of the standard SOLA algorithm. Accuracy of the ROS estimation was assessed to prove its robustness. 
StreszczenieW referacie przedstawiono algorytm nierównomiernej modyfikacji czasu trwania sygnału mowy działający w czasie rzeczywistym. Powstał on poprzez połączenie algorytmu SOLA (Synchronous Overlap and Add ) z detektorami samogłosek, spółgłosek i ciszy. Na podstawie informacji dotyczących zawartości analizowanego sygnału oraz estymowanego tempa mowy, proponowany algorytm dopasowuje wartości współczynnika skali. W części eksperymentalnej referatu zbadano możliwość przetwarzania sygnału w czasie rzeczywistym oraz jakość spowolnionego sygnału mowy. Jakości spowolnionej mowy została oceniona poprzez porównanie wyników testów subiektywnych przeprowadzonych dla mowy modyfikowanej z wykorzystanie proponowanego algorytmu oraz algorytmu SOLA. Zbadano także skuteczność algorytmu estymacji tempa mowy co pozwoliło wykazać jego odporność. 

Entry No. 368 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, A. Kupryjanow 
English titleAUTOMATIC SOUND RESTORATION SYSTEM -CONCEPTS AND DESIGN 
Polish titleSystem automatycznej rekonstrukcji dźwięku – koncepcja i projekt 
ConferenceSIGMAP 
Preprint 
Number 
Volume 
Pages1 - 5 
Conference siteSewilla, Hiszpania 
Conference date19.7.2011- 21.7.2011 
Bibliographic No.13 
AbstractA concept of a system for automatic audio recording reconstruction is described. It is supported by the video image reconstruction algorithm, focused on the video instability analysis. Sound restoration is performed focusing on noise and wow and flutter analysis. Presented algorithms are designed to be automatic and to reduce the human effort during the restoration process. A web service designed especially for automatic restoration process is envisioned as an integration platform for these algorithms and for repository of recordings. 
StreszczenieW referacie przedstawiono koncepcję systemu automatycznej rekonstrukcji nagrań fonicznych. Proces rekonstrukcji dźwięku jest wspierany przez zastosowanie analizy obrazu filmowego ukierunkowaną na śledzenie stabilności klatek filmowych. Z sygnału dźwiękowego usuwane są następujące zakłócenia: szerokopasmowy szum, drżenie i kołysanie dźwięku. Przedstawione algorytmy rekonstrukcji zastały opracowane tak by zminimalizować udział człowieka w procesie poprawy jakości dźwięku. W celu udostępnienia opracowanych mechanizmów rekonstrukcji oraz nagrań zgromadzonych w repozytorium zaproponowano specjalny serwis internetowy zoptymalizowany pod kątem pracy z nagraniami fonicznymi. 

Entry No. 369 
Entry typeconference paper 
AuthorsM. Papaj, A. Czyżewski 
English titleFacial features extraction for color, frontal images. 
Polish titleEkstrakcja cech twarzy z kolorowych frontalnych obrazów 
Conference4th Image Pprocessing and Communications Challenges 3 
Preprint 
Number 
Volume102 
Pages23 - 31 
Conference siteBydgoszcz, Polska 
Conference date5.9.2011- 7.9.2011 
Notesseries: Advances in intelligent and Soft Computing; ISBN 978-3-642-23153-7; Springer-Verlag,2011 
AbstractThe problem of facial characteristic features extraction is discussed. Several methods of features extraction for color en--face photographs are discussed. The methods are based mainly on the colors features related to the specific regions of the human face. The usefulness of presented methods was tested on a database of en--face photographs consisting of 100 photographs. 
StreszczenieW referacie omówiony jest problem ekstrakcji cech twarzy. Przeanalizowanych zostało kilka metod ekstrakcji cech twarzy z kolorowych frontalnych obrazów twarzy, bazujących w większości na cechach kolorystycznych związanych ze specyficznymi regionami ludzkiej twarzy. Użyteczność zaprezentowanych metod została przetestowana na bazie danych zawierającej 100 frontalnych obrazów twarzy. 

Entry No. 370 
Entry typeconference paper 
AuthorsR. Kosikowski, Ł. Kosikowski, P. Odya, A. Czyżewski 
English titleSENSES - WHAT U SEE? Vision screening system dedicated for iOS based devices. Development and screening results.  
Polish titleSENSES - WHAT U SEE? System do przesiewowego badania wzroku dedykowany dla urządzeń mobilnych z systemem operacyjnym iOS. Wytwarzania i wyniki badań. 
ConferenceInternational Conference on Signal Processing and Multimedia Applications 
Preprint 
Number 
Volume 
Pages 
Conference siteSewilla, Hiszpania 
Conference date18.7.2011- 21.7.2011 
NotesPublikacja: SciTePress Digital Library, oraz CD 
AbstractThis paper describes a design and implementation of the vision screening system dedicated for iOS (iPhone/iPad/iPod Operating System) based devices. The aim of the system is to promote and popularize the vision tests, especially among children and youth. The examination consists of color vision and contrast differentiation tests. After the examination the system automatically evaluates users’ answers and generates the results. Test data are anonymously sent to the server allowing for a detailed analysis. The paper contains analysis of the results on the population of about 3800 people. Presented data show that vision problems concern about half of users. The analysis was divided into two age groups (pre-school children and older) and two types of eye disorders - vision acuity and perceptions of colors including Dalton testing. Test for the first age group has been adapted to examine people with special educational needs. 
StreszczenieW artykule opisano projekt i wdrożenie systemu do badań przesiewowych wzroku dedykowanego dla systemu operacyjnego iOS (iPhone / iPad / iPod). Celem aplikacji jest promocja i popularyzacja badań wzroku, zwłaszcza wśród dzieci i młodzieży. Egzamin składa się z widzenie kolorów i testów różnicowania kontrastu. Po dokonaniu analizy system automatycznie ocenia odpowiedzi użytkowników i generuje wyniki. Dane testowe są anonimowo wysyłane do serwera, co pozwala na szczegółową analizę zgromadzonych danych. Artykuł zawiera analizę wyników na populacji około 3800 osób. Przedstawione dane wskazują, że problemy z widzeniem dotyczą połowy użytkowników. Analiza została podzielona na dwie grupy wiekowe (dzieci w wieku przedszkolnym i starszych) oraz dwa rodzaje zaburzeń wzroku - ostrości widzenia i postrzeganie kolorów. Test dla pierwszej grupy wiekowej został dostosowany do badania osób ze specjalnymi potrzebami edukacyjnymi. 

Entry No. 371 
Entry typejournal paper 
AuthorsM. Szwarc, B. Kostek, J. Kotus, M. Szczodrak, A. Czyżewski 
English titleProblems of Railway Noise—A Case Study 
Polish titleProblemy z hałasem szynowym – studium przypadku 
JournalInternational Journal of Occupational Safety and Ergonomics 
Volume17 
Number
Pages309 - 325 
AbstractUnder Directive 2002/49/EC relating to the assessment and management of environmental noise, all European countries are obliged to model their environmental noise levels in heavily populated areas. Some countries have their own national method, to predict noise but most have not created one yet. The recommendation for countries that do not have their own model is to use an interim method. The Dutch SRM II scheme is suggested for railways. In addition to the Dutch model, this paper describes and discusses 3 other national methods. Moreover, discrepancies between the HARMONOISE and IMAGINE projects are analysed. The results of rail traffic noise measurements are compared with national methods. 
StreszczenieZgodnie z postanowieniami zawartymi w dyrektywnie 2002/49/EC związanej z oceną i zarządzaniem hałasem w środowisku wszystkie kraje należące do UE są zobligowane do opracowania planów akustycznych na obszarach gęsto zaludnionych. Niektóre kraje mają opracowane narodowe metody obliczeniowe umożliwiające modelowanie hałasu lecz większość krajów nie posiada własnych opracowań. Dla tych krajów zaleca się tymczasowe stosowanie metody holenderskiej SRM II w odniesieniu do źródeł hałasu szynowego. W artykule przedstawiono, oprócz modelu holenderskiego, jeszcze analizę porównawczą dla 3 innych modeli narodowych. Ponadto, w opracowaniu różnic pomiędzy modelami uwzględniono również metodę opracowaną w ramach projektów HARMONOISE oraz IMAGINE. Wyniki pomiarów hałasu szynowego porównano z wynikami otrzymanymi za pomocą poszczególnych modeli narodowych.  

Entry No. 372 
Entry typeconference paper 
AuthorsM. Szczodrak, K. Kopaczewski, A. Czyżewski, H. Krawczyk 
English titleRepository of benchmark data and urban monitoring system aiding algorithms 
Polish titleRepozytorium nagrań testowych i algorytmy wspomagania systemów monitoringu przestrzeni publicznej 
ConferenceVI Krajowa Konferencja Naukowa „INFOBAZY 2011 – Nauka, Projekty Europejskie, Społeczeństwo Informacyjne”  
Preprint 
Number 
Volume 
Pages104 - 110 
Conference siteGdańsk, Polska 
Conference date5.9.2011- 7.9.2011 
AbstractThe concept and implementation of benchmark video recordings repository for the purpose of evaluating of the video analysis algorithms. The aim of the completed work is gathering of audiovisual data comprising different types of crowd behavior with description which serves for verification of video analysis algorithms. The content of the recordings which consist of both typical and untypical behavior is thoroughly described. Metadata description methodology is introduced. The outcomes of experiment to assess the algorithm of untypical crowd behavior detection are discussed. 
StreszczenieW referacie przedstawiono założenia i realizację repozytorium nagrań testowych dla potrzeb oceny algorytmów analizy obrazu. Celem wykonanej pracy jest zgromadzenie materiałów audiowizualnych zawierających różne rodzaje zachowań tłumu wraz z opisem służących do weryfikacji algorytmów analizy obrazu. Omówiono szczegółowo treść nagrań wprowadzonych do repozytorium, wśród których wyróżnić można zachowania typowe jak i nietypowe. Przedstawiono sposób opisu zgromadzonych materiałów meta danymi. Zaprezentowano schemat użycia repozytorium w dedykowanej platformie programistycznej. 

Entry No. 373 
Entry typeconference paper 
AuthorsM. Szczodrak, J. Kotus, K. Kopaczewski, K. Łopatka, A. Czyżewski, H. Krawczyk 
English titleBehavior Analysis and Dynamic Crowd Management in Video Surveillance System 
Polish titleAnaliza zachowań i dynamiczne zarządzanie tłumem w systemie nadzoru wizyjnego 
Conference22nd International Workshop on Database and Expert Systems Applications (DEXA) 
Preprint 
Number 
Volume 
Pages371 - 375 
Conference siteToulouse, Francja 
Conference date29.8.2011- 2.9.2011 
Notesdoi.ieeecomputersociety.org/10.1109/DEXA.2011.16 
AbstractA concept and practical implementation of a crowd management system which acquires input data by the set of monitoring cameras is presented. Two leading threads are considered. First concerns the crowd behavior analysis. Second thread focuses on detection of a hold-ups in the doorway. The optical flow combined with soft computing methods (neural network) is employed to evaluate the type of crowd behavior, and fuzzy logic aids detection of the hold-ups. The experiments with the behavior classification algorithm were performed employing prepared repository of typical and untypical behavior recordings. The effectiveness of the analysis was assessed by comparing algorithmic processing results to a set of prepared reference data, which provides a description of behavior type occurring in each video frame. Application of parallel image processing and influence of parallelization on achieved performance is explained. Apart from the crowd management the behavior analysis may be used in automatic surveillance system deployed in a city area. 
StreszczeniePrzedstawiono koncepcję i praktyczną realizację systemu wspomagającego zarządzanie tłumem, który pobiera informacje z kamer monitoringu. W referacie wyróżniono dwa główne wątki. Pierwszy dotyczy analizy zachowań tłumu, drugi przedstawia wykrywanie sytuacji blokowania się obszarów przy przejściach. Do określania zachowań tłumu używana jest metoda przepływu optycznego wraz z inteligentami metodami obliczeniowymi (sztuczna sieć neuronowa), a wykrywanie sytuacji blokowania obszarów przy wyjściach wykorzystuje logikę rozmytą. Przeprowadzono eksperymenty z wykorzystaniem stworzonego wcześniej repozytorium nagrań zachowań typowych i nietypowych. Zbadano efektywność algorytmów analizy przez porównanie ich wyników z zestawem danych referencyjnych. Przedstawiono zastosowany sposób równoległej analizy obrazu oraz wpływ zrównoleglenia na uzyskaną wydajność przetwarzania. 

Entry No. 374 
Entry typejournal paper 
AuthorsA. Czyzewski, J. Kotus, M. Szczodrak 
English titleOnline Urban Acoustic Noise Monitoring System 
Polish titleSystem aktywnego monitoringu hałasu w algomeracji miejskiej 
JournalNoise Control Engineering Journal 
Volume 
Number 
Pages 
Notesw recenzji 
AbstractConcepts and implementation of the Online Urban Noise Monitoring System are presented. Principles of proposed solution used for dynamic acoustical maps creating are discussed. The architecture of the system and the data acquisition scheme are described. The concept of noise mapping, based on noise source model and propagation simulations, was developed and employed in the system. Dynamic estimation of noise source parameters utilized in the system is introduced. The details of implementation of noise map computation and visualization are presented. Advances introduced by the developed solution in the continuous noise monitoring and acoustic maps creation is in focus. The results of measurements and simulations performed by the system prototype are depicted. Noise measurements results gathered by system and created acoustic maps are compared with some other solutions in order to investigate accuracy. 
StreszczenieW artykule przedstawiono koncepcję i praktyczną implementację internetowego systemu monitorowania hałasu. Przedyskutowano możliwości zastosowania proponowanych rozwiązań do tworzenia dynamicznych map hałasu. Opisano architekturę systemu oraz moduły akwizycji wyników pomiarowych. Opracowana koncepcja tworzenia map hałasu opiera się na wykorzystaniu modeli wybranych źródeł hałasu oraz części propagacyjnej. W systemie wprowadzono funkcjonalność umożliwiającą dynamiczną zmianę parametrów opisujących źródło hałasu. Ponadto przedstawiono szczegóły realizacji obliczeń i wizualizacji map hałasu. W dalszej części pracy przedstawiono wyniki długookresowych pomiarów hałasu oraz mapy hałasu uzyskane za pomocą opracowanych narzędzi. Przedstawiono również analizę dokładności uzyskanych wyników na podstawie porównania wyników modelowania opracowanym narzędziem oraz komercyjna aplikacją do sporządzania map hałasu. 

Entry No. 375 
Entry typejournal paper 
AuthorsG. Szwoch, P. Dalka, A. Czyżewski 
English titleResolving conflicts in object tracking for automatic detection of events in video 
Polish titleRozwiązywanie konfliktów w śledzeniu obiektów w celu automatycznej detekcji zdarzeń w obrazie z kamer 
JournalElektronika 
Volume52 
Number
Pages52 - 55 
AbstractAn algorithm for resolving conflicts in tracking of moving objects is presented. The proposed approach utilizes predicted states calculated by Kalman filters for estimation of trackers position, then it uses color and texture descriptors in order to match moving objects with trackers. Problematic situations, such as splitting objects, are addressed. Test results are presented and discussed. The algorithm may be used in the system for automatic detection of security threats. 
StreszczenieArtykuł przedstawia algorytm rozwiązywania konfliktów w śledzeniu obiektów ruchomych. Proponowane podejście wykorzystuje predykcję stanu dokonywaną przez filtry Kalmana do estymacji pozycji obiektów oraz wartości deskryptorów koloru i tekstury do celu dopasowania trackerów do obiektów. Problematyczne sytuacje, takie jak dzielenie obiektów, są również brane pod uwagę. Przedstawiono i omówiono wyniki testów. Algorytm może być wykorzystany w systemie automatycznego wykrywania zagrożeń bezpieczeństwa. 

Entry No. 376 
Entry typebook 
AuthorsA. Czyżewski, G. Szwoch, P. Dalka, P. Szczuko, A. Ciarkowski, D. Ellwart, T. Merta, K. Łopatka, Ł. Kulasek, J. Wolski 
English titleMulti-stage video analysis framework 
Polish titleWielopoziomowy system do analizy obrazu z kamery 
EditorIntech 
Pages145 - 171 
NotesRozdział w książce Video Surveillance, Ed. Weiyao Lin, Chapter 9, ISBN 978-953-307-436-8 
AbstractThe authors designed a framework that analyses camera images on multiple levels, from basic detection of moving objects to advanced object recognition and automatic detection of important events. The proposed system has a flexible structure, with functional modules that may be selected so that the system suits the need of a particular application. These modules are based on algorithms proposed by various authors, adapted to the needs of the presented framework and enhanced by the authors in order to provide an efficient solution for automatic detection of important security threats in video monitoring systems. 
StreszczenieAutorzy: Andrzej Czyżewski, Grzegorz Szwoch, Piotr Dalka, Piotr Szczuko, Andrzej Ciarkowski, Damian Ellwart, Tomasz Merta, Kuba Łopatka, Łukasz Kulasek, Jędrzej Wolski WWW: http://www.intechopen.com/articles/show/title/multi-stage-video-analysis-framework Autorzy opisali system do wielopoziomowej analizy obrazu z kamery, od podstawowej detekcji obiektów ruchomych do zaawansowanego rozpoznawania obiektów i automatycznego wykrywania istotnych zdarzeń. Proponowany system cechuje się elastyczną strukturą, moduły funkcjonalne mogą być dobierane pod kątem danego zastosowania. Moduły są oparte na algorytmach proponowanych przez innych autorów, zaadaptowanych do potrzeb proponowanego systemu i rozwiniętych przez autorów w celu dostarczenia wydajnego rozwiązania do automatycznego wykrywania zagrożeń bezpieczeństwa w systemach monitoringu wizyjnego. 

Entry No. 377 
Entry typeconference paper 
AuthorsD. Ellwart, A. Czyżewski 
English titleViewpoint independent shape-based object classification for video surveillance 
Polish titleNiezależna od kąta obserwacji sceny klasyfikacja obiektów w oparciu o ich kształt 
Conference12th International Workshop on Image Analysis for Multimedia Interactive Services 
Preprint 
Number 
Volume 
Pages 
Conference siteDelft, Holandia 
Conference date13.4.2011- 15.4.2011 
Bibliographic No.
NotesISBN: 978-94-90818-00-5 
AbstractA method for shape based object classification is presented. Unlike object dimension based methods it does not require any system calibration techniques. A number of 3D object models are utilized as a source of training dataset for a specified camera orientation. Usage of the 3D models allows to perform the dataset creation process semiautomatically. The background subtraction method is used for the purpose of detecting moving objects and Kalman filters based method is utilized for object tracking. Detected objects are parameterized and then classified using a set of SVM classifiers. Probability of each classification attempt is calculated and averaged over object lifetime resulting in effectiveness improvement. The method classification efficiency is tested during experiments for two various camera angles and for two various feature vector lengths. 
StreszczenieW niniejszej pracy zaprezentowano metodę klasyfikacji obiektów w oparciu o ich kształt. W przeciwieństwie do metod wykorzystujących rzeczywiste rozmiary obiektów, przedstawione podejście nie wymaga przeprowadzania kalibracji. W celu przygotowania danych treningowych dla opracowanego klasyfikatora, zbudowano zestaw modeli 3D. Na potrzeby detekcji obiektów w obrazach kamer zastosowano metodę odejmowania tła. Natomiast w celu śledzenia obiektów wykorzystano filtrację Kalmana. Wykryte w obrazie obiekty poddawane są parametryzacji, a następnie przeprowadzany zostaje proces klasyfikacji, w którym posłużono się Maszyną Wektorów Wspierających (SVM). W celu poprawy skuteczności zastosowano uśredniane wyników klasyfikacji i odpowiadających im prawdopodobieństw, w czasie istnienia obiektu w obserwowanym kadrze. Przeprowadzono eksperymenty dla różnych długości wektora parametrów opisujących kształt oraz dla dwóch różnych kątów elewacji kamery. Omówiono otrzymane rezultaty. 

Entry No. 378 
Entry typeconference paper 
AuthorsD. Ellwart, P. Szczuko, A. Czyżewski 
English titleCamera sabotage detection for surveillance systems 
Polish title 
ConferenceInternational Joint Conference Security and Intelligent Information Systems 
Preprint 
Number 
Volume7053 
Pages 
Conference siteWarszawa, Polska 
Conference date13.7.2011- 14.7.2011 
Bibliographic No.
NotesDruk w Lecture Notes in Computer Science Vol. 7053 - w chwili obecnej jeszcze niedostępny (15.12.2011) 
AbstractCamera dysfunction detection algorithms and their utilization in realtime video surveillance systems are described. The purpose of using the proposed analysis is explained. Regarding image tampering three algorithms for focus loss, scene obstruction and camera displacement detection are implemented and presented. Features of each module are described and certain scenarios for best performance are depicted. Implemented solutions are evaluated as independent events and final results are discussed. A detection efficiency improvement method is proposed. 
StreszczenieW dokumencie opisano algorytmy detekcji nieprawidłowości pracy kamer i możliwości ich wykorzystania w systemach monitoringu. Przedstawiono powody konieczności stosowania takich metod. Zaprezentowano trzy podstawowe algorytmy, detekcji utraty ostrości, przesłonięcia kadru oraz zmiany pola patrzenia kamery. Opisano cechy każdego z tych modułów oraz omówiono optymalne warunki pracy poszczególnych algorytmów. Przedstawiono i skomentowano wyniki otrzymane w trakcie eksperymentach. Zaproponowano metody zwiększenia skuteczności detekcji w ramach opisanych modułów. 

Entry No. 379 
Entry typeconference paper 
AuthorsK. Łopatka, A. Czyżewski, H. Krawczyk 
English titleAutomatic recognition of events in audio data using supercomputer cluster 
Polish titleAutomatyczne rozpoznawanie zdarzeń w strumieniu fonicznym z wykorzystaniem klastra superkomputerowego 
Conference130th Convention of the AES 
Preprint8377 
Number 
Volume 
Pages 
Conference siteLondyn, Wielka Brytania 
Conference date13.5.2011- 16.5.2011 
AbstractDangerous events automatic recognition by audio analysis employing parallel processing on a supercomputer cluster is described in the paper. Sound files recorded by microphones operating in a security surveillance system are processed by a sound event detection and classification algorithm. Because of the large amount of data, parallel computation is employed to speed up the analysis. The sound file recorded by the surveillance system is divided into chunks and processed by separate threads or processes. Several strategies for such parallel computation are introduced and discussed. Results obtained in tests using a supercomputer cluster are presented. 
StreszczenieW referacie przedstawiono metodę automatycznego rozpoznawania niebezpiecznych sytuacji na podstawie analizy dźwięku z wykorzystaniem klastra superkomputerowego. Dane dźwiękowe zarejestrowane przy użyciu mikrofonów środowiskowych są przetwarzane algorytmami detekcji i klasyfikacji zdarzeń dźwiękowych. Z powodu dużej ilości danych do przetworzenia zastosowano równoległe przetwarzanie strumieni danych. Dane są dzielone na porcje i poddawane równoległej analizie na klastrze. Omówiono kilka strategii zrównoleglenia obliczeń. Strategie te zostały porównane i poddane ocenie. 

Entry No. 380 
Entry typeconference paper 
AuthorsK. Łopatka, J. Kotus, A. Czyżewski 
English titleMonitoring of public events audience employing acoustic vector sensors 
Polish titleNadzorowanie publiczności wydarzeń masowych z wykorzystaniem wektorowych czujników akustycznych 
Conference14th International Symposium on Sound Engineering and Tonmeistering 
Preprint 
Number 
Volume 
Pages 
Conference siteWrocław, Polska 
Conference date19.5.2011- 21.5.2011 
Notesmateriały zamieszczone na płycie CD, rozszerzony referat opublikowano w "Archives of Acoustics" 
AbstractA method for localization of sounds in the audience of public events is presented. Acoustic vector sensors, which provide multichannel output signals of acoustic pressure and particle velocity are employed. The methods for detection of acoustic events are introduced. The algorithm for localizing the sound event in the audience is presented. The system set up in a lecture hall, which serves as a demonstration of the proposed technology, is described. The accuracy of the proposed method is evaluated by the described measurements. The analysis of the results is followed by conclusions about the usability of the system. The concept of the multimodal audio-visual detection of events in the audience is also introduced.  
StreszczeniePrzedstawiono metodę lokalizacji źródeł dźwięku na widowni masowych wydarzeń. Zastosowano wektorowe czujniki akustyczne, dostarczające wielokanałowego sygnału ciśnienia i prędkości cząsteczek powietrza. Opisano algorytm lokalizacji źródeł dźwięku w pomieszczeniu. Jako demonstrator proponowanej technologii przedstawiono system działający w sali wykładowej. Dokładność systemu zbadano, przeprowadzając serię pomiarów. Referat podsumowuje analiza wyników i dyskusja nad przyczynami niedokładności systemu. Przedstawiono również koncepcję multimodalnej wizyjno-akustycznej detekcji zdarzeń na widowni. 

Entry No. 381 
Entry typeconference paper 
AuthorsK. Łopatka, J. Kotus, M. Szczodrak, P. Marcinkowski, A. Korzeniewski, A. Czyżewski 
English titleMultimodal Audio-Visual Recognition of Traffic Events 
Polish titleMultimodalne wizyjno-akustyczne rozpoznawanie zdarzeń w ruchu drogowym 
Conference22nd International Workshop on Database and Expert Systems Applications (DEXA) 
Preprint 
Number 
Volume 
Pages376 - 380 
Conference siteTuluza, Francja 
Conference date29.8.2011- 2.9.2011 
AbstractA demonstrator of traffic events detector based on the multimodal analysis of audio and video signals is described. The subsystem is a part of smart surveillance applications. It uses surveillance cameras and microphones as the data source. The algorithms employed to the analysis of data - sound event recognition and video analytics, are explained. Results of the multimodal analysis of recordings of dangerous and passive traffic situations are presented and discussed. 
StreszczeniePrzedstawiono demonstrator systemu wykrywania niebezpiecznych zdarzeń w ruchu drogowym oparty na jednoczesnej analizie danych wizyjnych i akustycznych. System jest częścią systemu automatycznego nadzoru bezpieczeństwa. Wykorzystuje on kamery i mikrofony jako źródła danych. Przedstawiono wykorzystane algorytmy - algorytmy rozpoznawania zdarzeń dźwiękowych oraz analizy obrazu. Zaprezentowano wyniki działania algorytmów na przykładzie zarejestrowanych symulowanych zdarzeń. 

Entry No. 382 
Entry typeconference paper 
AuthorsD. Ellwart, A. Czyżewski, P. Darminio 
English titleAutomatic Data relevancy Discrimination for a PRIVacy-sensitive video surveillance 
Polish titleAutomatyczna dyskryminacja danych prywatnych w systemach monitoringu wizyjnego 
ConferenceSummit on the new technologies for Urban Security EuroMed 
Preprint 
Number 
Volume 
Pages 
Conference siteGenua, Włochy 
Conference date20.5.2011- 21.5.2011 
NotesPlakat 
AbstractThe poster presents ADDPRIV project overview. Main goals and assumptions of the reasearch are introduced. The developed system logical design is described and the expected results are shown. 
StreszczenieNa plakacie przedstawiono opis zagadnień projektu ADDPRIV. Pokazano główne założenia i cele badawcze. Zaprezentowano logiczny schemat działania opracowywanego systemu oraz przedstawiono spodziewane rezultaty projektu. 

Entry No. 383 
Entry typejournal paper 
AuthorsM. Lech, B. Kostek, A. Czyżewski 
English titleRecognition of Dynamic and Static Hand Gestures Applied to Computer Application Controlling 
Polish titleRozpoznawanie dynamicznych i statycznych gestów rąk w zastosowaniu do sterowania aplikacjami komputerowymi 
JournalZeszyty Naukowe Wydziału ETI PG 
Volume
Number10 
Pages177 - 186 
NotesSeria: Wytwarzanie Gier Komputerowych. 
AbstractIn the paper an interface, methods and algorithms of controlling a computer by dynamic and static hand gestures have been presented. The solution consists of a PC on which engineered software is installed, a webcam and a multimedia projector. Gestures are recognized based on analysis of a video stream obtained from the webcam attached to the multimedia projector and on analysis of video stream displayed by the projector (retrieved from the computer). For the purpose of dynamic gestures recognition motion trajectory has been modeled by fuzzy rules. Static gestures are recognized using Support Vector Machines. In the paper results of efficiency examination of the interface engineered have been given. In conclusions, further plans to extend the system with algorithms enabling to work with the camera placed front-faced have been presented. 
StreszczenieW referacie przedstawiono interfejs, metody oraz algorytmy sterowania komputerem za pomocą dynamicznych i statycznych gestów rąk. Komponentami opracowanego rozwiązania są komputer klasy PC wraz z opracowanym interfejsem i oprogramowaniem, kamera internetowa oraz projektor multimedialny. Gesty rozpoznawane są w procesie analizy obrazu wizyjnego pozyskanego z kamery internetowej przymocowanej do projektora oraz analizy obrazu wyświetlanego przez projektor (pozyskanego z komputera). Do rozpoznawania gestów dynamicznych zastosowano modelowanie trajektorii ruchu rąk za pomocą reguł logiki rozmytej. Gesty statyczne rozpoznawane są za pomocą maszyn wektorów nośnych (SVM). W referacie przedstawiono wyniki badania wydajności opracowanego systemu. We wnioskach przedstawiono również plany dotyczące rozbudowy systemu o algorytmy umożliwiające pracę z kamerą umieszczoną przed użytkownikiem. 

Entry No. 384 
Entry typeconference paper 
AuthorsB. Kostek, B. Kunka, A. Czyżewski 
English titleAnalysis of Video Accompanied by Audio Employing Gaze Tracking 
Polish titleAnaliza treści wizyjnej powiązanej z dźwiękiem z wykorzystaniem techniki śledzenia wzroku 
ConferenceSeventh Symposium on Computational Aesthetics in Graphics, Visualization, and Imaging, 2011 
Preprint 
Number 
VolumeACM Press. ISBN 978- 
Pages 
Conference siteVancouver, Kanada 
Conference date5.8.2011- 7.8.2011 
NotesPlakat 
AbstractThe objectivization process of carrying out correlation tests in the audio-visual domains employing gaze-tracking system was outlined. The reliability of tested subjects was checked with the statistical analysis of test results. Comparing outcomes of the dynamic heat maps generated by the gaze tracking system with the associated movie samples, it was observed that the localization of the fixation point representing view direction is directly related to the localization of the virtual sound source in the stereo phantom basis. Experiments performed show that visual objects attract the viewers’ attention, thus sound sources perceived seem to be localized closer, centrally to the screen. It was also possible to analyze whether the subject’s attention remains stable. 
StreszczenieW referacie przedstawiono proces obiektywizacji badań w dziedzinie korelacji wzrokowo-słuchowych z wykorzystaniem systemu śledzenia punktu fiksacji wzroku. Uzyskane wyniki świadczą o możliwości prowadzenia tego typu testów w oparciu o system śledzenia punktu fiksacji wzroku. System ten pozwala na badanie uwagi osób testowanych, a także odpowiada na pytanie, w jaki sposób wyświetlane obiekty wizualne wpływają na percepcję dźwięku towarzyszącemu obrazowi. Dziedzina: percepcja, psychoakustyka 

Entry No. 385 
Entry typejournal paper 
AuthorsJ. Kotus, A. Czyżewski 
English titleAUTOMATIC SOUND SOURCE LOCALIZATION IN DISTURBING CONDITIONS USING ACOUSTIC VECTOR SENSORS 
Polish titleAUTOMATYCZNA LOKALIZACJA ŹRÓDŁA DŹWIĘKU W OBECNOŚCI ZAKŁÓCEŃ Z WYKORZYSTANIEM WEKTOROWYCH CZUJNIKÓW AKUSTYCZNYCH 
JournalElektronika  
Volume 
Number
Pages36 - 38 
AbstractA concept, practical realization and applications of a passive acoustic radar to automatic localization and tracking of sound sources in disturbing conditions were presented in the paper. The device consists of the new kind of multichannel miniature sound intensity sensors and a group of digital signal processing algorithms. The sensitivity of the realized acoustic radar was examined in free sound field. Several kinds of sound signals were used, such as: pure tone from 125 to 16000 Hz, one third octave band noise in the same frequency range and impulsive sounds. As results from experiments, in some cases even the small value of the signal to noise ratio was sufficient to localize sound source correctly. A video PTZ (Pan Tilt Zoom) camera can be pointed automatically to the spot the detected acoustical source is localized.  
StreszczenieW referacie przedstawiono pomysł i praktyczną realizację pasywnego radaru akustycznego do automatycznego lokalizowania i śledzenia źródeł dźwięku w warunkach zakłóceń. Urządzenie składa się z nowego typu wielokanałowych miniaturowych czujników natężeniowych oraz algorytmów cyfrowego przetwarzania sygnałów. Czułość radaru akustycznego została zbadana w warunkach pola swobodnego. Użyto sygnałów testowych takich jak: sygnały tonalne z zakresu od 125 do 16 kHz, szumowe (w tym samym zakresie częstotliwości) oraz o charakterze impulsowym. Uzyskane wyniki pomiarów wskazują, że nawet niewielka wartość stosunku sygnału do szumu była wystarczająca do poprawnego zlokalizowania źródła dźwięku. Informacja o kierunku dobiegania dźwięku może być zastosowana do automatycznego sterowania cyfrową kamerą typu PTZ (Pan Tilt Zoom). 

Entry No. 386 
Entry typeconference paper 
AuthorsJ. Kotus, K. Łopatka, A. Czyżewski 
English titleDetection and localization of selected acoustic events in 3D acoustic field for smart surveillance applications 
Polish titleDetekcja i lokalizacja wybranych zdarzeń akustycznych w polu akustycznym dla zastosowań w systemach monitorowania bezpieczeństwa 
ConferenceMultimedia Communications, Services and Security, Communications in Computer and Information Science 
Preprint 
Number149 
Volume 
Pages55 - 63 
Conference siteKraków, Polska 
Conference date2.6.2011- 3.6.2011 
AbstractA method for automatic determination of position of chosen sound events such as speech signals and impulse sounds in 3-dimensional space is presented. The events are localized in the presence of sound reflections employing acoustic vector sensors. Human voice and impulsive sounds are detected using adaptive detectors based on modified peak-valley difference (PVD) parameter and sound pressure level. Localization based on signals from the multichannel acoustic vector probe is performed upon the detection. The described algorithms can be useful in a surveillance systems to monitor the behavior of participants of public events. The results can be used to detect the position of sound source in real time or to calculate the spatial distribution of sounds in the environment. Moreover, spatial filtration can be performed to separate the sounds coming from the chosen direction. 
StreszczenieW artykule przedstawiono metodę automatycznego określania położenia źródła dźwięku w przestrzeni 3D w oparciu o analizę wybranych zdarzeń akustycznych takich jak mowa lub sygnały o charakterze impulsowym. Źródło dźwięku jest lokalizowane w rzeczywistych warunkach akustycznych (liczne odbicia) w oparciu o analizę zdarzenia akustycznego za pomocą wektorowego czujnika akustycznego. Głos człowieka i impulsowe dźwięki są wykrywane za pomocą adaptacyjnie przestrajanych detektorów, których działanie opiera się na analizie różnić w pikach widma oraz poziomu dźwięku. Moduł lokalizacji źródła dźwięku działa w oparciu o analizę wielokanałowego sygnału pozyskanego za pomocą czujnika wektorowego. Jedynie fragmenty z wykrytym zdarzeniem akustycznym są analizowane pod kątem określenia pozycji źródła dźwięku. Przedstawione algorytmy mogą znaleźć zastosowanie w systemach monitorowania bezpieczeństwa podczas imprez masowych. Wyniki działania opracowanych algorytmów mogą być wykorzystywane do wykrywania pozycji źródła dźwięku w czasie rzeczywistym lub do obliczania przestrzennego rozkładu energii dźwięku w środowisku. Ponadto, możliwe jest wyodrębnienie dźwięku dobiegającego z wybranego kierunku w oparciu o filtrację przestrzenną. 

Entry No. 387 
Entry typeconference paper 
AuthorsJ. Kotus, K. Łopatka, A. Czyżewski, H. Krawczyk 
English title 
Polish titleMultimedialny system wspomagania wykładowcy i prelegenta 
ConferenceVI Krajowa Konferencja Naukowa „INFOBAZY 2011 – Nauka, Projekty Europejskie, Społeczeństwo Informacyjne” 
Preprint 
Number 
Volume 
Pages80 - 86 
Conference siteGdańsk – Sopot, Polska 
Conference date5.9.2011- 7.9.2011 
AbstractA multimedia system for assisting the lecturer is presented in the paper. The demonstration system is installed in chosen lecture halls in the building of the Faculty of Electronics, Telecommunication and Informatics, Gdansk University of Technology. The system comprises of acoustic vector sensors, fixed cameras and Pan-Tilt Zoom cameras (PTZ). The multimodal audio-video system is a part of the MAYDAY EURO 2012 project infrastructure. The streams from acoustic sensors and cameras are transmitted to the supercomputer cluster. The KASKADA framework enables parallel analysis of multimedia streams in real time. The algorithms for analysis of multimedia streams are described. The algorithm for detection of acoustic events is presented. The methods for calculation of the position of the sound source are introduced. The results are used to aim the camera in the direction of the sound source. The calibration procedure is described and the results of detection and localization of sounds are discussed. The presented technology can be used to assist the lecturer by detecting such activities as taking part in the discussion or disturbing sounds. The system can also be used in smart surveillance to monitor public events. The combined analysis of audio and video stream can lead to a significant increase in the efficiency of the system. 
StreszczenieW referacie przedstawiono multimedialny system wspomagania wykładowcy i prelegenta, zainstalowany w wybranych salach audytoryjnych w nowym gmachu Wydziału Elektroniki Telekomunikacji i Informatyki Politechniki Gdańskiej. System ten tworzą: wektorowe czujniki akustyczne, kamery stacjonarne oraz kamery obrotowe z możliwością regulacji ogniskowej. Opracowywany system akustyczno wizyjny stanowi część infrastruktury technicznej budowanej w ramach realizacji projektu MAYDAY EURO 2012. Sygnały pozyskiwane z poszczególnych urządzeń są w sposób ciągły przekazywane do systemu KASKADA, umożliwiającego przetwarzanie strumieni multimedialnych na klastrze superkomputerowym. W dalszej części referatu opisano algorytmy analizy strumieni w czasie rzeczywistym. Poszczególne modalności, tj. sygnał akustyczny i sygnał wizyjny podlegają współbieżnej analizie z uwzględnieniem synchronizacji czasowej. Przedstawiony algorytm przetwarzania sygnałów akustycznych umożliwia automatyczną detekcję wybranych zdarzeń akustycznych o charakterze impulsowym lub ustalonym (trzask, mowa). Dla wykrytych zdarzeń akustycznych określana jest pozycja źródła dźwięku. W oparciu o uzyskane dane możliwe jest nakierowanie kamery na wykryte źródło dźwięku. W ostatniej części referatu przedstawiono procedurę kalibracji systemu akustyczno-wizyjnego oraz wyniki detekcji i lokalizacji wybranych źródeł dźwięku. Opracowany system może stanowić istotną pomoc dydaktyczną dla wykładowcy lub prelegenta, zwiększając interakcję pomiędzy wykładowcą a słuchaczami obecnymi na sali. Opracowana technologia może również znaleźć zastosowanie w systemach monitorowania obiektów w trakcie trwania imprez masowych. Połączenie analizy akustycznej i wizyjnej może w istotny sposób większych skuteczność wykrywania zdarzeń niebezpiecznych. 

Entry No. 388 
Entry typeconference paper 
AuthorsA. Czyżewski, J. Kotus, P. Szczuko, K. Łopatka, P. Dalka 
English titlePassive Acoustic Radar 
Polish titlePasywny Radar Akustyczny 
ConferenceBrussels Innova 60th Edition 
Preprint 
Number 
Volume 
Pages 
Conference siteBruksela, Belgia 
Conference date17.11.2011- 19.11.2011 
AbstractPassive acoustic radar is a solution utilizing sound intensity probe (AVS – Acoustic Vector Sensor) for automatic detection, classification, localization and continuous tracking of sound sources such as: screams, gunshots, explosions and breaking glass. The invention comprises: sound intensity probe, module conditioning the signal for processing, computer with signal processing application and moveable pan-tilt-zoom camera. Multichannel output signal from the sensor is used in calculation of acoustic direction of arrival and identification of sound event type. That information is used to control the camera so as it points in the direction of incoming sound. The invention can be used with automatic surveillance systems (acoustic monitoring), in monitoring during mass events, and in military applications - to identify positions of shooters and artillery. The innovation consists in utilization, instead of commonly used microphone matrices or dummy heads, of a single multi-directional miniature passive (operating without sending a beam) sensor which enables identification and tracing of sound sources with high angular accuracy. 
StreszczeniePasywny Radar Akustyczny jest urządzeniem, które umożliwia automatyczną detekcję, klasyfikację, lokalizację i śledzenie źródeł dźwięku, takich jak: krzyki, wystrzały, wybuchy, tłuczone szkło. Składa się z nowego rodzaju wielokanałowych, miniaturowych wektorowych czujników akustycznych oraz algorytmów cyfrowego przetwarzania sygnałów. Umożliwia sterowanie kamerami PTZ oraz odsłuch dźwięku z wybranego kierunku. 

Entry No. 389 
Entry typejournal paper 
AuthorsK. Łopatka, J. Kotus, A. Czyżewski 
English titleApplication of vector sensors to acoustic surveillance of a public interior space 
Polish titleZastosowanie wektorowych czujników akustycznych do nadzoru wnętrz w przestrzeni publicznej 
JournalArchives of Acoustics 
Volume36 
Number
Pages851 - 860 
AbstractA method for precise sound sources detection and localization in interiors is presented. Acoustic vector sensors, which provide multichannel output signals of acoustic pressure and particle velocity were employed. Methods for detecting acoustic events are introduced. The algorithm for localizing sound events in the audience is presented. The system set up in a lecture hall, which serves as a demonstrator of the proposed technology, is described. The accurracy of the proposed method is evaluated by the described measurement results. The analysis of the results is followed by conclusions pertaining the usability of the proposed system. The concept of the multimodal audio-visual detection of events in the audience is also introduced. 
StreszczeniePrzedstawiono metodę precyzyjnej detekcji i lokalizacji źródeł dźwięku w pomieszczeniach. Wykorzystano wektorowe czujniki akustyczne, dostarczające sygnałów ciśnienia akustycznego i prędkości cząsteczek powietrza. Zaprezentowano metodę lokalizacji źródeł dźwięku na widowni wydarzenia publicznego. Przedstawiono demonstracyjny system zainstalowany w sali wykładowej. System poddano ocenie dokładności na podstawie przeprowadzonych pomiarów. Przedstawiono analizę wyników i dyskusję nad poprawą jakości działania systemu. 

Entry No. 390 
Entry typejournal paper 
AuthorsG. Szwoch, P. Dalka, A. Ciarkowski, P. Szczuko, A. Czyzewski 
English titleVisual Object Tracking System Employing Fixed and PTZ Cameras 
Polish titleSystem śledzenia obiektów ruchomych z wykorzystaniem kamer stacjonarnych i PTZ 
JournalJournal of Intelligent Decision Technologies 
Volume
Number
Pages177 - 188 
Noteshttp://iospress.metapress.com/content/m5060n24tk125406/?p=2aa903da834b4371955e56c56b058b6b&pi=5 
AbstractThe paper presents a video monitoring system utilizing fixed and PTZ cameras for tracking of moving objects. First type of camera provides image for background modelling, being employed for foreground objects localization. Estimated objects locations are then utilised for steering of PTZ cameras when observing targeted objects with high close-ups. Objects are classified into several classes, then basic event detection is being performed. Event type, object localisation and images acquired by the cameras are presented visually in a "live map" system. In the paper details related to detection of moving objects are presented. Next, camera calibration procedure and geopositioning coordinates way of processing are discussed. Event detection is described. Finally an experiment is presented, organised in order to verify the camera tracking system accuracy. 
StreszczenieW artykule przedstawiono system monitoringu wizyjnego z wykorzystaniem kamer stacjonarnych i PTZ do celów śledzenia obiektów ruchomych. Obraz z kamery stacjonarnej jest wykorzystywany do detekcji i śledzenia obiektów ruchomych. Estymaty pozycji obiektów są używane do nakierowania kamery PTZ na obserwowany obiekt. Po klasyfikacji obiektów następuje detekcja zdarzeń. Dane o wykrytych zdarzeniach są prezentowane na mapie. W artykule opisano metody detekcji obiektów, kalibracji kamer i estymacji położenia geograficznego obiektu oraz detekcji zdarzeń. Opisano eksperyment przeprowadzony w celu weryfikacji dokładności systemu. 

Entry No. 391 
Entry typeconference paper 
AuthorsP. Marcinkowski, A. Korzeniewski, A. Czyżewski 
English titleHuman Tracking in Multi-camera Visual Surveillance System 
Polish titleŚledzenie osób w wielokamerowym systemie kamer 
Conference4th International Conference Multimedia Communications, Services and Security (MCSS) 
Preprint 
Number 
Volume149 
Pages277 - 285 
Conference siteKraków, Polska 
Conference date2.6.2011- 3.6.2011 
NotesA. Dziech, A. Czyżewski: Multimedia Communications, Services and Security. Springer 2011, ISBN 978-3-642-21511-7 
AbstractA short survey of visual human tracking technologies used in intelligent surveillance systems is presented. Face recognition algorithms combined with human tracking systems are not meant to identify human face and personality. There is no database with persons’ biometric features employed, thus in this case there is no problem with violating privacy policy. The concept of combining human tracking technology with face recognition techniques, in order to increase efficiency, has been described. The paper also includes the description of KASKADA - hardware and software supercomputer platform for development of multimodal (audio and video) algorithms, including object and person tracking video monitoring systems. Face recognition algorithm on the KASKADA platform was proposed. Method of implementation of the proposed algorithm was described. 
StreszczenieArtykuł prezentuje krótkie podsumowanie wykorzystywanych technologii z dziedziny śledzenia osób z wykorzystaniem inteligentnych systemów bezpieczeństwa. Opisane w niniejszym opracowaniu systemy rozpoznawania twarzy, w połączeniu ze śledzeniem osób, nie mają na celu rozpoznawania tożsamości osób. Nie powstaje żadna baza danych łącząca cechy biometryczne z konkretnymi osobami, co sprawia że przestrzegane jest prawo w zakresie ochrony danych osobowych. W niniejszym opracowaniu opisano koncepcję wykorzystania algorytmów rozpoznawania twarzy w celu poprawienia skuteczności rozpoznawania osób w obrazie z kamer. Dokument ten zawiera również opis platformy KASKADA - superkomputerowej platformy kontekstowej analizy strumieni danych multimedialnych do identyfikacji wyspecyfikowanych obiektów lub niebezpiecznych zdarzeń. Zaproponowano wykonanie algorytmu rozpoznawania twarzy z wykorzystaniem platformy KASKADA, oraz przedstawiono sposób implementacji właściwego algorytmu. 

Entry No. 392 
Entry typeconference paper 
AuthorsA. Czyżewski, B. Kostek, A. Kupryjanow 
English titleOnline Sound Restoration for Digital Library Applications 
Polish titleSieciowa rekonstrukcja dźwięku przeznaczona dla cyfrowych bibliotek 
ConferenceSYNAT Workshop - Post-Conference Event by The International Symposium on Methodologies for Intelligent Systems (ISMIS 2011)  
Preprint 
Number 
Volume390 
Pages227 - 242 
Conference siteWarszawa, Polska 
Conference date1.7.2011- 1.7.2011 
Bibliographic No.29 
AbstractA system for sound restoration having the following features was conceived and engineered: no special sound restoration software is needed to perform audio restoration; the process of online restoration employs automatic reduction of noise, wow and impulse distortions; no skills in digital signal processing are required from the user. The principles of the created system and its features as well as hitherto achieved results are discussed in the paper. 
StreszczenieW referacie przedstawiono system rekonstrukcji dźwięku posiadający następujące własności: nie wymaga specjalistycznego oprogramowania służącego do rekonstrukcji sygnałów fonicznych; proces sieciowej rekonstrukcji dźwięku pozwala na automatyczne usunięcie z nagrań dźwiękowych szerokopasmowego szumu, zniekształceń impulsowych oraz drżenia i kołysania dźwięku; użytkownicy systemu nie muszą posiadać wiedzy związanej z cyfrowym przetwarzaniem sygnałów. W referacie przedstawiono zasadę działania systemu jego funkcjonalność oraz dotychczas osiągnięte wyniki.  

Entry No. 393 
Entry typeconference paper 
AuthorsJ. Cichowski, A. Czyżewski 
English titleReversible Video Stream Anonymization for Video Surveillance Systems Based on Pixels Relocation and Watermarking 
Polish titleOdwracalna Anonimizacja Strumieni Wizyjnych w Systemach Monitoringu Wykorzystująca Relokację Pikseli oraz Znakowanie Wodne 
Conference13th IEEE International Conference on Computer Vision - ICCV2011 
Preprint 
Number 
Volume 
Pages1971 - 1977 
Conference siteBarcelona, Hiszpania 
Conference date6.11.2011- 13.11.2011 
NotesPlakat, WS22: The Eleventh IEEE International Workshop on Visual Surveillance. Wersja na CD, materiały konferencyjne zostaną wydrukowane później przez IEEE. 
AbstractA method of reversible video image regions of interest anonymization for applications in video surveillance systems is described. A short introduction to the anonymization procedures is presented together with the explanation of its relation to visual surveillance. A short review of state of the art of sensitive data protection in media is included. An approach to reversible Region of Interest (ROI) hiding in video is presented, utilizing a new relocation algorithm for hashing and a watermarking technique for extra data embedding. Implemented application is described, and results obtained using it are reported. Future work and possible improvements to introduced algorithms are discussed. 
StreszczenieOpisano metodę odwracalnej anonimizacji obszarów zainteresowań w obrazie wideo dla zastosowań w wizyjnych systemach nadzoru. Krótkie wprowadzenie do procedur anonimizacji zostało zaprezentowane wraz z wyjaśnieniem ich powiązania z systemami monitoringu. Umieszczono również przegląd aktualnego stanu techniki dotyczącego ochrony danych delikatnych w mediach. Zaprezentowano podejście do odwracalnego ukrywania obszarów w strumieniu wideo, wykorzystujące nowy algorytm relokacji do zamazywania treści oraz technikę cyfrowego znakowania wodnego w celu osadzania dodatkowych danych w obrazie. Opisano stworzoną aplikację oraz omówiono uzyskane dzięki niej wyniki badań. Przedyskutowano przyszły kierunek rozwoju i możliwe udoskonalenia zastosowanych algorytmów.  

Entry No. 394 
Entry type 
AuthorsA. Czyżewski, A. Kupryjanow 
English title 
Polish titleSposób i system wspomagania rozumienia mowy. 
Noteszgłoszenie patentowe 
StreszczenieSystem wspomagania charakteryzuje się tym, że w jednostce przetwarzania znajdują się połączone ze sobą moduły: detektor mowy, detektor samogłosek, moduł redukcji nadmiarowości i synchronizacji, dyskryminator tempa mowy oraz moduł transpozycji czasowej, którego wyjście stanowi źródło wyjściowego sygnału fonicznego dla odbiorcy 

Entry No. 395 
Entry type 
AuthorsA. Czyżewski, A. Kupryjanow 
English title 
Polish titleSystem wspomagania rozumienia mowy. 
Noteszgłoszenie patentowe 
StreszczenieSystem wspomagania rozumienia mowy charakteryzuje się według wynalazku tym, że jednostka przetwarzania wbudowana jest do implantu ślimakowego wszczepionego odbiorcy zwłaszcza z pogorszoną rozdzielczością czasową słuchu.  

Entry No. 396 
Entry type 
AuthorsA. Czyżewski, A. Kupryjanow 
English title 
Polish titleSposób i system wspomagania rozumienia mowy 
Notespatent nadany w 2014 r.  
AbstractIstotą wynalazku jest sposób transpozycji czasowej mowy nie naruszającej jej zrozumiałości.  

Entry No. 397 
Entry type 
AuthorsM. Lech, B. Kostek, A. Czyżewski 
English title 
Polish titleUkład do miksowania dźwięku 
NotesPrawo wyłączne, data publikacji WUP: 2016-11-30 
Streszczeniewykaz towarów Sposób miksowania dźwięku polegający na zmianie parametrów i sterowaniu parametrami sygnału zapisanego na poszczególnych ścieżkach dźwiękowych składających się na końcowy sygnał foniczny za pomocą aplikacji komputerowej udostępniającej operacje miksowania dźwięku charakteryzuje się tym, że określone operacje miksowania wybiera się i wykonuje bezkontaktowo za pomocą gestów obiektów sterujących (OS) odbieranych przez moduł akwizycji gestów (K), które po ich przetworzeniu metodami cyfrowymi w urządzeniu sterującym (U) współpracującym z komputerem (C) wykorzystuje się do generowania sygnałów elektronicznych sterujących wyborem operacji miksowania dla aplikacji komputerowej udostępniającej operacje miksowania dźwięku, przy czym użytkownik dowolnie określa i modyfikuje powiązania gestów z poszczególnymi operacjami miksowania. System miksowania dźwięku zawiera zespół głośników (G) współpracujących z komputerem (C) wyposażonym w aplikację komputerową (AM) udostępniającą operacje miksowania dźwięku i wyposażony jest w urządzenie sterujące (U) sprzężone z komputerem (C) i posiadające moduł akwizycji gestów (K) sprzężony bezkontaktowo z obiektami sterującymi (OS). 

Entry No. 398 
Entry typebook 
AuthorsA. Dziech, A. Czyżewski 
English titleMultimedia Communications, Services and Security 
Polish titleMultimedialna komunikacja, usługi i ich bezpieczeństwo 
EditorSpringer, Communications in Computer and Information Science 287 
Pages 
NotesRedakcja wydania książkowego 
AbstractProceedings of 5th International Conference, MCSS 2012 Krakow, Poland, May/June 2012 
StreszczeniePrace V Miedzynarodowej konferencji MCSS 2012 Kraków, Polska, maj-czerwiec 2012 

Entry No. 399 
Entry typejournal paper 
AuthorsA. Czyżewski, J. Kotus, M. Szczodrak 
English titleOnline Urban Acoustic Noise Monitoring System 
Polish titleSystem aktywnego monitoringu hałasu w algomeracji miejskiej 
JournalNoise Control Engineering Journal 
Volume60 
Number
Pages69 - 84 
AbstractConcepts and implementation of the Online Urban Noise Monitoring System are presented. Principles of proposed solution used for dynamic acoustical maps creating are discussed. The architecture of the system and the data acquisition scheme are described. The concept of noise mapping, based on noise source model and propagation simulations, was developed and employed in the system. Dynamic estimation of noise source parameters utilized in the system is introduced. The details of implementation of noise map computation and v