Granular Synthesis

Wstęp
Podstawy Syntezy Granularnej
Metody

Wstęp

Dźwięk został definiowany przez wielu teoretyków akustycznych na różny sposób. Helmholtz postulował, że mózg analizuje falę dźwiękową jako superpozycję fal sinusoidalnych o różnych częstotliwościach. Ta teoria jednakże kłóci się z faktem, że dźwięk zmienia się w czasie. Gabor (1947) sformułował teorię, a której dźwięk jest percepowany jako seria krótkich, dyskretnych ładunków energii. Zasugerował, że w bardzo krótkim oknie czasowym (10 - 21 mikrosekund) ucho jest zdolne do zarejestrowania pojedynczego sygnału o pewnej częstotliwości. Ta teoria została matematycznie zweryfikowana przez Bastiaans'a (1980). Faktycznie, jest to własnością dźwięku, która pozwala cyfrowym formatom audio na przedstawienie go w postaci ciągu dyskretnych próbek.

Powrót

Podstawy Syntezy Granularnej

Przed przedstawieniem dokładnej analizy syntezy granularnej należy wspomnieć, iż nie zawiera ona żadnych nowych czy rewolucyjnych rozwiązań w dziedzinie cyfrowego przetwarzania sygnałów. Rzeczywiście jedna z metod zaimplementowanych w syntezie granularnej jest bazowana na najbardziej prymitywnej manipulacji sygnałem dźwiękowym: skalowanie danej wartości (np. zmiana amplitudy). Ta metoda jest spotykana wszędzie, gdzie przetwarza się dźwięk (np. stoły mikserskie). Jednakże, to co wznosi ją nad inne, niezbyt skomplikowane metody przetwarzania dźwięku, jest niezwykle "wysoki poziom kontroli" w stosunku do prostych manipulacji sygnałem. Innymi słowy, nie chodzi o to jaki proces czy metoda jest wykorzystywana, lecz raczej jak jest zaimplementowana.

Synteza granularna nie wprowadza czy wynajduje żadnych nowych parametrów - umożliwia ona po prostu manipulację istniejących technik przetwarzania sygnałów na niezwykle dokładnym poziomie.

Zasadniczo, synteza granularna polega na tworzeniu dźwięku z pewnej liczby małych elementów, cząsteczek zwanych "granulkami dźwiękowymi" (ang. sonic grains).

Pojedyncza granulka może być rozpatrywana jako kwant energii - zdefiniowanej i następnie kontrolowanej dwoma sposobami:

a) specyfikacja czasowa (np. obwiednia w czasie)

b) specyfikacja częstotliwościowa (widmo sygnału)

Widmo cząstki dźwięku jest ściśle związane ze specyfikacją czasową.

W najprostszym przypadku specyfikacja częstotliwościowo-widmowa granulki może być rozpatrywana jako sygnał okresowy (przebieg sinusoidalny):

Do zilustrowania powyższej sytuacji w dwóch wymiarach i w bardziej konwencjonalny sposób, należy przeanalizować poniższy rysunek:

Jak widać zawartością pojedynczej granulki jest fala o częstotliwości 1kHz. Dodatkowo, mamy obwiednię amplitudową, która wpływa na kształt cząsteczki.

Kolejno, aby zobaczyć jak dwa powyższe wykresy przedstawiają zasadniczo tę samą informacje należy przeanalizować poniższy rysunek:

Jak dotąd mieliśmy do czynienia z dwiema metodami manipulacji sygnału odnośnie natury istnienia granulki (widmo i obwiednia). Jednakże, jak to było wspomniane wcześniej, żadna z tych technik nie jest nową w dziedzinie przetwarzania sygnałów. Dopiero nadzwyczajnie wysoki poziom poziom kontroli parametrów wprowadza nowość.

Mówiąc "wysoki poziom kontroli" mamy na myśli precyzyjny opis:

1) kształtu granulki,

2) czasu trwania granulki i

3) zawartości widma granulki.

Ad 1) Kształt granulki

Obwiednia "gaussowska":

Kombinacja obwiedni gaussowskiej z oknem prostokątnym:

Jest oczywiste, że kształt obwiedni powoduje różne efekty na dźwięku granulowanym. Prostokątne okno, na przykład może być przyczyną nagłego, ostrego początku i końca granulki. Co można uslyszeć w następującym pliku: "x1". Te ostre zniekształcenia mogą zostać bardzo łatwo wygładzone poprzez zastosowanie "gaussowskiego" typu granulki: "x2".

Ad 2) Czas trwania granulki

Następnym parametrem, który należy dokładnie omówić jest czas trwania cząsteczki dźwięku. Aby graficznie zaprezentować ten parametr należy przyjrzeć się następującemu rysunkowi:

Parametry te mają wpływ na percepcję syntetyzowanego dźwięku. Ludzkie ucho nie potrafi jednak zidentyfikować każdego z nich z osobna. Jednakże mają one znaczący wpływ na dźwięk końcowy.

Ad 3) Widmo granulki

Najprostszą formą zawartości widma granulki jest fala sinusoidalna.
Jednakże, może być użyta, zamiast sinusa, fala prostokątna, czy każdy inny przebieg okresowy. Ponadto jest również możliwe zastosowanie DOWOLNEGO sygnału jako zawartości widma pojedynczej granulki. Zostało to przedstawione na poniższym rysunku:

Kolejnym ważnym aspektem syntezy granularnej jest gęstość granulek. Granulki nie muszą być w stałej odległości pomiędzy sobą, mogą na siebie zachodzić. Aby to zobrazować należy przyjrzeć się poniższemu rysunkowi:

*)

Zakładjąc, że zawartością "specyfikacji częstotliwościowej" jest fala sinusoidalna, sygnał audio będzie miał postać:

**)

Sygnał audio:

Aby ocenić wpływ zmiany gęstości dźwięku granulowanego, należy przesłuchać następujący przykład dźwiękowy: "xc1". Dżwięk zaczyna się od granulek porozsuwanych między sobą, a kończy z granulkami zachodzącymi na siebie w takim stopniu, iż słuchowo nie da się odróżnić go od oryginału: "xc2". Można z tego wyciągnąc następujący wniosek. Im więcej pojedynczych granulek zachodzi na siebie, tym dźwięk wynikowy jest zbliżony do oryginału.

Powrót

Metody

Screens

One of the first composers to develop a method for composition with grains was Iannis Xenakis. His method is based on the organization of the grains by means of screen sequences, which specify the frequency and amplitude parameters of the grains (FG) at discrete points in time (Dt) with density (DD). Every possible sound may therefore be cut up into a precise quantity of elements DF DG Dt DD in four dimensions. The scale of density of grains is logarithmic with its base between 2 and 3, and does not exist on the screens. When viewing screens as a two dimensional representation, it is important not to lose sight of the fact that the cloud of grains of sound exist in the thickness of time Dt and that the grains of sound are only artificially flattened on the plane (FG). Xenakis placed grains on the individual screens using a variety of sophisticated Markovian Stochastic methods which he changed with each composition. The first compositions to use this method were Analogique A, for string orchestra, and Analogique B, for sinusoidal sounds, both composed in 1958-59. More recently, a variation on Xenakis' screen abstraction has been implemented into the UPIC workstation discussed below.

Pitch-Synchronous Granular Synthesis

Pitch-synchronous granular synthesis (PSGS) is an infrequently performed analysis-synthesis technique designed for the generation of pitched sounds with one or more formant regions in their spectra. It makes use of a complex system of parallel minimum-phase finite impulse response generators to resynthesize grains based on spectrum analysis.

Quasi-Synchronous Granular Synthesis

Quasi-synchronous granular synthesis (QSGS) creates sophisticated sounds by generating one or more "streams" of grains. When a single stream of grains is synthesized using QSGS, the interval between the grains is essentially equal. The overall envelope of the stream forms a periodic function. Thus, the generated signal can be analyzed as a case of amplitude modulation (AM). This adds a series of sidebands to the final spectrum. By combining several QSGS streams in parallel it becomes possible to model the human voice. Barry Truax discovered that the use of QSGS streams at irregular intervals has a thickening effect on the sound texture. This is the result of a smearing of the formant structures that occurs when the onset time of each grain is indeterminate.

Asynchronous Granular Synthesis

Asynchronous granular synthesis (AGS) was an early digital implementation of granular representations of sound. In 1978, Curtis Roads used the MUSIC 5 music programming language to develop a high-level organization of grains based on the concept of tendency masks ("Clouds") in the time-frequency plane. The sophisticated software permitted greater accuracy and control of grains. When performing AGS, the granular structure of each "Cloud" is determined probabilistically in terms of the following parameters:

1. Start time and duration of the cloud
2. Grain duration (Variable for the duration of the cloud)
3. Density of grains per second (Also variable)
4. Frequency band of the cloud (Usually high and low limits)
5. Amplitude envelope of the cloud
6. Waveforms within the grains
7. Spatial dispersion of the cloud

Obviously, AGS abandons the use of specific algorithms and streams to determine grain placement with regard to pitch, amplitude, density and duration. The dynamic nature of parameter specification in AGS results in extremely organic and complex timbres.

Powrót