Your order

Close basket

Subtotals

września 21, 2016

Zapytaj eksperta: układy DSP i podstawy próbkowania dźwięku

Opinie na temat Digital Signal Processing – czyli cyfrowego przetwarzania dźwięku – już od wielu lat są skrajne, a niektóre z nich pokazują wręcz zdumiewające braki w wiedzy oraz nieuzasadnione uprzedzenia. Wygląda na to, że pora to wszystko wyjaśnić w kolejnym odcinku „Zapytaj eksperta”.
Żeby bezpiecznie wpłynąć na głębokie wody cyfrowego dźwięku, potrzebny będzie doświadczony sternik. Najlepszym człowiekiem w tej roli będzie dyrektor działu technicznego Dynaudio, Jan Abildgaard Pedersen. Nawiguje on pomiędzy zagadnieniami akustyki i cyfrowego przetwarzania sygnału już od wielu lat na tyle sprawnie, że uważamy go za jednego z czołowych ekspertów w branży. Jako że jesteśmy w dobrych rękach – pora wyruszyć w rejs!

W tym odcinku:

W kolejnym odcinku „Spytaj eksperta” prowadzimy śledztwo w sprawie cyfrowego przetwarzania dźwięku, biorąc pod uwagę szczególnie poniższe kwestie:
• Balans pomiędzy kanałami
• Kompensacja błędów w torze sygnału
• Zjawiska czasowe w dziedzinie częstotliwości

Zaraz po rozpoczęciu wywiadu Jan wyciągnął tablicę i przeprowadził prawdziwy wykład na temat podstaw cyfrowego przetwarzania sygnału, wyjaśniając w jaki sposób dokonujemy tego bez strat informacji. W poniższym video Jan odpowiada na pytania widzów i wprowadza nas w tajniki DSP.

Odwiedź nasz kanał YouTube: Zapytaj eksperta

Pytania i odpowiedzi:

Regulacja głośności kanałów
Erik Miner: Czy możliwe jest zastosowanie regulacji balansu pomiędzy kanałami Xeo? A jeśli tak, to dlaczego nie zastosowaliście takiego rozwiązania?

Błędy i niedokładności sygnału
Ernst van Kleij: Jak – i czy w ogóle – układy DSP kompensują błędy i niedokładności pojawiające się w torze sygnałowym?

Zjawiska czasowe w dziedzinie częstotliwości
Ernst van Kleij: Rozwiązywanie problemu niezgodności czasowych w dziedzinie częstotliwości wydaje się być niemożliwe. Jak kompensujecie te wszystkie zmienne za pomocą operacji matematycznych?

DFT (dyskretna transformata Fouriera), transformata Z oraz splot – przeanalizujmy podstawy cyfrowego przetwarzania dźwięku.
Wnikliwe pytania Sebastiana Roya doprowadziły do wyjaśnienia, na czym polega cyfrowe próbkowanie, a może nawet następnej wizyty Jana Abildgaarda Pedersena?

 

Dziękujemy!
Chcemy podziękować tym z Was, którzy zadali pytania. Wygląda na to, że będziemy musieli zanurzyć się głębiej, a Jan z przyjemnością powróci do nas i podzieli się jeszcze większą wiedzą na temat możliwości, jakie daje DSP. Będziemy trzymać rękę na pulsie i monitorować pytania do następnych odcinków „Zapytaj eksperta”.

Odwiedź nasz kanał YouTube: Zapytaj eksperta

Jeśli macie jakieś inne pytania, podzielcie się z nami oraz resztą społeczności Dynaudio na naszym profilu facebookowym lub bezpośrednio w dziale komentarzy naszego kanału na YouTube.

Pozdrawiamy!
Jan i Christopher

Ask the Expert with Jan Abildgaard Pedersen who talks about digital signal processing

Zapis rozmowy:

Christopher Kjærulff: Witamy w naszym cyklu „Spytaj eksperta”. Jestem Christopher, a w dzisiejszym odcinku zajmiemy się cyfrowym przetwarzaniem sygnału. Jest mi bardzo miło przedstawić Wam Jana, który znalazł dziś czas, żeby powiedzieć nam o kilku ciekawych zagadnieniach. Czy możesz opowiedzieć nam, czym zajmujesz się w Dynaudio?

Jan A. Pedersen: Witam i dziękuję za zaproszenie.

Christopher: Proszę bardzo.

Jan: Jestem dyrektorem działu technicznego Dynaudio. Oznacza to, że jestem odpowiedzialny za wszystkie badania i testy, które przeprowadzamy i wynikające z nich rozwiązania techniczne. Wszystko, co jest związane z zagadnieniami stosowanymi w naszych konstrukcjach – także technologiach kupowanych od innych firm lub modyfikowanych samodzielnie przez naszych specjalistów w ramach różnych projektów.

Christopher: Jak wspominałem wcześniej – bardzo, ale to bardzo cieszy mnie to, że jesteś tu dziś z nami. Tak więc przejdźmy do pierwszego pytania.

Erik Miner pyta, dlaczego w seri Xeo nie zastosowaliśmy regulacji balansu pomiędzy kanałami.

Jan: Hm, z technicznego punktu widzenia jest to do zrobienia. Jednakże podczas projektowania Xeo założyliśmy, że użytkownik zazwyczaj dysponuje jakimś sprzętem, aplikacją lub oprogramowaniem z regulacją balansu – np. w telefonie – tak więc same głośniki nie będą potrzebować tej funkcji. Zastanawiam się też, dlaczego padło pytanie akurat o balans. Przecież używa się go bardzo rzadko – np. gdy słuchacz nie może znaleźć się w najlepszym miejscu, czyli w równej odległości od obydwu głośników – ten obszar to tzw. „sweet spot”. A jeśli słuchacz przesuwa się na bok, przybliża się do jednego z kanałów i zaczyna słyszeć ten kanał głośniej, a przede wszystkim – wcześniej. Mamy więc do czynienia z sytuacją, w której dźwięk z tego kanału dobiega do niego szybciej... Tzn. dotarcie do uszu słuchacza zajmuje fali dźwiękowej krótszy czas.

Christopher: OK…

Jan: Mamy więc do czynienia z różnicą w poziomie głośności oraz w czasie. A w przypadku tradycyjnego regulatora balansu możemy poprawić tylko jeden z tych parametrów: głośność. Jako że ludzki mózg analizuje obydwa te czynniki dla każdego pasma słyszalnych częstotliwości, „obraz dźwiękowy” poprawiony tylko w funkcji głośności będzie zakłócony. Mogę stwierdzić, że gdybyśmy mieli zastosować balans w serii Xeo (lub innych głośnikach), zrobilibyśmy to w pełnym zakresie – czyli w postaci zaawansowanej regulacji parametru głośności oraz czasu.

Christopher: Czyli po prostu tak jak trzeba...

Jan: Dokładnie.

Christopher: Świetnie. Ernst von Kleij pyta, czy możliwa jest poprawa wad i niedokładności sygnału cyfrowego.

Jan: Czy chodzi tutaj o zjawiska mogące zachodzić w konwerterze cyfrowo-analogowym?

Christopher: Tak.

Jan: Jeśli skoncentrujemy się na  przetworniku (DAC), wiele z jego błędów można przewidzieć – to ostatnie to słowo-klucz. Wszystko, co w torze sygnałowym jest w pełni przewidywalne (czyli można powiedzieć: stabilne), można naprawić. Nawet błędy nieliniowości. Wystarczy, że będą powtarzalne, a wtedy możemy stworzyć ich model – dzięki zastosowaniu techniki MQA (Master Quality Audio). Jest to system, w którym jako punkt referencyjny służą źródłowe nagrania wysokiej rozdzielczości zakodowane w postaci standardowych plików. Służy on też do kalibracji przetworników cyfrowo-analogowych, a więc i do kompensacji niektórych niedokładności konwersji. A zatem – tak, jest to możliwe. Wykorzystujemy to w bardzo dużym stopniu.

Christopher: Hm, mój umysł automatycznie zadaje pytanie: „jak to możliwe”? Czy możesz uchylić nam rąbka tajemnicy na temat stosowanych tutaj technik?

Jan: Tak jak wspomniałem – najważniejszą rzeczą jest zbadanie, czy sytuacja jest powtarzalna, a błędy przewidywalne. Jeśli okaże się że tak – a badania tego typu przeprowadza się pobierając bardzo dużo próbek z różnych głośników, przeprowadzając za każdym razem wiele pomiarów, żeby sprawdzić czy rezultaty są te same… Tak więc jeśli przez cały czas sytuacja się powtarza, trzeba stworzyć model matematyczny tego, co się dzieje. Jeśli na przykład błędy pojawiają się w dziedzinie częstotliwości, wystarczy zaprogramować filtr będący ich odwrotnością.

Ale nawet błędy nieliniowe można wyeliminować wtedy, gdy dysponujemy modelem spełniającym założenia fizyczne, w ramach których się poruszamy. Wszystko jest częścią układu, w którym dokonujemy operacji.

Christopher: A więc chodzi o zidentyfikowanie powtarzalnych błędów i ich poprawę?

Jan: Dokładnie tak. Albo na przykład nieliniowości głośników, albo podobnych zagadnień. Można je bez problemu wyeliminować za pomocą układów DSP.

Christopher: A więc można dokonać bardzo wielu rzeczy?

Jan: O, tak. Jesteśmy dopiero na początkowym etapie tego procesu.

Christopher: To bardzo ciekawe!

Ernst ma następne pytanie do Jana, na temat funkcji czasu. Pyta, czy można (albo nie) rozwiązać matematycznie problemy czasowe, które wpływają na pasmo częstotliwości.

Jan: Można. Przy okazji, to doskonałe pytanie! Przede wszystkim musimy uświadomić sobie, że funkcje czasu i częstotliwości to… właściwie jedno i to samo. To nic innego, jak podejście do tego samego zagadnienia z dwóch różnych punktów. W matematyczny sposób określamy to jako pełny dualizm tych funkcji. Oznacza to, że każde zjawisko w jednej z nich ma swój odpowiednik w drugiej. Dla przykładu, można zastosować dualny czasowy filtr dolnoprzepustowy w postaci funkcji splotu odpowiedzi impulsowej, albo zrobić to samo w funkcji częstotliwości, gdzie splot zostaje zastąpiony mnożeniem. Czasami prościej i praktyczniej jest dokonywać wszystkich operacji w jednej z tych funkcji zamiast w drugiej. Ale jeśli zależy nam szczególnie na którejś z nich, można wykonać wszystkie działania tylko i wyłącznie w niej pamiętając o tym, że i tak są one powiązane z drugą. Zazwyczaj wszystko zależy to od tego, która funkcja okaże się praktyczniejsza i efektywniejsza. Jeśli np. musimy przeanalizować bardzo długi impuls, byłoby bardzo nieefektywnie dokonywać tego w funkcji czasu. Jeśli zamiast tego przeanalizujemy go w funkcji częstotliwości – im dłuższy impuls, tym dokładniejsze będą dane.

Christopher: A więc...

Jan: A więc wszystkie operacje, jakich dokonamy w jednej z funkcji, mają odpowiedniki w drugiej. Niektóre z tych działań mogą być jednak bardziej skomplikowane, a więc mniej efektywne. Tak to wygląda w praktyce: każde działanie można wykonać w obydwu funkcjach.

Christopher: Więc tak naprawdę chodzi tu wybór pomiędzy purystyczne trzymanie się jednej z funkcji, albo praktyczne uproszczenie zagadnienia.

Jan: Albo raczej o to, w jaki sposób przebiega tor sygnału. Jeśli większość operacji jest przeprowadzana w dziedzinie częstotliwości, korzystniej będzie pozostać właśnie przy niej. Albo odwrotnie – gdy inne elementy wykonują operacje w dziedzinie czasu, prościej będzie pozostać tam.

Christopher: Świetnie. Jak widzicie, w międzyczasie przesunęliśmy stoły i rozstawiliśmy tablicę. A to dlatego, że Jan narysuje nam kilka ciekawych rzeczy –nawiązując do pytania Sebastiana Roya.

Tak w ogóle mamy sporo pytań dotyczących dyskretnej transformaty Fouriera (DFT), a dokładniej: uszeregowania danych set transform i splotu. Właśnie dlatego Jan musi nam to wytłumaczyć wizualnie.

Jan: Sądzę, że przed zagłębieniem się w odpowiedzi na te pytania musimy przypomnieć sobie podstawy cyfrowego przetwarzania dźwięku (DSP) i dowiedzieć się, jak dokonujemy tego bezstratnie.

Zazwyczaj wszystko zaczyna się od przebiegu analogowego, który jest konwertowany na cyfrowy za pomocą układów DSP, a następnie zazwyczaj powracamy do analogu – czyli do wzmacniacza mocy i głośników. Możemy rozpatrywać przebiegi w funkcji czasu i częstotliwości. Weźmy na przykład taki przebieg czasowy – celowo nie narysowałem prostej sinusoidy, gdyż rzeczywistość jest dużo bardziej skomplikowana.

Jeśli przeanalizujemy ten sygnał czasowy w funkcji częstotliwości, wygląda on tak. Na środku zazwyczaj mamy 0 Hz, a następnie różne poziomy. Coś takiego, symetrycznie – przepraszam za brak zdolności plastycznych... Przebieg musi być całkowicie symetryczny, gdyż tylko symetria w tym miejscu oznacza prawidłowe odwzorowanie rzeczywistego sygnału. Nie mamy do czynienia z liczbami zespolonymi, a więc nie ma składowej urojonej. Dlatego wykres jest symetryczny. Cyfrowa analiza przebiegu polega na próbkowaniu (samplowaniu) jego fragmentów – na pewno słyszałeś o tym wcześniej. Tak więc co pewien czas...

Christopher: Dokonujemy pomiaru przebiegu…

Jan: Tak – określamy, jak wygląda przebieg w określonych punktach czasowych. Zazwyczaj dokonujemy tego w standardowy sposób: np. dla 44.1 kHz, co oznacza, że sygnał jest pobierany 44100 razy na sekundę. To częstotliwość próbkowania, którą znamy ze starych, dobrych płyt kompaktowych. W nowszych systemach mamy 96, 192 kHz, a nawet 384 kHz. W dzisiejszych czasach możemy więc próbkować sygnał częściej niż 100 000 razy na sekundę.

Christopher: Czyli bardzo gęsto.

Jan: Zgadza się. W przypadku przebiegu cyfrowego, przyjmuje on postać punktów. Każdy z nich oznacza poziom sygnału w danym momencie. I następny poziom w innym momencie. I dalej – następne. Tak mniej więcej wygląda sygnał cyfrowy.

A co z częstotliwością? Będziemy potrzebowali większej skali. Dlaczego? Bo wszystko wygląda tak jak wcześniej, z tym że ulega duplikacji.

Christopher: Duplikacji?

Jan: Tak. Jeśli mamy częstotliwość próbkowania – określającą, ile razy na sekundę dokonaliśmy pomiaru przebiegu – ten sam wykres powtórzy się dokładnie tutaj. Może jest to trochę niedokładne, ale począwszy od częstotliwości próbkowania, aż do nieskończoności – będziemy mieli do czynienia z duplikatami oryginalnego przebiegu. Po obu stronach zera.

Christopher: Sygnał się skopiuje…

Jan: Tak. Widzimy tu więc fundamentalny problem techniki cyfrowej: jeśli pasmo częstotliwości przebiegu będzie zbyt szerokie, te dwie części nałożą się na siebie. W tym szczególnym przypadku nie stanowi to problemu. Ale jest takie prawo dotyczące częstotliwości próbkowania, znane jako twierdzenie Shannona.

Wynika z niego, że jeśli mamy określone pasmo częstotliwości przebiegu, musimy zastosować próbkowanie z częstotliwością do najmniej dwukrotnie wyższą niż maksymalna częstotliwość zawarta w tym przebiegu. Jeśli chodzi o sygnały akustyczne, ucho ludzkie słyszy do 20 kHz – tak więc zgodnie z tym twierdzeniem częstotliwość próbkowania powinna wynosić co najmniej 40 kHz. Właśnie stąd wzięło się próbkowanie płyty CD, wynoszące 44.1 kHz.

Christopher: Czyli dzięki temu możemy prawidłowo zapisać wszystkie szczegóły przebiegu?

Jan: Przejdźmy dalej. Zazwyczaj stosujemy filtr dolnoprzepustowy, służący do wyeliminowania z przebiegu składowych powyżej częstotliwości Nyquista, wg której określamy częstotliwość próbkowania – obszar ten jest także nazywany zakresem Nyquista. Zakres próbkowania musi być więc co najmniej dwukrotnie wyższy od częstotliwości Nyquista. Stosując filtr dolnoprzepustowy powodujemy, że przebieg nie przekracza częstotliwości Nyquista.

Jeśli przedział częstotliwości byłby za szeroki, nastąpiłoby... Spróbuję pokazać to na przykładzie... Tutaj wykres szedłby dalej, i tak samo z tej strony, więc w tym miejscu wartości zsumowałyby się, osiągając dużo wyższy poziom – uzyskalibyśmy więc zupełnie co innego. Tak wygląda aliasing – gdy przebieg wygląda jak coś zupełnie innego. Czyli ma swój alias, fałszywą tożsamość.

Christopher: Zgaduję, że brzmiałoby to tragicznie...

Jan: Zgadza się, to byłoby zupełnie nie do przyjęcia. Właśnie dlatego stosujemy filtr dolnoprzepustowy – żeby jak najskuteczniej wyeliminować zjawisko aliasingu. Pamiętajmy też, że żaden filtr nie zapewni nieskończenie mocnego tłumienia. Ale jeśli działa on wystarczająco skutecznie i nie usłyszymy tego zjawiska – będzie dobrze. A teraz pójdźmy dalej. Postaram się wyjaśnić, dlaczego cyfrowy łańcuch DSP jest nierozerwalny i nie tracimy po drodze żadnych danych, jeśli ustalimy prostą zasadę: próbkowania z dwukrotnie wyższą częstotliwością. Mamy więc próbki które nie są wymyślone, tylko dokładnie odzwierciedlają przebieg. Są to cyfry: 0 lub 1.

A tutaj wracamy do analogu. Co się wtedy stanie? Na początek zaznaczę na wykresie cyfrowe wartości w wycinkach czasu. Coś takiego. Jeśli przestrzegamy zasady podwojenia częstotliwości próbkowania, nie ma aliasingu, a następnie założymy drugi filtr dolnoprzepustowy tutaj – może narysuję następny wykres – powyżej mamy do czynienia ze zbiorem przebiegów częstotliwościowych, tak więc tutaj będzie filtr dolnoprzepustowy… Bardzo trudno powtórzyć ten sam wykres, prawda?

Christopher: Oj, tak.

Jan: Ale widać, że przynajmniej się staram...

Christopher: A ja dzięki temu doskonale rozumiem Twój wykład.

Jan: A zatem przy przejściu z cyfry do analogu stosujemy kolejny filtr dolnoprzepustowy, dzięki któremu odzyskujemy tylko oryginalny przebieg, bez duplikacji powstałych w wyniku przetwarzania cyfrowego, gdzie wszystko się zapętla i generuje raz za razem.

Tak więc jeśli zastosujemy dokładny filtr dolnoprzepustowy w tym miejscu, pomiędzy tymi punktami czasowymi otrzymamy – co jest dla niektórych chyba najbardziej zaskakujące – przebieg identyczny z oryginalnym. Spróbuję jeszcze raz… Coś takiego. Otrzymamy wszystkie szczegóły pomiędzy tymi punktami. Następnie przebieg stromo opada, później wykazuje niewielkie zaburzenie w tym miejscu – w górę i w dół – właśnie tak. Dzieje się tak, jeśli przestrzegamy twierdzenia Shannona, które dotyczy samplingu.

W rezultacie otrzymujemy dokładnie ten sam przebieg. Nie jakąś prostą kreskę albo wygładzoną krzywą pomiędzy punktami – odwzorowany zostaje oryginalny sygnał, dlatego że zapisaliśmy całą informację o nim w funkcji częstotliwości.

Christopher: Przestrzegając wszystkich zasad?

Jan: Oczywiście jeśli powiększymy któryś fragment, może okazać się, że nie wszystko jest perfekcyjne. Nie istnieje bowiem idealny filtru dolnoprzepustowego, który wyeliminuje wszystkie zjawiska zachodzące tutaj. To akurat bardzo dobry przykład na to – dużo ludzi o to pyta – dlaczego stosujemy tak wysoką częstotliwość próbkowania.

No więc właśnie dlatego – z powodu częstotliwości Nyquista, która jest połową częstotliwości próbkowania. przy niej ten filtr dolnoprzepustowy musi mieć bardzo dużą skuteczność: 90, a nawet 120 decybeli. Ale jednocześnie musi także sięgać wystarczająco daleko, żeby nie zmienić oryginalnego sygnału muzycznego. Jako że dla zwykłego odtwarzacza CD sygnały są ograniczone do 20 kHz,

filtr dolnoprzepustowy musi być bardzo stromy. Zaczyna on działać dopiero od 20 kHz i dla połowy częstotliwości próbkowania, czyli 22.05 kHz, musi odfiltrować jak najwięcej. Tak więc przy 22 kHz musi wykazywać się gigantycznym tłumieniem. Właśnie dlatego stosujemy wyższą częstotliwość próbkowania – w takim przypadku częstotliwość Nyquista jest dwu-, trzy-, albo nawet czterokrotnie wyższa.

Christopher: Co pozwala na...

Jan: Pozostawienie dużo większego zakresu na skuteczne filtrowanie. Możemy także ustawić filtr na częstotliwości dużo wyższe niż te w sygnale muzycznym, dzięki czemu nie zmienia on tego przebiegu aż tak bardzo. Amplituda przebiegu – czyli poziom na tym wykresie – to jedno. Ale przecież każdy filtr zaburza odpowiedź czasową przebiegu.

Chodzi tu o zjawiska fazowe, które zachodzą dziesięciokrotnie poniżej częstotliwości odcięcia. Jeśli ta ostatnia wynosi 20 kHz, to dla 2 kHz nastąpi nieznaczne przesunięcie fazy. Mam nadzieję, że te wszystkie wykresy pozwolą zrozumieć, w jaki sposób można uzyskać jak najdokładniejszą kopię przebiegu dzięki operacjom zachodzącym przy cyfrowym przetwarzaniu sygnały. Cyfrę da się skopiować dużo prościej niż przebieg analogowy, czego byliście świadkami przed chwilą, gdy chciałem przerysować krzywe przebiegów.

Christopher: No tak… Dużo prościej jest też skopiować zero.

Jan: I to jest właśnie odpowiedź. Gdy wchodzimy w świat cyfrowy, możemy wykonać tyle kopii przebiegu ile potrzeba, bez zmiany sygnału, przy pełnej kontroli wykonywanych operacji. Zaskakujące jest, że jeśli dokonamy tego w prawidłowy sposób, na wyjściu uzyskamy wszystkie szczegóły, a nie tylko uproszczone linie łączące punkty próbkowania.

Christopher: Właśnie to ostatnie zupełnie mnie zaskoczyło. W jaki sposób jesteśmy w stanie odzyskać te wszystkie poszarpane krzywe, drobne uskoki i uwypuklenia?

Jan: Te dane można znaleźć dokładnie tutaj. Wszystkie informacje stąd są przeniesione w to miejsce. A przecież tutaj został zawarty cały przebieg, ze wszystkimi jego zawiłościami i szczegółami.

Christopher: Rzeczywiście!

Jan: Tak więc widmo przebiegu tutaj jest identyczne jak poniżej. Przenosząc analog do cyfry, a później z powrotem do analogu – uzyskujemy z powrotem perfekcyjną kopię przebiegu oryginalnego. Wszystko to wynika z przeprowadzania operacji w prawidłowy sposób, z pełną kontrolą nad całym procesem.

Christopher:  To bardzo imponujące.

Niestety zbliżamy się do końca tego odcinka. Jak łatwo się domyślić, ledwie wypłynęliśmy z portu. Myślę, że przed nami jeszcze wiele lądów do odkrycia.

Jan: Szczerze mówiąc, nie mogę się doczekać aż spotkam się z Wami ponownie i opowiem więcej o tym, jakie możliwości daje cyfrowe przetwarzanie dźwięku, bo naprawdę jest o czym mówić. Możliwości są… prawie nieograniczone. Przed nami wiele zagadnień – na razie przybliżyłem Wam absolutne podstawy, dzięki którym DSP coraz częściej można spotkać w wysokiej klasy sprzęcie audio.

Christopher: Jan, to był zaszczyt gościć Cię w naszym cyklu. Mam nadzieję, że spodobał się Wam wykład na tablicy i powrócimy do takiej formy prezentacji nie raz. Dziękuję także oglądającym za ciekawe pytania – i zapraszam ponownie!