Skocz do zawartości

Czy słychać różnicę? Mp3 vs. FLAC i inne ślepe testy


Kraft

Recommended Posts

6 minut temu, Pboczek napisał:

Źle stawiasz pytanie. Ja pytam nie o to, co gra, tylko na czym polega różnica w graniu Yamahy i Nada.

Twoje kierowane jest raczej do sprzedawców RTV.

Dziwi mnie, że nie budzi Twojej refleksji fakt, że różnice w graniu słyszysz tylko wtedy, gdy widzisz co gra. U mnie coś takiego powoduje automatyczne stawianie sobie pewnych pytań.

Edytowano przez Kraft
Link do komentarza
Udostępnij na innych stronach

2 minuty temu, Pboczek napisał:

Dopuszczam każdy rodzaj badania, staram się jednak oceniać ich przydatność. Wychodzi z artykułu, że ABX prawdopodobnie nie nadaje się do wychwytywania różnić w dźwięku. Wiec co zostaje?

Opisany w artykule test dotyczył bardzo wąskiego zakresu rozpoznawania dźwięków. Nie wiem, czy można go przekładać na całe audio. A co zrobić ze ślepymi testami, gdzie różnice się ujawniły? Skoro wszystkie ślepe testy są do kitu, to co z nimi począć? Zapomnieć o nich?

Link do komentarza
Udostępnij na innych stronach

 

1 minutę temu, Kraft napisał:

Opisany w artykule test dotyczył bardzo wąskiego zakresu rozpoznawania dźwięków. Nie wiem, czy można go przekładać na całe audio. A co zrobić ze ślepymi testami, gdzie różnice się ujawniły? Skoro wszystkie ślepe testy są do kitu, to co z nimi począć? Zapomnieć o nich? 

Tu chodzi o dźwięk, a bardziej o słuch. Różnice się ujawniły ale chyba nie w ABX?

Link do komentarza
Udostępnij na innych stronach

Po co te ślepe testy? Google tak mi przetłumaczył podany na końcu link. Zamieszczam również dodatkowy odnośnik, by uwiarygodnić pierwszy.
Dlaczego tak wielu audiofilów odrzuca ślepe testowanie komponentów audio? Ponieważ naukowo udowodniono, że jest bezużyteczny ponad 60 lat temu.
Naukowiec zajmujący się mową Irwin Pollack przeprowadził eksperyment na początku lat pięćdziesiątych. W ślepym teście odsłuchowym ABX poprosił ludzi o rozróżnienie minimalnych par spółgłosek (takich jak „r” i „l” lub „t” i „p”). Dowiedział się, że słuchacze nie mają problemu z rozróżnianiem tych spółgłosek, gdy odtwarzane są natychmiast po kolei. Ale gdy zwiększył przerwę między odtwarzaniami, zdolność słuchacza do rozróżnienia między nimi zmniejszyła się. Gdy czas oddzielenia dźwięków przekroczył 10-15 milisekund (około 1/100 sekundy), ludzie mieli naprawdę trudny czas, aby odróżnić wyraźnie różne dźwięki. Ich odpowiedzi stały się statystycznie nie lepsze niż przypadkowe domysły. Jeśli interesuje Cię nauka o tych rzeczach, oto miłe podsumowanie: Kategoryczne i nieklasyczne tryby percepcji mowy w kontinuum dźwięczności. Od tego czasu eksperyment był powtarzany wiele razy (ostatnia duża aktualizacja w 2000 r., Niezawodność zadania pary dychotycznej spółgłoski-samogłoski przy użyciu procedury ABX). Wiarygodne rozpoznawanie różnicy między podobnymi dźwiękami w środowisku ABX jest niemożliwe. 15 ms przerwy w odtwarzaniu, a domysł słuchacza nie jest lepszy niż losowy. Dzieje się tak, ponieważ ludzie nie mają żadnej znaczącej pamięci przebiegów. Nie możemy dokładnie przypomnieć sobie samego dźwięku i polegać na różnych modelach mentalnych dla porównania. Opracowanie tych modeli wymaga czasu i wysiłku, co sprawia, że jesteśmy naprawdę źli w grze „dostrzeż różnicę dźwięku teraz i tutaj”.

Pamiętaj również, że eksperymentatorzy używali dźwięków mowy. Ludzkie uszy mają znacznie lepszą rozdzielczość i dyskryminację w widmie mowy. Jeśli metoda porównawcza nie działa dobrze z mową, nie działa w ogóle z muzyką.

Tak więc tłum „podwójnie ślepych testów” czci protokół ABX, który udowodniono naukowo ponad 60 lat temu, aby całkowicie nie nadawać się do odróżniania podobnych dźwięków. A oni upierają się, że wszystkie inne metody są „nienaukowe”.

https://www.quora.com/Why-do-so-many-audiophiles-reject-blind-testing-of-audio-components
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3517997/
I pozamiatane... ;-)

Wysłane z mojego LG-H870 przy użyciu Tapatalka

Link do komentarza
Udostępnij na innych stronach

 

14 godzin temu, dzarro72 napisał:

I pozamiatane... 😉

No raczej nie.

Powiedziałbym że raczej jest to duża szpila w 'audiofilską pamięć" 🤣

Test polegał jak zrozumiałem na ROZPOZNANIU danej spółgłoski a nie na powiedzeniu czy jest czy nie różnica (o ile dobrze zrozumiałem)

Po przykładach które tutaj były nawet zamieszczane (materiały wideo/audio), wiemy że rozpoznawanie mowy a szczególnie 'blisko dźwiękowo' brzmiących zestawów jest bardzo silnie związane ze wzrokiem.

Druga sprawa - co zrobić z testami ślepymi gdzie udało się uchwycić różnice ? Nie istnieją? Należy je pominąć?

Trzecia sprawa - przypomnę to wideo :

 

 

Czy to wideo nie istnieje?

Czy pomiary kabli kłamią?

Dlaczego przytaczam te elementy ? Ano bo za słyszeniem stoją tylko wrażenia. Wrażenia oparte na odsłuchu . odsłuchu który odbywa się z przerwami, które to zostały wręcz sponiewierane w teście na który sie powołujecie. ;)

Pomiary nawet jeżeli pokazują różnice to są one na tysięcznym miejscu po przecinku albo jeszcze niżej/dalej.

Testy typu "null test" ... można by pewnie wymienić jeszcze kilka.

A jednocześnei jak juz wcześniej wspomniano były ślepe testy które pokazywały że ludzie wychwytują różnicę.

Musicie się na coś zdecydować :D

 

Link do komentarza
Udostępnij na innych stronach

1 godzinę temu, Fafniak napisał:

A jednocześnei jak juz wcześniej wspomniano były ślepe testy które pokazywały że ludzie wychwytują różnicę.

By dyskusja mogła nas gdzieś dalej prowadzić, właściwym byłoby podanie przykładów testów ABX w których słuchający rozpoznali co gra. Pewnie były takie, skoro piszecie.

Prosiłem o to wcześniej kilka razy, ale Krafcik podawał jedynie przykłady ślepych testów innego typu, nie ABX.

Link do komentarza
Udostępnij na innych stronach

 
 
 
Dnia 18.03.2019 o 21:40, Pboczek napisał:

 Wiarygodne rozpoznawanie różnicy między podobnymi dźwiękami w środowisku ABX jest niemożliwe. 15 ms przerwy w odtwarzaniu, a domysł słuchacza nie jest lepszy niż losowy. Dzieje się tak, ponieważ ludzie nie mają żadnej znaczącej pamięci przebiegów. Nie możemy dokładnie przypomnieć sobie samego dźwięku i polegać na różnych modelach mentalnych dla porównania. 

Jeżeli są takie wnioski z badania to nie świadczy to zawodności "ślepych testów" a o zawodności naszej pamięci w rozpoznawaniu podobnych do siebie dźwięków. Skąd wnioski o zawodności metody badawczej?

Link do komentarza
Udostępnij na innych stronach

47 minut temu, Pboczek napisał:

By dyskusja mogła nas gdzieś dalej prowadzić, właściwym byłoby podanie przykładów testów ABX w których słuchający rozpoznali co gra. Pewnie były takie, skoro piszecie.

Prosiłem o to wcześniej kilka razy, ale Krafcik podawał jedynie przykłady ślepych testów innego typu, nie ABX.

Proszę bardzo. Parę testów ABX w których różnice się ujawniły.

Testy wzmacniaczy:

ARC D120 vs CM Labs CM914a - trzech testujących. Skuteczność rozpoznania - 82 / 90 = 91%

10 Watt Tubes vs. Dyna 400 - dziewięciu testujących. Skuteczność rozpoznania - 78 / 126 = 62% 

10 Watt Tubes vs. Dyna 400 - dziesięciu testujących - 63 / 80 = 79%

Testy zniekształceń:

3% THD - 154 / 242 = 64%

7% THD - 210 / 256 = 82%

Testy wkładek gramofonowych:

Shure V-15III vs. Sonus Blue - trzynastu testujących - 104 / 169 = 62%

Shure V-15III vs. Shure M70B - - dziesięciu testujących - 107 / 141 = 76%

CD:

Sony CDP-707 ESD vs. Phillips CD100 (14-bit) - 73 / 109 = 67%

Porównanie kolejnych kopii taśm:

Original vs. 3rd copy (4th generation) - siedmiu testujących - 58 / 78 = 74%

Original vs. 1st copy (2nd generation) - sześciu testujących - 193 / 340 = 57%

Wykrywanie filtra:

Low Pass -3 dB @ 13.5 kHz. (music) - pięciu testujących - 30 / 42 = 93%

High Pass -3 dB @ 40 Hz - dwóch testujących - 28 / 32 = 88%

Low Pass -3 dB @ 13.5 kHz. (pink noise) - czterech testujących - 64 / 64 = 100%

Kolumny głośnikowe:

Yamaha S4115H vs. AR-5 - dwudziestu testujących - 312 / 320 = 97%

Magnetofony:

Revox A77 vs. Nakamichi 700-II - ośmiu testujących - 79 / 114 = 69%

 

Wystarczy???

 

Link do komentarza
Udostępnij na innych stronach

Nasza zdolność słyszenia nie poprawia się w teście widzialnym a pojawia się w nim sugestia pochodząca z produktu. Ślepe testy służą do tego aby ją wyeliminować.  Aby podważyć zasadność ślepych testów w audio trzeba by wykazać, że przy widzianych testach nie ulegamy tej sugestii i oceniamy identycznie jak w ślepych. 

Edytowano przez Fortepiano
Link do komentarza
Udostępnij na innych stronach

17 minut temu, Pboczek napisał:

@Fortepiano żeby się to nie rozjechało, może skup się na wyniku eksperymentu którego wnioskiem jest to, że ABX nie pokazuje pewnych różnic w dźwięku, i z drugiej strony na tym co obrazują podlinkowane przez Krafta testy.

Nasze osobiste dywagacje, nie poparte żadnym dowodem, to tylko gdybania. 

Wynik testu w ABX informuje tylko o tym, że percepcja rozpoznowania oddzielnych spółgłosek podawanych w większych odstępach czasowych jest u nas słabsza. Jak z tego wyniku wyciągnołeś wniosek o nieużyteczności ślepych testów w audio?

Link do komentarza
Udostępnij na innych stronach

20 minut temu, Fortepiano napisał:

Wynik testu w ABX informuje tylko o tym, że percepcja rozpoznowania oddzielnych spółgłosek podawanych w większych odstępach czasowych jest u nas słabsza. Jak z tego wyniku wyciągnołeś wniosek o nieużyteczności ślepych testów w audio? 

No wiesz, wydaje mi że spółgłoski to dźwięki. Nie?

 

Link do komentarza
Udostępnij na innych stronach

 

1 godzinę temu, Pboczek napisał:

No wiesz, wydaje mi że spółgłoski to dźwięki. Nie?

 

Aha, jeżeli na tej podstawie to ten wniosek jest błędny. Z wyniku tego testu możemy tylko wynieść informację o naszej percepcji podobnych krótkich dźwięków podowanych w danych odstępach czasowych. Eksperyment nie informuje nas nawet o wpływie danej metody na rozpoznawalność tych dźwieków.  Gdyby zastosowano metodę widzialną z widocznym lektorem spółgłosek to nasza możliwość rozpoznania będzie większa z powodu czytania z ust ale to nadal nie byłby wynik do wysunięcia wniosku o zawodności ślepych testów w audio.

Edytowano przez Fortepiano
Link do komentarza
Udostępnij na innych stronach

10 minut temu, Pboczek napisał:

No wiesz, wydaje mi że spółgłoski to dźwięki. Nie?

Czy w nawiązaniu do rzeczonego odstępu czasu między próbkami, a naszą pamięcią słuchową wniosek o takiej treści będzie prawdziwy? Ze względu na ograniczenia pamięci słuchowej (pomijając zawodowych muzyków i kompozytorów) porównywanie dźwięków np. po wymianie elementów toru audio (kable, kondensatory, bezpieczniki itp.) pozwala z dużą dozą prawdopodobieństwa twierdzić, że słuchający różnic nie wychwyci, co potwierdzają wskazywane badania i ograniczenia naszej percepcji 😉

Link do komentarza
Udostępnij na innych stronach

3 godziny temu, MariuszZ napisał:

Ze względu na ograniczenia pamięci słuchowej (pomijając zawodowych muzyków i kompozytorów) porównywanie dźwięków np. po wymianie elementów toru audio (kable, kondensatory, bezpieczniki itp.) pozwala z dużą dozą prawdopodobieństwa twierdzić, że słuchający różnic nie wychwyci, co potwierdzają wskazywane badania i ograniczenia naszej percepcji 😉

Tak, różnic nie wychwyci. Negatywny wynik ślepego testu jest dowodem na to, że różnic nie wychwycono, a nie że ich nie ma.

Kraft te wyniki pokazują że można było wychwycić różnice w połowie z podanych przez ciebie przykładów. Liczę te powyżej 75%. Wartości mniejsze zasadniczo mogą być traktowane jako losowe trafienia. By określić wartość dowodową tych reprezentatywnych przykładów, trzeba się przyjrzeć temu na próbie ilu osób były wykonywane.  Tylko trzy testy miały większą reprezentacje, pozostałe bieda.  Te trzy dotyczyły: kolumn, pieca, wkładki. Pokazałeś że w ślepych testach można wychwycić tu różnice, bo one występują. Ale kiedy zauważyć, że trafienie było tylko w jednym z trzech testów dot. wzmacniaczy, i w jednym z dwóch dot. wkładek, to widać, że nawet w odniesieniu do tak istotnych elementów toru, nie ma jednoznaczności. I jak tu badać testem ABX bezpieczniki?

Link do komentarza
Udostępnij na innych stronach

55 minut temu, Pboczek napisał:

Kraft te wyniki pokazują że można było wychwycić różnice w połowie z podanych przez ciebie przykładów. Liczę te powyżej 75%. Wartości mniejsze zasadniczo mogą być traktowane jako losowe trafienia. 

Niestety źle interpretujesz wyniki. Wszystkie przedstawione wyżej testy dały wynik pozytywny (różnice zaobserwowano). Miały wartość prawdopodobieństwa testowego (probability value) "p" w zakładanym przedziale. Po prostu im mniej prób tym większy musi być procent pozytywnych odpowiedzi by uznać test za udany. Jeśli prób jest mało, trafień musi być powiedzmy 90% by zaliczyć test. Jednak gdy są ich setki wystarczy już skuteczność np. 60%. Nie możesz oceniać procentu odpowiedzi w oderwaniu od ilości wykonanych prób. Uwierz mi. Ktoś te wyniki dobrze wcześniej przemyślał. 

Edytowano przez Kraft
Link do komentarza
Udostępnij na innych stronach

Ilość prób rozkłada się na uczestników, których ilość obiektywnie nie jest pozbawiona znaczenia dla wyniku testu. Chyba. Jeżeli nie jest liczna, to co z tego, że poddajemy ją większej ilości prób.

Piszą, że tradycyjne podejście do progów słyszalności określało punkt progowy jako środek między wszystkimi poprawnymi (100%) i zgadywaniem (50%). Zatem mniej niż 75% poprawnych wskazuje, że efekt nie został wykryty przez słuchaczy. Dzięki analizie statystycznej, porównania porównawcze ABX Double Blind mogą wykazywać słyszalne różnice przy zaledwie 51% poprawności, pod warunkiem, że eksperyment jest starannie zaprojektowany. Statystyki zapewniające wysoki poziom rozdzielczości są podstawowe. Poniższa dyskusja może służyć zarówno jako wyjaśnienie dla osób nowych w statystyce, jak i przypomnienie dla statystyków, którzy nie używają tych prostych metod regularnie.

Budują rozdzielczość, cokolwiek to znaczy.

Link do komentarza
Udostępnij na innych stronach

2 godziny temu, Pboczek napisał:

Te trzy dotyczyły: kolumn, pieca, wkładki. Pokazałeś że w ślepych testach można wychwycić tu różnice, bo one występują.

Wydawało mi się, że piszę otwartym tekstem. Skoro nawet w obostrzonych rygorem trzech przykładach słychać, to znaczy że różnice występują.

 

Edytowano przez Pboczek
Link do komentarza
Udostępnij na innych stronach

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Gość
Odpowiedz...

×   Wkleiłeś treść z formatowaniem.   Przywróć formatowanie

  Only 75 emoji are allowed.

×   Twój link będzie automatycznie osadzony.   Wyświetlać jako link

×   Poprzedni post został zachowany.   Wyczyść edytor.

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Utwórz nowe...