Marina Mel'nikova
март 2015.
50815

По какому принципу работает приложение Shazam?

Ответить
Ответить
Комментировать
1
Подписаться
52
6 ответов
Поделиться

У Shazam есть доступ практически ко всем композициям мира. Каждая песня представлена в виде 2D-спектрограммы, которую компьютер анализирует и составляет так называемые «аудио-отпечатки» (acoustic fingerprints) конкретной композиции. Эти отпечатки являются практически индивидуальными для каждой песни (поэтому их называют отпечатками — по аналогии с отпечатками пальцев). У Shazam составлена огрооомная база этих отпечатков.

Итак:

1) С помощью приложения мы записали 10 секундный отрывок композиции.

2) Телефон анализирует спектрограмму аудиозаписи и отправляет из на сервер с базой отпечатков.

3) Если найдено совпадение, сервер сообщает пользователю подробную информацию о песне.

301

Все равно не понятно. Что за отпечатки, откуда берутся, как создаются.

+2
Ответить

То есть эти отпечатки - что-то вроде спектров в ИК-спектроскопии: для каждого вещества свой спектр, так и для каждой композиции свой отпечаток? Только вот что вообще он из себя представляет?

+1
Ответить

Никита, программа переводит звук в понятный для себя график, диаграмму (если так можно сказать), который быстрее и проще сравнить с другими диаграммами из базы и найти совпадения. Мне кажется, это чем-то похоже на эквалайзер в плеерах. Такой формат проще передать и проще хранить. 

+2
Ответить
Ещё 4 комментария

https://www.youtube.com/watch?v=M9xMuPWAZW8

вот так выглядит эта самая спектрограмма. На видео DJ Aphex "рисует" спектрограммой песни картинки. т.е. получается что в данном примере картинка закодирована ЗВУКОМ ( если уж совсем упростить)

+1
Ответить

Но на это же уходят считанные секунды. Как программа соотносит записанный звук и миллионы композиций ТАК быстро?

+2
Ответить

Магические алгоритмы поиска

0
Ответить

К слову, такой же принцип используется спецслужбами и рекламными агенствами в качестве одного из алгоритмов деанонимизации пользователя.

0
Ответить
Прокомментировать

Shazam превращает 10 секундный отрывок аудио в «отпечаток», основанный на спектрограммах (частотно-временной график). Он отправляет этот отпечаток на сервер, где уже имеется база таких отпечатков. Сравнивает их и находит нужную песню.

66
Прокомментировать

Товарищи попытались нас надурить своей технической белибердой, но мы-то с вами все прекрасно знаем, что, нажимая кнопку в приложении, пользователь Shazam связывается с мобильным аналитическим гном-центром, где трудятся тысячи гномов-меломанов, которые готовы помочь каждому узнать автора и название "вот этой крутой песенки".

33

Я думаю все таки это Величественная расса Эльфов. Потому что гномы любят музыку менее, чем Эльфы) 

0
Ответить
Прокомментировать
Читать ещё 3 ответа
Ответить