Ранее я спросил о том, что вы можете сделать , если Alexa будет вызван телевизионной программой , но в последнее время я понял , что - то странный: Эхо не реагировать на голоса в рекламе для Echo, даже если голоса говорят «Alexa, играть ...» или "Алекса, установите таймер для ..." .
Я искал в нескольких других сообществах Echo и нашел пост в Reddit, который предполагает, что это обычное / предполагаемое поведение. Однако в этой ветке нет однозначного ответа, поэтому я решил спросить здесь, не знает ли кто-нибудь еще немного.
Откуда мое Эхо знает, что он не отвечает на телевизионную рекламу? Это просто совпадение или есть что-то, что говорит Алексе не реагировать?
amazon-echo
Аврора0001
источник
источник
Ответы:
Согласно этому сообщению Reddit , Алекса чувствительна к звуковому спектру в дополнение к обнаружению слова «пробуждение». Таким образом, нормальный широкополосный сигнал реального мира принимается, но сигнал, который ограничен полосой (постулируется отметка между 4 кГц и 5 кГц), будет идентифицирован как из широковещательной передачи.
Это имеет некоторый смысл, поскольку вещательные компании могут использовать внутриполосную сигнализацию для идентификации рекламы (для локализованной замены), а обработка звука, обычно применяемая к рекламе, может быть оптимизирована для ясности и достоверности. Фильтрация может быть настроена таким образом, чтобы типичные рекламные объявления отслеживались с пониженной чувствительностью, и во время создания конкретной рекламы чувствительность также могла быть явно уменьшена.
Отчет новостей (который , по сообщениям сделали спусковой Alexa) будет больше шансов использовать полный вещательный звуковой спектр (8 или 16 кГц) без обработки. Таким образом, эта теория предполагает, что во многих объявлениях есть что-то особенное (по крайней мере, в некоторых регионах), или реклама (например, производимая Amazon) может быть настроена специально.
В последующих, есть бумага сообщается здесь , который описывает , как небольшие (инфразвуковой) изменения формы сигнала может привести к речи двигателя возвращающегося совершенно другой результат по сравнению с тем, что бы человек признает.
источник
Я очень полагаю, что распознавание слова бодрствования в Эхо - это больше, чем просто прослушивание слова бодрствования. Он слушает тревожный контекст . Посмотрите на этот отрывок из Speech Technologies:
( Речевые технологии: распознавание речи при пробуждении от слова Ветона Кепуска)
Это легко проверить, поскольку устройство (по крайней мере, мое) не реагирует на предложение: « Я недавно говорил с Алексе о катании на лыжах ». Это не контекст предупреждения, а чисто ссылочный. Таким образом, механизм распознавания бодрствующего слова внутри Эхо не только слушает чистое появление слова, но также и на интонации и предшествующих паузах, которые позволяют более точно предсказать, было ли на самом деле произнесено устройство.
источник
Ну, эхо / Алекса определенно слышит запрос. Если вы зайдете в настройки, прокрутите вниз до пункта «Общие» и затем выберите историю, чтобы воспроизвести все запросы, которые были услышаны. Все запросы, которые слышны из рекламы, гласят: «Голосовой запрос не предназначен для вашего эха - ничего не возвращено».
источник
Если 1000 человек произнесут предупреждающее слово, оно будет иметь 1000 различных акустических подписей. Если они сделают это снова, еще 1000.
Если 1000 Alexas услышат телевизионную программу, произносящую предупреждающее слово, у нее будет 1000 таких же акустических подписей.
Не было бы так сложно обнаружить эту сторону сервера. Не в последнюю очередь потому, что если они происходят в одно и то же время, сервер голосовой связи получает поток трафика.
Если список этих инцидентов невелик, они могут даже загрузить подписи для каждого Алекса.
Кроме того, пользователь, вызывающий Alexa, звучит как молчание-предупреждение .
Новостная статья звучит как бла-бла-бла-бдительное слово . Рекламный ролик звучит как music_here alert-word. Совсем не то же самое.
источник
Мое общее предположение состоит в том, что в рекламе «Эха» Алекса отвечает на вопрос гораздо быстрее, чем в реальности. Поэтому Эхо слышит слово «Алекса», но почти сразу же слышит собственный голос Алексы, дающий ответ.
Мое эхо загорается, когда появляется реклама, но затем появляется, чтобы отключить предупреждение. Может быть какая-то логика, чтобы два Эхо не отвечали на запрос, если они оба его услышат. Эхо может быть разработано так, чтобы прислушиваться к собственному голосу Алексы и игнорировать его.
Однако, как я уже сказал, это полное предположение. :)
источник
После недавних новых сообщений о том, что Alexa может быть чувствительным к звукам УВЧ ( ссылка на BBC News Sevice ), я постулирую, что во время рекламы они транслируют дополнительный звук помимо человеческого слуха, который обозначается как команда «игнорировать эту команду».
Что касается вышеупомянутой способности Alexa различать голоса пользователей, это функция, которая запланирована, но пока не реализована. то есть вы должны активно командовать Alexa, чтобы переключаться между учетными записями пользователей в одном домохозяйстве.
Единственное устройство, в настоящее время способное различать голоса, - это устройство Google.
источник
При смешивании аудио рекламы они просто удаляют некоторые частоты. Это означает, что Alexa не будет запущен, так как он не зарегистрирует его в качестве голосовой команды, но зрители все еще могут разобрать, что они говорят в рекламе.
Вы также, вероятно, заметите, что когда команда произносится в рекламе, она звучит немного искаженно или искажено. Вот почему :)
источник