Как я разговаривал о смысле жизни с пультом ДУ
05.01.2017 Четверг 07:46
До недавнего времени у меня не было американского телевидения в квартире. Но с Нового года я подключил себе базовый пакет, чтобы было что слушать на фоне. Да и американский взгляд на международные и местные проблемы порой бывает интересно узнать. Но сейчас я хотел рассказать не об этом. А о вот этом пульте ДУ, который прибыл вместе с ресивером.
В принципе, пульт как пульт. За исключением одной маленькой кнопочки, которая отличает его от всех других пультов, которые я держал в руках до этого. А именно, вон та кнопка с нарисованным на ней синим микрофоном. Оказывается, этот пульт понимает голосовые команды! Именно для этого и нужна эта кнопка. Работает это просто: нажимаешь кнопку и говоришь, пока её держишь. Когда отпустил, команда распознаётся и выполняется. Можно говорить, например, "переключись на CNN", "хочу посмотреть научную фантастику", "хочу посмотреть "Матрицу", "Запиши Saturday Night Live" и т.п. Сначала я думал, что пульт распознаёт узкий набор команд, имеющих непосредственное отношение к телевидению, но в процессе тестирования обнаружилось, что он распознаёт вообще всё что угодно на английском языке! Как Сири в айфоне. Причём делает это, по-моему, лучше чем Сири: распознавание очень быстрое и надёжное. Вот, например, я спросил пульт, в чём смысл жизни... (Блин, спросил у пульта от телевизора, в чём смысл жизни... Если бы мне кто-то лет десять назад сказал, что я напишу эту фразу, я бы на этого человека очень подозрительно посмотрел.
) На что он, как и полагается, ответил числом "42":
Что является ссылкой на произведение
"Автостопом по Галактике" Дугласа Адамса.
Я попробовал выяснить, как эта технология работает. В частности, где происходит распознавание речи, то есть преобразование аудиопотока в набор символов и дальнейшая их интерпретация. Возможных места три: сам пульт, ресивер или, как сейчас принято говорить, облако. Я предполагаю, что вычислительных возможностей ресивера и, тем более, пульта, вряд ли хватило бы для выполнения этой задачи, поэтому скорее всего мой голос отправляется в интернет, там обрабатывается и возвращается в ресивер в виде цифровых команд для него. Правда, для такой схемы это как-то очень быстро работает. Быстрее чем Сири. Слова, которые я произношу, появляются на экране почти молниеносно. Поискал официальную инфу на эту тему, и Комкаст (мой провайдер ТВ и интернета), вроде бы,
подтверждает гипотезу про отправку голоса в интернет для распознавания:
After you speak into the remote, the voice commands are sent to Comcast and its contracted service provider for processing.Кроме того, если я правильно понял, в отличие от традиционных пультов управления этот пульт общается с ресивером посредством радиоволн, а не ИК-излучения:
There’s a huge transition today from old fashioned Infrared remotes to radio frequency (RF) remote controls based on the ZigBee® RF4CE™ standard.http://corporate.comcast.com/comcast-voices/comcast-voice-remote-texas-instruments
Characteristics of ZigBee RF4CE include: ... Operation in the 2.4GHz frequency band according to IEEE 802.15.4.http://www.zigbee.org/zigbee-for-developers/network-specifications/zigbeerf4ce/
Видимо, это позволяет быстро передавать аудиопоток из пульта в ресивер. На ИК-излучении это бы вряд ли происходило так быстро.
В общем, это круто. Всякие мелкие, интегрированные с интернетом устройства, с которыми можно разговаривать — это заметный шаг вперёд в технологии, я считаю. Мы всё ближе к
"интернету вещей".