Голосовое управление телофоном появилось за долго до сенсорных экранов, кнопок и даже дисков. Еще в дореволюционные годы, чтобы позвонить по телефону, надо было ГОЛОСОМ сказать телефонистке номер желаемого абонента и она соединяла вас. Это было просто и понятно. Все этим пользовались, пока, значит, количество абонентов не выросло настолько, что телефонисток стало на всех не хватать и процесс вызова нужного абонента пришлось автоматизировать.
Собственно этим мы пользуемся и сейчас, когда натыкиваем по экрану нужную запись в контактах. Но. Любая история развивается по спирали и все когда нибудь обречено на повторение, просто на более технологически продвинутом уровне и в других масштабах. Голосовое управление телефоном вернулось в виде распознования речи и всяких мобильных помощников/компаньенов, типа Siri или Cortana. И теперь у вас не просто своя персональная телефонистка внутри смартфона, которая по первому требованию выбирает нужный контакт из записной книжки, а намного больше, почти что настоящий искусственный интелект, с которым и поговорить незазорно будет. Так почему люди всем этим не пользуются, а голосовое управление нe стало трендом? Ведь это так удобно сказать смартфону, что тебе надо и чтобы он понял и выполнил и все это без необходимости держать его в руках и напряженно натыкивать текст запроса пальцами.
Сейчас я повторюсь, эту мысль я ранее высказывал в одном из обсуждений, но Стив Джобс ошибался, когда называл пальцы самым удобным инструментом, данным человеку от природы для управления смартфоном. Да, это было во времена выхода первого iPhone и так он хотел наглядно продемонстрировать преимущества управления пальцами в новом интерфейсе ios и достоинства нового емкостного экрана против стилуса и резистивного экрана у конкурентов. Но сейчас технологии шагнули дальше, стилус хоть и присутствует в отдельных устройствах но выполняет вспомогательную роль дигитайзера, в основном же все устройства оптимизированы под управление пальцами и это диктует свои ограничения.
Самое явное ограничение в том, что нужно таки использовать пальцы, чтобы устройство поняло, что вы от него хотите. А это не всегда удобно. Например, сидите вы в гостинной, а в ванной гудит стиральная машина. В этот момент вам звонят и, чтобы стиралка вам не мешала, вы выходите на балкон или там в кухню, где звуки стирки не так четко слышны. Намного проще было бы избежать этой ситуации если бы стиралка была с голосовым управлением. Вы бы просто сказали смартфону “поставь стиралку на паузу” и она бы остановилась, а вы бы нормально могли поговорить по телефону. Голосовое управление вполне может заменить обычное дистанционное управление с помощью пультов. И это уже сегодняшняя реальность, а не что-то из фантастического фильма. И вы забудете про все эти десятки разных пультов. Управления всего в доме со смартфона благодаря распознаванию голоса будет универсальным. Просто надо будет сказать смартфону, что ты хочешь выключить свет или включить телик и не надо искать пульт и на нем нажимать кнопки.
Другое ограничение связано с тем, что само устройство нельзя сделать очень маленьким. Это важный недостаток в эпоху, когда трендом становятся носимые гаджеты. Трогать каждый раз умные очки или часы по сенсорным панелям не всегда удобно и к месту. Проще и быстрее будет сказать вслух, что ты хочешь найти что-то в интернете или сменить трек в плеере. В случае с носимыми гаджетами у голосового управления большие перспективы. А когда люди поймут, что это работает и достаточно хорошо и удобно, они будет этим же пользоваться при использовании обычных смартфонов. Сейчас многие объясняют практическую пользу от роста диагонали на примере наэкранных клавиатур. Мол, размер экрана больше и, соответственно, размер каждой конкретной клавиши больше и, соответственно, набор текста происходит с меньшим количеством неправильных нажатий. Но, если для этих целей использовать голосовой набор, то это не только позволит повысить скорость набора и грамотность, но еще и вернет смартфонам приемлемые габариты. И, возможно, мы получим новые форм-факторы устройств.
Голосовое управление смартфоном может дать новый толчек в эволюцинном развитияи устройств. Смартфон, на котором не нужно набирать текст, по которому не нужно тыкать пальцем, может иметь абсолютно любую форму. Хоть гиперболоид, лишь бы удобно было с экрана информацию считывать. Вот тут и пригодятся и гнутые экраны, и гибкие батареи, и вообще смартфоны перестанут быть “кирпичами” и начнут хоть как-то отличаться внешне друг от друга. И это хорошо, потому что сегодня смартфоно-строители зашли в тупик в плане дизайна. Старый уже порядком надоел а новое что-то внедрить не получается, потому что все управление завязано на пальцах тыках и виртуальных клавах.
Только представьте себе смартфон будущего в форме ручки. При случае вы сможите развернуть свернутый рулоном большой экран для интернета игр фильмов чтения документов, но все остальное время экран будет свернут для экономии батареи и управлять смартфоном будет не очень удобно из-за ограниченых площадей сенсорных поверхностей. Голосовое управление в этом случае очень даже поможет.
Но все это в той или иной степени перспективы. Да, сейчас голосовой помощник может многое, но этого недостаточно для того, чтобы полностью перейти на управление голосом. К тому же, VCD (voice command device) имеют объективные недостатки, свойственные всем устройствам, поподающих в эту категорию. Будь то телик или автомобиль, чтобы он понял, что вы пытаетесь ему сказать слово, надо произносить предельно четко с определенными паузами. Т.е, с распознаванием живой обычной повседневной речи у них определенные проблемы. Особенно, если вы говорите с акцентом или вообще на языке, который устройство не понимает. Например, с той же Siri нельзя поговорить по-русски, а если вы попытаетесь отдать ей команду на понятном английском, располагая только давно забытыми знаниями из школьной программы, то разговор с Siri превратится в бесконечную пытку.
Производители про эти недостатки знают и постоянно совершенствуют как программное обеспечение по распознаванию голоса, так и хардверную часть. Поговаривают, что уже ведутся попытки практически применить высокое разрешение веб-камер для того, чтобы научить компьютер “читать по губам” и “понимать эмоции по выражению лиц” в помощь голосовым помощникам. Все это в сумме с контекстным поиском новыми алгоритмами и большими вычислительными мощностями должно в ближайшее время сделать мобильных компаньенов типа Siri еще более понятливыми и умными. Способными распознавать речь конкретно владельца устройства со всеми его акцентами или деффектами, и выполнять большее число команд и действий. Это позволит максимально сократить количество ошибок ввода и максимально расширить функциональность голосового помошника вплодь до того, что он заменит оатальные способы управления устройством.
Но будут ли люди разговаривать не “по” а “со” своим смартфоном. Ведь разговор предполагает ответную реакцию собеседника, а тут как бы нет собеседника. И возникает психологически неприятное ощущение, что “говоришь в пустоту”. Но я не вижу в этом проблемы. Cейчас это кажется непривычным и странным, но… Что может быть плохого в том, что вы говорите со смартфоном? Да, придется немного менять привычки, годами нас, потребителей, приучали жать на кнопки и тыкать в экран. Но голосовое управление лучше. Это удобно и быстро. И более, чем естественно. И когда эта технология окончательно созреет, то такая новая форма общения со смартфоном вполне может стать модным трендом. По типу мобильной фотографии. На заре этой мобильной фотографии ни кто не воспринимал камеры в смартфонах всерьез, а сейчас это один из важнейших критериев выбора и все производители уделяют ему значительное внимание в своих попытках привлечь покупателей. Распознавание голосом также несколько “пробуксовало” на старте, но чем дальше, тем, ИМХО, больше ему будет уделяться внимания, просто потому, что производителям уже нечего нового придумать для внедрения в смартфоны не могут и им только и остается, что совершенствовать то, что уже в них есть в ожидании очередного эволюционного прорыва, вот им как раз и может стать отказ от управления пальцами в пользу голоса.
не могу представить себе серфинг в интернете голосом.
З.ы. Не вплодь, а вплоть.
С утра в маршрутке:
Okey google, show me dancing pussy.
Если все начнут разговаривать со смартфонами в общественном транспорте это будет ад ))