В Google произошла утечка голосовых записей пользователей
Каждый, у кого есть смартфон на Android, хоть раз пользовался командой "Окей, Google". Она запускает голосовой помощник, способный выполнять различные команды - искать в интернете, включать музыку, устанавливать таймеры и будильники и многое другое. Такие же голосовые помощники живут и в умных колонках - небольших акустических системах, подключенных к интернету.
На западе популярны колонки от Google, Apple и Amazon, в России аналогичные устройства активно "Яндекс", создавший собственного голосового помощника Алису.
Все такие системы работают одинаково - они "слушают", что происходит вокруг. Когда владелец обращается к помощнику, начинается запись речи. Она отправляется на сервер, обрабатывается, а пользователю выдается результат - находится что-то в поисковике, включается музыка, рассказывается прогноз погоды, вызывается такси.
Кажется, что общение человека и такого помощника - очень личное, но на самом деле это не так. Большинство обращений обрабатывается автоматически, но часть голосовых записей передаются для изучения реальным людям. Это, как утверждает тот же Google, нужно для улучшения распознавания речи.
Разумеется, нанятые сотрудники должны держать в секрете такие материалы, но недавно в распоряжении бельгийского телеканала VRT оказались образцы настоящих голосовых запросов. Их в нарушение правил передал один из таких нанятых сотрудников.
В описании умной колонки Google Home не говорится о том, что в процесс расшифровки голосовых запросов могут вмешиваться посторонние люди. Сама компания после того, как несколько аудиозаписей прозвучали в телерепортаже, заявила, что "расшифровщики" не могут узнать, что за человек произнес ту или иную фразу. Кроме того, на ручную обработку направляются лишь 0,2 процента таких записей.
Несмотря на это, в самих запросах может быть случайно озвучена конфиденциальная информация. Также "расшифровщик" рассказал телеканалу, что на одной из присланных ему из Google записей он слышал голос женщины, которая находилась в опасной ситуации, связанной с физическим насилием.
Распознавание голосовых запросов с использованием как компьютера, так и человека используется абсолютно всех голосовых системах - и российских, и зарубежных, рассказали "РГ" представители "Яндекса".
"Для распознавания речи, обращенной к Алисе, мы используем машинное обучение. Ручная разметка обращений бывает необходима только для повышения качества работы голосового помощника. Возможности идентифицировать автора той или иной фразы не существует, так как образцы голоса видоизменяются - это дополнительная мера предосторожности для защиты персональных данных", - сообщили в компании.
Однако утечки, подобные недавней, представляют серьезную опасность, уверен Георгий Старостин, эксперт лаборатории практического анализа защищенности компании "Инфосистемы Джет".
"Опасность таких утечек становится актуальной в связи с тем, что сервисы стали внедрять различные виды биометрической аутентификации, в том числе и по голосу. Если у злоумышленника будет достаточно голосовых записей, то он сможет подделать ваш голос и получить доступ к вашим аккаунтам, например, банковским, позвонив в колл-центр кредитной организации", - считает эксперт.
Георгий Старостин также уверен, что голосовые данные "не только передаются с целью распознать голосовой запрос и выполнить его, но и сохраняются для дальнейшего анализа".
"Потребители в любом случае не должны забывать о базовых мерах предосторожности. Например, изучить конфигурацию и отключить ненужные функции перед использованием умных колонок, а также запретить выполнение команд без дополнительной авторизации и отключать микрофон, когда колонка не используется", - отмечают в антивирусной компании ESET.