В России импортозаместили расшифровку аудио
Первая причина, по которой зарубежные сервисы и платформы расшифровки аудио уступают российским - это риск утечки информации, рассказал генеральный директор ООО "Таймлист" Глеб Архангельский в кулуарах конференции INFOSTART TEAMLEAD&CIO EVENT. Компании, которые строго следят за информационной безопасностью, запрещают своим сотрудникам использовать иностранные расшифровщики. Это связано с тем, что использование зарубежных сервисов может привести к серьезным штрафам для отечественной компании-пользователя, поскольку зарубежные расшифровщики не соответствуют требованиям российского законодательства к хранению и обработке персональных данных, пояснил основатель ГК "Юнисофт" Алексей Оносов. Российское законодательство предоставляет серьезную защиту от утечки информации, зарубежные же компании руководствуются законодательствами своих стран, которое может допускать использование пользовательских данных в собственных целях и даже передачу их третьим лицам, объясняет Оносов.
Все дело в том, что если использовать зарубежные платформы, аудиофайлы и их расшифровки будут отправляться на серверы, которые находятся вне юрисдикции РФ. В таком случае конфиденциальная информация может стать доступна иностранным спецслужбам или коммерческим конкурентам. "Это же очень большие объемы информации, очень интересный, ценный нематериальный актив", - добавил Архангельский. По его словам, иностранные расшифровщики запрещено использовать не только в госкомпаниях. Таких же мер предосторожности придерживаются организации ОПК, "РЖД", "Газпром", крупные банки, атомная отрасль, где конфиденциальность данных - абсолютный приоритет.
Сейчас существует очень сильный тренд на использование расшифровки в закрытом контуре компаний, подчеркивает Архангельский. Например, адвокатские агентства, которые работают с "чувствительной" информацией, не используют любые сервисы расшифровки, если они не могут изолировать данные от остального интернета. При этом не имеет значения, отечественные это сервисы или зарубежные, считает эксперт. Этот тренд не зависит от внешнеполитической ситуации. Компании также не желают, чтобы их данные утекали отечественным конкурентам. "Мне в одной из госкорпораций сказали: мы не хотели бы, чтобы другая госкорпорация читала наши данные", - поделился эксперт. По оценкам Алексея Оносова, функционировать в полностью изолированной среде могут около трети сервисов расшифровки аудио.
Обучение качественного расшифровщика аудио требует комплексного подхода, поясняет Оносов. В основе программы должен быть набор данных с различными акцентами. Нужно адаптировать расшифровщик к специфическим условиям записи исходного аудио, например, шумам в операционной или зале судебных заседаний, а также к специфике языка - акцентам, особенностям лексики, профессиональным жаргонизмам. Для узкопрофильных специалистов, например, медиков или юристов, нужно дополнительно обогащать расшифровщик специализированными терминологическими словарями и обучать его на отраслевых материалах, отметил эксперт. Необходимо также применять современные методы машинного обучения с постоянно наблюдать за тем, как реальные пользователи взаимодействуют с продуктом, добавил Оносов.
Российские расшифровщики специализируются на конкретных корпорациях, индустриях и специфических словарях, подчеркивает Архангельский. В этом ещё одно преимущество отечественных сервисов для расшифровки. По словам эксперта, все иностранные сервисы обращаются к чату GPT, который обучен на общем массиве информации из сети Интернет. Из-за этого они не распознают специфические термины и аббревиатуры, утверждает Архангельский. Если запустить в чат GPT аудиозапись конференции, например, энергетической госкорпорации, то качество протокола будет низкое, потому что зарубежный сервис попытается расшифровать запись совещания, опираясь на общепринятые термины, поясняет эксперт.
Российские ИТ-специалисты обучают сервисы расшифровки на материалах тысяч совещаний, на которых используется специализированная терминология, рассказал Архангельский. "Мы добиваемся более точного попадания в специфику", - подчеркнул эксперт. Обучение отечественных сервисов для расшифровки проводится в российских компаниях, так как транскрибация напрямую зависит от языка. Для того, чтобы создать качественный расшифровщик, нужны сильные лингвисты, которые разбираются в структуре языка, отметил эксперт.
Архангельский рассказал, что отечественные решения в области расшифровки аудио появились ещё до конфликта России с западными странами. "В части стенограммы и автопротокола мы неплохо импортозаместили. В каких-то специфических корпоративных решениях мы даже опережаем", - подытожил Архангельский.