Top.Mail.Ru
Истории

Виталий Саттаров, Пётр Емельянов (UBIC Technologies): Как компаниям обмениваться данными, не обмениваясь ими

Истории
Софья Федосеева
Софья Федосеева

Независимый обозреватель, экс-редактор Rusbase

Софья Федосеева

По итогам прошедшей 4 октября 2019 года конференции Ai Stories, организованной Rusbase, публикуем подробные отчеты с выступлений всех спикеров. 

Виталий Саттаров, Пётр Емельянов (UBIC Technologies): Как компаниям обмениваться данными, не обмениваясь ими

Программа конференции была поделена на несколько блоков. 

  • Перспективы больших данных и искусственного интеллекта обсудили в блоке Next Big Thing
  • Для каких задач необходима технология получения информации из изображений и видеопотока, которая позволяет распознавать объекты реального мира без участия человека, разобрались в блоке «Компьютерное зрение»
  • О новом способе получения и анализа больших данных, о людях и их перемещениях без использования и обработки персональных данных рассказали спикеры блока «Геоаналитика»
  • Как множество различных датчиков, объединенных между собой проводными и беспроводными каналами связи и передающих данные, позволяют компьютеру получать представление о протекающих процессах и предпринимать определенные действия — рассказали спикеры блока «IoT и промышленные решения».
  • Как делать выводы на основе текстовой информации, обсудили в блоке «Текстовый анализ».

Неформальная часть конференции fAil Stories прошла при поддержке ODS Community. Практики рассказали про мифы и ошибки при работе с внедрением технологий искусственного интеллекта в бизнес.

Общий отчет с мероприятия можно найти по ссылкеОрганизационный партнер: Deworkacy Big Data.

Виталий Саттаров и Пётр Емельянов, представители UBIC Technologies, выступили в блоке Next Big Thing с темой «Как компаниям обмениваться данными, не обмениваясь ими». Они рассказали о применении протоколов совместных конфиденциальных вычислений в задачах машинного обучения.

Благодаря сервису Penxy мы можем поделиться с вами презентацией Виталия и Петра, которую можно не просто посмотреть, но и послушать. 

После выступления аудитория задавала вопросы спикерам. Мы публикуем «публичное интервью» с Петром и Виталием.

Хорошие модели машинного обучения обычно нелинейные. Получается, при разделении вычислений теряется информация о распределении данных и точность вычисления предсказаний будет хуже, чем без разделения.

Во-первых, как вариант, любую нелинейную функцию можно апроксимировать. Во-вторых, есть способы считать нелинейность как есть. Но они тоже довольно сложные и долгие. 

Ну и да, наверное, точность вычисления будет чуть-чуть хуже, но будет. А так не будет вообще.

Виталий, мне кажется, вопрос тебе. Какие правовые ограничения в России для использования MPC вы видите? Это же все равно будет работа с персональными данными. Насколько это легально?

Говорить о правовых ограничениях, когда правовой контекст очень быстро меняется, сложно. Какое-то время назад можно было телефон захешировать, и это было нормально – сейчас уже так нельзя. 

А в целом, ограничения, скорее, во времени, а не в технологиях – любому безопаснику, математику, инженеру, руководителю подразделения можно объяснить, что это безопасно, но на это уйдет время.

Как на уровне архитектуры нейросети делятся между сторонами?

Попробую объяснить. Нейросеть – это веса, линейная комбинация ходов и нелинейность, которая вычисляется в нейроне. Вот так и делится. 

Вес делится секретным образом. Грубо говоря, любое число можно разделить на некое количество случайных, но в сумме они дадут исходное – так делятся все веса. Собственно, это все что нужно. А дальше вычисления проводятся по MPC-протоколу, можно умножать, делить.

Смотреть все выступления.


Фото на обложке: Ai Stories

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Кто управляет данными в крупнейших российских компаниях
  2. 2 5 советов по использованию клиентских данных для развития бизнеса
  3. 3 История про типичную боль digital-проектов: как мы искали и нашли аналитика данных