Новости > Цифровая экономика

15.01.2020

Центр компетенций НТИ на базе МФТИ проанализировал главные тренды технологии машинного зрения

Третий альманах по искусственному интеллекту, подготовленный Центром, посвящен технологиям Computer Vision
Самыми актуальными тенденциями для разработчиков машинного зрения в 2019 году стали генеративно-состязательные сетей (GANs) для генерации изображений и видео, ускорение и упрощение моделей машинного зрения для их повсеместного внедрения, высокореалистичный фото- и видеоконтент, нейроаватары и синтезированная виртуальная 3D-среда для обучения алгоритмов. 

Обзор текущего состояния технологий машинного зрения и прогнозы дальнейшего развития этой области представлены в третьем выпуске альманаха «Искусственный интеллект». Исследование подготовлено специалистами Центра компетенций НТИ по направлению «Искусственный интеллект», работающего на базе Московского физико-технического института.

Альманах был подготовлен на основании анализа открытых источников, патентов, научных публикаций, сайтов университетов и компаний. Другим источником при подготовке альманаха стал опрос экспертов индустрии, путем анкетирования через Google Forms. При этом в исследовании не вошли кейсы использования машинного зрения в оборонных целях, так как по ним нет открытой достоверной информации.

В альманахе представлен таймлайн развития технологий машинного зрения. Как следует из инфографики, первый алгоритм цифровой обработки изображений был написан еще в 1960 году. А первое действительно интересное применение нейросетей, которое освещали СМИ, состоялось в 1993 году, - это было решение по распознаванию рукописных цифр.

В третий выпуск вошел обзор кейсов глубинного обучения (создания сверточных нейронных сетей) на базе машинного зрения, а также топ-лист специалистов в области компьютерного зрения. Авторы альманаха подготовили список главных трендов технологии машинного зрения.

Технологические тренды 

1) Для восстановления и синтеза изображений все больше используются генеративно-состязательные сети (GANs). Это подход, в котором две сети соревнуются между собой, одна пытается создать реалистичное изображение, вторая пытается отличить синтезированное изображение от настоящего. Такой подход будет распространяться все шире и использоваться для создания фотореалистичного контента для игр и виртуальных сред, восстановления фрагментов и улучшения качества фотографий, видео, а также для генерации еще более реалистичных deepfake.

2) Новые уровни в Computer vision, как правило, достигаются за счёт увеличения размеров нейронных сетей и размеров датасетов. В результате, обучение большой модели на датасете типа JFT (закрытый датасет Google, размером 300 млн изображений) под силу только большим компаниям. Но уже готовая обученная модель может быть выложена в сеть и тогда каждый желающий может доучить ее на своем маленьком датасете для своей конкретной задачи. Таким образом, большие базовые модели будут создаваться и обучаться большими корпорациями, а маленькие компании будут доучивать их на своих датасетах.

3  NAS (Neural Architecture Search) — алгоритм выбора архитектуры нейросети и оптимизации ее гиперпараметров под конкретный датасет и задачу (классификация, сегментация и др.). Алгоритм NAS находит архитектуру, следуя стратегии поиска, которая максимизирует производительность. Данный метод является крайне перспективным для быстрого решения многочисленных прикладных задач в области машинного обучения. 

4 Наблюдается бум методов ускорения/упрощения моделей для их повсеместного внедрения. Технологии будут становиться всё более универсальными, легко адаптируемыми для конкретных задач. Нейросетевые модели станут легче и будут работать быстрее на любых устройствах, например, на мобильных телефонах или камерах наблюдения. В результате будет становиться все больше «умных» устройств с ИИ-функционалом.

Рыночные тренды

1 Сейчас для генерации высокореалистичного фото- и видеоконтента используются генеративно-состязательные сети, Generative Query Network, сверточные нейронные сети (convolutional neural network, CNN). Текущий уровень развития моделей машинного обучения позволяет создавать анимацию с высоким разрешением из одного изображения, генерировать синтетические фотографии людей, не отличимые от оригинальных.

2 Будет появляться все больше облачных сервисов по рендерингу изображений на базе тяжелых вычислительно емких моделей машинного обучения. Мы сможем играть на мобильном телефоне в игры с потрясающей графикой, которая будет рендериться на удаленном сервере, а готовая картинка будет доставляться на телефон. С ростом пропускной способности сети (5G/6G) это станет обычным делом.

3 Еще одним применением для высококачественной синтезированной графики станет обучение новых нейросетей, например, моделей беспилотных автомобилей. Если мы сможем синтезировать качественное видео, где все данные уже размечены, то это сильно удешевит и ускорит обучение новых моделей. Это будет отдельный новый растущий рынок — синтезированные виртуальные 3D-среда для обучения алгоритмов.

4 Нейроаватары — трехмерные цифровые модели объектов, создающиеся при помощи нейронных сетей на основе всего одного изображения. Сеть, обученная на большой выборке моделей, лишь по одному изображению строит достаточно качественную 3D-модель объекта. Данная технология может использоваться для телеприсутствия и проецирования трехмерной голограммы.

5 Уже сейчас появляются новые форматы видео, позволяющие людям ориентироваться в увеличивающемся объеме контента. Применение машинного обучения существенно позволяет облегчить создание такого видео, в частности за счет автоматической разметки и наложения текста.

6 Повсеместное внедрение технологий распознавания лиц позволит расплачиваться, просто посмотрев на камеру и проходить через турникеты без всяких карточек доступа. Будут подключаться дополнительные каналы биометрии — радужка глаз, распознавание мимики и характерных движений и т.д. 

7 С ростом внедрения и популярности технологий биометрии с такой же скоростью будет расти арсенал техник взлома биометрии, в том числе с помощью adversarial attacks. Нам предстоит увидеть не один раунд увлекательной борьбы технологий. Одной из специфических областей такой защиты и нападения уже стали deepfake изображения. И дальше волна борьбы с deepfake будет только нарастать. Эта область будет расти быстрее остальных областей Computer Vision.


«Искусственный интеллект» — это регулярный сборник аналитических материалов. Предназначен для широкой аудитории, интересующейся технологиями ИИ и перспективами их прикладного использования. Прочитать новый выпуск можно на сайте альманаха.

Первый выпуск альманаха «Искусственный интеллект» был опубликован в июне 2019 года. Он представлял собой обзор текущего состояния отрасли ИИ в России и мире, включая основные технологии и их применение, ключевые компании, университеты, исследователей и лидеров мнений. В первом выпуске альманаха был опубликован обзор стратегий мировых лидеров в области ИИ и возможная стратегия России в области ИИ

Второй выпуск, вышедший в сентябре, включал обзор речевых технологий искусственного интеллекта: обработка естественного языка, распознавание и синтез речи. В альманахе были опубликованы статьи о перспективах применения речевых технологий, обзор ведущих компаний и научных команд, тренды и прогнозы.

#искусственный интеллект

Еще по теме

17.07.2020 Конкурс NEUROTECH CUP 2020 – срок подачи заявок продлен

02.04.2020 На конкурс World AI & Data Challenge открыт прием задач по борьбе с COVID-19

31.03.2020 В Иннополисе анонсировали разработку онлайн-сервиса, способного выявлять больных с коронавирусной пневмонией

11.03.2020 В финале Олимпиады НТИ по искусственному интеллекту спрогнозировали расходы клиентов банка

27.02.2020 Первые национальные стандарты для ИИ в медицине разработают в 2020 году

25.02.2020 Дорожные карты по внедрению ИИ в транспорте и в других отраслях спроектирует Минэкономразвития

25.02.2020 Ассоциация НБМЗ заключила соглашение по акселерации систем поддержки принятия врачебных решений

12.02.2020 Законопроект о введении в Москве особого правового режима для развития ИИ планируется принять уже в марте

12.02.2020 АСИ и Всемирный банк организовали международный конкурс World AI&Data Challenge

17.01.2020 Дмитрий Песков обозначил главные вызовы для цифровой трансформации медицины

string(3) "!!!" array(14) { ["ID"]=> string(4) "3898" ["~ID"]=> string(4) "3898" ["NAME"]=> string(100) "Цифровое развитие регионов – от практиков и экспертов" ["~NAME"]=> string(100) "Цифровое развитие регионов – от практиков и экспертов" ["DATE_CREATE"]=> string(19) "12.11.2019 20:31:56" ["~DATE_CREATE"]=> string(19) "12.11.2019 20:31:56" ["PROPERTY_LINK_VALUE"]=> string(34) "https://rf2035.net/labs/faculty/2/" ["~PROPERTY_LINK_VALUE"]=> string(34) "https://rf2035.net/labs/faculty/2/" ["PROPERTY_LINK_VALUE_ID"]=> string(5) "13039" ["~PROPERTY_LINK_VALUE_ID"]=> string(5) "13039" ["PREVIEW_PICTURE"]=> string(4) "4044" ["~PREVIEW_PICTURE"]=> string(4) "4044" ["SORT"]=> string(3) "500" ["~SORT"]=> string(3) "500" }

Принять участие

8, 11, 15, 18, 22, 25 июня 2020 года

Искусственный интеллект в медицине

Мероприятия НТИ

Подписка на обновления

«Информбюро 20.35» делает почтовую рассылку самых интересных публикаций один раз в неделю. Чтобы подписаться на нее, зарегистрируйтесь или войдите через свою учетную запись на платформе leader-id.ru.