Sberbank_robotics_review_2019_watermark
.pdfvk.com/id446425943
АНАЛИТИЧЕСКИЙ ОБЗОР МИРОВОГО РЫНКА РОБОТОТЕХНИКИ
201
05 Искусственный интеллект в робототехнике
способами, не привлекая инженерную команду для кропотливой настройки.
В ходе работы над проектом был решён ряд задач, с которыми сталкиваются, например, на складах при сборке заказов и в распределительных центрах при сортировке посылок:
01.Захват объекта, который находится в произвольном положении и ориентации;
02.Захват объекта, который может быть деформируемым;
03.обобщение решения на объектах разных цветов и размеров;
04.захват объекта в заданной точке таким образом, чтобы было известно его положение в захватном устройстве, чтобы можно было осуществлять дальнейшие целенаправленные манипуляции.
Поставленная цель была достигнута за счёт поиска на реальном объекте ключевых точек, которые задаёт оператор на изображении объекта.
В качестве аппаратного обеспечения были использованы: коллаборативный манипулятор
Universal Robots UR10, пятипалый захват Schunk SVH
и камера глубины Intel RealSense.
Для распознавания категории объекта, который располагается в рабочей области робота, была использована нейронная сеть ImageNet. Для поиска ключевых точек — свёрточная нейронная сеть Dense Object Net. Были разработаны модули автоматического сбора и предобработки информации для обучения нейросети на имеющихся моделях робота и камер глубины; модули распознавания и локализации ключевых точек; модуль формирования способов захвата для категории объектов и модуль выполнения захвата и дальнейших манипуляций.
Процесс обучения робота захвату нового класса объекта состоит из нескольких шагов.
01.Робот «осматривает» объект с разных сторон, записывая RGBD видео.
02.На основе RGBD-видео осуществляется реконструкция 3D-модели объекта.
03.На основе 3D-модели, карты глубин и кадров из видео строится обучающая выборка для нейронной сети.
04.Нейронная сеть обучается сопоставлять точки на изображениях объекта с точками на 3D-модели объекта.
05.Оператор задаёт ключевые точки (характерные для данной категории объектов).
vk.com/id446425943
АНАЛИТИЧЕСКИЙ ОБЗОР МИРОВОГО РЫНКА РОБОТОТЕХНИКИ
202
05 Искусственный интеллект в робототехнике
06.Оператор показывает роботу, как нужно брать объект необходимым для частной задачи способом (например, в режиме free-drive
или с помощью копирующего устройства).
Продолжительность обучения захвату новой категории объектов зависит от реализации программного обеспечения и используемого оборудования. В текущей лабораторной версии весь конвейер от подготовки данных до первого захвата занимает порядка трёх часов. После обучения робот готов к захвату объектов нового класса (даже если мы меняем цвет, форму, положение, ориентацию или размер объекта).
01.Робот «осматривает» объект с разных сторон, делая фотографии.
02.Нейронная сеть находит на фото ключевые точки, ранее определённые оператором.
03.С помощью камеры глубины найденные точки локализуются на поверхности реального объекта.
04.Робот подбирает наиболее подходящий из способов захвата, определённых оператором на этапе обучения, и планирует движения, аналогичные этому способу для текущего положения и ориентации объекта.
05.Робот выполняет захват объекта и цепочку дальнейших манипуляций с ним.
Логистический робот
Это автономное наземное транспортное средство — мобильный робот. Он предназначен для доставки товаров и ценностей в помещениях рядом с людьми. Его польза состоит в повышении экономии времени сотрудников банка за счёт автоматизации рутинных операций. У робота есть преимущество перед традиционной курьерской доставкой: уровень конфиденциальности перевозимого груза повышается благодаря исключению человеческого фактора.
Робот умеет перевозить грузы весом до 15 кг, выдавать их по ПИН-коду или по лицу получателя (используя Face Recognition), ориентироваться
в сложных условиях и эффективно маневрировать среди людей, для большей безопасности есть несколько контуров защиты, в том числе физический.
В роботе используется широкий стек технологий для решения задач расчёта кинематики и динамики, планирования и контроля перемещений, локализации и навигации и других. Некоторые задачи эффективно решаются с применением искусственного интеллекта, например:
01.при помощи алгоритмов Random forest и нейронных сетей робот определяет
vk.com/id446425943
АНАЛИТИЧЕСКИЙ ОБЗОР МИРОВОГО РЫНКА РОБОТОТЕХНИКИ
203
05 Искусственный интеллект в робототехнике
вероятность нахождения людей рядом с собой. Эта вероятность учитывается при планировании перемещений робота
и для избежания столкновений. Источником данных для алгоритмов служит лазерный дальномер (лидар), установленный на роботе, который с заданной частотой отправляет на вход алгоритма вектор координат;
02.Для детекции и распознавания лиц при получении груза используются нейронные
сети — многозадачная каскадная нейронная сеть (MTCNN) и остаточная нейронная сеть (ResNet).
Цифровой двойник Елена
Цифровой двойник — решение, позволяющее получать фотореалистичный видеоматериал из произвольного текста. Его уникальность в том,
что это первое подобное решение на русском языке.
Сфера применения технологии широка, цифровой двойник может выполнять работу телеведущегодиктора: для этого нужно обучить ансамбль нейронных сетей на датасетах из нескольких десятков часов записей голоса диктора и видеозаписей с актёром. После обучения
достаточно подать на вход текст, чтобы получить видеоряд, на котором ведущий будет озвучивать заданный текст с соответствующей мимикой на лице. Плюсом применения нейронных сетей
является получение возможности воспроизведения
голосом и мимикой любого произвольного текста с определёнными допущениями, даже с использованием различных языков, т. е. тот текст, который не произносили диктор и актёр при записи датасета.
В общем виде создание видеоряда можно представить в следующем виде:
01.исходный текст подаётся на модуль синтеза речи;
02.синтезируется речь (звук) и передаётся в модуль генерации лица;
03.генерируется лицо — формируется геометрия губ, зубов и лица на основе звука, затем компоненты лицевой геометрии выравниваются с лицом, формируются динамические текстуры и осуществляется композинг текстур с получившейся 3D-моделью;
04.звук синтезированной речи объединяется с видеоизображением сгенерированного лица.
Для синтеза речи используется рекуррентная нейронная сеть (RNN), а для задач генерации изображения лица — свёрточные (CNN). При этом в различных исполнениях решения возможно использование и других видов нейронных сетей, таких как LSTM и GAN.
vk.com/id446425943
АНАЛИТИЧЕСКИЙ ОБЗОР МИРОВОГО РЫНКА РОБОТОТЕХНИКИ
204
05 Искусственный интеллект в робототехнике
4. Обзор компаний, которые занимаются исследованием и развитием ИИ в робототехнике,
их классификация
На сегодняшний день конкуренция на рынке робототехники и искусственного интеллекта, как никогда, высока. Все большее количество крупных технологических (и не только) компаний ставит приоритетом развитие данных областей внутри организации, помимо этого, возникает множество стартапов, целью которых является
создание интеллектуальных роботов, которые могут найти применение в большом спектре направлений.
Согласно прогнозам BusinessWire, к 2023 г. мировая индустрия интеллектуальных роботов достигнет $14,3 млрд, что почти в три раза выше аналогичного показателя в 2018-м, который составил $4,9 млрд (в среднем за пять лет показатель ежегодно увеличивался на 23,7%)127.
Ассоциация потребительских технологий США (Consumer Technology Association, CTA) предложила использовать следующую классификацию компаний, которые специализируются на разработке и исследованиях в областях
искусственного интеллекта и робототехники.
CTA предлагает делить компании на Enabler, Engager
и Enhancer.
1. Enabler — компании, которые разрабатывают и поставляют составные компоненты (блоки)
для областей робототехники или искусственного интеллекта, такие как современное оборудование, системы/автомобили с автономным управлением, базы данных, используемые для машинного обучения.
Рисунок 141. Классификация компаний на рынке ИИ и робототехники (Consumer Technology Association)
Enabler |
Engager |
Enhacer |
Разработка и поставка |
Проектирование, создание |
Предоставление услуг в рамках |
составных компонентов |
или поставка разработок в форме |
полноценной экосистемы |
(блоков) |
конечных продуктов, ПО, систем |
(value-added services) |
vk.com/id446425943
АНАЛИТИЧЕСКИЙ ОБЗОР МИРОВОГО РЫНКА РОБОТОТЕХНИКИ
205
05 Искусственный интеллект в робототехнике
2.Engager — компании, которые проектируют, создают или поставляют разработки в областях робототехники и/или искусственного интеллекта в форме конечных продуктов, программного обеспечения или систем.
3.Enhancer — компании, которые предлагают пользователям различные услуги в рамках полноценной экосистемы (value-added services)129.
Среди компаний классов Enabler и Engager много стартапов и небольших компаний, которые недавно вышли на рынок. В свою очередь в класс Enhancer попадают крупные компании, которые уже предоставляют сложившуюся сервисную и продуктовую экосистему на рынке, а с помощью
ИИ и робототехники хотят укрепить свои позиции.
Существуют различные подходы к оценке успешности компании, её значимости на рынке и привлекательности для инвесторов. Один
из подходов представлен на Crunchbase — платформе для поиска деловой информации о частных и публичных компаниях (спектр представленных компаний варьируется от стартапов до гигантов отраслей).
Публикации Crunchbase включают информацию об инвестициях и финансировании, учредителях компании и частных лицах на руководящих должностях, слияниях и поглощениях, новостях и тенденциях в отрасли.
Рейтинг компаний Crunchbase создаётся
на основании ранжирования компаний, которые рассчитываются в режиме реального времени, принимая во внимание множество факторов. Ранг компании является изменчивым и может со временем расти и падать в зависимости от событий, таких как запуск новых продуктов, новые финансовые поступления, изменения
в руководстве и т. д. Всё это оказывает влияние на место компании в общем рейтинге130,131.
Для большей наглядности рассмотрим рейтинг компаний с применением фильтров по двум категориям — ИИ и робототехника. Таблица 9 содержит Топ компаний-лидеров
в обеих областях, по мнению Cruchbase. На первых позициях рейтинга находятся как крупнейший
идавно закрепивший за собой ведущие позиции представитель индустрии — NVIDIA, так и совсем недавно возникшие узкоспециализированные компании меньшего охвата, такие как Brain Corp
иVicarious.
В данном рейтинге преобладают компании из США, а также Китая, что подтверждает тот
факт, что эти страны на текущий момент являются лидерами, которые задают основные тенденции в указанных индустриях.
vk.com/id446425943
АНАЛИТИЧЕСКИЙ ОБЗОР МИРОВОГО РЫНКА РОБОТОТЕХНИКИ
206
05 Искусственный интеллект в робототехнике
Таблица 9. Топ компаний, которые относятся к категориям ИИ и «робототехника»*
№ |
Компания |
Объём |
Ранг CB |
Локация |
|
|
инвестиций |
|
|
1 |
NVIDIA |
$4B |
95 |
Санта-Клара, Калифорния, США |
2 |
NEXT Future Transortation |
$5M |
258 |
Сан-Хосе, Калифорния, США |
3 |
Starship technologies** |
$42.2M |
281 |
Сан-Франциско, Калифорния, США |
4 |
Horizon Robotics |
$700M |
348 |
Пекин, Китай |
5 |
Ripcord |
$80M |
509 |
Хейвард, Калифорния, США |
6 |
Argo AI |
$1B |
521 |
Питтсбург, Пенсильвания, США |
7 |
Aeye, Inc. |
$59.1M |
864 |
Плезантон, Калифорния, США |
8 |
WorkFusion |
$121.3M |
1079 |
Нью-Йорк, США |
9 |
Zymergen |
$574.1M |
1196 |
Эмеривилл, Калифорния, США |
10 |
UBTech Robotics** |
$940M |
1398 |
Шэньчжэнь, Китай |
11 |
Brain Corp |
$125M |
1448 |
Сан-Диего, Калифорния, США |
12 |
Pensa Systems |
$7.2M |
1624 |
Остин, Техас, США |
13 |
Vicarious |
$122M |
2116 |
Сан-Франциско, Калифорния, США |
14 |
Bossa Nova Robotics |
$69.6M |
2120 |
Сан-Франциско, Калифорния, США |
Источник: https://www.crunchbase.com