2 ноября 2019 г.

Samsung: искусственный интеллект должен понимать человека

Можете ли вы представить себе мир, в котором личный помощник на базе искусственного интеллекта в вашем смартфоне способен понять столько же, сколько и вы? Как насчет сценария, в котором общаться с этим умным помощником так же естественно и просто, как и с другим человеком? Разработка подобных возможностей - это именно то, чем занимается команда центра исследования искусственного интеллекта Samsung в Торонто.


Журналисты ресурса Samsung Newsroom встретились с руководителем центра Свеном Дикинсоном, чтобы больше узнать об этом интересном направлении и о том, как здешние разработки приближают будущее. 

Видение для видения

Второй центр исследования искусственного интеллекта Samsung в Северной Америке решили запустить в канадском Торонто. Его возглавил доктор Свен Дикинсон, эксперт в области компьютерного зрения и бывший заведующим кафедрой компьютерных наук в Университете Торонто.

Находясь в эпицентре исследований и разработок в сфере интеллектуальных технологий, центр исследования искусственного интеллекта Samsung в Торонто в основном сосредоточился на создании возможностей визуального понимания. Такие возможности помогут устройствам Samsung не просто видеть, но понимать мир, в котором они находятся. 

Кроме того, команда работает над мультимодальными взаимодействиями. Это обмен данными между пользователем и цифровой системой, который предполагает наличие у обеих сторон собственного видения, понимания языка и определенной базы знаний.  

«Предоставление устройствам Samsung возможности «видеть мир» с помощью компьютерного зрения позволяет им «визуально обосновать» свой диалог с пользователем, предоставляя интегрированный мультимодальный интерфейс, который гораздо более естественен, чем тот, что основан исключительно на видении или на диалогах», - заявил Дикинсон, который занимался изучением задач, связанных с восприятием формы и распознаванием объектов.

Рассказывая о преимуществах мультимодальной технологии, Дикинсон отметил: «Мне не нужно читать руководства, чтобы выяснить, какие кнопки нажимать на моем устройстве и в каком порядке. Скорее я должен быть в состоянии показать своему устройству то, что я хочу, и сказать ему, чего я хочу, на естественном языке, который понятен и является частью мира, в котором я живу».

Экстраполируя это утверждение на взаимодействие между компьютерным зрением и мультимодальными входами, он продолжил: «Чтобы достичь такой широты восприятия, устройство должно иметь мою модель понимания мира, способность надежно и естественно общаться со мной и способность видеть и понимать тот же мир, что воспринимаю я».

Среди примеров применения этой технологии Дикинсон считает наиболее убедительным «личного помощника, который не только разговаривает с вами, но и видит мир таким же, как и вы». Говоря о важности взаимодействия мультимодальных устройств, Дикинсон подчеркнул, что отказ хотя бы от одного из способов общения (аудио, речь, зрение и т. д.) будет препятствовать общению между двумя людьми, и отметил, что это также относится к личным устройствам.

Действительно широкий опыт использования как ключ ко всему

На выставке потребительской электроники Consumer Electronics Show (CES) в 2019 году Samsung представила свое видение Connected Living (“подключенной жизни”). Эта концепция предполагает подключение к сети каждого из 500 миллионов устройств, которые компания продает ежегодно, и превращение их в умные гаджеты. 

Дикинсон подчеркнул, что широкое разнообразие продуктов Samsung будет способствовать реализации этого видения. Он добавил: «Samsung отличается тем, что у неё множество моделей техники для домашнего использования, включая цифровые устройства, телевизоры и мобильные телефоны. У Samsung есть уникальная возможность задействовать эту технику, чтобы получить опыт одновременной работы с несколькими устройствами, сопровождая пользователя от одного устройства к другому и от одной комнаты к другой. Это поможет реализовать весь потенциал каждого устройства для эффективной связи, даст пользователю возможность выполнять специфические для устройства задачи и изучить привычки и предпочтения пользователя, чтобы последующее общение было не навязчивым, но вместо этого “всегда полезным”».

Дикинсон рассказал, что необходимо сделать его центру, чтобы по-настоящему реализовать компьютерное зрение и мультимодальное взаимодействие: «Видение - это не понимание изображений; видение - это понимание мира. По-настоящему способные системы искусственного интеллекта должны обладать пониманием нашего мира, его физики и причинности, его геометрии и динамики. Они также должны уметь моделировать и понимать поведение человека». 

Эксперт добавил: «Когда наши устройства смогут видеть трехмерный мир, в котором мы живем, так же, как мы, то есть понимать трехмерные формы, положения и идентичность объектов в нашей общей среде, тогда наши устройства смогут визуально воспринимать мир так же, как мы. Такой общий визуальный контекст будет иметь решающее значение для разработки личных помощников, реализация которых выполнена в полной мере».

Дикинсон заявил: Samsung является лидером в области действительно интеллектуального визуального понимания. Эксперт назвал «визуальное заземление» значимой базой для всесторонних возможностей визуального понимания. Дикинсон добавил: «Samsung является лидером в разработке технологий взаимодействия между человеком и устройством, которое имитирует взаимодействие между человеком и человеком. Без таких компонентов пользователи разочаровываются в сервисах и быстро перестают работать с ними».

Взаимодействие человека с устройством на основе открытого обмена информацией

Дикинсон продолжил: искусственный интеллект также должен уметь объясняться  с пользователем. После того, как интеллектуальная система не выполнила задачу или не дала ожидаемого ответа, «устройство должно быть в состоянии точно сообщить пользователю, как и почему оно получило такой ответ (или его отсутствие). В идеале устройство должно быть в состоянии проконсультироваться с пользователем, задавая вопросы, или предложить пользователю настроить свою камеру или [активировать] другие режимы ввода, чтобы иметь возможность собрать больше информации и сформулировать соответствующий ответ». 

Дикинсон утверждает, что такая открытость и постоянный обмен информацией станет ключом к дальнейшему усложнению взаимодействия между человеком и устройством. Эксперт добавил: «То, что мы называем областью «активного диалога и активного видения» - это область, в которой система может построить ментальную модель того, что пользователь понимает, и она, в свою очередь, может открыть свою собственную ментальную модель, чтобы пользователь мог понять мыслительные процессы устройства».

Преимущества размещения в Торонто

Отвечая на вопрос о том, как выбор Торонто в качестве места для создания центра исследования искусственного интеллекта отражается на работе организации, Дикинсон отметил: центр получил множество плюсов за счет близости к различным учреждениям мирового уровня, связанным с искусственным интеллектом, включая Университет Торонто, Йоркский университет и Университет Райерсон. Дикинсон подчеркнул: «Размещение в Торонто дает нам огромное региональное преимущество. Мы находимся через дорогу от Университета Торонто, где расположен факультет компьютерных наук, который входит в десятку лучших международных факультетов компьютерных наук. Более половины членов нашего центра исследования искусственного интеллекта преподают, учатся на факультете компьютерных наук или окончили его».

Что касается сотрудничества между глобальными центрами искусственного интеллекта Samsung, Дикинсон отметил: «Семь глобальных центров искусственного интеллекта работают над созданием передовых отраслевых решений в соответствующих областях своей деятельности, координируя усилия для достижения общей цели, которая заключается в реализации всеохватывающего видения Samsung в сфере искусственного интеллекта». Говоря о сотрудничестве центра исследования искусственного интеллекта в Торонто с другими центрами, эксперт добавил: «Мы начинаем изучать возможности сотрудничества в области исследований с другими глобальными центрами искусственного интеллекта и надеемся объединить усилия в отношении некоторых полезных вариантов использования для Samsung, его продуктов и сервисов».

Также вам будет интересно