Что каждый должен знать об искусственном интеллекте

Об искусственном интеллекте нужно знать, что он несовершенен и неточен в наши дни, и в определённых отраслях полагаться на него рискованно.

Сегодняшняя тема будет развиваться от частного к общему и завершится перспективами.

Под частным имеется в виду применение искусственного интеллекта в фэйскодинге. В данном контексте искусственный интеллект – это компьютерные программы, которые в автоматическом режиме сканируют эмоции по лицам людей. Иными словами, если в Эмоционикс используется человеческий ресурс для сканирования микровыражений — просто «фэйскодинг» (facial coding), то использование программы искусственного интеллекта — это автоматизированный фэйскодинг (automated facial coding).

И под общим, соответственно, подразумевается применение «компьютерного мозга» в других сферах жизни.

Нынешнее положение искусственного интеллекта в фэйскодинге

Начну с описания своих поисков совершенной автоматизированной системы для сканирования микровыражений, которую можно было бы применять в работе Эмоционикс. В конце концов, надёжное программное обеспечение (ПО) способствовало бы сокращению:

  • Издержек на персонал, поскольку программа заменила бы людей
  • Времени на обработку видеозаписей респондентов – ПО сразу за один просмотр выдаст результаты, человеку же зачастую несколько раз необходимо просмотреть одну видеозапись

Есть несколько крупных компаний-поставщиков данных систем. И все они, как правило, заявляют о 90%-й точности.

Естественно, необходимо было их проверить на предмет корректного определения микровыражений.

По результатам моего самостоятельного тестирования демо-версий ПО и видео-презентаций примеров их работы выяснилось, что автоматические системы далеко не всегда точно определяют эмоциональные состояния респондентов.

Например, такая программа может спутать осознанное восклицание/сомнение (поднятые брови) с эмоцией грусти.

Мы уже знаем из «Как могут проявляться базовые эмоции на лице», что для грусти характерны поднятые внутренние уголки бровей. И при поднятых полностью бровях система может не опознать поднятых внешних уголков – идентифицирует только часть движения, как в примере:Два последовательных скриншота из видео-презентации программы. Брови явно подняты и с внутренней, и внешней стороны, но столбец «Sad» (грусть – фиолетовый в правой части) вырос. Модель лица (слева) демонстрирует приподнятые внутренние уголки бровей и открытый рот, что не совсем соответствует действительности.

Более того, распознать поднятые брови совсем несложно для человеческого глаза, в отличие от других движений. Например, отличить дежурную улыбку от искренней. Такая погрешность может нанести вред тестируемым стимулам: продукту, рекламе или контенту. По той причине, что успешные маркетинговые элементы можно таким образом отнести к провальным и наоборот.

Почему системы искусственного интеллекта допускают такие неточности?

В одной компании-производителе мне не дали прямого ответа, насколько действительно точна их система, и выслали свои расценки на ПО. В другой компании ничего не ответили и впоследствии отправляли только информационные письма в рамках корпоративной email-рассылки.

Не являюсь специалистом по искусственному интеллекту, но полагаю, ответ кроется в сложности самого по себе считывания микровыражений.

Как мы знаем из «Как измерить эмоции потребителя или что такое фэйскодинг», на лице могут отражаться более 7 тысяч комбинаций выражений. Это примерно столько же, сколько иероглифов в японском языке. Помимо этого, для каждого движения есть 5 видов интенсивности – получаем примерно 35 тысяч сочетаний. Ещё стоит включить сюда физиогномические особенности каждого человека: у некоторых людей глубоко посажены глаза, у кого-то уголки губ в спокойном состоянии направлены вниз и прочее.

Также нужно учитывать тайминги – если микровыражение длится, к примеру, более 2-х секунд, это тоже может быть признаком не эмоции.

В сканировании лицевых движений довольно много тонкостей, для которых искусственный интеллект пока что недостаточно умён.

Помимо собственного тестирования, я посчитал нужным проконсультироваться с авторитетными в этой отрасли экспертами, которые могли бы дать объективную оценку работе искусственного интеллекта. На случай, если вдруг существует мало кому известная, но достоверная автоматическая система, которая не входила в список рассматриваемых.

Например, Sensory Logic, наш американский партнёр, намеренно использует человеческий ресурс вместо искусственного интеллекта. По проведённым исследованиям, точность автоматических программ составляет 40-50% в лучшем случае. Это равносильно методу угадывания, иначе говоря. Также такое ПО не распознаёт:

  • микровыражения во время речи
  • слабозаметные мгновенные микровыражения
  • комбинации эмоций

В случае Sensory Logic можно возразить, что они заинтересованы, поскольку сами применяют фэйскодинг в маркетинге. Да, как и Эмоционикс. Хотя с учётом затрат на персонал и временных издержек, это едва ли имеет смысл.

Наконец, оставался ещё Пол Экман – самая авторитетная фигура во всей отрасли фэйскодинга (facial coding). Без него мир бы просто не знал самого понятия «микровыражения».

Напомню, Экман – ученый, начавший (не маркетинговые) исследования в 60-х годах прошлого века, чтобы подтвердить или опровергнуть теорию Дарвина об универсальности лицевых экспрессий.

Теория подтвердилась, и к 1978 году он создал FACS (Facial Action Coding System) – мировой стандарт у всех компаний по фэйскодингу, как использующих, так и не использующих искусственный интеллект.

Пол Экман работал в том числе на спецслужбы, чтобы помогать разоблачать «врагов государства» и ловить террористов в аэропортах с помощью анализа микровыражений. В СМИ он известен по развлекательному телесериалу «Обмани меня», где являлся консультантом. Также помогал создавать графику лиц мультипликаторам Pixar в рамках «Игрушечная история» и DreamWorks – в «Шрек». Ведёт совместные проекты с Далай-Ламой.

Стоит заметить, что Экман не похож на того, кто каким-либо образом отстаивает применение FACS в маркетинге. Он скорее за использование инструмента в таких областях, как психология, медицина, правопорядок, национальная безопасность.

Поэтому его оценку, думаю, можно считать относительно непредвзятой.

В 2014 году Пол Экман написал в своём блоге, что автоматические системы распознавания микровыражений, существующие на рынке, «примитивны или несовершенны».

С другой стороны, с 2014 прошло уже 3 года и искусственный интеллект тоже, наверное, не стоит на месте.

Поэтому я решил задать вопрос непосредственно его организации о том, насколько развиты автоматизированные системы на данный момент, и какие именно разработчики производят наиболее надёжные ПО.

В Paul Ekman Group ответили, что в настоящее время они не одобряют эти технологии.

Поиски не увенчались успехом.

Нынешнее положение искусственного интеллекта в других областях

Если говорить о состоянии искусственного интеллекта в целом, применительно не только к фэйскодингу, то вспоминается авария автопилотируемого Tesla в 2016 году, в результате которой погиб человек.

Илон Маск недавно высказал предостережение, что искусственный интеллект – это «самый большой риск, с которым сталкивается цивилизация».

Он скептически относится к этим технологиям на данном этапе, и его поддерживают многие учёные, в том числе Стивен Хокинг.

В целом, положение искусственного интеллекта на данном этапе можно охарактеризовать следующим образом:

Перспективы искусственного интеллекта

Как уже говорилось, точные автоматизированные системы для распознавания эмоций в сфере маркетинга сократят людские издержки и время на обработку данных.

Пол Экман в той же своей записи 2014 года сказал, что он участвует в разработках совершенной системы анализа микровыражений с искусственным интеллектом и что она скоро появится. Судя по себе, думаю, что исследователи в маркетинге встанут первыми в очередь за таким «айфоном».

На создание самоуправляемого автомобиля Маск выделяет миллиард долларов и говорит, что через 20 лет нынешние авто станут развлечением вроде поездки на лошади, нежели средством передвижения.

Будем надеяться, что больше половины пути уже пройдено в этом направлении и скоро будут разработаны роботы, распознающие эмоции, и автомобили на автопилоте.

К сожалению, на данный момент, как бы ни было велико стремление интегрировать новые технологии во все сферы жизни, не стоит принимать или выдавать желаемое за действительное. И несмотря на то, что в маркетинге применение неточного искусственного интеллекта никого не убьёт, это может обернуться большими денежными потерями.

 

 

 

 

 

 

 

 

Кирилл Трон

Основатель Эмоционикс

 

Нажмите, чтобы поделиться статьёй в Facebook


 

Оставьте комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *