Мнение эксперта

Денис Матюхин
Председатель совета директоров и основатель ГК «Аэроклуб»

Искусственный интеллект – будущее туризма?

Каким потенциалом обладают технологии искусственного интеллекта (ИИ), что они могут предложить туристической индустрии, превосходят ли они возможности традиционных поисковых систем и менеджеров, какие у них перспективы в России? Разбираемся вместе с председателем совета директоров и основателем «Аэроклуба» Денисом МАТЮХИНЫМ.

За последние несколько лет на рынке сложилась благоприятная ситуация для использования высоких технологий: высокие мощности процессоров позволяют быстро обрабатывать большие объемы данных, научные исследования в области машинного обучения достигли больших успехов и применяются во многих областях. Неудивительно, что все больше компаний начинают применять в своей работе технологии искусственного интеллекта. Стартапы гремят по всему миру и привлекают огромные инвестиции в свои проекты, а титаны бизнеса вкладывают миллионы рублей в разработки на базе алгоритмов ИИ.

Денис, как обстоит ситуация с ИИ на российском рынке?

Начать лучше не с ИИ, а с данных, потому, что без данных ни о каком ИИ речи идти не может.

В России туристическая индустрия делится на два больших пласта – это оффлайн-компании и автоматизированные компании. Соотношение на данный момент, по моей оценке, 70% на 30%. Первые не могут себе позволить автоматизировать процесс работы или не хотят и все запросы обрабатывают вручную. Для второго пласта характерен достаточно высокий уровень автоматизации, сюда относятся и те, кто занимается самостоятельным развитием технологий продуктов, оптимизирует внешние и внутренние бизнес-процессы. Стоит выделить компании, использующие системы типа «Портбилет» «Випсервиса», чтобы хоть как-то оторваться от оффлайна и стать более прогрессивными.

Понятно, что ИИ может быть только у представителей второй группы.

Представим, что компания полностью автоматизировалась, отошла от работы оффлайн, и у нее появилась возможность собирать данные о клиенте. Встает вопрос - зачем? Большинство компаний делает это для того, чтобы выставить счет и получить минимальную статистику для клиента. Теперь внимание: при выписке билета агентство получает большой объем данных - 200-300 полей, из них в работу пойдет не больше 50 полей плюс несколько для сбора статистики, все остальное, можно сказать, просто выбрасывается. То есть, из 100% данных сохраняется не больше 20%.

Зачем нужны остальные 80% данных?

К примеру, клиент хочет перелет Москва – Санкт-Петербург, летают туда часто. Компания отправляет запрос системе, и та выдает 300 вариантов. Из них клиент выберет один, и именно его система сохранит, а остальные 299 вариантов сотрет. То есть, в будущем никто не сможет сказать, из каких именно 300 вариантов перелета клиент выбрал подходящий и почему. Получается, что, получив новый запрос от этого клиента, никто не сможет сделать анализ принципа выбора клиента, то есть не будет машинного обучения, и, как следствие, вы в будущем не сможете обратиться к «предыдущему опыту работы с этим человеком» и сразу предоставить ему подходящий вариант.

Мы отошли от такой модели работы в 2014 году. Именно тогда мы поняли, что важно сохранять данные по всем полям, включая время вылета, номер рейса, аэропорт вылета, выбранное пассажиром кресло и многое другое.

Значит, основные проблемы автоматизации и ИИ на рынке сосредоточены вокруг сбора данных и машинного обучения?

Нет. Если представить, что компания обладает всеми необходимыми данными о предпочтениях клиента, возникает другая проблема – проблема хранения big data.

Когда компания сохраняет порядка 10-20% данных запроса, они спокойно могут уместиться на двух-трех серверах, стоимость обслуживания которых составляет около 10 тысяч долларов США в год за каждый. Если же хранить все данные, отправленные клиенту по запросу, то через очень короткое время стоимость их содержания и хранения будет исчисляться десятками тысяч долларов США в месяц. Не все могут позволить себе подобные расходы, потому что с клиента сервисный сбор за хранение данных взыскать не получится.

Теперь представим себе, что есть агентства, которые сохраняют запросы и ответы клиентов, у них огромный data-центр… И вновь сталкиваемся с проблемой - они хранят так называемые «грязные данные», которые нужно систематизировать перед использованием.

И как же это сделать?

Нужен «инструмент» типа business intelligence (business intelligence – компьютерные методы и инструменты, позволяющие интерпретировать большое количество данных, заостряя внимание лишь на ключевых факторах. Ред.), который позволит обратиться только к нужной «ячейке информации». Это означает, что компаниям, желающим автоматизироваться, нужно не просто собирать данные, им нужно создать правильную базу данных с правильно структурированной информацией.

А как правильно наращивать базы данных, чтобы информация была структурирована?

Необходимости начинать процесс «искусственно» нет. Обладая всеми необходимыми данными, со временем компания сама по себе начнет оптимизацию.

Представим, что 20% запросов компании приходится на рейс Москва – Санкт-Петербург на дату N. Бессмысленно постоянно узнавать о наличии мест и всего остального, если через каждые 20 минут приходит идентичный запрос. В игру включается оптимизация процесса на уровне кэша, который, кстати, тоже нужно оптимизировать и понимать, насколько быстро он «протухает» - это зависит от потока клиентов.

Теперь, после оптимизации, появляется возможность «прогнозировать» клиента. А что, если в ответ на запрос предложить клиенту вариант, выбранный другим пассажиром, с идентичными параметрами?

Здесь важно обратить внимание на то, что, если клиент уже путешествовал с компанией, то предугадать его предпочтения легче, есть на что опереться. А если клиент новый? Вступает в игру массив собранных ранее данных.

То есть именно тут включается машинное обучение?

Именно, мы очень близко подошли к этому вопросу и ИИ. Посмотрим на ситуацию с запросом по принципу Парето (закон/принцип Парето - эмпирическое правило, которое в наиболее общем виде формулируется как «20% усилий дают 80% результата, а остальные 80% усилий — лишь 20% результата». Ред.), то есть сколько пассажиров в соотношении 80% на 20% выбирали рейс Москва – Санкт-Петербург, к примеру, в среду из аэропорта «Домодедово» в 7.30 утра.

Исходя из собранных данных, вы приходите к выводу, что 80% отправлявших подобный запрос выбирали «Уральские авиалинии» с вылетом в среду в 7.30 утра. Вы отправляете вариант клиенту, и он нажимает «ЗАБРОНИРОВАТЬ», подтверждая, что рейс ему подходит. Все, машинное обучение состоялось, теперь получая новый похожий запрос от этого клиента, система будет его идентифицировать и знать, что ему предложить.

Если клиент не выбрал этот вариант, система вновь пытается угадать его предпочтение, и предлагает рейс «Аэрофлота» из Шереметьево. Согласен? Машинное обучение вновь состоялось, только теперь мы понимаем, что клиент попал в 20%, а не 80. А если оба варианта клиент проигнорировал и стал вручную выбирать параметры рейса? Обучение системы все равно происходит, только теперь напротив его запроса можно сделать пометку «мы ничего не угадали, наш процент выигрыша равен 0», но при этом запись нужных ему параметров в системе сохраняется. То есть, получив в следующий раз заявку от этого клиента, нужно будет взять этот ответ, сравнить с новым запросом и на основе этого всего сделать некоторые допущения, которые могут помочь попасть в диапазон предпочтений этого конкретного клиента.

Для чего нужна такая мощная оптимизация работы с запросами?

Для того чтобы экономить время клиентов. По сути, мы поглощаем информацию в режиме реального времени, на уровне нескольких секунд.

В авиабилетах, да и вообще в тревел-сервисах можно сделать так, чтобы давать не тысячи вариантов, а один нужный. «Угадывая» таким образом, что нужно клиенту, мы повышаем его лояльность и доверие к компании. Как только он поймет, что за 5-10 секунд получит готовый ответ на свой запрос, ему даже не нужно будет ничего выбирать, - это уже будет сервис на очень-очень высоком уровне. Через какое-то время использование ИИ перестанет восприниматься как чудо и диковинка, клиенты будут ждать от компаний такого высокого уровня обслуживания и будет странно, если они этого не получат.

Получается, что ИИ решит все проблемы, с которыми сталкиваются сегодня менеджеры?

Чтобы эта система работала по принципу, о котором я рассказал, мало иметь ИИ, нужны правильные базы данных, big-data, data scientist’ы (data scientist – это эксперт по аналитическим данным, который обладает техническими навыками для решения сложных задач, а также любопытством, которое помогает эти задачи ставить. Ред.), нужны люди, которые проверяют гипотезы, и проч. Нужна структура, которая требует не только затрат на фонд оплаты труда, но также инфраструктурных затрат, очень больших.

В России немного компаний, которые могут позволить себе содержать даже самый усеченный вариант отдела, занимающегося ИИ и автоматизацией, там должно работать хотя бы пять специалистов. Траты на инфраструктуру вместе с отделом будут исчисляться десятками миллионов рублей. При этом приносить равноценных доходов это не будет. Отбить деньги можно только имея большие обороты бизнеса. Но доходность туристического бизнеса в России не так высока, и процесс автоматизации и внедрения ИИ затянется на долгие годы.

Беседовала Мария Акунова

Екатерина Корсунская
Гендиректор компании Aerotone Corporate Travel

Олег Шабуцкий
Основатель и совладелец группы компаний "Демлинк"

Дмитрий Горин
Председатель правления Союза агентств делового туризма, председатель Совета директоров холдинга «Випсервис»