Здравствуйте!
Машинное обучение позволяет специалистам тратить меньше времени на разработку эффективных алгоритмов, при этом получать точные данные от различных вычислительных устройств. Его история началась еще в 1950-е годы, когда компьютер впервые научился играть в шашки. С ростом вычислительных мощностей начало развиваться и машинное обучение. Кстати, всем известные голосовые боты Siri от Apple и Алиса от Яндекса — тоже его результат.
Что такое машинное обучение простыми словами
Если говорить просто, машинное обучение — это процесс, при котором компьютер сам обучается что-то делать, а не следует заданным алгоритмам. Оно избавляет программиста от необходимости «объяснять» машине, как именно нужно решать поставленные задачи.
Все, что требуется от специалистов — предоставить «учебники»: набор обучающих данных. А компьютер сам изучит их, найдет закономерности, составит статистику и будет делать точные прогнозы на ее основе. С помощью машинного обучения боты могут распознавать эмоции, вести живой диалог с пользователем, работать в технической поддержке, оценивать потенциал рекламных кампаний и выполнять многие другие вещи.
Давайте рассмотрим машинное обучение на самом простом примере. Вы загружаете в компьютер несколько фотографий с солнцем и без него. И пишете, есть ли солнце на фото, или нет. В дальнейшем, когда вы будете загружать новые фото, компьютер сможет определить, есть ли на нем солнце. При этом чем больше фотографий уже будет обработано, тем точнее будет результат.
Многие рекомендательные сервисы, также работают на основе машинного обучения.
Все виды методов машинного обучения
Условно машинное обучение можно разделить на две большие категории — обучение с учителем и обучение без учителя.
Обучение с учителем — это по сути создание алгоритма, который на основе ранее указанных данных будет решать поставленные задачи. Например, в программу будут внесены примеры (набор данных, слов, цифр, чертежей) и указаны правильные значения, то есть ответы. В дальнейшем при загрузке новых примеров программа будет автоматически рассчитывать значения для каждого из них.
Например: риэлторское агентство решило внедрить сервис автоматического расчета рыночной стоимости жилья. Для этого программисты написали специальную программу, в которую занесли 1 500 примеров жилья с указанием района, площади, типа ремонта и других переменных, а также итогового значения — рыночной цены. Система обработала данные и теперь может считать стоимость, если пользователь укажет необходимые параметры.
Обучение без учителя — ситуация, в которой требуется минимальный набор обучающих данных, а система пытается найти закономерности в имеющейся информации. Например, компьютер кластеризует объекты по определенным параметрам, находит уникальные объекты или выделяет 2-3 схожих характеристики для визуализации.
Например: все то же риэлторское агентство решило расширить возможности анализа.
Программисты написали программу и внесли в нее информацию о 1 500 объектах: описали местоположение, число этажей, инфраструктуру района и другие параметры. Но не указали итоговое значение — в нашем случае это стоимость.
Система не будет пытаться найти его, вместо этого она поможет определить, какая площадь квартир популярна в разных районах, сколько этажей нужно жителю пригорода, какой тип ремонта предпочитают люди, покупающие жилье в центре.
По сути, обучение с учителем — это решение уравнения на основе предоставленных данных. Человек сможет сделать то же самое, но программы проводят вычисление точнее, быстрее и эффективнее.
А машинное обучение без учителя — это «свобода действий» для программ. Они могут решать разные задачи, потому что не ограничены поиском одного решения.
Рекомендуем: Что такое CRM-системы и как помогают в автоматизации бизнеса
Классы задач машинного обучения
- Задача регрессии. Программа на основе введенных данных предсказывает вещественный ответ — то есть цифры. По сути — решает уравнение на основе примера, который ранее показал ей программист. Как в примере про расчет рыночной стоимости жилья, приведенном выше. Данные, то есть переменные, могут быть в виде цифр или букв: это не влияет на эффективность расчетов. Например: программы предсказывают стоимость акций компании через год, стоимость коллекционнной монеты через месяц, рассчитывают цену на автомобиль от собственника.
- Задача классификации. Компьютер на основе введенных данных предсказывает категориальный ответ. Число таких ответов строго ограничено. Грубо говоря, относит указанный пример к определенной категории или дает ответ в формате «Да/Нет». Например: автоматические программы определяют, есть ли в письме спам, болен ли пациент гриппом, определяют то, что находится на видео или распознают рукописный текст.
- Задача кластеризации. Система разбивает полученные объекты на тематические кластеры. Отличие от классификации — в том, что число кластеров не ограничено. Например, система может найти среди всех товаров бензопилы средней и низкой ценовой категории, с дополнительными опциями и без. Или разбить недвижимость по району города, количеству комнат, стоимости, удаленности от центра и другим кластерам.
- Задача уменьшения размерности. В этом случае программа анализирует все признаки объекта — их может быть бесконечное количество — и описывает его 2-3 параметрами. Чаще всего это используется для последующей визуализации. Например, система может самостоятельно построить график или визуализировать детали в пространстве.
- Задача поиска аномалий. Алгоритм оценивает все имеющиеся данные и отличает стандартные ситуации от аномалий. Эта задача немного схожа с задачей классификации, но у систем нет исходных данных, которые помогают точно определить аномалии. Например: автоматическая система определяет мошеннические переводы денег с электронных кошельков.
Статья в тему: KPI — что это и как применять
Примеры использования в маркетинге
Машинное обучение постоянно развивается, вместе с тем расширяются возможности его использования в маркетинге.
Например, сегодня его используют:
- в контекстной рекламе для оценки эффективности кампаний без тестового бюджета или поиска самых конверсионных объявлений;
- в оценке юзабилити для автоматизации тестирования и получения измеримых объективных результатов
- в электронной коммерции для автоматической рассылки, настройки динамического контента, создания эффективной корзины в интернет-магазине.
Кстати, многие крупные бренды уже используют машинное обучение. Например, Pinterest применяет его для поиска спама и контента для монетизации. Российский сервис Findface анализирует фото пользователя и ищет схожие фотографии в глобальной сети.
Машинное обучение помогает Facebook Messenger создавать чат-ботов, некоторые из которых неотличимы по поведению от обычного пользователя. В X (Twitter), Яндекс.Дзене и Instagram формируют «умные новостные ленты»: они оценивают контент в режиме реального времени и показывают пользователю записи, которые должны больше всего понравиться, причем на основе личных предпочтений читателя. Google Assistant может вести диалог с пользователем. И это — тоже с помощью машинного обучения.
А как вы считаете, какое будущее в маркетинге есть у машинного обучения? Поделитесь своим мнением в комментариях.
- 16 лучших библиотек машинного обучения Python, которые стоит попробовать
- Предвзятость в машинном обучении: Какова этика искусственного интеллекта?
До новых встреч!