Лекция № 33. Системы искусственного интеллекта и машинное обучение
Цель работы: создание условий для осознания школьниками важности построения дальнейшей индивидуальной образовательной траектории и ранней профориентации через знакомство с перспективными направлениями развития ИТ-индустрии (на примере искусственного интеллекта и машинного обучения).
Задачи:
Образовательная: расширить представление школьников о технологиях машинного обучения и перспективах развития этого направления ИТ-индустрии; познакомить с основными видами задач, решаемых с помощью систем машинного обучения в разных областях и сферах деятельности человека.
Развивающая: развитие интереса к предмету; формирование приёмов логического мышления; развитие способность анализировать и обобщать, делать выводы.
Воспитательная: акцентирование внимания на том, чтобы познакомить школьников с современным уровнем развития технологий на примере технологий искусственного интеллекта, которые не только улучшат качество жизни и работы людей, но значительно ускорят и изменят процессы и способы решения различных задач, требуя от специалистов любых профессий в будущем (в том обществе, в котором им жить!) дополнительных навыков и компетенций, многие из которых связаны с умением программировать (разрабатывать алгоритмы, писать программы для различных устройств и систем, логически и системно мыслить и т.п.).
Литература:
1. Учебник И.Г. Семакин, Е. К. Хеннер, «Информатика», 11 класс. БИНОМ, 2018.
2. Босова Л. Л., Босова А. Ю. Информатика. 11 класс. Базовый уровень. — М.: БИНОМ, 2016.
3. Семакин И. Г., Е. К. Хеннер. Информатика и ИКТ. 10—11 класс/ М.: БИНОМ. Лаборатория знаний, 2008.
4. К. Ю. Поляков, Е. А. Еремин. Информатика. 11 класс. Базовый и углубленный уровни: учебник в 2 ч. Ч. 1 / М.: БИНОМ. Лаборатория знаний, 2016
План
1. Классическое машинное обучение.
2. Классификация как задача машинного обучения
3. Регрессия: предсказание при помощи машинного обучения
1. Классическое машинное обучение
Классическое машинное обучение, или Classical Machine Learning, строится на классических статистических алгоритмах и решает вопросы, связанные с принятием решений на основе данных.
Его активно применяют как в офлайн, так и в онлайн-маркетинге для прогнозирования поведения пользователя и рекомендаций по интересам. Например, вы гуглили «купить солнцезащитные очки». И сразу же после этого во всех соцсетях вам приходит реклама таких же моделей очков. Или вы искали жилье для покупки по вашим субъективным критериям, а затем видите рекламу от застройщиков на любом ресурсе, куда бы ни зашли. Обученная система сама подбирает варианты, которые могут вас заинтересовать. Это – яркие примеры результатов классического машинного обучения.
В классическом машинном обучении с учителем программист, обучающий систему, размечает данные, приводит машине определенные примеры и наблюдает за её прогрессом. Задачами, которые решаются при помощи обучения с учителем являются, например, классификация и регрессия. Машинное обучение без учителя включает в себя следующие типы: кластеризация, обобщение, поиск правил. Эти алгоритмы часто применяются в Data Mining и их можно рассматривать как часть Data Science.
Рассмотрим некоторые из них.
2. Классификация как задача машинного обучения
Классификация – наиболее популярная задача машинного обучения. Она в чем-то схожа с тем, как ребенок учится определять форму и размер предметов, складывая их в раздельные кучки.
Задача классификации: предсказание категории объекта и разделение объектов согласно определенным и заданным заранее признакам. То есть машина сортирует данные по нужным категориям: одежду – по цветам, сезонам или ткани, книги – по жанрам, авторам, языкам написания, соусы – по степени остроты, письма – по личной или рабочей направленности, спам-составляющей и т.д.
В бизнесе классифицировать можно, например, клиентов: по количеству покупок, частоте заходов на сайт, покупательских привычках. По такой системе работают, например, письма от сети супермаркетов: каждому участнику программы лояльности приходят предложения со скидками на товары, которые они чаще всего покупают. Также подобной системой могут пользоваться банки, которым нужно на основании общего портрета соискателя кредита определить вероятность, что кредит будет возвращен.
Дополнительный продукт классификации по заданным параметрам – возможность выделить всё, что не вписывается в стандартные классы. Например, если речь о медицине, выделенным фрагментом может быть любое отклонение от нормы: утолщение, разрыв, новообразование, завышенные или заниженные показатели анализов. Если речь о финансовых рынках, то нестандартные показатели могут выдать инсайдерских игроков.
3.Регрессия: предсказание при помощи машинного обучения
Регрессия – это когда по заданному набору признаков необходимо спрогнозировать некую целевую переменную.
Задача регрессии: предсказание места на числовой прямой. Например, загруженность дорог в зависимости от времени суток и время на путь из пункта А в пункт Б в зависимости от пробок. Или каким будет объем рынка определенных товаров через 2 года. И даже скорость развития определенной болезни при общих показателях здоровья человека.
Поскольку регрессия запрограммирована на работу с числами, её встраивают в различные вычислительные системы, даже в классический Excel.
Интересный факт: систему классификации можно «доучить» и научить решать задачи регрессии. На практике это выглядит как понимание не только класса объекта, но и его близости к тому или иному показателю. Например, яблоко свежее или испорченное. А если ближе к испорченному, то на сколько процентов.
Кластеризация как тип обучения без учителя
Кластерный анализ (Data clustering) — задача разбиения заданной выборки данных (объектов) так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров значительно отличались друг от друга.
Задача кластеризации: используя все имеющиеся данные, предсказать соответствие объектов выборки их классам, сформировав таким образом кластеры.
Кластеризацию применяют для анализа и поиска признаков по которым можно объединить объекты, сжатия данных и поиска новизны (что не входит ни в один кластер)
В чем отличие классификации и кластеризации: при классификации у вас есть набор предопределенных классов, вы учите машину на наборе примеров и потом хотите знать, к какому классу принадлежит новый объект. При кластеризации вы используете алгоритм, который пытается сгруппировать набор объектов и определить, существует ли какая-либо взаимосвязь между объектами, машина учится сама.
Поиск ассоциативных правил как тип обучения без учителя
Поиск ассоциативных правил – метод, который активно используется в маркетинге для изучения поведения покупателя и составления типичного шаблона покупок.
Задача поиска ассоциативных правил: находить закономерности в потоке данных. Например, для анализа паттернов поведения пользователей на веб-сайтах или для правильной расстановки товаров на полках в магазине. Ведь не зря жвачки и батарейки расположены в прикассовой зоне, а сладости недалеко от чая/кофе.
Классическое обучение используется для качественного поиска контента, эффективных кросс-продаж, анализа имеющейся информации о клиентах, ускорения и автоматизации бизнес-процессов и многих других целей.
Подробный обзор машинного обучения можно прочесть в нашей статье: “Машинное обучение, искусственный интеллект, и нейросети - в чем разница, и для чего их используют”. Также мы подготовили обзор следующего типа машинного обучения “Обучение с подкреплением”.
ДОМАШНЕЕ ЗАДАНИЕ:
1. Проработайте лекционный материал.
2. Составьте 10 вопросов к просмотренному видео по лекции 33.
Скачано с www.znanio.ru
© ООО «Знанио»
С вами с 2009 года.