Статья:

Описание методов машинного обучения

Конференция: XLI Студенческая международная заочная научно-практическая конференция «Молодежный научный форум: технические и математические науки»

Секция: Технические науки

Выходные данные

Андросова Т.Е., Курочкин В.М., Болдырев А.С. [и др.] Описание методов машинного обучения // Молодежный научный форум: Технические и математические науки: электр. сб. ст. по мат. XLI междунар. студ. науч.-практ. конф. № 1(41). URL: https://nauchforum.ru/archive/MNF_tech/1(41).pdf (дата обращения: 23.08.2025)

Скачать сборник

Лауреаты определены. Конференция завершена

Эта статья набрала 0 голосов

Мне нравится

Дипломы
лауреатов

Сертификаты
участников

Дипломы
лауреатов

Сертификаты
участников

XLI Студенческая международная заочная научно-практическая конференция «Молодежный научный форум: технические и математические науки»

на печатьскачать .pdf поделиться

Описание методов машинного обучения

Андросова Татьяна Евгеньевна

студент 4 курса, факультет информатики, Самарский национальный исследовательский университет им. С.П. Королёва, РФ, г. Самара

Курочкин Владислав Михайлович

Болдырев Артем Сергеевич

Чернов Роман Вячеславович

Введение

Процесс обучения включает в себя приобретение новых декларативных знаний, разработку моторных и когнитивных навыков при помощи инструкций и практики, организацию знаний в общее и эффективное представление и обнаружение новых фактов и теорий через наблюдение и эксперименты.

Обучение и компьютерное моделирование этого процесса во всем своем многообразии представляет из себя машинное обучение. В основе машинного обучения лежат следующие исследования:

1. Проблемно-ориентированное обучение – разработка обучающейся системы для улучшения производительности при выполнении набора заданий.

2. Когнитивная симуляция – исследование и компьютерная симуляция процесса обучения человека.

3. Теоретический анализ – теоретическое исследования возможных методов обучения и алгоритмов независимо от сферы их применения.

Общее о машинном обучении

В машинном обучении главную роль играют сущности учителя и ученика. Учитель – это сущность, которая обладает необходимыми знаниями для выполнения задачи, а ученик должен приобрести некоторые знания для выполнения этой задачи.

Мы можем разделить стратегии обучения по количеству логических заключений, которые необходимо сделать ученику по информации, предоставленной учителем. Мы рассмотрим два крайних случая – без логических выводов и со значительным их количеством. Если компьютерная система (ученик) прямо запрограммирована, то ее знания растут, но она не делает никаких выводов, так как все когнитивные усилия выполнены программистом (учителем). С другой стороны, если система независимо открывает новые теории или создает новые понятия, ей необходимо сделать большое количество выводов, то есть получить организованные знания из экспериментов и наблюдений.

Промежуточный случай мог бы представлять из себя студента, которая учится решать математическую задачу по аналогии с решением, представленным в книге. Этот процесс требует логических заключений, но намного меньше, чем при создании новой математической теории.

Увеличивая количество выводов, которые ученик должен будет выполнить, мы уменьшаем нагрузку на учителя. Машинное обучение пытается найти компромисс между количеством усилий, которые придется затратить ученику и учителю.

Обучение по инструкции

Обучение по инструкции состоит в извлечении знаний от учителя или другого организованного источника (например, книги), требуя от ученика производить трансформацию знаний из входного языка во внутреннее представление. Новая информация интегрируется с предшествующими знаниями для эффективного использования. От ученика требуются некоторые выводы, но большая часть когнитивной нагрузки остается на учителе, который должен представить и организовать знания таким образом, чтобы они постепенно увеличивали знания ученика. Обучение по инструкции имитирует методы образования. Таким образом, задачей машинного обучения является проектирование системы, которая может принять инструкции, затем сохранить и применить накопленные знания эффективно.

Обучение по аналогии

Обучение по аналогии состоит в извлечении новых знаний или навыков путем трансформирования или увеличения существующих знаний (имеющих сильную схожесть с другим желаемым знанием или навыком), которые могут быть эффективно применены в новой ситуации. Система обучения по аналогии может быть применена для компьютерной программы в целях выполнения задачи, для которой она изначально предназначена не была, но имеет некоторую степень сходства. Обучение по аналогии требует от ученика большего количества выводов, чем обучение по инструкции. Аналогичный факт или навык должен быть сначала извлечен из памяти, затем это извлеченное знание должно пройти трансформацию, чтобы оно могло быть использовано в новой ситуации и сохранено для использования в будущем.

Обучение по примерам

После представления набора примеров, ученик выводит общее правило, которое описывает все примеры. Количество выводов, которые необходимо сделать ученику, намного выше, чем в обучении по аналогии. Обучение на примерах стало настолько популярным последние несколько лет, что часто просто называется обучением. Похожим образом ученик и примеры соответственно называются обучаемой машиной и данными.

Проблема обучения может быть описана как нахождение общего правила, которое описывает данные, после подачи на вход ограниченного числа примеров. Сложность этой задачи схожа с со сложность развития способности говорить у детей, которые учатся на звуках, которые издают взрослые.

Проблему обучения можно написать так: по ограниченному набору примеров необходимо построить модель описания данных. Техники обучения могут быть разделены на три группы: обучение с контролем, обучение с подкреплением и обучения без контроля.

Обучение с контролем

В обучении с контролем (обучение с учителем) данные – примеры входных и выходных данных. В этом случае описание данных представляет собой функцию, которая дает выход после подачи данных на вход. Обучение с контролем называется так потому, что объекты рассмотрения уже поделены на классы и реальные значения. Примером такой задачи обучения является распознавания рукописных букв и цифр, прогнозирование фондовых индексов.

В задаче обучения с контролем пары входных и выходных данных называются тренировочным набором (тренировочным множеством). Целью является нахождение детерминистической функции, которая ставит выходные данные в соответствие входным с минимальной ошибкой. Согласно типа выходных данных обучение с контролем может быть обучением с классификацией или обучением с регрессией.

Обучение с классификацией

Если выходные данные не имеют четкой структуры, то такое обучение называют обучением с классификацией (или просто классификацией). Каждый элемент выходного множества называется классом. Алгоритм обучения, который решает задачу классификации называется классификатором. В проблемах классификации задачей является присвоение набору входных данных определенного класса или категории. Эта задача характеризует большинство задач распознавания. Типичной проблемой классификации является присвоение рукописному символу его соответствующей печатной буквы.

Регрессия

Если выходные данные сформированы значениями переменных, продолжительных во времени, например, значениями индексов курса обмена акций, тогда задача обучения представляет из себя регрессию.

Обучение с подкреплением

Обучение с подкреплением своими корнями уходит в теорию контроля, которая рассматривает сценарии динамического окружения, в которых исходными данными являются три сущности: состояние, действие и награда. Разница между обучением с подкреплением и обучением с наблюдением состоит в том, что в первом нет оптимального действия в текущем состоянии, но обучающийся алгоритм должен выбрать правильное действие для того, чтобы увеличить награду. Описанием модели является стратегия, которая максимизирует награду.

Проблемой при обучении с подкреплением является выбор того, что нужно сделать в данной ситуации, то есть соотнести ситуации и действия, которые необходимы для максимизации награды. В отличие от обучения с учителем, обучающийся алгоритм не знает какие действия нужно предпринять в конкретной ситуации. Вместо этого предполагается, что ученик получает информацию о действии в результате получения награды, которая не обязательно приходит сразу после совершения действия. Примером такой проблемы является игра в шахматы. Каждая расстановка фигур на шахматной доске – конкретное состояние. Действия – возможные ходы при этой расстановке. Награда за ходы – это победа в игре, а наказание – проигрыш. Но и награда, и наказание наступают не сразу, что достаточно характерно для обучения с подкреплением. И так как в каждом состоянии нет оптимального действия, то одной из самых больших трудностей обучения с подкреплением является поиск компромисса между исследованием и использованием. Для того, чтобы максимизировать награду (или минимизировать наказание) алгоритм должен выбрать действия, которые были совершены в прошлом и в будущем увеличили награду. С другой стороны, для того, чтобы обнаружить эти действия, алгоритм должен выбрать действия, которые он не использовал в прошлом, таким образом исследуя пространство состояний. Для решения этой дилеммы нет общего решения.

Список литературы:

1. Camastra F., Vinciarelli A., “Machine Learning for Audio, Image and Video Analysys”, ISBN 978-1849966993, Oct. 2007.

Описание методов машинного обучения

Похожие статьи