Применение машинного обучения в аудите
Секция: Экономика
XXIII Студенческая международная научно-практическая конференция «Общественные и экономические науки. Студенческий научный форум»
Применение машинного обучения в аудите
MACHINE LEARNING IN AUDITING
Ekaterina Kaplina
Student, REU them G.V. Plekhanova, Russia, Moscow
Anastasia Korzon
Student, REU them G.V. Plekhanova, Russia, Moscow
Anastasia Smirnova
Student, REU them G.V. Plekhanova, Russia, Moscow
Osipyan Violetta Ernestovna
Student, REU them G.V. Plekhanova, Russia, Moscow
Аннотация. В статье авторами рассмотрены аспекты применения машинного обучения в аудите. Раскрыты важные термины технологии машинного обучения, исследованы текущие и потенциальные возможности его применения в аудите. Сделан вывод, что рассматриваемая технология позволяет значительно улучшить скорость и качество аудита, предоставляет аудиторам больше возможностей для рассмотрения внутренних и внешних задач, но при этом влечет за собой определенные риски. Особое внимание уделяется возможности исчезновения спроса на профессию «аудитор».
Abstract. In the article the authors consider the aspects of the application of machine learning in auditing. The authors provide an overview of including basic terminology and explore current and potential uses in the audit. They also examine challenges that there is the possibility of eliminating the demand for the profession of "auditor".
Ключевые слова: аудит, машинное обучение, риски, технологии, информация.
Keywords: auditing, machine learning, risks, technology, data.
Технологии искусственного интеллекта и машинного обучения перестали быть фантастикой и уже стали частью нашей жизни. В течение следующих нескольких лет машинное обучение может разрушить многие отрасли экономики, и профессия аудитора не является исключением. Джон Рафаэль, директор по инновациям в Deloitte, ожидает, что машинное обучение существенно изменит способ проведения аудита, поскольку это позволяет аудиторам в значительной степени «избежать компромисса между скоростью и качеством». Вместо того, чтобы полагаться в первую очередь на методы выборки, алгоритмы машинного обучения могут предоставить фирмам возможность выявлять аномалии (опознавать во время интеллектуального анализа редких данных, событий или наблюдений, которые вызывают подозрения ввиду существенного отличия от большей части данных) в целом населении. Технология машинного обучения для аудита все еще находится на этапе исследований и разработок. В данной статье объясняется, как работает машинное обучение, описывается его текущее и потенциальное влияние на профессию аудитора, а также выявляются некоторые актуальные проблемы, решение которых позволит в полной мере использовать инструменты машинного обучения для проведения аудита.
В настоящее время технология роботизированной автоматизации процессов уже оказывает влияние на процесс аудита за счет автоматизации рутинных задач. Многие ученые и специалисты-практики полагают, что новая технология снизит спрос на аудиторов. Набор навыков, необходимых для того, чтобы стать аудитором, непременно изменится благодаря автоматизации повторяющихся задач. Будущие аудиторы должны будут стать более универсальными, иметь четкое представление об информационных системах, науке о данных и общем бизнесе, в дополнение ко все более сложному набору правил и положений бухгалтерского учета и аудита. Наряду с этими изменениями, аудиторские фирмы должны быть осведомлены об изменении навыков аудиторов, чтобы помочь справиться с рисками сбоев, связанных с технологиями машинного обучения, аудиторы также должны демонстрировать четкое понимание ввода, обработки и вывода данных из широкого круга источников. Невозможно точно предсказать, как машинное обучение в конечном итоге изменит процесс аудита, однако, стоит задуматься о его нынешнем воздействии и будущих последствиях.
Машинное обучение
Машинное обучение – это подмножество искусственного интеллекта, автоматизирующее построение аналитических моделей. Машинное обучение использует эти модели для анализа данных, чтобы понять закономерности и сделать прогноз. Машины запрограммированы на использование итеративного подхода для извлечения уроков из анализируемых данных, что делает обучение автоматизированным и непрерывным; поскольку машина подвергается все большему количеству данных, надежные модели распознаются, а обратная связь используется для изменения действий. Машинное обучение и традиционный статистический анализ схожи во многих отношениях, но отличаются друг от друга по исполнению: в то время как статистический анализ основан на теории вероятностей и распределениях вероятностей, машинное обучение направлено на поиск сочетания математических уравнений, которые лучше всего предсказывают результат. Таким образом, машинное обучение хорошо подходит для решения широкого круга задач, связанных с классификацией, линейной регрессией и кластерным анализом.
Подходы к машинному обучению можно разделить на две категории: контролируемое и неконтролируемое обучение. Контролируемое обучение используется в ситуациях, когда исторические данные могут быть использованы для прогнозирования будущих результатов, таких как определение того, какие клиенты наиболее склонны не выполнять свои долговые обязательства. Неконтролируемое обучение используется там, где на выходных переменных нет ярлыков; системе не "говорят", что такое предполагаемый ответ, а вместо этого она сама вычисляет структуру данных. Неконтролируемое обучение содержит различные методы, которые могут быть использованы на транзакционных данных (например, кластерный анализ) и могут быть полезны, если используются в процессе оценки рисков для обнаружения ранее непредвиденных рисков.
Искусственные нейронные сети являются важной частью будущего искусственного интеллекта и машинного обучения. Системы данных могут быть настроены для формирования простых или многослойных нейронных сетей. Как и нейроны в мозгу человека, искусственные нейронные сети соединяются через узлы. Глубокое изучение сочетает вычислительные мощности машин с шаблонами подключения в нейронных сетях для понимания сложных взаимосвязей, таких как медицинская диагностика и распознавание местоположения.
Одной из проблем с продвинутым машинным обучением может быть "переоснащение", когда компьютер улавливает особенности в данных, которые не являются репрезентативными для моделей в реальном мире. Это может произойти, например, когда модель тестируется на тех же данных, что и при ее построении. Переустановка может привести к тому, что машина "забывает", что статистически значимые корреляции между переменными не обязательно подразумевают причинно-следственную связь. И наоборот, "подгонка" происходит тогда, когда модель недостаточно сложна, чтобы собрать образцы данных. В связи с этим, человеческое понимание и суждение все еще являются важными компонентами в машинном обучении, поскольку они могут иметь недостатки в выводах данных. Пользователи должны иметь представление о характере входов, данных, о том, что машина делает с данными, и о конечном результате.
Прогнозная надежность машинного обучения зависит от качества вводимых исторических данных. Новые и непредвиденные события могут привести к недействительным результатам, если их не идентифицировать или неправильно взвешивать. В результате, человеческие предрассудки могут играть важную роль в использовании машинного обучения. Такие отклонения могут повлиять на выбор наборов данных для обучения искусственному интеллекту, методы, выбранные для данного процесса, и интерпретацию результатов. Наконец, хотя машинное обучение обладает большим потенциалом, его модели все еще ограничены многими факторами, включая хранение и извлечение данных, вычислительную мощность, предположения алгоритмического моделирования, а также человеческое понимание и суждение.
Текущее и потенциальное использование технологии машинного обучения в будущем
Несмотря на то, что существуют некоторые ограничения на текущие возможности машинного обучения, оно отлично справляется с выполнением повторяющихся (однотипных) задач. Поскольку аудит требует большого объема данных, машинное обучение может повысить скорость и качество аудита. Машинное выполнение излишних задач должно предоставить аудиторам больше времени для проверки и анализа, что даст им больше возможностей сосредоточиться на областях наибольшего риска, а также лучше понять общую картину.
К настоящему времени уже существуют аудиторские фирмы, которые тестируют и изучают возможности машинного обучения в аудите. Одним из примеров является использование компанией “Deloitte” “Argus” –инструмента машинного обучения, позволяющего считывать такие документы, как договоры аренды, договоры о производных финансовых инструментах и договоры купли-продажи. “Argus” запрограммирован с алгоритмами, которые позволяют ему идентифицировать ключевые условия контракта, а также тенденции и выбросы (выделяющиеся значения). Затем аудиторы могут сосредоточиться на интерпретации ключевых особенностей документов. Например, нетрудно представить себе машину, читающую договор аренды, определяющую ключевые условия и определяющую, является ли аренда капитальной или операционной. При надлежащей разработке средства машинного обучения могут также выявлять закономерности и выбросы, такие как нестандартная аренда (например, с необычными обязательствами по выбытию активов). Это позволит аудиторам сосредоточить особое внимание на контрактах с наибольшим присущим им риском, что позволит повысить скорость и качество аудита.
Другим примером технологии машинного обучения, используемой в настоящее время “PricewaterhouseCoopers”, является “Halo”. “Halo” анализирует бухгалтерские проводки и может выявлять потенциально проблемные области, такие как записи с ключевыми словами сомнительного характера, записи из несанкционированных источников или необычно большое количество проводок записей журнала только под разрешенными пределами. “Halo” позволяет аудиторам проверять каждую бухгалтерскую проводку, сделанную компанией в течение данного года; подвергая все записи журнала тестированию и сосредотачиваясь только на выбросах с самым высоким риском, повышается скорость и качество процедур тестирования.
Некоторые фирмы и ученые уже изучают дополнительные способы использования машинного обучения при аудите финансовой отчетности, особенно в процессе оценки рисков. Тин Сун и Миклош Васархели предлагают использовать такие технологии машинного обучения как распознавание речи для проведения интервью с руководителями, требуемых стандартами аудита. Программное обеспечение может распознавать, когда интервьюируемые дают сомнительные ответы, такие как “вроде” или “может быть”, которые предполагают обман. Технология распознавания речи может также выявлять значительные задержки в ответах, что также может указывать на сокрытие.
Технологии распознавания лиц могут когда-нибудь быть использованы и для интервью. Университет Аризоны работает с Департаментом внутренней безопасности над разработкой программного обеспечения, которое использует распознавание лиц для выявления лицевых паттернов, которые предполагают чрезмерную нервозность или ложь во время собеседований с абитуриентами. Несмотря на то, что многие бухгалтерские фирмы обучают своих сотрудников тому, как проводить интервью, человеку может быть трудно обнаружить определенные модели поведения систематически и в режиме реального времени. Использование технологии распознавания речи и лиц при проведении собеседований с мошенниками, безусловно, может дополнить аудиторов и уведомить их о том, что ответы требуют дальнейшего расследования.
В будущем технология машинного обучения может позволить фирмам обнаруживать закономерности, которые в настоящее время могут остаться незамеченными. Например, ресторан может использовать исторические финансовые данные, связанные со спутниковыми снимками парковочных мест, информацию о количестве гостей, полученную из систем торговых точек, и графики работы сотрудников ресторана, чтобы продемонстрировать сильную корреляцию между высокими доходами и количеством автомобилей на стоянках в часы пик, высоким количеством клиентов и высокой заработной платой сотрудников. Распознав эти закономерности, система может идентифицировать местоположения с доходами, несовместимыми с количеством транспортных средств, количеством гостей или заработной платой. Это позволит аудиторам сосредоточиться на ресторанах с несоответствиями, а не выбирать рестораны на случайной основе.
Некоторые ресторанные компании уже используют технологию машинного обучения, чтобы лучше предсказывать поведение клиентов. Например, “Mcdonald's” использует технологию «smart kiosk», чтобы рекомендовать продукты на основе сезона, погоды и новых или повторных предпочтений клиентов. Аудиторы могут использовать эти данные с помощью средств машинного обучения, чтобы лучше понять деятельность, стоящую за цифрами. Алгоритм машинного обучения может обнаружить несоответствия с традиционными показателями, такими как обороты в час, средний доход за оборот и внешние поставки; аудиторам потребуется исследовать эти несоответствия. Кроме того, такое поведение клиентов может предоставить аудиторским группам ценную информацию, поскольку они пытаются сделать независимые прогнозы для аналитических процедур с использованием методов контролируемого обучения. Неконтролируемые методы обучения могут также выявить ранее скрытые риски.
Ученые также начинают изучать нетрадиционные отношения данных. Кюн Юн в своём исследовании изучал влияние погоды на продажи. В частности, ожидалось, что неблагоприятные погодные условия будут препятствовать посещению магазинов покупателями и тем самым снизят уровень продаж. Результаты показали, что модель была менее точной, чем использование данных из хранилищ с аналогичными характеристиками, но добавление переменных погоды к данным однорангового хранилища улучшило предсказуемость. Исходя из этого, использование нетрадиционных взаимосвязей данных может стать важным инструментом для аудитов, особенно в рамках процедур оценки рисков.
Актуальные проблемы
Аудиторские компании и регулирующие органы должны преодолеть ряд барьеров для того, чтобы технологии машинного обучения полностью раскрыли свой потенциал. Получение актуальных и полезных данных (особенно нефинансовых) от клиентов и из внешних источников может быть затруднено. В силу законодательных и нормативных ограничений аудиторы, как правило, не имеют доступа к огромным объемам информации из таких хранилищ данных, как “Google” или “Facebook”. Аудиторы также связаны определенными этическими и клиентскими требованиями конфиденциальности, которые могут ограничить их возможность доступа к качеству и количеству данных, необходимых для создания обучающих наборов данных.
Когда уместные данные доступны для использования, аудиторы должны понимать проверять полноту и точность входных данных для того, чтобы полагаться на результаты. Безопасность данных и целостность информации будут иметь решающее значение для определения надежности входных данных, используемых в машинном обучении. В противном случае несанкционированный доступ к финансовым и нефинансовым данным может привести к манипуляциям с данными, которые могут исказить результаты, в противном случае аудиторам придется работать с экспертами по кибербезопасности.
Вероятно, аудиторам, придется работать с учеными, изучающими данные, чтобы понять алгоритмы, подобно тому, как нынешние аудиторы работают с экспертами в области информационных технологий, актуарных расчетов и оценки. Аудиторам также необходимо будет понимать и эффективно документировать причины наличия или отсутствия причинно-следственных связей.
Таким образом, машинное обучение окажет большое влияние на профессию аудитора в ближайшем будущем. Чем доступнее будут становятся инструменты машинного обучения, тем больше возможностей станет доступно для небольших фирм. Технология роботизированной автоматизации процессов уже оказывает влияние на процесс аудита, автоматизируя рутинные задачи. Многие ученые и практикующие специалисты предполагают, что новая технология снизит спрос на аудиторов. Навыки, необходимые для того, чтобы стать аудитором, непременно изменятся. Аудиторские фирмы должны быть осведомлены о данных изменениях, чтобы помочь управлять рисками сбоев, связанными с технологиями машинного обучения. Хотя технология машинного обучения предоставляет аудиторам больше возможностей для рассмотрения внутренних и внешних задач, аудиторы должны демонстрировать глубокое понимание того, как вводятся, обрабатываются и выводятся данные из более широкого круга источников. Невозможно точно предсказать, как машинное обучение в конечном итоге изменит процесс аудита, но точно известно, что рассматриваемая технология позволит значительно улучшить скорость и качество аудита.