По всем вопросам звоните:

+7 495 274-22-22

УДК: 622.276, 08.00.05

Выбор способов применения машинного обучения для прогнозирования развития инновационно активных предприятий

Полаева Гозель Байгельдыевна канд. экон. наук, доцент кафедры стратегического управления топливно-энергетическим комплексом, Российский государственный университет нефти и газа (национальный исследовательский университет) им. И.М. Губкина 119991, г. Москва, Ленинский просп., д. 65, корп. 1, E-mail: gozel_polayeva@mail.ru
Яковлев Никита Борисович студент кафедры инновационного предпринимательства, МГТУ им. Н.Э. Баумана 105005, г. Москва, 2-я Бауманская ул., д. 5, стр. 1, E-mail: nikitakamov@yandex.ru
Глазнев Никита Валерьевич студент кафедры инновационного предпринимательства, МГТУ им. Н.Э. Баумана 105005, г. Москва, 2-я Бауманская ул., д. 5, стр. 1, E-mail: engie@usa.ru

Машинное обучение является одним из направлений искусственного интеллекта. Основной принцип заключается в том, что компьютер получает данные и «обучается» на них. Системы машинного обучения позволяют быстро применять знания, полученные при обучении, на больших наборах данных, что позволяет им преуспевать в таких задачах, как распознавание лиц, распознавание речи, распознавание объектов, перевод, и многих других [1]. На основе этих данных восстанавливается неявная зависимость, то есть строится алгоритм, способный для любого возможного входного объекта выдать достаточно точный ответ, а значит, прогнозировать развитие инновационно активного предприятия более точно и эффективно [2].

Литература:

1. Пресс-центр. Россия опередила США и Европу по активному внедрению искусственного интеллекта [Электронный ресурс] // Корпоративный сайт Microsoft. — URL: https://news.microsoft.com/ru-ru/business-leaders-age-of-ai/ (дата обращения: 01.03.2020).

2. Новости «Яндекс». «Помощница Алиса» [Электронный ресурс] // Ведомости. — URL: https://www.vedomosti.ru/technology/articles/2017/10/10/737253-yandeks (дата обращения: 21.03.2020).

3. Искусственный интеллект (рынок России) [Электронный ресурс] // TAdviser. Деловой портал с уникальной базой знаний. — URL: http://www.tadviser.ru/ index.php (дата обращения: 28.02.2020).

4. Модели и алгоритмы машинного обучения [Электронный ресурс] // Корпоративный сайт «Амазон». — URL: https://aws.amazon.com/ru/sagemaker/ (дата обращения: 12.03.2020).

5. Petroleum Related Rock Mechanics / Fjar E. [et. al.]. — 2nd Ed. — Elsevier, 2008. — 492 p.

6. Zwillinger D., Kokoska S. Standard Probability and Statistics tables and formulae. — London. — New York: Chapman & Hall CRC, 2000. — 537 p.

7. Chebyshev I., Legkokonets V., Lukin S. Specifics of mechanical and strength rock properties estimation for wells drilling and exploitation.

8. Procedia Structural Integrity. — 2017. — No 6. — Р. 252–258.

Любое построение корректной предсказательной модели развития инновационно активного предприятия ТЭК с использованием методов машинного обучения начинается с оценки исходных данных. В первую очередь нужно выделить главную проблему, препятствующую внедрению машинного обучения при прогнозировании физико-механических свойств пород, подходящих для бурения будущих нефтяных скважин, — это отсутствие единой актуальной базы данных. В настоящее время в распоряжении специалистов имеется достаточно большой архив материала с результатами проводимых исследований. Однако все данные в этом архиве хранятся разрозненно, результаты исследований находятся в отдельных таблицах, которые имеют различную структуру, оформление и особенности заполнения. Чтобы можно было использовать данные с алгоритмами машинного обучения, необходимо объединить их в единый массив. Для этого была собрана база из 4470 образцов для определения перспективности применения предложенной технологии, затем написан так называемый парсер — скрипт, компонующий данные из различных таблиц в одну базу [3].

После компоновки выборки следует предварительно обработать данные (удалить «выбросы», провести нормировку значений). Для каждого образца были известны значения пористости, плотности и дано словесное описание. Прогнозируемыми величинами являлись скорости распространения продольной и поперечной упругих волн, полученные в результате механических акустических исследований грунта.

Для того чтобы не учитывать аномальные значения в исходных числовых данных, можно руководствоваться следующими статистиками [4]:

• первый квартиль — число, при котором 25% объектов лежат левее него;

• третий квартиль — число, при котором 75% объектов лежат левее него;

• интерквартильный размах — разница третьего и первого квартилей.

Для определения некорректных значений целесообразно использовать следующую эвристику, свидетельствующую о том, что аномальные значения находятся за пределами интервала, границы которого определяются первым и третьим квартилями [4]:

Для Цитирования:
Полаева Гозель Байгельдыевна, Яковлев Никита Борисович, Глазнев Никита Валерьевич, Выбор способов применения машинного обучения для прогнозирования развития инновационно активных предприятий . Бухгалтерский учет и налогообложение в бюджетных организациях. 2021;9.
Полная версия статьи доступна подписчикам журнала
Язык статьи:
Действия с выбранными: