В современных условиях возникла необходимость в корректировке подходов к оценке земель и их качества в связи с тем, что в ряде инструктивных методов оценки плодородия почв, зафиксированных в документах различных руководящих органов, отмечается их упрощенное содержание, что не обеспечивает полноты оценочных действий [1].
Доступность вычислительных мощностей для научных исследований, развитие языков и библиотек программирования, а также появление ИИ-помощников в решении специализированных задач создают условия развития подходов к использованию современных математических инструментов, имеющих сквозную связь с теоретической базой всех естественных наук: алгоритмов, готовых моделей и инструментов машинного обучения, относящихся и к комплексу технологий ИИ и входящих в приоритетное развитие технологий в Российской Федерации в соответствии с Указом Президента РФ от 10 октября 2019 г. № 490 «О развитии искусственного интеллекта в Российской Федерации».
Инструменты машинного обучения выполняют две основные задачи: классификацию и регрессию. К задачам классификации в области сельскохозяйственных наук можно отнести, например, обнаружение сорняков на полях, отслеживание состояния животных, распознавание почв и культур — задачи из области применения методов машинного зрения или CV. К регрессионным задачам можно отнести прогноз погоды по данным метеостанций, моделирование заболеваемости культур и состояния почвы — преимущественно задачи прогноза с помощью различных методов математической аппроксимации с условиями соответствующей предобработки данных.
Машинное обучение, или ML, — область программирования, служащая для обработки больших данных, в которых для установления связей человеку пришлось бы монотонно выполнять огромное количество вычислений. Средства программирования позволяют быстро обрабатывать большие данные, исключают человеческий фактор ошибки на этапе расчетов и гибко настраиваются для решения узких задач. Нет универсальных методов использования ML — на сегодняшний день нет такой комбинации гиперпараметров, которые бы одинаково хорошо работали на разных наборах данных по величине измерений (образцов) или структуре данных. На текущий момент научным сообществом ведется активный поиск подходящих методов, параметров и данных (а также из предобработки) для решения различных задач, среди которых большое внимание уделяется прогнозированию урожайности, состоянию плодородия почв. В государственных системах прогноза урожайности Российской Федерации, Европейского союза и США методы машинного обучения на 2021 г. не использовались [3].