Последние несколько лет характеризуются очередным приходом искусственного интеллекта (ИИ) в ИТ и актуальностью использования Data Mining. По оценкам аналитиков, к 2022 г. суммарный объём рынка технологий ИИ увеличится до $52,5 млрд, или в 4 раза по сравнению с уровнем 2017 г. В 2019 г. специализирующиеся на ИИ-технологиях стартапы привлекли рекордные вложения — $26,6 млрд, заключив более 2200 сделок по всему миру [1]. Это определяет растущую востребованность ИТ-специалистов в области ИИ, что подтверждается данными с сайта hh.ru — крупнейшей российской компании интернет-рекрутмента.
Определены четыре основных столба высшего ИТ-образования: студенты, преподаватели, индустрия и учебные программы [2]. Главное — это студенты и связанные с ними проблемы, среди которых особо выделим следующие: работа студентов на предприятиях; работа в команде; выходной поток и соответствие актуальным требованиям индустрии.
Студент 3–4-го курсов и магистр — почти специалист, поэтому применяется проектный подход [3] к большинству дисциплин, в частности к дисциплине «Анализ данных». Актуальность такого подхода возникла и подтверждается при обсуждении с работодателями результатов производственной практики и начального опыта работы молодых специалистов, которые неплохо умеют решать отдельные этапы проекта и малые задачи, но весьма слабы в системе реализации проекта в целом.
Для подготовки магистров, диссертации которых должны содержать элементы научной новизны, применяется проектный — исследовательский — подход [3] к 3-семестровой дисциплине «Анализ данных» и Text Mining. Учебный проект выполняет группа магистров, в состав которой входит архитектор — интегратор проекта. У каждого участника — персональные задания и ответственность, в которые входят: изучение и презентация алгоритмов и их теории; программная реализация отдельных методов с поэтапным выводом промежуточных результатов; демонстрация тестирования — публичная защита своей части проекта; анализ реальных данных с извлечением знаний с доказательством их новизны.