Рентабельность банковской деятельности зависит от оценки рисков. Чем точнее оценка рисков и основанные на этом действия банкиров, тем выше доходность банка. В теории большее количество информации ведет к более точной оценке риска. Именно поэтому в последнее время появилась тенденция к активному использованию Big Data для обработки неограниченного количества структурированных и неструктурированных данных [1; 9].
Возможность использования более объемных и разнообразных данных помогает бизнесу снижать убытки за счет управления рисками и увеличивать прибыль за счет поиска новых перспектив развития. Именно поэтому изучение возможностей Big Data в области управления рисками является весьма актуальной.
Сегодня в зарубежной литературе приведено большое количество определений термина Big Data. Данное понятие очень обширное и имеет множество интерпретаций [1]. Так, в одних источниках термин Big Data используется для обозначения группы технологий, решающих две основные задачи. Первая — хранение и анализ значительного объема структурированных данных, требующих высокой скорости обработки и принятия мер реагирования в режиме реального времени. Вторая — сбор, хранение и использование неструктурированных данных, включая аудио-, фото- и видеоинформацию.
В других источниках под Big Data понимается только большой объем данных, размер которых составляет от нескольких десятков терабайт до петабайт (1000 терабайт = 1 петабайт) и даже эксабайт.
Отдельные авторы дополняют понятие Big Data высокой скоростью обработки больших объемов информации и использованием нестандартных технологий. Другие под Big Data понимают быстрые данные, когда необходима репликация в режиме, близком к реальному времени (2–5 минут): как между оперативными системами, так и между оперативными системами и оперативным хранилищем, используемым, например, в качестве источника данных для веб-сервисов или отчетности. Отмечают, что Big Data отличаются сложностью преобразования данных при их репликации из разнообразных систем, очистке данных и их консолидации.