Дисперсионный анализ применяют для сравнения средних нескольких нормальных совокупностей, когда дисперсии этих совокупностей равны. Предположим, что изучается урожайность некоторой сельскохозяйственной культуры (результативный признак Y). Причем важно изучить влияние на результативный признак Y некоторого удобрения, вносимого в почву (фактор А). В рассматриваемом исследовании фактор А дозируется количественно (уровни фактора А), например под уровнями фактора А могут пониматься различные дозы удобрения, вносимые в почву. Если урожайность изучается в зависимости только от одного фактора, то говорят, что проводится классификация по одному признаку. Остальные факторы, которые, безусловно, также влияют на результативный признак, называют остаточными факторами (неконтролируемые факторы).
Однако любой из неконтролируемых факторов по желанию исследователей может быть переведен в разряд контролируемых. Например, помимо влияния на Y дозы удобрения (фактор А), можно изучать влияние на урожайность плодородия земель (фактор В), измеряемое количественно в баллах (уровни фактора В). В случае дисперсионного анализа говорят, что проводится классификация по двум признакам. Очевидно, исследование можно усложнять по предложенной схеме и дальше.
Пусть
Для проверки основной гипотезы (2) необходимо иметь точечные оценки генеральных средних. Для отыскания таких оценок применяют метод наименьших квадратов (М.Н К.).
Рассмотрим сумму:
На протяжении всего дальнейшего изложения будут использоваться следующие общеупотребительные обозначения [1, 2].
Введем в рассмотрение следующую сумму квадратов:
Аббревиатура RSS общепринята в регрессионном и дисперсионном анализе, образуется от residual sum of squares — остаточная сумма квадратов. Заметим, что сумма (4) минимизировалась по переменным
которые не были связаны какими-либо дополнительными условиями. Теперь произведем минимизацию (4) при ограничениях, задаваемых гипотезой
Простейший путь состоит здесь в использовании гипотезы