Добрый день, Коллеги. Важное сообщение, просьба принять участие. Музей Ферсмана ищет помощь для реставрационных работ в помещении. Подробности по ссылке
Корреляционный анализ в геохимии: три проблемы практического применения
Анализируются типичные ошибки применения корреляционно-регрессионного анализа в геохимии и получаемые в результате ложные выводы, имеющие характер артефактов. По каждому виду ошибок дан теоретический анализ, затем результаты компьютерного моделирования ситуации, порождающей ошибку, в сравнении с правильными результатами. Наконец, как типичный пример проанализирована одна работа (докторская диссертация), содержащая все три вида рассмотренных ошибок.
Трудами корифеев математической статистики корреляционно-регрессионный анализ был внедрён в биологию (в особенности – в агробиологию). В геологии и геохимии внедрение и широкое использование его связано с именами А.Б. Вистелиу-са [1], Ф. Чейза [2, 3]. Однако практика применения корреляционного анализа в геологии и геохимии осложняется несколькими обстоятельствами:
а) геологи не всегда правильно понимают суть математических методов, о чём давно писали упомянутые выше авторы; это обстоятельство субъективное;
б) идентификация однородных, сопоставимых геологических объектов, которые составили бы вполне определенную генеральную совокупность или выборку из неё, является не тривиальной задачей;
в) в применении корреляционно-регрессионного анализа и его интерпретации имеется ряд нерешенных проблем.
Два последних обстоятельства – объективные. Всё это, вместе взятое, приводит к серьезным ошибкам, которые можно встретить в опубликованных работах, (например, [4]).
При значительной разработанности теоретической стороны методов корреляционно-регрессионного анализа, в их применении имеется большой пробел, связанный с интерпретацией результатов, в зависимости от того, что из себя представляет совокупность исходных данных. В частности, каков будет результат корреляционно-регрессионного анализа в подсовокупности исходной совокупности, в которую мы отобрали пробы (элементы совокупности) по какому-либо признаку, например,
по значениям X и/или Y, как теперь интерпретировать полученные результаты, что в них содержательного, а что является артефактами (лат. arte искусственно + factus сделанный), вольно или невольно порожденными процедурно-математическими свойствами корреляционно-регрессионного анализа? Эта проблема весьма актуальна, так как геологи и геохимики часто меняют состав изучаемых генеральных совокупностей и способ получения выборок из них, не всегда отдавая себе отчет в том, правильно ли они потом интерпретируют получаемые результаты.
Статья посвящена исследованию аналитическими методами и методами компьютерного моделирования следующих вопросов:
1. Как изменится коэффициент корреляции и параметры уравнения регрессии в выборке, образованной из исходной совокупности селекцией проб:
а) с помощью случайного выбора;
б) с помощью неслучайного выбора – в заданном интервале содержаний одного из двух коррелирующих компонентов (например, селекцией проб, содержание компонента в которых или выше заданного, или ниже заданного, или близко к среднему);
в) в заданном интервале (как в п. «б») суммы содержаний обоих коррелирующих компонентов.
2. Каким будет коэффициент корреляции и параметры уравнения регрессии, если коррелировать среднее содержание какого-либо компонента с его средним квадратическим отклонением? Как эти параметры изменятся, если распределение компонента подчиняется:
а) нормальному (гауссовскому) закону;
б) логарифмически-нормальному закону. <...>