Контактная информация

Задать вопросы и получить на них ответы, записаться на консультацию или обучение Вы можете любым удобным для Вас способом:

  • по телефону: +7 988 5814100
  • по Skype: sin-ta77
  • по электронной почте: stat@best-stat.ru

 Время работы - с понедельника по пятницу, с 10.00 до 18.00

Очные консультации и занятия проходят в городе Ростове-на-Дону.

 

Ошибки в статистике и в жизни

Ошибки - неотъемлемый элемент нашего существования, они сопровождают всю жизнедеятельность человека, от рождения до смерти. Они - знак нашего несовершенства, основа для опыта и учения. Мы стремимся их избежать и совершаем снова и снова. Но на всех ли ошибках можно учиться?

Ошибки мы постоянно совершаем и при изучении окружающего нас мира. Собираем данные, обрабатываем, ищем закономерности - и ошибаемся. Но любые ли ошибки говорят о непригодности результата?

Неизбежны ли ошибки? Все ли ошибки "плохие", или есть и "хорошие"? Чтобы ответить на эти вопросы, нужно попытаться проникнуть в их суть и причины возникновения.

В статистике ошибки принято классифицировать, разделять. В первую очередь на преднамеренные и непреднамеренные.

Ошибки статистического наблюдения

Преднамеренные - результат "злого умысла", искажения фактов людьми по тем или иным причинам. Как и в жизни, когда по доверчивости человек начинает поступать в соответствии с тем, что ему сказали, не проверив информацию, которая оказывается ложью и приводит к ошибкам в действиях и результате, преднамеренная ошибка способна исказить картину, полученную с помощью статистического исследования. Бороться с ней можно только проверкой получаемых сведений. Один человек с легкостью может солгать, двое или трое могут договориться о лжи. Но чем большее число человек мы опрашиваем, тем меньше влияние преднамеренной ошибки, тем достовернее результат. И в жизни, и в статистике нельзя полагаться на слова одного индивида.

Если преднамеренные ошибки возникают по воле людей, то непреднамеренные - отражение нашего несовершенства. И как человеческих существ, и как исследователей. Это следствие сущности статистического анализа, и фундаментального закона, согласно которому, человек не может знать и уметь все. Это те ошибки, которые возникают всегда, обязательно и неизбежно. Единственное, что мы можем сделать, это соблюсти все правила и требования, все законы, и тогда получим возможность минимизировать ошибку и, следовательно, ее последствия. Непреднамеренные ошибки также бывают разных видов. Рассмотрим их подробнее.

Естественные, неизбежные ошибки, возникающие всегда и связанные с самой природой статистических наблюдений - это ошибки случайные. Они сопровождают любое статистическое исследование, к их появлению необходимо быть готовым. Нужно понимать, что никакое исследование не может быть безошибочным. Но в тоже время нельзя считать исследование заведомо недостоверным только по причине неизбежности ошибок. Случайные ошибки приводят к тому, что получаемые нами результаты колеблются около истинного (неизвестного нам) значения интересующего нас показателя. Колебания происходят как "в плюс", так и "в минус", и если количество наблюдений (например, опрошенных лиц) будет достаточно велико (1), то в среднем эти колебания взаимно погасятся, и мы получим результат, который будет достаточно близким к истинному значению. Говорят, что случайные ошибки имеют свойство взаимопогашаться с увеличением числа наблюдений. Также и в жизни, мы часто не можем понять, что и как нам нужно делать, всего лишь с одного раза. Только после попадания в разные, в чем-то похожие ситуации, много раз, мы начинаем понимать свои ошибки и как же нам следует поступать. Чаще всего случайные ошибки невелики, однако иногда они могут быть и значительными. В этом случае для того, чтобы нивелировать влияние таких "выбросов", больших отклонений, требуется большее число наблюдений или повторов.

Таким образом, случайные ошибки - это неизбежность, которую необходимо учитывать. Они не являются следствием некорректности и искажений в нашем исследовании, его методологии. Для того чтобы они не испортили результат, необходимо использовать достаточно большое количество данных. Более сложной с этой точки зрения является другая группа ошибок - ошибки систематические.

Систематические ошибки связаны с нарушениями в сборе данных, и представляют собой результат наших неверных действий. Как и в жизни, когда наш неверный выбор приводит к тому, что мы повторяем и повторяем ошибочные действия, упорно не учась на собственных ошибках и не меняя модели поведения с их учетом, так и систематические ошибки при сборе данных не дают нам корректно выявить интересующую нас закономерность. Другими словами, систематические ошибки связаны с самой системой сбора информации: если она имеет существенные недостатки, ошибки неизбежны. При этом систематические ошибки, в отличие от случайных, не взаимопогашаются при росте числа опрошенных (или собранных данных), и могут быть устранены только путем внесения изменений в способ получения информации, то есть устранения ошибок, приведших к их появлению.

Систематические ошибки, в свою очередь, делятся на два вида. Первый - ошибки измерения. К ним относятся те, которые связаны с неточностью измерительных приборов (весов, радаров сотрудников ГИБДД, термометров и т.п.), или с округлением (так, бухучет принято вести с точностью до копеек, и если расчет будет давать три или четыре знака после запятой в денежной сумме, при округлении мы получим ошибку измерения). Или систематическую ошибку измерения мы получим, если неверно сформулируем вопрос анкеты. Так, на вопрос "довольны ли Вы стилем руководства Вашего начальника" маловероятно, что будут получены ответы "нет", особенно если опрос проводит сам начальник, имеющий полномочия увольнять сотрудников. Другое дело, если будет задан вопрос "хотели бы Вы изменить что-либо в работе Вашего подразделения?". Такой, казалось бы, непрямой вопрос позволит получить ответы и о стиле управления тоже. Ошибки измерения первого типа обычно устраняются использованием нескольких приборов или проведением серии измерений, проведением более точных расчетов. Например, систематическая ошибка получается при фиксации возраста как числа полных лет, исполнившихся человеку. "Ровесниками" предстают и тот, у кого день рождения был вчера, и у кого будет завтра, если первому вчера исполнилось х лет, а второму завтра будет х+1. Для нивелирования этого эффекта необходимо считать не только число прожитых лет, но и число месяцев.

В экономике к ошибкам измерения можно отнести также ошибки, возникающие по причине того, что интересующая нас характеристика может оказаться не наблюдаемой непосредственно, и мы вынуждены использовать что-либо, ее замещающее. Самый простой пример - спрос. Этим понятием постоянно оперируют экономисты, он растет и падает, и влияет на рыночную ситуацию. Однако возникает вопрос: а как измерить спрос? Как определить, есть ли у человека возможность и желание приобрести данный товар по данной цене? Можно провести опрос, но возникнет вопрос достоверности данных. Поэтому чаще всего спрос оценивают через объем продаж, то есть учитывают спрос уже реализовавшийся. Но ведь совершенно не факт, что все люди, которые хотели и могли купить что-либо, это сделали. Поэтому и возникает ошибка.

Еще более серьезной, чем перечисленные, систематической ошибкой является ошибка репрезентативности. Она возникает при использовании так называемого выборочного метода, то есть когда на основании опроса части населения делается вывод обо всем. Для того, чтобы это было возможным, выборка должна быть репрезентативной, или представительной, то есть представлять собой уменьшенную копию генеральной совокупности наблюдений (то есть всех возможных наблюдений, например, всего населения). Ошибка репрезентативности появляется, если это правило нарушается. Например, если мы захотим изучить, как распределяются студенты по полу, придем для этого на традиционно "женский" филологический факультет и на основании этого заявим, что все современные студенты - девушки. Но хорошо, если мы представляем себе, что такая ошибка может появиться, поскольку вряд ли кто-то станет действовать так абсурдно, как в этом примере. Гораздо хуже, когда ошибка репрезентативности не столь заметна, но столь же коварна и пагубна. Скажем, если мы решим "просто опросить людей на улице", и встанем для этого возле института. Даже если он находится на центральной улице с высокой проходимостью, с большой вероятностью в нашу выборку попадет значительно большая доля молодежи, чем ее проживает в городе. Около дорогого торгового центра – рискуем завысить оценку благосостояния, рядом с собесом – получим смещение в сторону пенсионеров и т.д. Словом, ошибка репрезентативности при сборе данных аналогична ошибке в жизни, когда мы, общаясь все время с аналогичным типом людей, пытаемся делать выводы "обо всех". Типичный пример - такие выводы, сделанные на основании личного опыта, как "все женщины меркантильные" или "все мужчины жадные". Хотя в таких случаях обычно сам человек выбирает только один типаж противоположного пола (хотя, возможно, и бессознательно). Для того чтобы избежать ошибок репрезентативности, необходимо соблюдать условия отбора наблюдений, чтобы данные представляли собой репрезентативную совокупность. Ну, а в жизни нужно всегда помнить, что наш опыт никак не может дать нам достоверную с этой точки зрения информацию. И каждый раз, начав говорить фразу вроде "да все они..." или "вот всегда так...", вспомнить, что мы не можем претендовать на то, что наши знания и опыт дают нам основания распространять наши выводы на всех и всё, и скорее всего мы совершим ошибку репрезентативности.

Таким образом, ошибки неизбежны и естественны. Практически со всеми можно бороться - если не избежав ошибки, то хотя бы исправив последствия. Но если случайные ошибки нормальны и естественны, чтобы они не повлияли на результат, достаточно использовать много данных (например, опросить много людей), то к ошибкам репрезентативности необходимо относиться весьма внимательно, поскольку они могут быть "коварны" и сильно исказить результат исследования. Как и в жизни, нельзя работать и жить, отрицая собственные ошибки. Они еще "проявят себя", и в самый, казалось бы, неподходящий момент. Нужно помнить, что они всегда будут, они естественная часть нашей жизни. И только понимание этого дает возможности не отрицать их, а использовать для того, чтобы учиться и совершенствоваться, идти вперед и получать новые результаты. Ведь важна не невозможная на практике безошибочность исследования, а качество его проведения и достоверность и новизна итогов.


1 С точки зрения статистики "достаточно велико" - это когда начинает работать так называемый "Закон больших чисел", который позволяет погашаться ошибкам и проявляться закономерностям. Его сущность мы постараемся простыми словами объяснить в последующих статьях. Существуют формулы, позволяющие вычислять минимально необходимую численность выборки, чтобы получать результаты с заданной достоверностью.

Дата публикации: 05.02.2014