Студенческий сайт КФУ - ex ТНУ » Учебный раздел » Учебные файлы »Информатика

Верю не верю

Тип: статья
Категория: Информатика
Скачать
Купить
Верю не верюАракелян АрсенЧтобы разобраться в том, как и где искажается информация, мы решили чуть подробнее рассмотреть основные этапы сбора, анализа и визуализации данных. Выяснилось, что скомпрометировать данные можно на любом из них. Включая сбор данных, особенно если никакого сбора-то и нет, а информация взята…С потолкаТакой наглый подход и раньше встречался редко, а сейчас его и вовсе можно заносить в Красную книгу, поскольку человека, который постоянно придумывает несуществующую статистику, слишком легко поймать за руку. Впрочем, за руку ловят не часто - утверждения, подкрепленные статистикой и отсылкой к авторитетам, по умолчанию считаются достоверными, и сомневаются в их справедливости лишь те, кто придерживается противоположного мнения и имеет на руках статистику, доказывающую обратное утверждение.Поэтому больше всего придуманной статистики на темы, которые никому особенно не важны. Знаете ли вы, что, по данным Всемирной Организации здравоохранения, блондинки являются носителями вымирающего гена и в течение ближайших двухсот лет исчезнут с лица Земли? А знакомо ли вам утверждение, согласно которому человек должен выпивать ежедневно не меньше восьми стаканов воды? Или, возможно, вы слышали, что ежегодно полторы сотни человек погибает под ударами упавших с пальмы кокосовых орехов.Если слышали, то имейте в виду, что ни одно из этих утверждений не соответствует действительности. ВОЗ ничего подобного о блондинках не говорила, исследований на эту тему не вела и даже публично опровергла эти заявления (так что у блондинок есть шанс на выживание); на опасность зрелых кокосов обратили внимание копирайтеры британской страховой компании, которые, конечно, никаких подсчетов не проводили, а байка про восемь стаканов воды появилась в результате неправильно понятой журналистом научной статьи, автор которой хоть и писал о злополучных стаканах, отдельно упоминал, что это общий объем жидкости, включающий в себя как чистую воду, так и воду, содержащуюся в продуктах питания (а там ее достаточно много).Иногда придуманная статистика выбрасывается в народ не для того, чтобы убедить кого-то в своей правоте, а чтобы убедить аудиторию в неправоте оппонента. Джоэл Бест в книге "Наглая ложь и статистика" приводит пример, когда активисты атаковали Рональда Рейгана, утверждая, что в США полтора миллиона бездомных. Активисты придумали эти данные (отвечая на любую критику удивительно конструктивным образом: "Вы что, сомневаетесь, что бездомных мало? Вам что, наплевать на проблемы бездомных?"). Все понимали, что данные о бездомных взяты с потолка, но еще очень долго администрации приходилось убеждать общественность, что реальные показатели в десятки раз меньше - общественность была уверена, что правительство занижает невыгодные для себя показатели, ведь дыма без огня не бывает. И если полтора миллиона были придуманы, значит, в реальности как минимум миллион двести - и ни одним бездомным меньше.Британские ученыеФеномен "британских ученых" все еще ждет своего Линнея. "Британские ученые" - один из главных источников недостоверной информации, в том числе и статистической (для российской прессы, в Британии они пользуются меньшей популярностью). Само словосочетание звучит достаточно серьезно, да и поди проверь, что думают британские ученые на самом деле. Кроме того, Великобритания большая страна, в ней много ученых - вполне возможно, что при определенных усилиях там можно найти ученого, который придерживается нужной точки зрения.Одним из главных источников "научных новостей" с островов Туманного Альбиона является газета Daily Mail, чей авторитет в научном мире близок к авторитету в том же научном мире газеты "Огни Заполярья". Daily Mail - очень качественный таблоид, сотрудники которого умеют придумывать яркие заголовки и хорошие сюжеты. Ни проверкой полученных данных, ни, боже упаси, рецензированием статей они не занимаются - и даже из научных новостей выбирают только те, которые можно эффектно подать и продать целевой аудитории. А целевая аудитория Daily Mail - особенные люди, которые в Британии давно стали объектом злых шуток (у нас аналог подобрать довольно трудно - ну разве что читатели "Комсомольской правды" и "Экспресс-газеты"? - но что-то подсказывает, что 35 процентам населения, которые считают Евгения Петросяна своим любимым артистом, русский аналог Daily Mail пришелся бы по душе)."Независимые" лабораторииНе исключено, что в большинстве "независимых" лабораторий работают именно "британские ученые". Как бы то ни было, "независимые" лаборатории удивительно часто добиваются такого результата, какого ждет от них рекламодатель. И главный метод обеспечения нужных результатов - грамотный подбор группы, на которой будут производиться испытания. В идеале статистическая выборка должна быть достаточно широкой и составленной случайным образом, однако на практике это зачастую невыполнимо. Если, например, заказчика интересует, как отнесутся к его товару обеспеченные домохозяйки от 20 до 27 лет, то платить за привлечение к опросу пенсионеров он не будет, да и выборку в два десятка человек может посчитать вполне достаточной. На выходе получаем изящный пресс-релиз, из которого следует, что девяносто процентов женщин, принявших участие в исследовании эффективности крема от морщин, отметили, что после трех недель использования крема морщины значительно разгладились. Самое интересное, что все в этом пресс-релизе - чистая правда, хотя в двадцать лет морщин, наверное, не очень много.Величина выборки во многом зависит от объекта исследований. Если, скажем, для исследования эффективности крема с лихвой хватило бы тысячи случайно выбранных женщин, то для проверки эффективности прививки от полиомиелита не хватило в свое время 1200 детей, половине которых была сделана прививка, а половине - нет. Собственно, сама проверка прошла вполне успешно - никто из привитых детей во время эпидемии полиомиелита не заболел. Подпортило картину то, что из непривитых детей тоже ни один не заболел. По той простой причине, что полиомиелит, слава богу, не простуда. И даже во время эпидемии вероятность заболеть полиомиелитом грозит очень малой доле населения. Детям повезло. Экспериментаторам, которые должны были изначально взять более широкую выборку, - не очень.Порой источником нужных заказчику данных является не полувиртуальная независимая лаборатория, а вполне уважаемая научная организация. Позволить себе такое могут только очень богатые компании, заказывающие исследования сразу в нескольких институтах, а потом выбирающие те результаты, что не противоречат "политике партии". По очевидным причинам информации о таких сделках крайне мало, но то тут, то там, бывает, всплывет кусочек внутренней корпоративной переписки, из которой заинтересованные читатели могут узнать, например, что в начале 1990-х одна крупная табачная компания запретила публикацию заказанного ею же исследования, потому что по результатам этого исследования получалось, что на здоровье животных пассивное курение действует плохо. К счастью, у компании на руках было другое исследование, в котором говорилось, что в течение девяноста дней у наблюдаемых животных никаких серьезных отклонений замечено не было. Оно и пошло в ход.Еще один пример, который можно здесь привести, не связан напрямую с независимыми лабораториями, а связан, скорее, с не очень добросовестной рекламой. Как и подавляющее большинство статистических подлогов, он крайне прост и формально подлогом не является, однако вводит потребителя в заблуждение. Это реклама паевых инвестиционных фондов, которые - если верить этой самой рекламе - являются крайне прибыльными предприятиями. На заинтересовавшегося будущими миллионами инвестора с удовольствием обрушат гору статистической информации, наглядно доказывающей, как мудра управляющая компания, как осторожно и вместе с тем эффективно она распределяет средства, как выросли активы ее клиентов за последний год и так далее. И все это правда. Все так и есть. С той лишь разницей, что таких фондов у компании множество, рекламирует она, разумеется, самые успешные и никаких гарантий, что активы будут расти и дальше, конечно же, не дает. Если бы компанию интересовала не прибыль, а репутация, она, возможно, обратила бы внимание потенциального инвестора на то, что потеряла деньги на многих своих начинаниях, а также на тот простой факт, что предсказать рост или падение в долгосрочном периоде попросту невозможно. Но в компании, которые заботятся о репутации в ущерб прибыли, много денег не принесут, поэтому финансисты делают вид, что вырастили целый лес, даже если из всех саженцев прижился лишь один. Умному и этого достаточно, а у дурака все равно кто-нибудь деньги вытянет - так лучше уж мы, чем какие-нибудь мошенники...
Другие файлы:

Ледяное солнце
Я ТЕБЕ НЕ ВЕРЮ…Ты — сон вчерашний, который мне пророчит слезы. Я ТЕБЕ НЕ ВЕРЮ! Ты — снег зимы прошедшей, он давно растаял. Я ТЕБЕ НЕ ВЕРЮ! Ты — солнце...

Верю в тебя
Вашему вниманию предлагается книга "Верю в тебя"....

Стратегия: Спасатель
В мистику знаков Зодиака я не верю, я верю в штамп Зодиака. Поставили на тебя с раннего детства печать -- будешь ей следовать, куда ты денешься. Если...

Я не верю в анархию
«Я не верю в анархию» — это дайджест, сборник различных газетных публикаций о Летове и ГО с 1989 по 1997 год. Несмотря на казалось бы специфическое со...

Идеальный Дворецкий
Возможно, кто-то верит в сказки, в мистику, боится привидений и ищет источник молодости. А я верю в силу воли, дружбу и приемлемый процент риска. Чего...