Что могут данные, и на что они не способны?

09.06.2012

Джонатан Грей (Jonathan Gray) считает, что журналисты и творцы сенсаций при разработке собственных гипотез должны тщательно проверять основанные на данных гипотезы и воспитывать в себе более критический взгляд.

Что могут данные, и на что они не способны?

На заре развития фотографии существовал огромный оптимизм, связанный с открывшимися возможностями по знакомству всех людей с точными и объективными изображениями из различных уголков мира. В 19 веке пионеры фотографии (позднее названные фотожурналистами) принесли в мир беспрецедентные документальные изображения сцен войны в Мексике и Крыму, а также событий в США. Через полтора столетия -- пройдя через десятки лет рекламы, пропаганды и PR, монтажа, ретуши и откровенных манипуляций -- мы уже не так безоговорочно верим в то, что фотография отражает реальность. Фотография потеряла свою привилегию служить безоговорочным доказательством истины. Фотографии стали частью того мира, где журналисты, аналитики, критики, читатели и ученики должны все тщательно взвешивать, анализировать и критически оценивать.

На фоне очередной волны интереса к данным, технологиям их обработки и множеству других вещей, вращающихся вокруг всего этого, возникает сомнение в том, что обрабатываемые машинами, структурированные данные являются чем-то особенным. Начало 20 века принесло почти мистический оптимизм в ряды интересующихся наукой людей, социологов, философов и ученых, которые решили, что теперь они могут оставить в стороне напичканные оценочными суждениями учебники, и приступить к изучению модели мира, основанной исключительно на фактах. "Факты священны", -- заявляет Guardian Datablog и "за взгляд на мир, построенный на фактах", -- гласит Gapminder. Мысль о связи наших репортажей, аналитики и критических материалов с правдой, подкрепленной данными, определенно утешает. Но идея о том, что данные открывают нам прямой доступ к природе вещей, по большей части, является химерой.

Данные могут иметь исключительную ценность, если используются должным образом. Но отстаивая с пеной у рта подобную точку зрения, мы должны стремиться к тому, чтобы сдерживать наши ожидания пропорционально возможностям того, кто их представляет. Мы должны воспитывать в себе критический взгляд. Хотя мы не можем надеяться на обретение в одночасье проницательности и легкости опытного статистика или ветерана журналистских расследований, мы можем по крайне мере попытаться оставить за дверями различные мифы, основанные на неверной трактовке данных. На этом можно было бы и закончить, однако следует оставить несколько советов любителям покопаться в данных:

Данные сами по себе не являются силой

Данные никогда не формируют оценки и не изменяют мир сами по себе. Разговоры о том, что данные изменяют мир, являются не меньшим преувеличением, чем рассуждения о прессе, изменяющей мир. Базы данных не стучат в двери, не набирают телефонные номера, не начинают реформ, не создают новые учреждения, не обучают граждан тому, что им делать в лабиринтах окружающего их бюрократического мира.

Потенциальная ценность данных может стать реальной, когда их поймет человек, намеревающийся сделать что-то полезное для общества Они приобретают ценность в результате приложения мастерства, опыта и (вероятно, самое главное) кропотливой работы людей. Сила не возникает автоматически просто в результате того, что существуют открытые базы данных, доступ к которым можно получить через интернет.

Данные не являются идеальным отражением окружающей действительности

Открытые для широких масс наборы данных не могут служить хорошей информацией об окружающем мире. И в этом нет ничего удивительного. В них содержится свой мир, собранный, сгенерированный, отобранный, упорядоченный, отфильтрованный, сопоставленный, проанализированный и откорректированный в соответствии с определенными задачами. Эти задачи могут быть нацелены на удовлетворение самых различных потребностей -- прогноз погоды, управление трафиком, планирование городов, оценка различных сценариев развития ситуации в обществе.

Данные часто далеки от необходимой степени полноты, совершенства, точности и актуальности. Они формируются людьми и преломляются через многочисленные слои бюрократии и официоза. Поэтому данные часто подобны тени, отбрасываемой на стену. Однако, несмотря на свою неполноту и несовершенство, данные генерируемые общественным институтами могут стать наилучшим источником информации, который мы можем найти по данному предмету. К тому же их можно дополнить информацией из других источников, документами и внешней экспертизой. Вместо того, что бы верить в заявленную ценность и непогрешимость наборов данных, лучше их рассматривать в качестве отправной точки или дополнительного источника, для понимания того или иного предмета.

Данные не говорят сами за себя

Иногда элементы базы данных становятся понятными без привлечения дополнительной информации, контекста или инструкций по интерпретации. Примером подобного рода может быть расписание движения поездов. С его помощью мы ясно видим, когда отправляется необходимый нам состав. Но часто, для того чтобы понять смысл данных, необходимо провести дополнительный анализ или исследование.

Во многих официальных базах данных собраны официальные тексты, понять которые может только тот человек, которого научили правильно их изучать и критически интерпретировать. Он должен уметь читать между строк, замечая, что здесь опущено или не заслуживает внимания. Такой человек видит значимость и значение специфических оборотов речи и т.п. Мы никогда не должны думать, что любой человек сможет правильно интерпретировать такую базу данных. Точно также -- не каждый сможет вникнуть в политический документ или научную статью.

Данные не могут управлять

Для некоторых людей данные могут служить источником для анализа социальных процессов, с последующей подготовкой более детальной, насыщенной информацией статьи. В принципе, это может помочь большему количеству людей участвовать в подготовке политических решений. Но демократизация информации, это другое, нежели демократизация власти.

Знание того, что какой-то процесс идет не так, как следовало бы, а также того, как это исправить, еще не означает возможность внесения исправлений или хоть какого-нибудь влияния на это.

Более-менее безупречных аргументов и непогрешимых доказательств обычно недостаточно для запуска реформ. Если вы хотите изменить мир, законы или политику, то вам скорее помогут непреклонные адвокаты, влиятельные или богатые покровители, положительное внимание прессы, огромное количество времени или последователи, внушительные суммы денег и так далее. Наблюдения за тем, что происходит в коридорах власти, через доступные базы данных, еще не гарантируют, что вы сможете свободно проникнуть туда и удачно обойти все острые углы. Открытая информация о правительстве, еще не означает открытое правительство, общедоступное правительство или хорошее правительство.

Интерпретировать данные не так просто, как кажется

Существует мнение, согласно которому, широкая доступность данных и инструментов для обращения с ними означают демократизацию в анализе и интерпретации данных. Имея на вооружении правильные инструменты и техники, каждый может правильно понять суть, заключенную в данных. Или не так?

Важно различать уровни обработки и интерпретации: с приходом современной вычислительной техники и интернета, работать с данными стало легко, как никогда прежде (собирать, визуализировать, распространять и т.п.). Но из этого не следует в обязательном порядке, что стало легче извлекать знания из данных. Революция в средствах управления контентом, позволяющая нам легко находить нужные законы, еще не значит, что она облегчила нам их интерпретацию. Поэтому стать хорошим журналистом, основывающим свои статьи на изучении данных, аналитиком или репортером сегодня нисколько не легче, чем было когда-то.

Создание хорошего журналистского материала, построенного на данных, или хорошего приложения, управляемого данными, часто больше похоже на искусство, чем на науку. Как и в фотографии, оно подразумевает отбор, фильтрацию, обрезание, композицию и выделение. Данные должны быть использованы так, чтобы указать на правду -- а правда редко дается легко. Среди огромного количества сервисов и виджетов, библиотек и плагинов, разговоров и пособий, нет ни одной техники, которая бы дала уверенный результат.

Автор статьи уверен, что со временем придет сбалансированное и критическое понимание ценности данных, и их значения в нашей информационной среде. Бывший журналист BBC Майкл Блестленд (Michael Blastland) написал в недавно опубликованном Пособии по журналистике, основанной на данных (Data Journalism Handbook), "мы не должны быть ни слишком критичны, ни слишком наивны, но -- осторожны".

Источник: The Guardian
Переводчик Александр Никитин

Текст сообщения*
:) ;) :D 8) :( :| :cry: :evil: :o :oops: :{} :?: :!: :idea:
Защита от автоматических сообщений
 


Что такое интернет сообщество?
Интернет сообщество - это группа людей, которые имеют общие интересы и общаются по этому поводу в интернете.






Последние комментарии