Войти в банк статистических данных

О ПРОЕКТЕ "БАНК СТАТИСТИЧЕСКИХ ДАННЫХ"

Статистика – это оружие и в честной, и в нечестной борьбе «мнений», даже если это не политическая публицистика, а научные исследования. Вот простой пример: два журналиста, один – сторонник Лужкова, другой – его противник, пишут об одной и той же «статистике» в середине 1993 года. Сторонник заявляет: «… 80% москвичей живут в отдельных квартирах!», рассматривая это как успех градоначальника, а противник с таким же пафосом восклицает: «Каждый пятый москвич живет в коммуналке!». Оба используют одну и ту же статистику, не информируя читателя, что эти данные никак не характеризуют деятельность Лужкова – эта информация была использована им для заявления своих позиций о реформе ЖКХ, продвижение которой Лужков осуществил лишь в 2001 году при поддержке Грефа (её результаты весьма спорны).

В предполагаемом издании многотомника об истории 90-х важную роль должна играть (и будет играть) статистика, без которой нельзя оценить меняющуюся на глазах ситуацию в экономике, в обществе, в повседневной жизни людей. Могут сказать, что это так, но зачем огород городить, если есть БД Росстата, есть ЕМИСС (Единая межведомственная информационно-статистическая система, в которую поставляют данные 62 ведомства), имеются огромные международные БД (ООН, МВФ, Мировой банк, Евростат и «куча» других). И всё же вся эта невообразимая по размеру совокупность статданных разных лет, разных стран и самых разных показателей мало пригодна в исходном виде для того, чтобы с ее помощью разобраться в происходившем и происходящем.

Дело в том, что используемые в многотомнике статистические данные должны быть легко доступными, иметь «паспорт» источника (кто, когда и по какой методике собрал эти данные), должны быть сопоставимыми при сравнении разных лет и разных стран, одинаково называемые показатели должны означать одно и то же. И, одновременно, статистические данные должны быть представлены в удобной для читателя форме, т.е. должны быть преобразованы в легко используемые и осмысливаемые таблицы, графики, диаграммы. В то же время даже такой фундаментальный показатель как ВВП (Внутренний Валовой Продукт) или GDP (Gross Domestic Product) сплошь и рядом имеет существенные различия в разных БД. Например, ВВП (GDP) России в миллиардах долларов в 1994 оценен Росстатом, МВФ и Мировым банком следующими значениями: 172, 298 и 395 соответственно, – различия очень весомы: Росстат даёт значение на 42,28% меньшее, чем МВФ, а Мировой банк завышает данное МВФ значение на 32,55%.

В дополнение к указанным проблемам согласования данных из разных источников и придания им удобной для пользователей формы проектом предусматривается еще одна: создание специальных индикаторов результативности описываемых реформ 90-х для анализа динамики (характера происходящих изменений) и для сопоставления российских реформ с реформами в других странах. Для этого, как правило, стандартные данные официальной статистики или стандартные данные экспертных опросов оказываются мало пригодными, нужна профессиональная работа по агрегированию разных статистических показателей в некие интегральные характеристики.

В настоящее время завершена разработка нашего банка статистических данных (БСД), т.е. определены элементы её состава, организация хранения и поиска данных пользователями и работа с файлами, и начато ее воплощение. Мы создаем ее в трех целях:

  • она должна стать удобным подспорьем для авторов создаваемого многотомника по истории 90-х;
  • она должна стать доступным и удобным источником для всех, кто тоже захочет изучать 90-е – ученых, студентов, аспирантов, журналистов и т.п., даже если они не обладают высокой квалификацией в сфере статистических исследований;
  • она должна стать основой для последующего пополнения.

Наша БСД снабжается удобной, гибкой и понятной системой поиска нужных данных. Наконец, она должна помогать всем, кто будет с ней работать, разъясняя особенности тех или иных данных, их природу и возможности практического применения. Можно признаться, что мы рассчитываем на создание особенного ресурса статистических данных, аналогов которому мы не знаем.

С этой целью наша БСД будет хранить следующие данные:

  1. Источники данных (сведения о других банках и базах данных) – это самый простой тип данных, состоящий из ссылки на источник. Примерами источников данных могут быть Росстат или ООН.
  2. Базы данных – это файлы в формате Excel, в которых данные организованы так, что они сопоставимы и удобны для дальнейшего статистического исследования. Часто они будут результатом нашей собственной работы с источниками, описанными выше. Например, данные разных лет будут собираться в удобные таблицы для изучения динамики значений различных показателей. Другой пример – сопоставление разных регионов России или разных стран. Будут также и подобные файлы, подготовленные не нами, но с указанием авторства.
  3. Визуализации – это также файлы в формате Excel, в которых наряду с фрагментами баз данных (см. выше) будут содержаться графики и диаграммы, образующие визуальные представления некоторых закономерностей, которые можно извлечь из данных фрагментов статистических данных. Любой интересующийся пользователь может вставлять эти рисунки в свои исследования, осмысливая в своем исследовании представленные закономерности.
  4. Аналитические доклады – это тексты, в которых описываются результаты исследований, опирающихся на статистические данные. Наличие таких данных в нашей БСД обусловлено тремя причинами: (1) упрощение научной коммуникации между исследователями, применяющими статистические методы; (2) повышение статистической квалификации пользователей нашей БСД; (3) пояснение некоторых терминов, понятий, методик, смыслов. Это значит, что мы будем размещать только доклады, которые удовлетворяют этой цели.
  5. Наборы данных – это просто списки данных всех четырех предыдущих типов, объединенных некоторым общим важным признаком или исследовательской логикой. Речь, конечно, идет о некоторых не очень формальных и достаточно уникальных признаках, которые не учитываются стандартными и общепринятыми признаками, используемыми для поиска данных в БСД.
  6. Описания данных – это тексты, в которых даются, если это необхолимо, пояснения к данным типа от 1-го до 5-го. Кроме того, описания данных снабжены ссылками друг на друга, образуя сеть, выполняющую, помимо прочего, и образовательные функции.

Для поиска нужных пользователям статистических данных в БСД будет предоставлено две возможности. Первая – обычный контекстный поиск. Вторая возможность – навигация по БСД с помощью набора атрибутов (характеристик) данных и их заданных нами значений. Вот они:

  • тип данных; этот важнейший атрибут уже описан выше;
  • годы, к которым относятся данные;
  • тип источника данных – кто произвел эти данные (Росстат, Мировой банк и т.п.);

Мы открываем первую версию банка статистических данных для общей опытной эксплуатации. Мы ждем ваших предложений и замечаний. Мы также открыты для сотрудничества: если кто-то хочет предложить для размещения в нашем банке свои данные или результаты их анализа, милости просим. Вы можете присылать свои соображения и предложения по адресу statis@indem.ru с указанием темы письма: "В банк статистических данных".