Римма Прокопьевна Рудакова, Виктор Иванович Гаврилов, Леонид Леонидович Букин
Статистика: учебное пособие
Предисловие
Становление рыночных отношений в экономике России изменило и статистическую систему: внедряется система национальных счетов, создана качественно новая статистика цен, труда и занятости, бюджетная и банковская статистика и т. д. Изменилась и методика статистического учета: на смену сплошному статистическому наблюдению пришло несплошное, с применением оценочных досчетов.
Несмотря на разнообразие сфер применения статистики, имеются общие методы статистической обработки информации. Статистика имеет дело с числовой информацией, с большими и малыми выборками, с различного рода вычислениями, которые целесообразно производить с применением средств вычислительной техники. Изучающим статистику целесообразно сначала освоить приемы и методы, присущие общей теории статистики, а затем ознакомиться с их комплексным применением с целью более углубленного анализа изучаемых экономических процессов.
В предлагаемом учебном пособии в разделе I рассматриваются вопросы целесообразности и последовательности применения статистических методов в статике (в пространстве). Этому посвящена глава 1. Затем рассматривается целесообразность и последовательность применения статистических методов в динамике – глава 2. В главе 3 анализируются вопросы комплексного применения статистических методов в различных их сочетаниях. Так, применяя индексный метод в сочетании с аналитическим выравниванием, исследователь может выявить влияние на результат управляемых (выразившихся в трендовых значениях) и неуправляемых факторов (выразившихся в колеблемости относительно тренда). При сочетании же индексного метода с регрессионными моделями удается выявить не только влияние на изменение результата размеров каждого из факторов, но и эффективность использования каждого из них.
Такого рода углубленный анализ позволяет производить и более достоверный прогноз, что весьма важно не только при прогнозировании макроэкономических показателей, но и на уровне отдельного предприятия. Без предвидения управление любыми процессами, особенно экономическими, – невозможно. Каждый специалист, менеджер любого звена управления должен владеть навыками прогнозирования. Помочь решению этой задачи и призван данный учебник, который является более углубленным курсом статистики, включающим и элементы эконометрики.
Раздел II посвящен вопросам социально-экономической статистики с учетом перехода к использованию в статистике международных стандартов, что позволяет применять в статистике показатели, которые предназначены для анализа рыночной экономики, и обеспечивает международную сопоставимость данных. В учебном пособии рассмотрена система национальных счетов, статистика результатов развития экономической деятельности, статистика уровня жизни населения и демографическая ситуация в стране, статистика занятости и безработицы, финансов предприятий и кредитно-денежной системы, статистика ценных бумаг. Отдельные главы посвящены изучению факторов производства: статистика основного и оборотного капитала; статистика трудовых ресурсов, а также статистика издержек производства и обращения на предприятиях.
Учебное пособие подготовлено на основе курса лекций, читаемых в Ленинградском государственном университете им. А. С. Пушкина. Данный курс был прочитан на курсах ООН в Ташкенте и заслужил высокую оценку специалистов по статистике более чем из 40 стран, повышавших на этих курсах свою квалификацию.
Авторы благодарят за тщательное рецензирование рукописи и ценные замечания доктора экономических наук, профессора М. М. Юзбашева и доктора экономических наук, профессора ЛГУ им. А. С. Пушкина Н. М. Космачеву, а также за помощь в подготовке учебного пособия к печати А. Н. Рудакова и Е. А. Мещерякову.
Раздел I
ОБЩАЯ ТЕОРИЯ СТАТИСТИКИ
Глава 1
ЦЕЛЕСООБРАЗНОСТЬ И ПОСЛЕДОВАТЕЛЬНОСТЬ ПРИМЕНЕНИЯ СТАТИСТИЧЕСКИХ МЕТОДОВ ПРИ АНАЛИЗЕ СТАТИЧЕСКИХ ПРОЦЕССОВ И ЯВЛЕНИЙ
1.1. Методы исследования однородности изучаемого объекта и типологическая группировка
Одной из отличительных черт бурного развития науки является широкое применение статистических методов и вычислительной техники в освоении информации. В настоящее время невозможно представить себе дисциплину, которая не пользовалась бы в процессе познания методами численного выражения закономерностей, связей, зависимости, измерения тенденции и т. д. Это, в частности, относится и к экономическим наукам.
В статистической литературе большое внимание уделяется изучению и применению отдельных статистических методов и приемов, но совсем недостаточно освещены вопросы целесообразности и последовательности использования того или иного статистического метода, их комплексного применения, сочетания различных методов. Абсолютизация того или иного метода исследования ничего, кроме вреда, не приносит. Только сочетание различных методов может дать заметный эффект. Именно с этих позиций и нужно оценивать роль и место статистического моделирования в системе познания различных процессов и явлений. В данной работе предпринята попытка систематизировать методику комплексного применения статистических методов в экономических исследованиях, рассмотрена целесообразность и последовательность использования статических методов и приемов при анализе статических и динамических процессов.
Первым этапом исследования является накопление (сбор) необходимых сведений об изучаемом объекте. Если наблюдений не очень много, то можно провести упорядочение, расположив их в порядке возрастания или убывания, т. е. построить ранжированные ряды. Если же наблюдений много, то приходится прибегать к их группировке. Статистические ряды носят самый разнообразный характер, имеют различное назначение и в разных целях могут использоваться в экономическом анализе. Одни статистические ряды являются вариационными рядами распределения. Эти ряды показывают распределение единиц изучаемой совокупности по отдельным группам, выделенным по какому-либо признаку. Другой разновидностью статистических рядов является последовательность чисел, отражающих величину того или иного показателя во времени. Это так называемые ряды динамики. Они позволяют анализировать изменение любых явлений во времени, об этом речь пойдет позже. Не умаляя значения временных рядов, следует отметить, что вариационным рядам распределения в статистическом анализе принадлежит особое место, ибо только при помощи распределения сложных совокупностей на качественно однородные группы можно изучать их структуру, соотношение между частями целого и т. п., без чего немыслим никакой экономический анализ. Ряды распределения могут строиться по качественным (атрибутивным) и по количественным признакам, по одному признаку и по нескольким, предоставляя тем самым широкие возможности исследователям при изучении сложных экономических явлений. Ряды распределения могут быть представлены либо в табличной форме, либо в геометрической, т. е. графической. Статистическая совокупность, представленная в виде ранжированного ряда распределения, графически изображается в виде огивы. Она строится так: на оси абсцисс наносятся номера элементов совокупности по ранжиру, а на оси ординат откладываются значения признака. Огива наглядно показывает интенсивность изменения изучаемого признака. Вариационные ряды распределения изображаются графически в виде полигонов и гистограмм. В виде полигонов обычно изображаются дискретные вариационные ряды распределения. При этом значения признака откладывают на оси абсцисс, а частоты (или частости) – на оси ординат. Вершины ординат соединяют прямыми линиями, в результате чего получают полигон (многоугольник). В виде полигона можно представить и интервальные вариационные ряды. Для этого за отдельные значения признака принимаются средние значения интервалов. Интервальные же вариационные ряды чаще всего изображают в виде гистограммы, в которой частоты выражают в виде прямоугольников соответствующей длины, а основания прямоугольников, опирающиеся на ось абсцисс, соответствуют интервалу значения признака (рис. 1).
Рис. 1. Гистограмма и полигон распределения
Различают одновершинные и многовершинные распределения. Многовершинность распределения, как правило, является признаком неоднородности изучаемой совокупности. Из разнообразия форм одновершинных кривых распределений можно выделить следующие наиболее характерные типы: симметричные, умеренно асимметричные, крайне асимметричные.
В практике обычно редко встречаются идеально симметричные распределения, чаще умеренно асимметричные, в которых частоты с одной стороны от центра рассеивания уменьшаются заметно быстрее, чем с другой. Асимметричное распределение в пределе становится крайне асимметричным – в этом случае наибольшая частота расположена на одном из концов распределения.
При решении некоторых вопросов удобнее пользоваться накопленными частотами распределения. Кривая накопленных частот распределения носит название «кумулята распределения». При построении кумуляты на оси абсцисс откладываются значения признака, на оси ординат – накопленные частоты. Построение вариационного ряда распределения и его графическое изображение позволяют получить первое представление о его наиболее характерных общих чертах. В то же время статистическое изучение совокупности не может ограничиться лишь простым упорядочением наблюдаемых величин. К тому же ряды распределения и их графики бывают довольно громоздкими, так как включают в себя всю исходную информацию. Поэтому наиболее рациональным путем статистического описания распределения будет вычисление определенных числовых характеристик, отражающих реальные свойства совокупности. К таким характеристикам прежде всего относятся характеристики центральной тенденции ряда распределения, т. е. нахождение его центрального значения; рассеивания значений признака относительно центра распределения; асимметрии и островершинности распределения. Изучение статистических характеристик распределений целесообразно начать с рассмотрения наиболее простых и в то же время чаще всего используемых в статистическом анализе, т. е. с изучения средних величин; затем научиться измерять вариацию, изучить меры скошенности и островершинности. Все эти показатели тех или иных особенностей распределения составляют единую систему статистических характеристик.
Однако применение тех или иных статистических методов предполагает прежде всего однородность изучаемой совокупности: нельзя, например, анализировать совокупность, состоящую из разных категорий хозяйств, включающую предприятия разной специализации и т. д. Для успешного решения задач необходимо глубокое понимание сущности изучаемого процесса или явления. Учитывая сложность, неоднородность экономических явлений и процессов, необходимо производить анализ таким образом, чтобы наиболее существенные различия между отдельными группами явлений не затушевывались, а выделялись для более успешного их изучения. В то же время объединение в группы сходных однотипных явлений помогает выявить их черты и особенности, которые при изучении каждого явления отдельно могут оставаться незамеченными. Выделение в каждой совокупности общественно/экономических типов явлений – главное условие ее научного анализа. А это можно осуществить, только применяя метод типологических группировок.
Массовые явления хозяйственной деятельности предприятий, являющиеся объектом статистического изучения, имеют сложный характер, обладают качественной общностью, свойственной данному явлению, но в то же время имеют и различия. Так, производством какой-либо продукции занимаются сельскохозяйственные предприятия и фермерские хозяйства и т. д. Стало быть, при характеристике производства данного вида продукции в регионе следует исходить из учета качественных особенностей предприятий, производящих эту продукцию, – в противном случае выводы будут неточными, а принимаемые на основании таких выводов решения – неэффективными.
Типологическая группировка данных – основной прием изучения экономических явлений, обеспечивающий качественную сопоставимость единиц совокупности и дающий возможность получения обобщенного количественного значения признака.
1.2. Методы измерения обобщающих характеристик совокупности
Метод группировок позволяет изучить состояние и взаимосвязи экономических явлений, если группы будут охарактеризованы показателями, раскрывающими наиболее существенные стороны изучаемого явления.
При анализе и планировании необходимо опираться не на случайные факты, а на показатели, выражающие основное, типичное, коренное. Такую характеристику дают различные виды средних величин, а также мода и медиана.
Вопрос об однородности совокупности не должен решаться формально по форме ее распределения. Его, как и вопрос о типичной средней, нужно решать, исходя из причин и условий, формирующих совокупность. Однородной является такая совокупность, единицы которой формируются под воздействием общих главных причин и условий, определяющих общий уровень данного признака, характерный для всей совокупности.
Согласно теории типологических группировок, решающее значение в оценке однородности совокупности принадлежит не форме распределения, а размеру вариации и условиям ее формирования. Для качественно однородной совокупности характерна вариация в определенных пределах, после чего начинается новое качество. Вместе с тем к этим границам для оценки качественной однородности совокупности надо подходить с точки зрения существа дела, а не формально, так как одно и то же количество в разных условиях выражает новое качество. Например, при одной и той же численности рабочих предприятия одних отраслей промышленности являются крупными, а других – мелкими.
Для всестороннего и углубленного изучения явлений, для объективной характеристики типов явлений, их взаимоотношений и процессов, обусловленных развитием системы как целого, необходимо сочетать групповые средние с общими средними. Сочетание таких средних и является одним из основных элементов анализа сложных систем. Это сочетание связывает в одно целое два органически дополняющих друг друга статистических метода: метод средних величин и метод группировки. При расчете средней индивидуальные варьирующие по группе значения заменяются одним средним значением. При этом случайные отклонения значения признака по отдельным единицам в сторону увеличения или уменьшения взаимно уравновешиваются и погашают друг друга, а в величине средней проявляется типичный размер признака, свойственный данной группе. Средняя величина служит характеристикой совокупности и в то же время относится к отдельному ее элементу – носителю качественных особенностей явления. Значение средней вполне конкретно, но одновременно и абстрактно; оно получено путем абстрагирования от случайного индивидуального по каждой единице с целью выявления того общего, типичного, что свойственно всем единицам и что формирует данную совокупность. При расчете средней величины численность единиц совокупности должна быть достаточно большой. Величина средней определяется как отношение общего объема явлений к числу единиц совокупности в группе. Для несгруппированных данных это будет средняя арифметическая простая:
а для сгруппированных данных, где каждое значение признака имеет свою частоту, – средняя арифметическая взвешенная:
где
Поскольку средняя арифметическая рассчитывается как отношение суммы значений признака к общей численности, она никогда не выходит за пределы этих значений. Средняя арифметическая обладает рядом свойств, которые широко используются в целях упорядочения расчетов.
1. Сумма отклонений индивидуальных значений признака от средней величины всегда равна нулю:
Разделив левую и правую часть на
получим:
2. Если значения признака (Xi) изменить в
Среднюю арифметическую из новых значений признака обозначим X, тогда:
Постоянную величину 1/
3. Если из всех значений признака
Средняя из отклонений значений признака от постоянного числа будет равна:
Точно так же доказывается это и в случае прибавления постоянного числа.
4. Если частоты всех значений признака уменьшить или увеличить в
При наличии данных об общем объеме и известных значениях признака, но неизвестных частотах для определения среднего показателя используют формулу среднеарифметической взвешенной.
Например, имеются данные о ценах реализации капусты и общей выручке за различные сроки реализации (табл. 1).
Цена реализации капусты и общая выручка за различные сроки реализации
Так как средняя цена представляет отношение общей выручки к общему объему реализованной капусты, то вначале следует определить количество реализованной капусты по разным срокам реализации как отношение выручки к цене, а затем уже определить среднюю цену реализованной капусты.
В нашем примере средняя цена будет:
Если рассчитать в данном случае среднюю цену реализации по средней арифметической простой, то получим иной результат, который исказит истинное положение и завысит среднюю цену реализации, так как не будет учтен тот факт, что большая доля в реализации приходится на позднюю капусту с более низкой ценой.
Иногда требуется определить среднюю величину, когда значения признака даются в виде дробных чисел, т. е. обратных целым числам (например, при изучении производительности труда через обратный его показатель, трудоемкость). В таких случаях целесообразно использовать формулу средней гармонической:
Так, среднее время, необходимое для изготовления единицы продукции, есть средняя гармоническая. Если Х1 = 1/4 часа, Х2 = 1/2 часа, Х3 = 1/3 часа, то средняя гармоническая этих чисел есть:
Для расчета средней величины из отношений двух одноименных показателей, например темпов роста, применяется средняя геометрическая, рассчитанная по формуле:
где Х1× Х2 … × … Х4 – отношение двух одноименных величин, например цепных темпов роста;
Рассмотренные средние величины обладают свойством маорантности:
Пусть, например, имеем следующие значения
При изучении состава совокупности о типичном размере признака можно судить по так называемым структурным средним – моде и медиане.
Модой
где Х0 – нижняя граница модального интервала;
Значение моды в интервальном ряду довольно просто можно отыскать на основе графика. Для этого в самом высоком столбце гистограммы от границ двух смежных столбцов проводят две линии. Из точки пересечения этих линий опускают перпендикуляр на ось абсцисс. Значение признака на оси абсцисс и будет модой (рис. 2).
Рис. 2
Для решения практических задач наибольший интерес представляет обычно мода, выраженная в виде интервала, а не дискретным числом. Объясняется это назначением моды, которая должна выявить наиболее распространенные размеры явления.
Средняя – величина, типичная для всех единиц однородной совокупности. Мода – тоже типичная величина, но она определяет непосредственно размер признака, свойственный хотя и значительной части, но все же не всей совокупности. Она имеет большое значение для решения некоторых задач, например для прогнозирования того, какие размеры обуви, одежды должны быть предназначены для массового производства, и т. д.
Медиана
Медиана является лучшей характеристикой центральной тенденции, когда границы крайних интервалов открыты. Медиана является более приемлемой характеристикой уровня распределения и в том случае, если в ряду распределения имеются чрезмерно большие или чрезмерно малые значения, которые оказывают сильное влияние на среднюю величину, а на медиану – нет. Медиана, кроме того, обладает свойством линейного минимума: сумма абсолютных значений отклонений величины признака у всех единиц совокупности от медианы минимальная, т. е.
Это свойство имеет большое значение для решения некоторых практических задач – например, для расчета самого короткого из всех возможных расстояний для разных видов транспорта, для размещения станций техобслуживания таким образом, чтобы расстояние до всех обслуживаемых данной станцией машин было минимальным, и т. п.
При отыскании медианы сначала определяется ее порядковый номер в ряду распределения:
Далее, соответственно порядковому номеру, по накопленным частотам ряда находят саму медиану. В дискретном ряду – без всякого расчета, а в интервальном ряду, зная порядковый номер медианы, по накопленным частотам отыскивается медианный интервал, в котором путем простейшего приема интерполяции определяется уже значение медианы. Расчет медианы осуществляется по формуле:
где
Рассчитаем среднюю величину, моду и медиану на примере интервального распределения. Данные приведены в табл. 2.
Таким образом, в качестве центра распределения могут быть использованы различные показатели: средняя величина, мода и медиана,
и каждая из этих характеристик имеет свои особенности. Так, для средней величины характерно то, что все отклонения от нее отдельных значений признака взаимно погашаются, т. е.
Для медианы характерно то, что сумма отклонений индивидуальных значений признака от нее (без учета знаков) является минимальной. Мода же характеризует наиболее часто встречающееся значение признака. Поэтому в зависимости от того, какая из особенностей интересует исследователя, и должна выбираться одна из рассмотренных характеристик. В отдельных случаях рассчитываются все характеристики.
Их сравнение и выявление соотношений между ними помогает выяснить особенности распределения того или иного вариационного ряда. Так, в симметричных рядах, как в нашем случае, все три характеристики (средняя, мода и медиана) примерно совпадают. Чем больше расхождение между модой и средней величиной, тем более асимметричен ряд. Установлено, что для умеренно асимметричных рядов разность между модой и средней арифметической примерно в три раза превышает разность между медианой и средней арифметической: