реферат найти Сводка и группировка статистических материалов. Статистические таблицы

2 Виды группировок и основания их классификации

Образование видов группировки обусловлено четким формулированием познавательной задачи статистического исследования объекта, определением признаков, которые могут быть положены в основу их классификации, именуемых в статистике группированными признаками.

Иногда группировочный признак называют основанием группировки. От ее правильного выбора зависят выводы статистического исследования.

Одним из важнейших методологических принципов, лежащих в основе научного выбора группировочных признаков и построения группировок, является положение, согласно которому производить их следует с обязательным учетом качественных характеристик группируемых единиц совокупности.

Эти характеристики должны учитывать сущностные (наиболее важные, необходимые, имманентные) признаки изучаемого общественного явления, позволяя объединить в отдельные (самостоятельные) группы однородные по социально-экономической и правовой природе единицы изучаемой совокупности. В противном случае одни и те же данные могут дать диаметрально противоположные выводы при различных приемах группировки.

Сущность и явление — философские категории, отражающие всеобщие формы объективного мира, его познания и практической деятельности людей. Их противопоставление не конструктивно. Сущность — это внутреннее содержание предмета; явление — то или иное обнаружение (выражение) предмета, внешние, непосредственно данные формы его существования’.

Сущность совпадает с тем, что в логике именуется существенными признаками понятия. Степени и виды существенности признаков различают разными терминами; так, основные существенные признаки отличают от производных, равно как существенные признаки, общие нескольким понятиям, от признаков, исключительно принадлежащих данному понятию.

В каждом конкретном исследовании включение признака в состав группировочных должно быть теоретически обосновано. Только на базе теоретического анализа социально-правовых явлений, основанного на современных достижениях соответствующих наук, можно правильно определить состав (систему) признаков.

Так, если за основу группировки всей массы зарегистрированных преступлений против собственности взять такой признак, как способ хищения, имеющий важное квалифицирующее значение, то обнаруживается, что за 2002 г. в России зарегистрировано 926,8 тыс. краж (ст. 158 УК), что значительно меньше, чем за каждый из семи предшествующих лет (в 2003 г. краж было зарегистрировано 1150,8 тыс.).

Но как свидетельствует та же статистика, людей не только стали чаще обворовывать, но и убивать. В постсоветские годы ежегодное число регистрируемых убийств более чем удвоилось. Если в 1991 г. в России было зарегистрировано 16,1 тыс. убийств (с покушениями), то в 2001 г. уже 33,6 тыс. В последующие два года число зарегистрированных убийств в стране не претерпело значительных изменений.

Совсем иная была бы группировка приведенных данных по признакам места, времени или тяжести последствий.

Итак, выбор группировочного признака основывается на предварительном анализе качественной природы, существенных связей, изучаемых явлений. Лишь наличие таких связей имеет смысл иллюстрировать количественно.

Статистическая наука выработала следующие основные правила для выбора (обоснования) группированных признаков:

1) руководствуясь знанием сущности явления, его природы и законов развития, в основание группировки необходимо положить наиболее существенные признаки, отвечающие задачам исследования данного явления;

2) группировочные признаки должны отбираться учетом конкретных особенностей изучаемых явлений;

3) для всесторонней характеристики сложных общественных явлений целесообразно брать несколько (систему) признаков.

Группировка, в которой группы образованы по одному признаку, называется простой.

Для характеристики сложных явлений, к числу которых относятся и правонарушения, бывает недостаточно разбить совокупность на группы по какому-либо одному признаку. В этом случае прибегают к сложной группировке, в которой разделение совокупности производится по двум и более признакам, их системе, взятым в сочетании (комбинации)

Только совокупность признаков позволяет отразить развитие явления, всесторонне выявить реальные связи, взаимоотношения отдельных сторон процесса.

3 Количественные и качественные группировочные признаки

Группировочные признаки могут отражать качественную или количественную сторону изучаемого явления. При распределении данных по количественным признакам (возрасту правонарушителей, числу лиц в организованной преступной группе; количеству судимостей, срокам лишения свободы и др.) необходимо выделить общее количество групп и определить разницу между максимальным и минимальным значениями признака (интервала) в каждой группе.

Например, при группировке правонарушителей по возрасту, беря за основу определенные качественно-возрастные особенности, сочетаемые с уголовно-правовыми или уголовно-процессуальными положениями, можно наметить несколько групп с разными интервалами:

1) от 14 до 16 лет (малолетняя). Лица этого возраста несут ограниченную уголовную ответственность по видам деяний и мерам наказания, Расследование дел в отношении данных лиц имеет множество процессуальных особенностей;

2) от 16 до 18 лет (несовершеннолетняя). Эти лица несут уголовную ответственность за любые уголовно-наказуемые деяния, но для них есть ряд уголовно-правовых и уголовно-процессуальных особенностей;

3) от 18 до 25 лет (молодежная). При расследовании дел в отношении данных лиц нет никаких уголовно-правовых и уголовно-процессуальных особенностей, но с криминологической точки зрения это наиболее активная в криминальном отношении возрастная группа. Она имеет самый высокий коэффициент поражаемости преступностью;

4) от 25 до 30 лет и т.д. Аналогичные обоснования необходимы при определении интервалов и по другим количественным группировочным признакам.

Следует, однако, иметь в виду, что разные интервалы, помогая выявить одни качественно-количественные особенности, могут затушевывать другие. Так, нередко наряду с названными интервалами выделяется группа 30—49 лет, на которую падает наиболее высокий удельный вес совершенных преступлений, хотя преступная активность после 30 лет (если рассматривать по отдельным годам) падает.

В сопоставлении разных интервалов этого не видно, так как интервал 30—49 лет включает двадцать возрастных групп, 25—29 — пять, 19—24 — шесть, 16—18 — три, 14—15 — два. Поэтому в целях выявления долевого распределения правонарушителей по возрастным группам надо использовать равные интервалы, а еще лучше (если позволяют данные) разделить их строго по годам.

Статистические группировки, отражающие качественные (атрибутивные) признаки (степень общественной опасности и тяжести преступлений, вид деяний, содержание мотивации преступного поведения, социальное положение правонарушителей, условия нравственного формирования личности в семье, характер гражданского иска, вид гражданско-правового деликта и т.д.) широко распространены в социально-правовых изучениях.

Официальные статистические данные правоохранительных органов группируются по качественным и количественным признакам уголовно-правового (по главам и статьям уголовного закона, формам вины, категориям тяжести деяния, видам и размерам уголовного наказания) и криминологического характера (сферам социальной жизни, причинам, мотивам, обстоятельствам совершения преступления, социально-демографическим признакам правонарушителей и др.).

В данном случае группировочные признаки заложены в соответствующих формах статистической отчетности органов внутренних дел, налоговой полиции, таможенной службы, прокуратуры, суда. Упорядоченное распределение единиц совокупности по качественным или количественным признакам представляет собой соответственно атрибутивные или вариационные ряды распределения, которые и лежат в основе различных видов статистических группировок.

В криминологической литературе выделяются еще и качественно-количественные или «полуколичественные» признаки», по которым обладающие ими объекты могут сравниваться в понятиях «больше — меньше». «Полуколичественным» признаком, например, является общественная опасность, отраженная в категориях преступлений (ст. 15 УК РФ).

По этому признаку все преступления, исходя из их общественной опасности (качественный признак) и максимальных мер наказания в годах лишения свободы (количественный признак), делятся на деяния небольшой тяжести, за совершение которых максимальное наказание не превышает двух лет лишения свободы; преступления средней тяжести — пять лет; тяжкие — 10 лет; особо тяжкие — свыше 10 лет и более строгое наказание.

Такой прием группировки особо распространен при анкетировании граждан, когда есть необходимость ранжировать их ответы методом суммарных оценок (шкала Лайкерта) по пятибалльной системе. В этих случаях при формулировании вопросов анкеты одновременно дается веер закрытых ответов, из которых делает выбор анкетируемый:

1 — «полностью не согласен», 2 — «не согласен», 3 — «нейтрален», 4 —-«согласен», 5 — «полностью согласен».

Сравнение объектов по «полуколичественному» признаку позволяет зафиксировать лишь тот факт, что у одних из опрошенных этот признак выражен сильнее, чем у других. Вопрос о том, насколько сильнее он выражен, остается при этом открытым. Тем не менее, такой способ группировки позволяет выявить некоторые качественно-количественные сдвиги в структуре изучаемых явлений.

Табличный способ изложения статистических показателей

Результаты статистической сводки и группировки, как правило, помещаются в статистических таблицах и графиках, представляющих собой рациональное, наглядное, компактное и систематизированное изложение статистических показателей.

С технической стороны статистическая таблица представляет собой ряд взаимно пересекающихся горизонтальных и вертикальных линий. Горизонтальные линии таблицы именуются строками, а вертикальные — графами (столбцами, колонками). Каждая строка и графа имеют свое наименование (заголовок), соответствующее содержание показателей, помещенных в таблице, а таблица в целом имеет общее наименование, определяющее ее содержание.

Любая правильно составленная статистическая таблица содержит два основных элемента: подлежащее и сказуемое. Подлежащее — это объект изучения или перечень единиц совокупности (их групп), которые характеризуются в таблице. Сказуемое — это перечень показателей, которыми характеризуется подлежащее.

При разработке таблиц в процессе сводки и группировки статистических показателей следует иметь в виду, чтобы это не было простым собиранием данных, размещенных в произвольном порядке. Каждая таблица должна заключать в себе аналитическое изложение результатов наблюдения, чтобы в последовательном ряду строк и граф развертывалась цифровая картина тех явлений, которые подлежат изучению и анализу.

Рефераты:  Реферат: Проблемы и перспективы современной цивилизации -

Таблицы бывают простые, групповые и комбинационные. Простые таблицы — это перечневые, территориальные и хронологические. Перечневые простые таблицы имеют в подлежащем элементарный перечень однородных признаков, составляющих единый объект изучения. Например, дается перечень ступеней образования: начальное, среднее, высшее.

В подлежащем простой территориальной таблицы приводятся территории районов, городов, областей, которые в последующих графах характеризуются теми или иными количественными показателями, например по уровню регистрации рождений, смертей, браков или разводов. Хронологическими простыми называются таблицы, в подлежащем которых даны периоды времени (годы, кварталы, месяцы).

Деление простых таблиц на перечисленные виды очень условно, поскольку эти виды могут сочетаться между собой по-разному, образуя перечневую хронологическую таблицу или территориальную хронологическую. Во всех простых таблицах сказуемое, как правило, одно.

В групповых таблицах подлежащее подразделяется на отдельные группы по какому—то одному признаку. Например, гражданские дела, рассмотренные судом, делятся на трудовые, жилищные, семейные, имущественные, финансовые, которые в свою очередь могут распределяться по результатам рассмотрения дел (иск удовлетворен, в иске отказано, иск оставлен без рассмотрения) и т.д. Сказуемое групповых таблиц также может быть сложным, отражающим различные стороны подлежащего.

Комбинационные таблицы характеризуют юридически значимые явления через многие признаки и свойства, отраженные как в подлежащем, так и в сказуемом.

При всей сложности качественно-количественных характеристик того или иного явления они, как правило, взаимосвязаны между собой, поскольку отражают одно и то же явление, только с разных сторон. Типичным примером комбинационных таблиц высокой сложности могут быть формы отчетов по государственной или ведомственной отчетности.

Таблица должна быть оптимальной по своему размеру. С одной стороны, содержать все необходимые показатели, с другой — не быть перегруженной избыточной статистической информацией.

Таблица должна иметь четкое общее название, а также названия подлежащего и сказуемого, их групп и разделов. Таблицы без названий понимаются с трудом. Кроме того, в них должны быть указаны единицы измерения, территория, период времени и другие необходимые сведения, привязывающие таблицу к конкретному содержанию, объему данных, времени и пространству.

Строки подлежащего и графы сказуемого могут размещаться от частного к общему или наоборот. Итоговые показатели обычно помещаются на последней строке или графе. Однако, исходя из задач, решаемых таблицей, итоговые показатели могут быть приведены и в первой строке.

Если таблица большая и располагается на нескольких листах, ее строки и графы могут нумероваться (обозначаться) порядковыми числами или буквами по алфавиту.

Все приводимые статистические данные должны иметь одинаковую степень точности (целые числа, целые числа с десятыми или сотыми показателями). Есть статистические сведения (например, среднегодовые темпы прироста (снижения) преступности, судимости или других явлений), которые традиционно даются с точностью до сотых долей.

При отсутствии данных, за какой — то год или по какому-то параметру вместо соответствующих цифр обычно ставится многоточие или помета «нет данных». Если отсутствие, каких — то данных является объективным фактом (например, при изложении сведений по отдельным видам преступлений, которых до принятия УК 1996г. в уголовном законодательстве не было), то вместо соответствующих данных ставится прочерк (тире).

Все сомнения, которые могут возникнуть при чтении таблицы должны быть упреждены в примечаниях к ней. Если таких объяснений не будет, таблица может ввести читающего в заблуждение.

Графический способ изложения статистических показателей

Статистические таблицы высоко информативны и в определенной мере наглядны. Но проникновение в их цифровое содержание требует времени, вдумчивой работы с цифрами и серьезного сравнительного анализа. Большей наглядностью обладают графики, составленные на основе табличных данных.

Графиком в статистике называют наглядное изображение статистических величин при помощи геометрических линий и фигур (диаграмм) или географических картосхем (картограмм). Грамотно подготовленный график доходчив, понятен и аналитичен. В отличие от лежащей в его основе таблицы, он дает предметную обобщающую картину состояния изучаемого явления, позволяет практически «с ходу» заметить его особенности, содержащиеся в многочисленных количественных показателях, увидеть тенденции и закономерности его изменения, выявить взаимосвязи с другими явлениями и процессами и даже предполагать его возможное развитие в будущем.

Как и таблица, график имеет ряд признаков или элементов, знание которых позволяет грамотно построить его вручную или машинным способом.

Основа любого графика — его геометрические знаки (точки, линии, фигуры), с помощью которых изображаются статистические величины. Графические компьютерные программы имеют большие наборы этих знаков (одинарных и двойных, сплошных и прерывистых линий различной толщины и цвета, иных обозначений и символов), позволяющих изображать графические фигуры так, чтобы они легко отличались одна от другой.

Следующие элементы графика — его пространственные ориентиры, определяющие размещение геометрических знаков на графике. Пространственные ориентиры задаются в виде координатных сеток. В статистических графиках обычно применяется система прямоугольных координат в двумерном или трехмерном изображении.

В картограммах средствами пространственной ориентации являются либо географические ориентиры (контуры дорог, рек, морей, лесов, населенных пунктов), либо административные или государственные границы. С пространственными ориентирами тесно связаны масштабные, которые дают графическим изображениям количественную определенность.

Масштабные ориентиры определяются шкалами графика. В этом случае масштаб выполняет роль условной меры перевода количественных величин в графические. В статистических графиках, как правило, применяются прямолинейные масштабные шкалы. В связи с этим на осях абсцисс и ординат в условных масштабах откладываются соответствующие единицы измерения.

В наших условиях это абсолютные или относительные (проценты, коэффициенты и др.) числа преступлений, правонарушителей, осужденных, заключенных, гражданских или уголовных дел, истцов, ответчиков или лет, месяцев, административно-территориальных образований и т.д.

В графиках, построенных по форме круговых и секторных диаграмм, применяются кривоугольные шкалы. И прямоугольные, и кривоугольные шкалы могут быть равномерными и неравномерными. В юридической статистике применяются равномерные шкалы, в которых отрезки пропорциональны числам.

Важный элемент графика — его поле, т.е. то место, где расположены геометрические знаки. В зависимости от целей и задач графика это поле может быть чистым или заштрихованным. Последний метод часто применятся при подготовке графиков с помощью ЭВМ, что позволяет более рельефно выделить те или иные графические образы.

Размер поля зависит от назначения графика. Его форма может быть в виде квадрата или прямоугольника. Как и таблица, график должен иметь заголовки и словесные пояснения. Название графика чаще всего соответствует названию таблицы, на основе которой он построен.

Он обязательно должен содержать наименования масштабных шкал: название отложенных на них единиц измерения (преступность в абсолютных и относительных числах — в миллионах, тысячах, коэффициентах, процентах и т.д.) ц другие необходимые пояснения. В зависимости от целей графика, его количественной базы и применяемых геометрических знаков графики могут быть точечными (совокупность точек), линейными, столбиковыми, полосовыми, квадратными, круговыми и т.д.

Иногда в юридических графиках используются рисунки отдельных предметов (пистолеты, автомашины) или силуэтов (например, полицейских) для обозначения соответствующей статистической картины. Такие графики называют фигурными. Линейные графики имеют самое широкое распространение в уголовно-правовой и криминологической статистике для обозначения динамики преступности, выявленных правонарушителей, осужденных, заключенных, оправданных и т.д.

Рис. 1. Динамика преступлений и выявленных лиц (1956—1991 гг.)

Столбиковые диаграммы — это наглядные графические изображения для сравнения значений статистических показателей, характеризующих разные объекты или одни и те же объекты в разные годы. Столбиковые диаграммы строятся в системе прямоугольных координат. Основания столбиков обычно берутся одинакового размера, размещенных на оси абсцисс, а высота столбика отражает значение показателя.

Каждый столбик посвящается одному показателю, поэтому их столько, сколько показателей. Столбики могут располагаться между собой через какое-то равное расстояние или вплотную друг к другу. Кроме шкалы ординат, которая градуируется в соответствующем масштабе, значение показателя может отмечаться на самом столбике.

Полосовые диаграммы — те же столбиковые, только столбцы в них расположены не вертикально, а горизонтально. Поэтому их возможности практически те же, что и у столбиковых диаграмм, но они более наглядны при сопоставлении большого количества показателей.

Картограммы — это средства наглядного изображения фактических данных, которыми характеризуются отдельные районы, города, области и субъекты Федерации. Это может быть картограмма интенсивности преступности, где ее уровень в каждом регионе имеет свою окраску или штриховку.

Для составления картограмм преступности, как, впрочем, и любой другой диаграммы с помощью компьютеров, необходимо соответствующее программное обеспечение, которое в настоящее время имеется в достаточном количестве в нашей стране и постоянно совершенствуется.

Картограммы нередко сочетаются с фигурными диаграммами, когда те или иные преступления на той или иной территории обозначаются фигурами: убийство из огнестрельного оружия (пистолет), угон автомашины (автомашина) и т.д. Такие диаграммы именуются пиктограммами.

Компьютерная графика дает возможность строить более сложные и наглядные графики и диаграммы, позволяющие в максимально сжатом виде понятно и доходчиво показать реальное положение дел, которое трудом понимается при изучении таблиц или отдельных статистических показателей.

Сводка и группировка материалов статистического наблюдения

По окончании статистического наблюдения получают разнообразную информацию о каждой единице изучаемой совокупности, обладающей многочисленными признаками, изменяющимися во времени и пространстве. Для того чтобы выявить некие закономерности, общие характерные особенности и черты статистической совокупности в целом, как некоего массового явления, необходимо систематизировать и обобщить результаты статистического наблюдения, т.е. получить сводную характеристику объекта изучения в целом.

Рефераты:  Ценовая дискриминация

Следовательно, сводка первичного материала — следующий этап статистического исследования после статистического наблюдения.

Статистическая сводка — первичная систематизация, обработка и получение общих и групповых итогов, а также расчет обобщающих показателей (средних и относительных величин).

По глубине и точности обработки материала различают простую и сложную сводки [11].

Простая статистическая сводка — операция по подсчету итоговых данных по совокупности единиц наблюдения и оформление полученного материала в таблицы.

Сложная статистическая сводка — комплекс операций, включающих разбиение данных на группы, составление системы показателей для полученных групп и подгрупп, подсчет итогов для каждой группы и сведение результатов проведенной работы в виде статистических таблиц.

Поскольку бывает недостаточно лишь подсчета итоговых данных, то сложная сводка с проведением статистической группировки осуществляется наиболее часто.

Статистическая группировка — разделение единиц совокупности на группы по наиболее существенным (исследуемым) признакам. Эти признаки, положенные в основание группировки, называют группировочными.

Группировочный признак — отличительная черта, присущая единице статистической совокупности, на основе которой строятся отдельные группы.

Например, туристы могут быть сгруппированы по таким признакам, как пол, возраст, туристские расходы и проч.

По функциям группировки выделяют следующие ее виды.

Типологическая группировка — разделение всей неоднородной совокупности на отдельные, качественно однородные группы, типы, классы. Например, разделение совокупности предприятий по формам собственности, размеру бизнеса — малые, средние, крупные и проч.

Структурная группировка — разделение однородной совокупности на группы в соответствии с группировочным признаком. Например, распределение туристов по полу, возрасту, странам, доходам и проч.

Аналитическая группировка — предполагает исследование взаимосвязи между признаками (двумя или более) в пределах одной совокупности. При этом признак, на который, как предполагается, оказывают влияние другие признаки, называют результативными, а признаки, оказывающие влияние, — факторными. Например, на объем турпотока оказывают влияние такие факторы, как климат, наличие культурно-исторических ресурсов и проч.

Все признаки подразделяются:

  • • на качественные (атрибутивные);
  • • количественные.

Качественные(атрибутивные) признаки могут быть выражены только показателями в виде текстовой записи (национальность, страна, образование и проч.), при этом количество групп будет зависеть от числа градаций атрибутивного (качественного) признака.

Например, если мы группируем туристов по принадлежности к полу, то возможны только две группы: женский и мужской пол; или студентов по посещаемости занятий — также возможны две группы: «посещают» и «не посещают». Если же решили исследовать национальность, то количество групп будет зависеть от представленности тех или иных национальностей в конкретной группе туристов.

Количественные(вариационные) признаки выражаются в виде цифровой записи и имеют числовое выражение (возраст человека, доход (заработная плата), длительность однодневных посещений (в часах) или продолжительность посещений с ночевками и проч.).

Если в качестве основания группировки выбран количественный признак, то следующим шагом будет решение вопроса о количестве групп, на которое необходимо разбить исследуемую совокупность.

Решение о числе групп принимается как математически с использованием специальной формулы, так и логически, в зависимости от количества единиц исследуемого объекта, колеблемости группиро- вочного признака, необходимости сопоставить полученные данные сданными, полученными при проведении подобного обследования в прошлом периоде, а также от того, является ли он дискретным (прерывным) или непрерывным.

Дискретная величина — величина, характеризующаяся целыми, конкретными значениями.

Непрерывная величина — величина, которая в пределах вариации принимает значения, различающиеся между собой на сколь угодно малую величину.

Определение числа групп математически осуществляется с применением формулы Стерджесса:

реферат найти Сводка и группировка статистических материалов. Статистические таблицы

где п — число групп; N — число единиц совокупности.

Следующим шагом после принятия решения о числе групп является определение интервалов группировки.

Интервал — значение варьирующего признака, лежащего в определенных границах.

Каждый интервал имеет свою величину h, верхнюю и нижнюю границы или хотя бы одну из них.

Нижняя граница интервала — наименьшее значение признака в интервале.

Верхняя граница — наибольшее значение признака в интервале.

Величина интервала h — разница между верхней и нежней границей интервала, или наибольшим и наименьшим значениями признака в интервале.

В зависимости от величины интервалы бывают равные и неравные.

Группировку с равными интервалами строят, когда вариация проявляется в узких границах, а распределение носит равномерный характер.

Величина равного интервала определяется по формуле

реферат найти Сводка и группировка статистических материалов. Статистические таблицы

где хтах — максимальное значение признака в совокупности; xmin — минимальное значение признака в совокупности; R — размах вариации; п — число групп.

Если полученная величина интервала представляет собой десятичную дробь, то ее округление проводят по правилам в зависимости от того, сколько знаков до запятой она имеет:

  • • если полученная величина имеет один знак до запятой, например
  • 0,234 или 1,456 или 7,896, то округление проводят до десятых,

т.е. в рассмотренном выше примере получим соответственно 0,2,

или 1,5, или 7,9;

  • • если полученная величина имеет два знака до запятой, например 14,975, то округление проводят до целого числа, т.е. в рассмотренном выше примере необходимо округлить до 15;
  • • если же полученная величина представляет собой трех-, четырехзначное и т.д. число, то округление проводят до ближайшего числа, кратного 100 или 50. Например, 467 округляют до 500, а 455 до 450.

Неравные интервалы могут быть прогрессивно-возрастающими или прогрессивно-убывающими в арифметической или геометрической прогрессии. Группировка с неравными интервалами применяется в связи с тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних — несущественное. Интервалы группировок бывают открытые и закрытые. Закрытыми называются интервалы, у которых имеются и нижняя и верхняя границы, например интервал 14—20 представляет собой закрытый интервал, где 14 — нижняя, 20 — верхняя границы интервала.

Открытыми называются интервалы, у которых имеется лишь одна граница — или верхняя у первого или нижняя у последнего интервала. Например, первый интервал может выглядеть «до 16», а последний «более 50» или «50 и более».

Если в основании группировки лежит дискретный (прерывный) признак, то нижняя граница последующего интервала на единицу больше верхней границы предыдущего интервала, например количество пребываний с ночевками: 1—3 ночи; 4—7 ночей; 8—28 ночей; 29-91 ночь; 92-365 ночей.

Если в основании группировки лежит непрерывный признак (например, заработная плата), то одно и то же значение выступает в качестве верхней границы предыдущего интервала и нижней границы следующего интервала (табл. 3.1). В этом случае возникает вопрос, в какую группу включить единицу изучаемого объекта, значения признака у которого совпадает с границами интервалов.

Если нижняя граница формируется по принципу «включительно», а верхняя — по принципу «исключительно», то единица объекта относится к тому интервалу, который включает данное значение.

Если не оговорено, по какому принципу формируются границы интервала, то ориентируются по последнему интервалу:

  • а) если интервал закрытый и принцип формирования границ неизвестен, то значение попадает в интервал, где первый раз встречается (т.е. по принципу «включительно»);
  • б) если интервал открытый, то это зависит от варианта его обозначения. Возможны два варианта:
    • 1) 50 тыс. руб. и более;
    • 2) более 50 тыс. руб.

В первом варианте 50 тыс. руб. попадает непосредственно в последний интервал, т.е. 50 тыс. руб. и все, что более.

Во втором варианте 50 тыс. руб. попадает в предыдущий интервал, так как в последний согласно звучанию попадут только значения более 50 тыс. руб.

Относительно всех предыдущих интервалов, то в зависимости от звучания последнего интервала они читаются аналогично.

Пример 3.1. Известны группы работников по уровню заработной платы (см. табл. 3.1).

Таблица 3.7

Группы работников по уровню заработной платы

Последний интервал закрытый

Последний интервал открытый 1-й вариант

Последний интервал открытый 2-й вариант

1) до 10 000 руб.

1) до 10 000 руб.

1) до 10 000 руб.

2) 10 000-15 000 руб.

2) 10 000-15 000 руб.

2) 10 000-15 000 руб.

3) 15 000-20 000 руб.

3) 15 000-20 000 руб.

3) 15 000-20 000 руб.

4) 20 000-27 000 руб.

4) 20 000-27 000 руб.

4) 20 000-27 000 руб.

5) 27 000-34 000 руб.

5) 27 000 и более

5) более 27 000 руб.

В данном случае пограничное значение 27 000 попадает в 4 интервал, значение 20 000 — в третий ит.д.

В данном случае можно прочитать: «27 000 и более, 20 000 и более, 15 000 и более» и т.д. таким образом, работник с заработной платой 27 000 попадает в 5-й интервал,

10 000 — во 2-й и т.д.

В данном случае можно прочитать: «более 27 000, более 20 000, более 15 000, более 10 000» и т.д., таким образом, работник с заработной платой 27 000 попадает 4-й интервал, 10 000 — в 1-й

Рефераты:  Межличностные отношения в различных группах и коллективах, Реферат

Для расчета некоторых показателей (например, средних величин) бывает необходимо открытый интервал «превратить» в закрытый. У первого интервала имеется лишь верхняя граница, у последнего — лишь нижняя граница, и чтобы рассчитать нижнюю границу или, соответственно, верхнюю границу, необходимо знать величину интервала И. Поскольку она неизвестна, то условились для первого интервала величину интервала принять равной величине второго интервала, а для последнего — величину последнего интервала принять равной величине предыдущего интервала.

В нашем примере: для расчета нижней границы первого интервала рассчитаем величину второго интервала: 15 000 — 10 000 = 5000. Из верхней границы первого интервала вычитаем полученное значение: 10 000 — 5000 = 5000, тогда первый интервал 5000—10 000.

Для расчета верхней границы последнего интервала рассчитаем величину предыдущего интервала: 27 000 — 20 000 = 7000. К нижней границе последнего интервала прибавим полученное значение 27 000 7000 = 34 000, тогда второй интервал 27 000—34 000.

Пример 3.2. В ходе исследования экскурсионной группы, путешествующей в автобусе по Золотому кольцу, были получены данные статистического наблюдения (табл. 3.2). Необходимо сгруппировать полученные данные по качественным признакам (национальность, пол) и количественным признакам (по доходу — количество групп п = 5 и возрасту в соответствии с группировкой посетителей по возрасту ВТО (см. п. 3.6):

  • 1) 0-14 лет;
  • 2) 15—24 года;
  • 3) 25-44 года;
  • 4) 45—64 года;
  • 5) 65 лет и старше).

Таблица 3.2

Данные статистического наблюдения (условные)

Ф. И. О. туриста

Пол

Национальность

Возраст, лет (*,-)

Среднемесячный доход, руб. (х.)

Турист 1

жен.

русская

23 (2)*

15 000 (1)**

Турист 2

жен.

армянка

32 (3)

30 000 (2)

Турист 3

муж.

армянин

34(3)

45 000 (3)

Турист 4

муж.

болгарин

65 (5)

40 000(3)

Турист 5

жен.

русская

60 (4)

25 000 (2)

Турист 6

жен.

русская

36 (3)

38 000 (3)

Турист 7

жен.

русская

18(2)

10 000(1)

Турист 8

муж.

русский

42(3)

40 000(3)

Турист 9

муж.

болгарин

55 (4)

58 000 (4)

Турист 10

жен.

болгарка

48 (4)

35 000 (3)

Турист 11

муж.

немец

29 (3)

42 000 (3)

Турист 12

муж.

литовец

28 (3)

46 000 (3)

Турист 13

муж.

грузин

25 (3)

24 000 (2)

Турист 14

жен.

армянка

18(2)

11 000(1)

Турист 15

жен.

армянка

19(2)

15 000(1)

Ф. И. О.

туриста

Пол

Национальность

Возраст, лет (*,-)

Среднемесячный доход, руб. (х)

Турист 16

жен.

русская

17(2)

15 000 (1)

Турист 17

жен.

русская

19(2)

11 000 (1)

Турист 18

муж.

русский

25 (3)

34 000 (3)

Турист 19

муж.

татарин

45 (4)

60 000 (5)

Турист 20

жен.

грузинка

24(2)

25 000 (2)

Турист 21

жен.

татарка

17(2)

10 000 (1)

Турист 22

муж.

татарин

24(2)

20 000 (1)

Турист 23

жен.

англичанка

44(3)

70 000 (5)

Турист 24

муж.

англичанин

44(3)

70 000 (5)

Турист 25

муж.

русский

13(1)

16 000 (1)

Турист 26

жен.

татарка

38 (3)

34 000 (2)

Турист 27

жен.

татарка

34(3)

30 000 (2)

Турист 28

жен.

русская

14(1)

14000(1)

Турист 29

жен.

татарка

19(2)

16 000(1)

Турист 30

муж.

татарин

21(2)

22 000(2)

Итого 30

* В скобках указана группа, в которую будет распределен турист (см.

табл. 3.6).

** В скобках указана группа, в которую будет распределен турист (см.

табл. 3.5).

Решение

В таблице данных два признака — качественные: пол и национальность, и два признака — количественные: возраст и доход.

1. Сгруппируем данные по качественному (атрибутивному) признаку «национальность». Вопрос о количестве групп решается в зависимости от числа национальностей, представители которых присутствуют в группе туристов. Таким образом, получилось 8 групп, по которым были распределены туристы исследуемой группы, и получился ряд распределения (табл. 3.3).

Распределение туристов по признаку «национальность»

№ группы

Национальность (группировочный признак)

Количество туристов, чел. (/^) (частота)

1

2

3

1

русские

10

2

армяне

4

3

грузины

2

4

болгары

3

5

англичане

2

6

татары

7

7

литовцы

1

8

немцы

1

Всего

30

2. Также можно сгруппировать данные по качественному (атрибутивному) признаку «пол». Таким образом, получится всего две группы: женский пол и мужской пол, по которым распределим туристов группы (табл. 3.4).

Таблица 3.4

Распределение туристов по признаку «пол»

№ группы

Пол

(группировочный признак)

Количество туристов, чел. (/) (частота)

1

женский

17

2

мужской

13

Всего

30

3. Сгруппируем данные по количественному признаку «доход». Для этого найдем максимальное и минимальное значения признака в группе (максимальный и минимальный среднемесячный доход), а также зададим количество групп п = 5 и найдем величину интервала И:

реферат найти Сводка и группировка статистических материалов. Статистические таблицы

тогда
реферат найти Сводка и группировка статистических материалов. Статистические таблицы

Сформируем группы (табл. 3.5, графа 2).

Таблица 3.5

Распределение туристов группы по признаку «доход»

№ группы

Доход, руб. (х.)

Количество туристов, чел. (/р (частота)

1

2

3

1

10 000-22 000

11

2

22 000-34 000

7

3

34 000-46 000

8

4

46 000-58 000

1

5

58 000-70 000

3

Итого

30

Представим полученные результаты графически (рис. 3.1).

Графическое представление полученных интервалов

Рис. 3.1. Графическое представление полученных интервалов

4. Сгруппируем данные по количественному признаку «возраст», в соответствии с заданными группами.

Таблица 3.6

Распределение туристов по признаку «возраст»

№ группы

Возраст, лет Ц)

Количество туристов, чел. (/р(частота)

1

2

3

1

0-14

2

2

15-24

11

3

25-44

12

4

45-64

4

5

65 и старше

1

Итого

30

Статистические ряды распределения — упорядоченное распределение наблюдаемой статистической совокупности на отдельные группы по конкретному варьирующему признаку.

Статистические ряды могут быть вариационными и атрибутивными. В свою очередь, вариационные подразделяют на дискретные (прерывные) и интервальные.

Такое деление обусловлено группировочным признаком, на основе которого и строится ряд распределения. Как мы уже знаем (см. параграф 3.1) все признаки можно разделить на атрибутивные (качественные) и количественные.

Разделение групп по атрибутивным (качественным) признакам приводит к построению атрибутивных рядов распределения (см. табл. 3.3 и 3.4).

Разделение групп по количественным признакам приводит к построению вариационных рядов распределения (см. табл. 3.5 и 3.6). Дело в том, что количественный ряд представляет собой некие варианты значений признаков, таким образом, присутствует вариация (рассеяние) значений признаков.

В зависимости от вида количественного группировочного признака — дискретного, т.е. прерывного, имеющего конкретные значения или интервального — ряды распределения также делятся на дискретные и интервальные.

Ряд распределения состоит из вариант и частот.

Каждое значение признака, которое это признак принимает в статистическом ряду распределения, называется вариантой х. (табл. 3.7).

Если ряд распределения является дискретным, то данные конкретные значения признака в каждой группе и являются вариантой. Если же ряд распределения интервальный, то для дальнейших расчетов необходимо найти конкретное значение варианты по каждому интервалу как среднее интервальное значение признака (см. табл. 3.7, графа 4).

Среднее интервальное значение признака (среднее значение признака по интервалу) находится как полусумма верхней и нижней границ интервала.

Например, для интервала 20 000—27 000 среднее интервальное значение будет равно

реферат найти Сводка и группировка статистических материалов. Статистические таблицы

Частоты — числовые значения, показывающие, сколько раз то или иное значение признака (варианта х.) встречается в ряду распределения (табл. 3.7, графа 3).

Распределение туристов по признаку «доход»

группы

Доход, руб. (х)

Количество туристов, чел. {/.) частота

Среднее интервальное значение (х’.) варианта

Удельный вес (доля) каждой группы в общем числе, (fj%) частость

Накопленная частота (У), кумулята

1

2

3

4

5

6

1

10 000-22 000

11

16 000

— 100% = 36,7% 30

= 11

2

22 000-34 000

7

28 000

— • 100% = 23,3% 30

= 11 7= 18

3

34 000-46 000

8

40 000

— ?100% = 26,7% 30

= 18 8 = 26

4

46 000-58 000

1

52 000

— 100% = 3,3% 30

= 26 1 = 27

5

58 000-70 000

3

64 000

— 100% = 10% 30

= 27 3 = 30

Итого

30

100%

В атрибутивном ряду каждая варианта х. обозначается текстовой записью с указанием соответствующей частоты(см. табл. 3.3).

Частота может показывать как непосредственно количество повторений, так и иметь процентное выражение. Частота, имеющая процентное выражение, называется частость, обозначается как^.% и представляет собой относительную величину структуры. Частость также называют удельным весом, % (см. табл. 3.7, графа 5).

Любой ряд распределения можно охарактеризовать с помощью накопленных частот, или подсчета кумуляты (S{).

Кумулята — накопленная частота {S) или частость (Sj%). Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем полученное значение, и рассчитываются путем последовательного прибавления к частоте (частости) первого интервала частот следующих интервалов (см. табл. 3.7, графа 6).

Например, кумулята третьего интервала в табл. 3.7 говорит о том, что 26 человек из рассматриваемой группы туристов получают доход не более 46 тыс. руб.

Плотность распределения р — рассчитывается как отношение частоты или частости к величине интервала hj и применяется в группировках с неравными интервалами для обеспечения сопоставимости данных.

Оцените статью
Реферат Зона
Добавить комментарий