Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он





Скачать 101.57 Kb.
НазваниеЗакон Лотки для распределения научной продуктивности, полученный в 1926 г. Он
Дата публикации25.12.2014
Размер101.57 Kb.
ТипЗакон
100-bal.ru > Культура > Закон

Характеристики гиперболических распределений


  1. Частотная и ранговая формы гиперболических распределений

В современных науках, связанных с изучением биологических, технологических, социально-экономических и информационных систем, для многих исследуемых параметров весьма распространена степенная зависимость, имеющая вид:

(1)

где y и x –переменные, А и b – постоянные.

Примерами подобных зависимостей могут служить, например, зависимость национального дохода от определяющих его параметров, зависимость между технологическим уровнем и объемом и т.п. Рассмотрим аллометрический закон, определяющий степенное соотношение между соответствующими параметрами.

Так, например, для автомобилей различных марок имеет место зависимость (1) между полной длиной и рабочим объемом цилиндра, а для разных животных такое соотношение наблюдается между шириной и длиной туловища (рис.1).



Рис. 1

Если показатель степени а отрицательный (, где >0), то зависимость (1) удобно переписать так:

(2)

Зависимости типа (2) называются гиперболическими.

Распространенный метод обработки эмпирических данных сводится к тому, что для определенного множества подсчитывается число элементов n(x) в зависимости от величины соответствующего параметра x. Оказывается, что при достаточно большом числе элементов имеет место распределение

, (3)

имеющее вид зависимости (2). Запись показателя степени в виде объясняется определенными удобствами, ибо позволяет ввести важное понятие характеристического показателя , показывающего принадлежности к соответствующему распределению.

Один из первых эмпирических результатов, описываемых гиперболическим распределением (3), был получен около ста лет назад известным итальянским экономистом Вильфредо Парето (1848 – 1923).



На базе обширных статистических данных о подоходном налоге Парето получил кривую распределения доходов, т.е. зависимость между числом людей, обладающих определенными доходами, и величиной этих доходов. Эта кривая подтверждается в соответствующих пределах и для современного распределения доходов (рис. 2). В настоящее время эта зависимость в нормированном виде носит в математической статистике название распределения Парето и имеет вид, совпадающий по форме с (3):

, (4)

где p(x) – это доля людей, имеющих доход x; ; n(x) – число людей с доходом x; N – общий размер массива. Особенностью гиперболических распределений является то, что они обычно справедливы не для всего диапазона значений параметра x, а лишь начиная с некоторого значения , т.е. для .

Примером гиперболического распределения является закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он подсчитал число ученых, написавших одну, две и т.д. статьи, приведенные в реферативном журнале по химии за десять лет. Сгладив статистические данные, он в результате получил следующую зависимость (рис. 3) для числа ученых n(x), написавших x статей:

, (5)

где – число ученых, написавших минимальное число статей (одну статью), – максимальная продуктивность ученого.

Во всех примерах задача сводилась к тому, чтобы подсчитать число элементов, связанных с соответствующим значением некоторого параметра и определить зависимость числа элементов от величины характеризующего их параметра. Иногда удобнее говорить не об абсолютном числе n(x) таких элементов, а об их доле p(x) во всем анализируемом массиве, или о частоте встречаемости элементов с данным значением параметра. Поэтому этот метод обычно называется частотным подходом к эмпирическому изучению гиперболических распределений.

Возможен и другой метод обработки эмпирических данных, приводящий к гиперболическому распределению: упорядочивание элементов по величине характеризующего их параметра, т.е. расположить их в порядке увеличения или уменьшения этого параметра, или ранжировать. Для множества ранжированных по уменьшению параметра элементов, составляющих информационную или социально-экономическую систему, во многих случаях имеет место гиперболическая зависимость следующего вида:

(6)

где r – ранг элемента; – параметры. Эта зависимость носит название ранговой, а сам метод ее определения называется ранговым подходом к эмпирическому анализу гиперболических распределений.

Одним из традиционных примеров эмпирического анализа гиперболических распределений ранговым методом является статистическое исследование литературных текстов. В качестве классического примера такого подхода следует указать на работы американского ученого Дж. Ципфа, первые результаты которого в этом направлении были получены еще в тридцатые годы. На основе статистического анализа огромного эмпирического материала Ципф попытался показать, что многие формы человеческого поведения подчиняются достаточно простому принципу, названному им «принципом наименьшего усилия».

При статистическом исследовании языка эта закономерность получается следующим образом. Для конкретного взятого литературного текста выписывается последовательность всех различных слов в порядке уменьшения частоты их встречаемости (самому частому слову приписывается ранг, равный единице). Сопоставление частоты встречаемости каждого слова такой последовательности с его местом (номером) в этом ряду (величиной ранга) r приводит, как показал Ципф, к обратно пропорциональной зависимости между частотой и рангом:

(7)

которая совпадает с общим выражением (6) для случая . Выражение (7) обычно называется законом Ципфа.

Наряду с законом Ципфа примером рангового подхода является эмпирическое распределение, прослеживаемое при анализе массива научных журналов, которое называется обычно законом Брэдфорда, или законом рассеивания научной информации. Этот закон именуют иногда, в силу его важности, основным законом информации, он был открыт английским исследователем научной информации С.К. Брэдфордом в тридцатых годах прошлого века. Стремясь найти закономерность, которой подчиняется распределение научной информации по данной тематике в различных научных журналах, Брэдфорд отобрал журналы, в которых содержались одна, две и более статей на одну определенную тему, и статистически отобрал этот информационный массив.

Оказалось, что последовательность множества журналов, ранжированных в порядке уменьшения числа статей по данной тематике (от наиболее продуктивного журнала с максимальным числом статей и рангом, равным единице, до наименее продуктивного журнала с одной статьей, замыкающего ряда), можно разделить на группы с приблизительно одинаковым суммарным числом статей в каждой группе. При этом соотношение пропорциональности для числа журналов в первой, второй и т.д. группах имеет вид т.е. представляет собой геометрическую прогрессию со знаменателем q (единица соответствует числу журналов в первой группе, включающей наиболее продуктивные журналы). В математическом плане закон Брэдфорда в простейшей формулировке утверждает, что общее число статей по данной тематике в первых n наиболее продуктивных журналах пропорционально (с точностью до константы) логарифму от числа n этих журналов.

Все рассмотренные выше эмпирические примеры гиперболических распределений отражают, два разных метода анализа соответствующего статистического материала: частотный (распределения Парето, закон Лотки) и ранговый (Законы Ципфа, Брэдфорда).

2. Ранговый подход к моделированию культуры

Рассмотрим одну из моделей, относящихся к сфере культуры – «потреблению» населением симфоний, картин, стихотворений, повестей и т.д.

Представим систему культуры, функционирующую в обществе, как некое множество элементов, каждый из которых потенциально может быть «потреблен», освоен индивидами членами данного общества. В качестве таких «элементов культуры» могут выступать:

а) знания о фактах, явлениях из сферы культуры, или так называемая информированность в сфере культуры, т. е. знания фактов типа: «Пушкин родился в 1799 году;

б) навыки общения с такими сложными семиотическими (знаковыми) структурами, как произведения искусства — например, умение отличать по стилю произведения одной музыкальной школы от другой; такие элементы необходимы для полноценного освоения культурных благ; иногда эти элементы и сами могут выступать в качестве конечных целей культурного потребления;

в) представления о наиболее общих свойствах окружающего мира, об «эталонах» чувственного отношения к этим свойствам, о видах переживаний в «типовых ситуациях» и т.д.

Рассмотрим теперь элементы а) – в). Попытаемся найти какую-то упорядоченность внутри множества этих элементов культуры, функционирующих (обращающихся, имеющих хождение) в обществе.

Очевидно, значительную часть элементов можно упорядочить (пусть не строго) по их трудности – доступности для освоения.

Эту часть системы культуры, иногда называемую «основным телом», составляют элементы, с которых начинается освоение индивидуумом системы культуры. В границах «основного тела» элементы совместимы друг с другом в том смысле, что факт освоения индивидуумом какого-либо элемента А не дает возможности сделать статистически достоверный вывод о том, что этот индивидуум не освоил какой-то другой элемент В.

Но система культуры (рис. 4) имеет еще и другую, так называемую «ветвящуюся» часть, где элементы уже нельзя считать совместимыми. Все элементы в этой части разделены на какие-то группы, и факт освоения индивидуумом какого-то элемента С, принадлежащего к одной ветви, может статистически достоверно означать, что этот индивидуум не освоил какой-то элемент D, принадлежащий к другой ветви элементов. Например, вследствие определенной «специализации» одна часть индивидов осваивает элементы из сферы музыки, а другая часть индивидов – элементы, относящиеся к сфере живописи, и в отношении некоторых из элементов этих сфер может наблюдаться феномен взаимной несовместимости. Однако в «ветвящейся части» располагаются уже достаточно сложные, трудные для восприятия элементы.


Рис. 4

Итак, в пределах «основного тела» системы культуры все ее элементы могут быть упорядочены по трудности освоения их индивидуумом. Порядок их расположения по трудности считается одинаковым для самых различных индивидов. Эту систему элементов можно представить в виде иерархической структуры – набора определенных «ступеней трудности» или слоев, в каждом из которых расположены какие-то элементы. Чем выше расположен элемент на этой «лестнице», тем больше требуется от индивидуума усилий для того, чтобы его освоить.

Рассмотрим индивидуума – представителя какой-то конкретной социокультурной группы (например, молодого рабочего – участника художественной самодеятельности или пенсионера – бывшего агронома, жителя районного центра и т.п.). Пусть в рассматриваемой группе существует какой-то «обязательный культурный минимум» – некий набор элементов, который должен быть освоен каждым членом этой группы. Пусть полный набор элементов, которые потенциально могут быть освоены членами данной группы, состоит из n единиц. Тогда частота встречаемости какого-то L-го элемента определяется как отношение числа членов группы, освоивших этот L-й элемент, к суммарному количеству Q элементов, освоенных всеми членами группы:

, где (12)

Рассмотрим степень разнообразия элементов, освоенных среднестатистическим представителем данной группы. Степень разнообразия может быть измерена величиной энтропии, приходящейся на один элемент:



Разумно предположить, что индивид стремится минимизировать «цену энтропии» – среднюю затрату своих усилий на единицу энтропии:

(13),

где Т – «экономия усилий» (затраты энергии на освоение одного среднего элемента одним среднестатистическим индивидуумом - представителем данной группы)

Ту же мысль можно выразить иначе: индивидуум стремится обеспечить максимальное разнообразие своего культурного «потребления» на единицу усилий, затраченных на эти цели.

Минимизируя R, получаем для выражение, описывающее закон Ципфа (с точностью до постоянной):

(14)

где C, и – константы, характерные для данной социокультурной группы. В логарифмическом масштабе по обеим координатам эта зависимость имеет вид прямой:

(15)

с тангенсом угла наклона к оси абсцисс, равным – (рис. 5).



Рис. 5

Итак, получили следующую картину освоения элементов культуры членами какой-то фиксированной социокультурной группы по частоте встречаемости этих элементов. Зависимость частоты от ранга элемента должна иметь два характерных участка (см. рис. 5)

До ранга вероятность освоения индивидом (среднестатистическим представителем рассматриваемой группы) элементов равна единице; этот участок соответствует области «обязательного культурного минимума» данной группы. Затем при более высоких рангах () эта вероятность начинает падать в согласии с законом Ципфа; крутизна падения вероятности при росте ранга r элемента описывается коэффициентом (-), равным тангенсу угла наклона (к оси абсцисс) графика соответствующей зависимости, построенной в логарифмическом масштабе. Очевидно, что к оси ординат эта зависимость имеет угол наклона, тангенс которого равен .

Указанными двумя величинами: размером области «обязательного культурного минимума» и крутизной спада в ципфовском диапазоне может быть полностью описано поведение рассматриваемой группы в пределах «основного тела» системы культуры. При этом особый интерес представляет последний показатель , который характеризует поведение индивидуумов – членов рассматриваемой группы – в области за границей «обязательного культурного минимума», где от индивидуума требуется проявление личных усилий (сверх группового «стандарта») для освоения элементов культуры. Чем выше величина , тем более полого происходит спад вероятности освоения элементов при росте их «редкости». Следовательно, коэффициент может быть назван индикатором культурной активности членов группы: чем больше значение этого индикатора, тем более высокую активность проявляют члены данной группы по освоению «необязательных» для них элементов, встречающихся в их среде достаточно редко.

На рис. 6 в качестве примера представлены ранговые зависимости для двух гипотетических социокультурных групп (I и II), построенные в логарифмическом масштабе, в координатах и . Каждая зависимость имеет оба описанных выше характерных линейных участка: при – область «обязательного культурного минимума», где =1 и, следовательно, =0; при r>> – ципфовская область линейного уменьшения величины при росте (с углом наклона к оси ординат, тангенс которого равен ); между этими характерными линейными участками имеется переходной нелинейный участок (который отсутствовал при использовании координат и ). Обратим внимание на существенно различное поведение зависимостей I и II. Ясно, что индивидуумы – представители второй социокультурной группы – имеют не только больший (чем у представителей первой группы) размер области «обязательного культурного минимума» , но и существенно более высокую величину индикатора культурной активности . Рис. 6




Добавить документ в свой блог или на сайт

Похожие:

Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он icon5 Закон распределения Пуассона. Биномиальный закон распределения случайной дискретной величины
Основные понятия теории вероятностей. Различные определения вероятности события
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он icon111672, Москва, Салтыковская ул.,5 А тел факс 702-75-40 Протокол...
Государственного бюджетного образовательного учреждения города Москвы гимназии №1926
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он iconТема Туристский продукт и его особенности
Каналы распределения туристского продукта. Торговые взаимоотношения между участниками каналов распределения
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он iconПрограмма по формированию навыков безопасного поведения на дорогах...
Цель урока: Сформировать у учащихся знания о законах биологической продуктивности. Учащиеся должны обобщить и конкретизировать знания...
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он icon«Стратегическое развитие сетей распределения компаний»
Целью чтения дисциплины является развитие у студентов знаний по основным принципам и методам проектирования сети распределения и...
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он iconПрограмма по формированию навыков безопасного поведения на дорогах...
Комплект книг, полученный в начале учебного года в читальном зале, необходимо будет сдать после первого семестра. Сдают литературу...
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он iconПрограмма подготовки: Электрические аппараты управления и распределения...
Для магистерской программы «Электрические аппараты управления и распределения энергии»
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он iconКурсовая работа по дисциплине «обеспечение надежности функционирования кс»
Вычислить восстанавливаемости (fв (t),V(t), Tв) системы, если известна функция F(X) распределения времени длительности восстановления...
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он iconПрограммная оболочка для автоматизации расчетов параметров акустического поля
Программа предназначена для расчета комплексного поля распределения акустической энергии, расчета функции потерь на распространение...
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он iconДинамика распределения студентов по группам здоровья в направлении укрепления состояния здоровья
...
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он iconПрограмма подготовки: Электрические аппараты управления и распределения...
Для магистерской программы «Электрические аппараты управления и распределения энергии»
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он iconРоль государственного регулирования в решении проблемы неравенства и распределения
Теоретические основы государственного регулирования неравенства и распределения благ в обществе 5
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он iconКонспект урока по биологии с мультимедийной поддержкой Тема урока...
Тема урока: «Искусственные системы. Агроценозы, факторы повышения их продуктивности»
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он iconПроект алтайский край закон о государственной региональной молодежной политике в алтайском крае
Новосибирской области от 20. 04. 1995 n 17-оз "О научной деятельности и научно-технической политике Новосибирской области", в целях...
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он iconПрограмма по формированию навыков безопасного поведения на дорогах...
Закон последствий: что посеешь, то и пожнёшь. Закон причины и следствия основной закон жизни
Закон Лотки для распределения научной продуктивности, полученный в 1926 г. Он iconИспользование предметно-ориентированных языков для повышения продуктивности...
Электропривод и автоматика промышленных установок и технологических комплексов (ЭП)


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск