?

Log in

No account? Create an account

Previous Entry | Next Entry

Много званых

Говорят, свой знаменитый принцип Вильфредо Парето сначала сформулировал на огороде, когда обнаружил, что 80% всех горошин приходится на 20% стручков – и лишь потом углядел ту же закономерность в итальянском землевладении.


Еще один пример вездесущей степеннóй зависимости – распределение числа комментариев в моем ЖЖ, построенное программкой ljArchive. По горизонтальной оси – ники (неразличимые в таком масштабе), а по вертикальной – число комментариев каждого.

Имеет ли смысл вопрос, почему столь разные системы проявляют одну и ту же численную закономерность?


Слева – иллюстрация принципа Парето (картинка отсюда), а справа – распределение комментариев к моему журналу

Posts from This Journal by “виртуальный мир” Tag

  • Чтоб все на счете точно отразить

    Обнаружила, что у ЖЖ есть два разных рейтинга пользователей! Если я нажимаю соответствующую кнопку из своего профиля, то открывается вот эта…

  • Кто тамъ гнѣвно свирѣпѣетъ?

    Во френдленте бушуют страсти по старой орфографии. Многочисленность ее приверженцев явилась для меня полной неожиданностью: сама я даже точки над…

  • – Что, в двух словах, происходит на родине?

    Известие о том, что Александра Элбакян, создательница пиратского сайта Sci-Hub, заблокировала доступ к нему из России, взволновало мою…

Comments

( 71 comments — Leave a comment )
dralkin
Apr. 24th, 2016 07:29 am (UTC)
Думаю, что вопрос имеет смысл. Надо только подумать, какой.
egovoru
Apr. 24th, 2016 12:25 pm (UTC)
Я имела в виду, означает ли одинаковая численная закономерность и некую общность "физических механизмов", и если да, то какую? Какая общность физических механизмов может быть у процесса созревания гороха и комментирования в ЖЖ? На первый взгляд тут вроде бы нет ничего общего ;)
(no subject) - dralkin - Apr. 24th, 2016 04:20 pm (UTC) - Expand
(no subject) - egovoru - Apr. 24th, 2016 05:07 pm (UTC) - Expand
(no subject) - dralkin - Apr. 25th, 2016 05:43 am (UTC) - Expand
a_gorb
Apr. 24th, 2016 07:52 am (UTC)
”Имеет ли смысл вопрос, почему столь разные системы проявляют одну и ту же численную закономерность?”
Имеет. Ведь вот распределение Гаусса, которое встречается может быть даже чаще, чем распределение Парето, имеет такого рода обоснование.
sergeyoho
Apr. 24th, 2016 08:58 am (UTC)
Между этими двумя распределениями, как я понимаю, сложные отношения. (Если точнее, между нормальным распределением и семейством “heavy-tailed distributions”. Распределение Парето – член этого семейства.)

Нассим Талеб часть известной книги про «Чёрных лебедей» посвящает атаке на использование гауссовских моделей в экономике. Получают, пишет, Нобелевки за далёкую от жизни математику. А потом фонды, консультируемые лауреатами, дают дуба.
(no subject) - a_gorb - Apr. 24th, 2016 09:25 am (UTC) - Expand
(no subject) - sergeyoho - Apr. 24th, 2016 09:35 am (UTC) - Expand
(no subject) - egovoru - Apr. 24th, 2016 02:31 pm (UTC) - Expand
(no subject) - dralkin - Apr. 24th, 2016 04:27 pm (UTC) - Expand
egovoru
Apr. 24th, 2016 12:20 pm (UTC)
А скажите, пожалуйста, что же это за обоснование? (Я, может, и знала это в студенческое время, но сейчас не могу сообразить :( И каково обоснование для степенного распределения? Последнее ведь еще и основа фракталов, так что, поняв, почему появляются такие зависимости, мы бы, наверное, узнали и то, почему вокруг нас так много фракталов :)

Жаль, ljArchive не позволяет экспортировать данные в текстовом формате, а то можно было бы определить, что это за степень - выглядит как довольно высокая.
(no subject) - a_gorb - Apr. 25th, 2016 07:06 pm (UTC) - Expand
(no subject) - egovoru - Apr. 25th, 2016 10:59 pm (UTC) - Expand
(no subject) - a_gorb - Apr. 30th, 2016 07:55 am (UTC) - Expand
(no subject) - egovoru - Apr. 30th, 2016 12:46 pm (UTC) - Expand
alex_new_york
Apr. 24th, 2016 02:14 pm (UTC)
Самым простым объяснением наблюдения Парето (20/80) является концепция логнормального распределения. Нормальное (гауссово) распределение какой-то величины возникает, если величина является результатом сложения множества разных случайных факторов. Когда же величина является результатом не сложения, а произведения множества случайных факторов, распределенной по нормальному закону является не сама величина, а её логарифм, что обычно приводит к результатам, довольно близким к правилу 20/80, хотя конкретные числа могут и несколько отличаться, в зависимости от параметров распределения (как и в реальной жизни, где правило 20/80 выполняется лишь приблизительно).
egovoru
Apr. 24th, 2016 02:29 pm (UTC)
Надо сказать, что распределение комментариев скорее напоминает не 80/20, а 90/10 - степень функции должна быть не меньше 3, а то и выше. К сожалению, в ljArchiv не предусмотрен вывод текстового файла, а то можно было бы провести более детальное исследование.

Там, например, явно присутствует некое плечо на уровне 200 комментариев - может, это не шум, а закономерность? Кроме того, хотя в таком масштабе этого не видно, программа на самом деле считает не только "входящие" комментарии, но и "выходящие", т.е., сколько ответных комментариев написала каждому комментатору я сама - а это тоже интересный материал для анализа ;)

"Когда же величина является результатом не сложения, а произведения множества случайных факторов, распределенной по нормальному закону является не сама величина, а её логарифм"

Да, но это ведь тоже математическое описание, только выраженное в других терминах, а можно ли усмотреть тут какой-то общий "физический механизм"? Иными словами, почему в некоторых случаях сила влияющих факторов складывается, а в других - умножается?
(no subject) - alex_new_york - Apr. 24th, 2016 03:03 pm (UTC) - Expand
(no subject) - egovoru - Apr. 24th, 2016 05:05 pm (UTC) - Expand
(no subject) - alex_new_york - Apr. 25th, 2016 12:54 am (UTC) - Expand
egovoru
Apr. 25th, 2016 12:49 pm (UTC)
Подумала, что, наверное, самый важный фактор, влияющий на характер распределения - это малость отношения числа тех, кто включил меня в число друзей и, значит, регулярно читает мои тексты, и общего числа пользователей ЖЖ. Из последних каждый может случайно зайти в журнал и оставить там один комментарий, потеряв всякий интерес к журналу сразу после этого. Поскольку число их очень велико, они и дают длинный "хвост" распределения. А вот каждый из малого числа моих друзей, разумеется, и оставляет основное число комментариев ;)

Edited at 2016-04-25 12:50 pm (UTC)
(no subject) - alex_new_york - Apr. 25th, 2016 02:17 pm (UTC) - Expand
(no subject) - egovoru - Apr. 25th, 2016 11:11 pm (UTC) - Expand
egovoru
Apr. 25th, 2016 10:53 pm (UTC)
"Самым простым объяснением наблюдения Парето (20/80) является концепция логнормального распределения"

Вики вроде бы пишет, что логнормальное и степенное распределение - это не одно и тоже:

"For example log-normal distributions are often mistaken for power-law distributions: a data set drawn from a lognormal distribution will be approximately linear for large values (corresponding to the upper tail of the lognormal being close to a power law), but for small values the lognormal will drop off significantly (bowing down), corresponding to the lower tail of the lognormal being small (there are very few small values, rather than many small values in a power law)."
(no subject) - alex_new_york - Apr. 26th, 2016 12:46 am (UTC) - Expand
(no subject) - egovoru - Apr. 26th, 2016 01:04 pm (UTC) - Expand
(no subject) - alex_new_york - Apr. 26th, 2016 02:10 pm (UTC) - Expand
(no subject) - egovoru - Apr. 27th, 2016 01:01 am (UTC) - Expand
(no subject) - alex_new_york - Apr. 27th, 2016 02:33 am (UTC) - Expand
vls_smolich
Apr. 24th, 2016 04:23 pm (UTC)
А ещё существует утверждение что 95% человечества -- идиоты.
А в более цивилизованной форме говорят о том, что только 5% способны создавать и осмысливать новую информацию.
И если это так, то распределение Парето в процессе эволюции приобретает всё более радикальный характер.
egovoru
Apr. 24th, 2016 05:19 pm (UTC)
Да и на графике распределения комментариев видно, что соотношение скорее не 80/20, а 90/10 ;) Интересно, какой конкретно степени соответвует каждое соотношение? (Подсчитать вроде бы легко, но что-то неохота этим заниматься ;) Судя по немалой крутизне графика комментариев, степень их распределения не меньше 3, а то и больше. Посмотрим, как оно будет меняться со временем ;)

Что же касается того, что распределение интеллекта в человеческой популяции становится со временем все более крутым, так ведь недаром в Евангелии сказано: "Кто имеет, тому дано будет, а кто не имеет, у того отнимется и то, что он думает иметь" ;)

Физический же смысл, видимо, в том, что это увеличение крутизны распределения - результат продолжающейся специализации функций отдельных элементов внутри системы; а это, действительно - столбовая дорога всякой эволюции ;)

Edited at 2016-04-24 05:38 pm (UTC)
(no subject) - dralkin - Apr. 25th, 2016 05:54 am (UTC) - Expand
(no subject) - egovoru - Apr. 25th, 2016 12:13 pm (UTC) - Expand
(no subject) - dralkin - Apr. 25th, 2016 07:31 am (UTC) - Expand
(no subject) - egovoru - Apr. 25th, 2016 12:20 pm (UTC) - Expand
(no subject) - dralkin - Apr. 25th, 2016 12:32 pm (UTC) - Expand
(no subject) - egovoru - Apr. 25th, 2016 12:42 pm (UTC) - Expand
(no subject) - dralkin - Apr. 25th, 2016 01:14 pm (UTC) - Expand
(no subject) - egovoru - Apr. 25th, 2016 01:25 pm (UTC) - Expand
(no subject) - dralkin - Apr. 25th, 2016 01:49 pm (UTC) - Expand
(no subject) - egovoru - Apr. 25th, 2016 11:16 pm (UTC) - Expand
(no subject) - dralkin - Apr. 26th, 2016 02:28 pm (UTC) - Expand
(no subject) - dralkin - Apr. 25th, 2016 10:19 am (UTC) - Expand
(no subject) - egovoru - Apr. 25th, 2016 12:37 pm (UTC) - Expand
(no subject) - dralkin - Apr. 25th, 2016 01:05 pm (UTC) - Expand
(no subject) - egovoru - Apr. 25th, 2016 01:24 pm (UTC) - Expand
(no subject) - dralkin - Apr. 25th, 2016 02:00 pm (UTC) - Expand
(no subject) - egovoru - Apr. 25th, 2016 11:13 pm (UTC) - Expand
(no subject) - vls_smolich - Apr. 26th, 2016 05:07 pm (UTC) - Expand
almakedonskij
May. 3rd, 2016 08:16 am (UTC)
большинство ников в жж либо боты, либо трупаки-репостеры )
egovoru
May. 3rd, 2016 12:15 pm (UTC)
Но ведь боты вроде бы тоже оставляют "комментарии"? Я вообще с их деятельностью плохо знакома :)

Что же касается репостеров, то их доля в числе обычных комментариев - по крайней мере в моем журнале - ничтожно мала. Я, признаться, в деятельности репостеров не вижу много смысла - для этого ведь есть отдельная кнопка "add to memories"? Но копка репоста, наверное, удобнее ;)
(no subject) - almakedonskij - May. 3rd, 2016 06:14 pm (UTC) - Expand
(no subject) - egovoru - May. 4th, 2016 11:38 am (UTC) - Expand
(no subject) - almakedonskij - May. 4th, 2016 02:46 pm (UTC) - Expand
(no subject) - egovoru - May. 4th, 2016 11:36 pm (UTC) - Expand
(no subject) - almakedonskij - May. 5th, 2016 06:00 am (UTC) - Expand
(no subject) - egovoru - May. 5th, 2016 12:09 pm (UTC) - Expand
(no subject) - almakedonskij - May. 5th, 2016 12:22 pm (UTC) - Expand
(no subject) - egovoru - May. 5th, 2016 11:03 pm (UTC) - Expand
(no subject) - almakedonskij - May. 6th, 2016 08:13 am (UTC) - Expand
(no subject) - egovoru - May. 6th, 2016 11:41 am (UTC) - Expand
(no subject) - almakedonskij - May. 7th, 2016 11:14 am (UTC) - Expand
(no subject) - egovoru - May. 7th, 2016 01:07 pm (UTC) - Expand
(no subject) - almakedonskij - May. 8th, 2016 05:51 am (UTC) - Expand
(no subject) - egovoru - May. 8th, 2016 12:04 pm (UTC) - Expand
(no subject) - almakedonskij - May. 8th, 2016 03:07 pm (UTC) - Expand
(no subject) - egovoru - May. 8th, 2016 03:23 pm (UTC) - Expand
(no subject) - almakedonskij - May. 8th, 2016 07:06 pm (UTC) - Expand
p2004r
Jun. 13th, 2016 05:47 am (UTC)
По моему есть смысл считать только комментарии постов "первого уровня".
egovoru
Jun. 13th, 2016 12:22 pm (UTC)
Такой функции в этой программке, увы, нет. Но и по существу я, наверное, с Вами не соглашусь: мне кажется, что, если пост вызывает длительное содержательное обсуждение даже с одним собеседником - это важно. Я гонюсь не столько за количеством, сколько за качеством беседы ;)
( 71 comments — Leave a comment )