ermouth: (Default)
[personal profile] ermouth

Я недавно писал, что за день потерял $3000+ (в самом деле получилось чуть меньше). Это часть суммы контрактов на размещение рекламы в нашем новом проекте, которые были расторгнуты из-за неготовности к тому моменту (деньги не пришли, макет не подписан и т.п.)

Это решение было хоть и неприятным, но посчитанным. morfizm меня попросил писать про всякие мои дела – вот я сейчас и расскажу, как это посчитать, используя сеть Байеса.

Мне исключительно важно, чтобы издание вышло вовремя, к Маргаритинской ярмарке, цена облома совершено неприемлема. Поэтому нужно было выделить рисковые факторы могут меня к такому привести и прикинуть их взаимосвязи-вероятности.

И посмотреть на общую картину.

Рисковые факторы, по которым у меня была приемлемого качества статистика, получились такие:

  • пропущенные ошибки в файлах, передаваемых в печать
  • непредвиденные проблемы в типографии
  • необходимость “авральной” перекомпоновки и пересборки вёрстки (почти всегда в результате ошибки, пусть и обнаруживаемые, но вызывающие задержку)
  • как часто получается пересобрать с первого раза
  • как часто задержка на день в результате даёт все два (между прочим, 1 раз из трёх, и это вообще повсеместное явление, как я заметил)
  • проблемы логистики из типографии (мы в Питере это издание печатаем)
  • влияние ошибок в PDF и печати в спешке на качество
  • какую долю внезапно вскрывшихся проблем с доставкой и браком удаётся решать за день

Интуитивно серьёзным рисковым фактором вырисовывалась задержка на день. Вообще, это позволило бы снизить потери почти до нуля – но было непонятно, насколько приемлем риск.

И я построил сеть Байеса. Вот такую (MSBNX, которую я использую, не понимает кириллицу наглухо есличё):

image

Она, конечно, не так красиво выглядела – я тут порасставлял овалы, перед тем как скриншотить.

На каждый узел навешивается статистика, это примерно так:

image

Тут фокус в том, чтобы выбирать такие понятия, по которым есть чёткое представление о причинах и следствиях и есть статистика, хоть какая-то. То-есть в табличке выше вторая строка снизу значит, что эта типография лажает со сроками примерно один раз из 10 (ну да, из 11 конечно), если им отправить кривой PDF.

На новый фактор, DalayTillTomorrow, я повесил 1:1. Типа, решение принимается монеткой.

Сеть Байеса хороша тем, что показывает не просто дерево вероятностей, а позволяет посмотреть, какие именно факторы с наибольшей вероятностью дают конкретное событие.

Для меня конкретным событием мог бы быть эпический фэйл, если мы не сможем представить журнал к субботе на этой неделе к 13 часам.

То-есть, вопрос в самом деле звучал так: “Предположим, что фэйл случился. Что же к этому скорее всего привело?”. Сеть Байеса как раз отвечает на этот вопрос.

После установки на последний узел результата “No” получился такой расклад:

image

На тот момент получалось, что если я облажаюсь, то к этому с вероятностью больше 2/3 приведёт жадность.

Попробовал немного поиграть оценками. Выставлял, к примеру, “No” на плохое качество, то-есть исключал возможность того, что брак вообще возможен. Развесовки менял туда-сюда по факторам, где так себе статистика.

Все равно получалось больше 2/3.

Я посчитал это неприемлемым и не стал давать ещё день на доделки. И верно, кажется, сделал – потому что пришлось таки пересобирать и пересылать заново PDF. Если выставить это как случившиеся события и поставить, что задержка на день всё же была, вероятность облажаться становится 40%. По факту задержки не было и вероятность облажаться у меня на сейчас – меньше 20%.

Такая вот магия, да.

Date: 2011-09-12 02:35 am (UTC)
From: [identity profile] verreteno.livejournal.com
ты велик.

Date: 2011-09-12 09:01 am (UTC)
From: [identity profile] ermouth.livejournal.com
если без сарказма, это должен каждый студент-второкурскник экономических вузов уметь делать имхо.

Date: 2011-09-12 11:54 am (UTC)
From: [identity profile] verreteno.livejournal.com
я без сарказма. меня этот вопрос вообще здорово занимает. они же ветхозаветные теории изучают вместо этого. а на практике - ну, ты знаешь, чем они на практике занимаются. липовыми отчётами...

Date: 2011-09-12 12:34 pm (UTC)
From: [identity profile] sigel9.livejournal.com
Это бухгалтерия липой занимается. Экономисты как раз с реальными цифрами работают, фантазировать иногда приходится - зависит от получателя (пользователя) отчетности.
На счет ветхозаветных теорий то ж не согласен. Не без них конечно, но это почти ко всем специальностям относится - образовательные системы не успевают своевременно адаптироваться под изменения.
Не знаю чем вам так не угодили экономисты. ;)

Date: 2011-09-12 12:49 pm (UTC)
From: [identity profile] verreteno.livejournal.com
да нет, не в экономистах дело, это частности.
я как раз про образовательные системы в целом печалюсь.

Date: 2011-09-12 04:42 pm (UTC)
From: [identity profile] ermouth.livejournal.com
Саш, липовыми отчётами занимается любой студент -- это чуть не основной навык, которому в универах учат. делать что-то похожее на работу, не делая при этом работу.

бесплатный софт, который позволяет строить байесовы сети с той или иной степенью удобства, существует десятки лет. и, насколько я знаю, нет даже попыток.

обраовательные системы не потому жалкие, что не успевают, а потому, что им выгоднее не адаптироваться. для этого нужны мозги у препода, а с этим нередко беда.

Date: 2011-09-12 04:39 pm (UTC)
From: [identity profile] ermouth.livejournal.com
знаешь, если ты пойдёшь на википедию или возьмешь учебник по теорверу, оно тоже будет выглядеть ветхозаветной теорией -- теореме Байеса лет 250, на всякий случай. ну и сам Байес был священником ) так что вполне себе ветхозаветно.

вопрос в том, как это преподавать. если нудно несколько лекций формулы рассказывать, у кого хочешь желание отвалится. тут надо на примерах и не заставлять считать самим -- там сложные расчёты -- а показывать софт, который считает за тебя. то-есть учить задачу ставить.

Date: 2011-09-12 04:53 pm (UTC)
From: [identity profile] ermouth.livejournal.com
сам ты бисусль )

Date: 2011-09-12 05:09 am (UTC)
From: [identity profile] sigel9.livejournal.com
Ниче не понял )

Date: 2011-09-12 09:45 am (UTC)
From: [identity profile] ermouth.livejournal.com
да брось, тут всё довольно легко бггг

Date: 2011-09-12 10:57 am (UTC)
From: [identity profile] sigel9.livejournal.com
Безусловно, моделировать бизнес-процессы по теории вероятностей это круто. У меня не получалось строить сколь либо рабочих (толковых) моделей. Недаром из математиков получаются хорошие экономисты, а наоборот нет. ))
P.S. Было б здорово пример наглядный изучить. ;)

Date: 2011-09-12 04:43 pm (UTC)
From: [identity profile] ermouth.livejournal.com
не получалось потому что ты их строить не пробовал -- скорее всего, просто инструмента не было. посчитать такую сеть, что у меня нарисована, руками -- это день убить если ты предмет знаешь.

Date: 2011-09-12 05:52 am (UTC)
From: [identity profile] rezkiy.livejournal.com
все понял, очень разумно. Фича не успела в RTM.

Date: 2011-09-12 09:45 am (UTC)
From: [identity profile] ermouth.livejournal.com
ну да. в случае если вопрос стоит не по принципу "приемлемо/неприемлемо", а по принципу "насколько приемлемно" риски надо ещё на деньги перемножать.

Date: 2011-09-12 11:13 am (UTC)
From: [identity profile] rezkiy.livejournal.com
Да, конечно. Это называется матожидание проеба.

Date: 2011-09-12 05:29 pm (UTC)
From: [identity profile] andrey-larin.livejournal.com
Прочитал как "метаожидание проеба", эпично звучит и так таинственно-научно.

Date: 2011-09-12 08:01 pm (UTC)
From: [identity profile] ermouth.livejournal.com
а для меня это как название порнухи с элементами мистики )

Date: 2011-09-12 10:10 pm (UTC)
From: [identity profile] ktototam-lj.livejournal.com
типа "Закрытая дверь"? бгг

Date: 2011-09-12 09:30 pm (UTC)
From: [identity profile] rezkiy.livejournal.com
я когда слышу слово "мета", вспоминаю "метаданные" из 1С. Так вот, это "данные о данных". Метапрограммирование это написание программ которые работают с другими программами. Метаожидание, соответственно, ожидание ожидания. Наверное к этому можно приписать мистическую порнуху.

Date: 2011-09-12 06:09 am (UTC)
From: [identity profile] 802-11.livejournal.com
Очень круто. Интересно было бы на это все взглянуть в каком-нибудь датавизе типа Hierarchical Parallel Coordinates.

Date: 2011-09-12 09:08 am (UTC)
From: [identity profile] ermouth.livejournal.com
не очень подходит, слишкм много мусора. проще показывать силу влияния и распространение волны вероятности толщинами линии, а разные основные сценарии -- наложением одинаковых графов друг на друга со сдвижкой.

получается очень компактно и наглядно, я просто заленился перерисовывать к посту.

Date: 2011-09-12 04:53 pm (UTC)
From: [identity profile] andrey-larin.livejournal.com
Лэн, я конечно все понимаю, но только ты можешь мне напомнить ссылку с типами диаграмм, я посеял эту страничку :(

Date: 2011-09-12 05:21 pm (UTC)
From: [identity profile] 802-11.livejournal.com
Ты, наверное, об этом (http://www.jvetrau.com/2009/03/11/vizualizatsiya-dannyih-naglyadnyiy-i-kompaktnyiy-sposob-otobrazheniya-informatsii-chast-1-klassifikatsiya/), но там нет Hier. Parallel Coordinates — я это взяла из статей по Multidimensional Data Visualization.

Date: 2011-09-12 05:28 pm (UTC)
From: [identity profile] andrey-larin.livejournal.com
Да, именно она. Спасибо!

Date: 2011-09-12 05:39 pm (UTC)
From: [identity profile] 802-11.livejournal.com
De nada.)

Date: 2011-09-12 10:15 am (UTC)
From: [identity profile] cooleekoff.livejournal.com
Крут, чо.

Date: 2011-09-13 06:35 am (UTC)
From: [identity profile] morfizm.livejournal.com
Спасибо, что решился выложить, и присоединяюсь к комменту номер один! :)
1. Какой софт ты используешь для моделирования сетей Байеса?
2. Анализ хорош, если выгода от успевания к дедлайну бесконечна. Но фактически ведь она ограничена каким-то числом. Ты делал расчёт, который показывает, что мат.ожидание потерь от вероятности провала выше, чем принимаемые потери, которые позволили тебе уменьшить эту вероятность?

Date: 2011-09-13 09:58 am (UTC)
From: [identity profile] ermouth.livejournal.com
конечно, на деньги я множил, если ты об этом )

софт -- microsoft belief network (MSBNX она называется), бесплатная программа 2000 года. если будешь пробовать, её надо от имени администратора запускать.

Date: 2011-09-15 04:21 pm (UTC)
From: [identity profile] andy-scott.livejournal.com
интересно, а другие есть программы для этих целей?

Date: 2011-09-15 04:27 pm (UTC)
From: [identity profile] ermouth.livejournal.com
и много, полагаю. я последний раз интересовался несколько лет назад, редко использую и мне msbnx хватает.

Date: 2011-09-15 04:51 pm (UTC)
From: [identity profile] andy-scott.livejournal.com
действительно вроде бы(!) много, но почему-то free / opensource всё какое-то... позаброшенное, что ли

впрочем спасибо по-любому, MSBNx для начала прекрасно подойдет :)

Date: 2011-09-15 04:20 pm (UTC)
From: [identity profile] andy-scott.livejournal.com
шикарно

спасибо за идею, я как-то до сих пор упустил Байесовские сети в моей биографии

Profile

ermouth: (Default)
ermouth

November 2021

S M T W T F S
 123456
78910111213
14151617181920
21 222324252627
282930    

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 1st, 2026 11:14 am
Powered by Dreamwidth Studios