Сеть Байеса и дэдлайн
Sep. 12th, 2011 06:30 am![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Я недавно писал, что за день потерял $3000+ (в самом деле получилось чуть меньше). Это часть суммы контрактов на размещение рекламы в нашем новом проекте, которые были расторгнуты из-за неготовности к тому моменту (деньги не пришли, макет не подписан и т.п.)
Это решение было хоть и неприятным, но посчитанным. morfizm меня попросил писать про всякие мои дела – вот я сейчас и расскажу, как это посчитать, используя сеть Байеса.
Мне исключительно важно, чтобы издание вышло вовремя, к Маргаритинской ярмарке, цена облома совершено неприемлема. Поэтому нужно было выделить рисковые факторы могут меня к такому привести и прикинуть их взаимосвязи-вероятности.
И посмотреть на общую картину.
Рисковые факторы, по которым у меня была приемлемого качества статистика, получились такие:
- пропущенные ошибки в файлах, передаваемых в печать
- непредвиденные проблемы в типографии
- необходимость “авральной” перекомпоновки и пересборки вёрстки (почти всегда в результате ошибки, пусть и обнаруживаемые, но вызывающие задержку)
- как часто получается пересобрать с первого раза
- как часто задержка на день в результате даёт все два (между прочим, 1 раз из трёх, и это вообще повсеместное явление, как я заметил)
- проблемы логистики из типографии (мы в Питере это издание печатаем)
- влияние ошибок в PDF и печати в спешке на качество
- какую долю внезапно вскрывшихся проблем с доставкой и браком удаётся решать за день
Интуитивно серьёзным рисковым фактором вырисовывалась задержка на день. Вообще, это позволило бы снизить потери почти до нуля – но было непонятно, насколько приемлем риск.
И я построил сеть Байеса. Вот такую (MSBNX, которую я использую, не понимает кириллицу наглухо есличё):
Она, конечно, не так красиво выглядела – я тут порасставлял овалы, перед тем как скриншотить.
На каждый узел навешивается статистика, это примерно так:
Тут фокус в том, чтобы выбирать такие понятия, по которым есть чёткое представление о причинах и следствиях и есть статистика, хоть какая-то. То-есть в табличке выше вторая строка снизу значит, что эта типография лажает со сроками примерно один раз из 10 (ну да, из 11 конечно), если им отправить кривой PDF.
На новый фактор, DalayTillTomorrow, я повесил 1:1. Типа, решение принимается монеткой.
Сеть Байеса хороша тем, что показывает не просто дерево вероятностей, а позволяет посмотреть, какие именно факторы с наибольшей вероятностью дают конкретное событие.
Для меня конкретным событием мог бы быть эпический фэйл, если мы не сможем представить журнал к субботе на этой неделе к 13 часам.
То-есть, вопрос в самом деле звучал так: “Предположим, что фэйл случился. Что же к этому скорее всего привело?”. Сеть Байеса как раз отвечает на этот вопрос.
После установки на последний узел результата “No” получился такой расклад:
На тот момент получалось, что если я облажаюсь, то к этому с вероятностью больше 2/3 приведёт жадность.
Попробовал немного поиграть оценками. Выставлял, к примеру, “No” на плохое качество, то-есть исключал возможность того, что брак вообще возможен. Развесовки менял туда-сюда по факторам, где так себе статистика.
Все равно получалось больше 2/3.
Я посчитал это неприемлемым и не стал давать ещё день на доделки. И верно, кажется, сделал – потому что пришлось таки пересобирать и пересылать заново PDF. Если выставить это как случившиеся события и поставить, что задержка на день всё же была, вероятность облажаться становится 40%. По факту задержки не было и вероятность облажаться у меня на сейчас – меньше 20%.
Такая вот магия, да.