Как работает метод Монте-Карло

Для начала введем термины:

  • Модель расчёта — функция или система функций и выбранный порядок их расчёта
  • Опыт — эксперимент, одна из проб расчёта по выбранной модели и получения результата
  • Исход — это результат проведенного опыта
  • Событие — явление, которое может произойти или не произойти в результате опыта, при сопоставлении предполагаемого результата с фактическим наблюдением
  • Свертка данных — это приведение нескольких значений к одному, например выбрать «среднее» или «медиану» или другие математические операции, позволяющие дать характеристику набору данных в одном значении.
  • Волатильность — изменчивость данных измеряемой величены

Метод Монте-Карло представляет собой перебор возможных исходов событий. А для его использования в планировании необходимо сначала выбрать модель по которой будет производиться расчет.

Для понимания того как работает метод используем его для решения задачи «прогнозирования сроков завершения проекта интеллектуальной работы».

Замечание метода в ИТ!
Когда мы говорим о прогнозировании сроков ИТ команды лучшим отрезком свертки данных по пропускной способности будет является неделя. Связано это с тем, что количество задач выполненных за день будет сильно изменятся от дня ко дню, по причине высокой волатильности результатов зависящих как от эмоционального состояния людей, так и разной сложности решаемых задач и многих других параметров.

Прогнозирования сроков завершения проекта на основе пропускной способности

Для примера необходимо взять достаточный набор данных, предлагаю использовать периоды от 7 до 26 недель. С чем может быть связано? 7 недель, это чуть более чем полтора месяца, меньше данных для использования метода Монте-Карло приведет высокой степени недостоверности результата. А брать более чем 26 недель, что соответствует половине года, не имеет смысла, так как в интеллектуальной работе происходят постоянные изменения, которые так же могут внести повысить недостоверность прогнозов. С другой стороны такого набора данных вполне достаточно для хорошего прогнозирования.

Будет ли работать метод, с учетом того, что интеллектуальные задачи очень разные по сложности и времени выполнения? Да, конечно будет. Главное чтобы объемы этих задач не отличались кратно. Например если в наборе данных мы имеем задачу которую можно решить в течении пары часов и задачу которую будут решать более 120 дней, то это может привести к недостоверности результата прогнозирования внося огромную дисперсию в результат. По этому рекомендуется использовать декомпозицию задач, которые будут нивелировать огромный разрыв в характеристиках поставленных заданий.

Постановка задачи для примера

И так рассмотрим пример прогнозирования сроков выполнения проекта, который декомпозирован на 40 задач.

Есть набор данных в виде количества завершенных задач суммированных понедельно — это данные пропускной способности “Throughput”:

[4, 1, 2, 1, 4, 3, 2, 3, 6, 3, 2, 1, 6, 13, 3, 1, 6, 1, 4, 4, 6, 3, 6, 2, 6, 2]

Каждое число в этом наборе — это количество задач завершенных за одну неделю. Общее количество данных мы взяли за последние 26 неделю.

Chart Throughput

Алгоритм метода

Шаг первый

Выбираем случайное число из набора данных пропускной способности.

Например, 8 число из набора. Это будет «3»

[4, 1, 2, 1, 4, 3, 2, |3|, 6, 3, 2, 1, 6, 13, 3, 1, 6, 1, 4, 4, 6, 3, 6, 2, 6, 2] → 3

Шаг второй

Считаем что в первую неделю работы над проектом сервис выполнит 3 задачи. И от 40 исходных задач проекта отнимаем это же количество, получим 37.

Burn Cahrt of Project

Шаг третий

Повторяем первый шаг, и второй до тех пор, пока в исходном наборе 40 задач проекта не останется их совсем. Так мы получим вероятное количество недель за которое будет выполнен проект, запоминаем это количество недель. А добавив этот отрезок времени к планируемой дате начала проекта, можем получить дату завершения.

Burn Cahrt of Project

На примере просчета первого эксперимента (на картинке), проект завершится за 17 недель. Запоминаем этот срок.

Шаг четвертый

Алгоритм шагов от первого до третьего повторяем от 10000. После каждого расчета сроков, мы получим число недель за которое может закрыться проект. Собираем эти сроки и считаем сколько раз проект закрылся за этот срок.

Множественные повторения расчета завершения срока проекта, где запоминаем результат в виде количества необходимых итераций

Так получаем распределение данных показывающих за какое количество недель может быть выполнен проект, и какое количество исходов получилось при моделировании в одно и тоже количество недель.

Количество недель5678910111213141516171819202122
Количество исходов7411533206541070142016641631122691154121597251032

Для каждой недели имеем количество раз, сколько раз завершился проект в эту неделю.

Используя эти данные мы можем рассчитать вероятность завершения проекта к каждой неделе в которую он завершился.

По формуле

P = SUM (si) / N; i = 0 ... 10000

где s — количество исходов на текущей неделе. Т.е. сумма общих исходов до текущей даты, делённая на N —количество экспериментов, в рассматриваемом случае это 10000.

Количество недель5678910111213141516171819202122
Количество исходов «s»7411533206541070142016641631122691154121597251032
Вероятность «P»0.00070.00480.02010.05210.11750.22450.36650.53290.6960.81960.91070.96480.98630.9960.99850.99950.99981

Можем увидеть, что количественная вероятность завершить проект в 15 неделю уже превышает 90%, а на 16 уже превысить 95%.

Выбрав удовлетворяющую вас вероятность завершения проекта, вы определяете и срок завершения.

Из опыта, хорошей вероятностью для интеллектуальной работы является вероятность в пределах от 85% до 98%.

Если отобразить этот результат на графике, то получим следующее

График вероятности завершения

В данном случае можно взять в качестве сроков выполнения проекта 16 неделю, где вероятность завершения проекта равна 0.9648, что соответствует 96.48%.

Алгоритм метода на JavaScript

Вот пример кода на JavaScript для этой простой модуляции.

// Данные по пропускной способности по итерациям времени
// итерация - минимальная единица времени в которой хотим считать
// длительность проекта
const historicalDataThroughput = [
    4, 1, 2, 1, 4, 3, 2, 3, 2, 3, 6,
    3, 2, 1, 6, 13, 3, 1, 6, 1, 2,
    4, 4, 6, 3, 1, 3, 3, 6, 6, 2,
    6, 2, 1
  ];
  
  // количество задач в проекте
  const countTaskInProject = 40;
  const result = MonteCarloForProject(historicalDataThroughput, countTaskInProject, 10000);
  console.table(result)
 
  /**
   * Получить распределение вероятности завершения проекта
   * на основе количества решаемых задач за итерацию
   * 
   * @param {Array<Number>} historicalDataThroughput Набор испторических данных по пропускной способности
   * @param {Number} countTaskInProject Количество задач в проекте
   * @param {Number} numberOfExperiments Количество проводимх эксперимантов
   * @returns {Array<Number, Number>} key - количество фич в итерации, value - частота
   */
  function MonteCarloForProject(
    historicalDataThroughput,
    countTaskInProject,
    numberOfExperiments
  ) {
    const result = new Map();
    const len = historicalDataThroughput.length
    let experiment = 1;
    
    for (; experiment <= numberOfExperiments; experiment++) {
      let prjTasks = countTaskInProject;
      // индекс начинается с "0"
      let IndexIteration = 0;
      while (prjTasks > 0) {
        let randomIndex = Math.floor(Math.random() * len);
        let countTasks = historicalDataThroughput[randomIndex];
        IndexIteration += 1;
        prjTasks = prjTasks - countTasks;
      }
  
      let i = result.get(IndexIteration);
      result.set(IndexIteration, i ? i + 1 : 1);
    }
    let sum = 0;
    // Из Map переводим в тип Массив, расчитываем вероятность
    return Array.from(result, ([name, value]) => ({ iteration: name, count: value}))
      .sort((a, b) => a.iteration - b.iteration)
      .map((i,j) => {
          sum += i.count;
          return {
              ...i,
              probability: sum/numberOfExperiments
          }
      })
  }

Пример на Gist Github

Код написан так, чтобы можно было его запустить в браузере.

Пример вывода результата программы:

┌─────────┬───────────┬───────┬─────────────┐
│ (index) │ iteration │ count │ probability │
├─────────┼───────────┼───────┼─────────────┤
│    0    │     4     │   1   │   0.0001    │
│    1    │     5     │  11   │   0.0012    │
│    2    │     6     │  51   │   0.0063    │
│    3    │     7     │  125  │   0.0188    │
│    4    │     8     │  341  │   0.0529    │
│    5    │     9     │  646  │   0.1175    │
│    6    │    10     │ 1087  │   0.2262    │
│    7    │    11     │ 1492  │   0.3754    │
│    8    │    12     │ 1630  │   0.5384    │
│    9    │    13     │ 1528  │   0.6912    │
│   10    │    14     │ 1289  │   0.8201    │
│   11    │    15     │  892  │   0.9093    │
│   12    │    16     │  515  │   0.9608    │
│   13    │    17     │  242  │    0.985    │
│   14    │    18     │  96   │   0.9946    │
│   15    │    19     │  37   │   0.9983    │
│   16    │    20     │  13   │   0.9996    │
│   17    │    21     │   3   │   0.9999    │
│   18    │    22     │   1   │      1      │
└─────────┴───────────┴───────┴─────────────┘

Где

  • iteration — это количество недель (итераций) которое понадобится на реализацию проекта из 40 задач
  • count — количество исходов, результатов завершения проекта за этот срок из заданных 10000 повторений
  • probability — рассчитанная количественная вероятность завершения за этот срок

Можно ли в модели учесть неожиданные события?

Да, вполне! Вы так же можете учесть возможные риски которые могут случится с какой-то вероятностью.

Для этого добавим функциональность, которая в зависимости от наступления риска добавялет некое количество задач, указанное в пределах от минимального до максимального количества возможных для этого риска.

Нам нужно определить заранее предполагаемую вероятность наступления риска, и предположить сколько задач он может добавить или убрать какое-то количество.

Добавление задач к проекту при возникновении риска

Алгоритм метода на JavaScript с учетом рисков

Алгоритм метода на JavaScript с учетом рисков

// Данные по пропускной способности по итерациям времени
// итерация - минимальная единица времени в которой хотим считать
// длительность проекта
const historicalDataThroughput = [
  4, 1, 2, 1, 4, 3, 2, 3, 2, 3, 6,
  3, 2, 1, 6, 13, 3, 1, 6, 1, 2,
  4, 4, 6, 3, 1, 3, 3, 6, 6, 2,
  6, 2, 1
];

// количество задач в проекте
const countTaskInProject = 40;

// Риски которые могут случится с какой-то вероятностью
// И добавить новых задач к проекту
// Предполагаем что риск может сработать один раз
const risks = [
  // С вероятностью "probability" наступления риска, к проекту добавится от "min" до "max" задач
  { probability: 2, countTask: { min: 10, max: 15 } },
  { probability: 12, countTask: { min: 2, max: 20 } },
  { probability: 5, countTask: { min: 5, max: 12 } },
  { probability: 4, countTask: { min: -8, max: -2 } },
]

// Выполнить функцию Монте-Карло и получить результат
const result = MonteCarloForProject(
  historicalDataThroughput,
  countTaskInProject,
  risks,
  10000
);

// Показать результат в консоли
console.table(result);

/**
 * Получить распределение вероятности завершения проекта
 * на основе количества решаемых задач за итерацию
 *
 * @param {Array<Number>} historicalDataThroughput Набор испторических данных по пропускной способности
 * @param {Number} countTaskInProject Количество задач в проекте
 * @param {Array<{probability: Number, countNewTasks: Number}>} risks Риски
 * @param {Number} numberOfExperiments Количество проводимх эксперимантов
 * @returns {Array<Number, Number>} key - количество фич в итерации, value - частота
 */
function MonteCarloForProject(
  historicalDataThroughput,
  countTaskInProject,
  risks,
  numberOfExperiments
) {
  const result = new Map();
  const len = historicalDataThroughput.length
  let experiment = 1;

  for (; experiment <= numberOfExperiments; experiment++) {
    let prjTasks = countTaskInProject;

    // Перебираем все риски
    risks.forEach(r => {
      let randomForRisk = getRandomBetween(1, 100);

      // Если сгенерированное число меньше чем указанный процент вероятности,
      // считаем что риск случился
      if (r.probability > randomForRisk) {
        // Выбираем случайное количество задач между min и max указанное в риске
        let countTasks = getRandomBetween(r.min, r.max);
        // Добавялем их к проекту
        prjTasks += countTasks;
      }
    });

    let IndexIteration = 0;
    while (prjTasks > 0) {
      // Выбираем случайное число из набора Throughput
      let randomIndex = Math.floor(Math.random() * len);
      // Получаем какое количество задач нужно отнять в эту неделю
      let countTasks = historicalDataThroughput[randomIndex];
      // Отнимаем это количество задач
      prjTasks = prjTasks - countTasks;
      // Переходим к следующей итерации
      IndexIteration += 1;
    }

    // Фиксируем какая итерация получилась
    let i = result.get(IndexIteration);
    result.set(IndexIteration, i ? i + 1 : 1);
  }
  let sum = 0;
  // Готовим данные к показу результата
  return Array.from(result, ([name, value]) => ({ iteration: name, count: value }))
    .sort((a, b) => a.iteration - b.iteration)
    .map((i) => {
      sum += i.count;
      return {
        ...i,
        probability: sum / numberOfExperiments
      }
    })
}

function getRandomBetween(min, max) {
  return Math.floor(Math.random() * (max - min + 1)) + min;
}

Пример на Gist Github

Код написан так, чтобы можно было его запустить в браузере.

Пример вывода результата программы:

┌─────────┬───────────┬───────┬─────────────┐
│ (index) │ iteration │ count │ probability │
├─────────┼───────────┼───────┼─────────────┤
│    0    │     0     │ 1789  │   0.1789    │
│    1    │     4     │   1   │    0.179    │
│    2    │     5     │   9   │   0.1799    │
│    3    │     6     │  31   │    0.183    │
│    4    │     7     │  103  │   0.1933    │
│    5    │     8     │  272  │   0.2205    │
│    6    │     9     │  554  │   0.2759    │
│    7    │    10     │  866  │   0.3625    │
│    8    │    11     │ 1149  │   0.4774    │
│    9    │    12     │ 1335  │   0.6109    │
│   10    │    13     │ 1375  │   0.7484    │
│   11    │    14     │ 1031  │   0.8515    │
│   12    │    15     │  711  │   0.9226    │
│   13    │    16     │  422  │   0.9648    │
│   14    │    17     │  208  │   0.9856    │
│   15    │    18     │  91   │   0.9947    │
│   16    │    19     │  37   │   0.9984    │
│   17    │    20     │  14   │   0.9998    │
│   18    │    21     │   2   │      1      │
└─────────┴───────────┴───────┴─────────────┘

Выводы

Модель расчетов можно расширять разными способами, и учитывать некоторые особенности реализации проектов в зависимости от контекста.

А суть метода останется прежней:

  1. Наблюдаем
  2. Берем исторические данные
  3. Формулируем модель расчета «выгорания» проекта
  4. На основе этих данных используем выбор случайной величины из набора
  5. Вычитаем из проекта количество равное случайной величине, до тех пор, пока не закончатся «очки» проекта
  6. Фиксируем в памяти срок за который закрылся проект
  7. Повторяем алгоритм много раз
  8. Смотрим сколько раз завершался проект за какой срок

Даже используя простую модель расчета, вы можете при помощи метода Монте-Карло, определить вероятность завершения проекта.

И такая вероятность будет достаточно точной, с учетом того, что ваша система (процессы создания ценности) не изменялись со временем.

Хотя, вы уже понимаете, что моделировать при помощи Монте-Крало можно и более сложные модели, в том, числе и с учетом предполагаемых изменений. Но надо иметь ввиду, что изменения вводимые в процессы очень сложно прогнозируются, и вы можете построить ошибочную модель.

Начинайте с простого.

Если же вы плохо понимаете в коде, то могу предложить посмотреть проект созданный Rodrigo Rosauro на основе работ Troy Magennis и Dimitar Bakardzhiev’s вот в этой Excel

Попробуйте воспользоваться этой страницей https://rodrigozr.github.io/ProjectForecaster/

Для тех кто пользуется Jira, есть специальный плагин для Chrome Jira Flow Companion. В нем уже встроен модуль Монте-Карло. Хоть он и очень простой, но для большинства задач, его будет достаточно.

Примечание
Проекты, на самом деле завершаются не так линейно как показано в этих примерах. Они могут так завершатся только в одном случае, если команда занимается только этим проектом. Однако часто это не так.
Если исследовать динамику завершения проектов, часто можно обнаружить S-образную функцию (s-curve) завершения проекта, связанную с тем, что в начале проекта неизвестно до конца сколько будет добавлено задач к проекту.

S-Curve
© controlchart

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *