not_cognito ([personal profile] not_cognito) wrote2021-05-20 05:12 pm

Первая запись

Итак, журнал создан для обсуждения всякой ерунды перспективных идей с теми, кто понимает.


Первая задачка.

Я хочу смоделировать траты людей в супермаркетах, чтобы научиться определять - производит ли тот или иной incentive статистически значимый отклик.

 

Для начала. Что мне нужно поделать с данными, чтобы понять, например, моделируются ли траты людей в супермаркетах Пуассоновским потоком? (Если моделируются, то я могу вычислить плотность потока, матожидание и дисперсию). Тогда мне легко будет понять - я наблюдаю статзначимое отклонение или нет.

 

Второй вопрос. Вот у меня база в многомноготыщ пользователей.

По каждому товарищу я могу посчитать скользящее среднее его трат за 30 дней на каждый день в году. И дальше я могу прикинуть дисперсию этого скользящего среднего за год. Вопрос. Мне нужно посчитать распределение таких дисперсий по всем клиентам в базе.

Могу ли я это сделать быстрее, чем:

- делая сначала исторический проход для вычисления скользящего среднего

- делая второй проход для вычисления дисперсии скользящего среднего

- итерируя эти два прохода по всей базе клиентов, чтобы получить чиселки распределения

 

Помогут ли мне тут преобразования Лапласа и FFT?  Есть ли идеи, как сделать это быстрее?