Первая запись
May. 20th, 2021 05:12 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Итак, журнал создан для обсуждения всякой ерунды перспективных идей с теми, кто понимает.
Первая задачка.
Я хочу смоделировать траты людей в супермаркетах, чтобы научиться определять - производит ли тот или иной incentive статистически значимый отклик.
Для начала. Что мне нужно поделать с данными, чтобы понять, например, моделируются ли траты людей в супермаркетах Пуассоновским потоком? (Если моделируются, то я могу вычислить плотность потока, матожидание и дисперсию). Тогда мне легко будет понять - я наблюдаю статзначимое отклонение или нет.
Второй вопрос. Вот у меня база в многомноготыщ пользователей.
По каждому товарищу я могу посчитать скользящее среднее его трат за 30 дней на каждый день в году. И дальше я могу прикинуть дисперсию этого скользящего среднего за год. Вопрос. Мне нужно посчитать распределение таких дисперсий по всем клиентам в базе.
Могу ли я это сделать быстрее, чем:
- делая сначала исторический проход для вычисления скользящего среднего
- делая второй проход для вычисления дисперсии скользящего среднего
- итерируя эти два прохода по всей базе клиентов, чтобы получить чиселки распределения
Помогут ли мне тут преобразования Лапласа и FFT? Есть ли идеи, как сделать это быстрее?