Oct. 7th, 2021

 Не могу составить постановку задачи. Что ж такое...

Итак, имеем...

 

Мы можем монетарно стимулировать клиентов, выплачивая им всем равные суммы в одни и те же периоды времени (для сравнения). Допустим мы берем миллион человек и платим им X% в период времени Т

Вариант, который я рассматриваю - это платить им меньше - не всегда, не всем, и не во все промежутки времени. На что я рассчитываю? На снижение выплат при том же примерно эффекте. Как мне рассчитать оптимальную функцию стимулирования? Или хотя бы функцию чуть более эффективную чем плоскую?

Возможно я слишком сложно ставлю задачу и пытаюсь научить играть в шахматы, не умея в крестики-нолики.

Я могу рандомизировать выплаты. Допустим. У меня будут разрозненные точки - места, где я "простимулировал" клиентов новым способом - снижая или повышая прогнозные выплаты. Но как понять - это в целом хорошо или плохо? В целом всё упирается в функцию отклика. Ок, я её придумал. Как понять, что она - нужная, то есть, что построенная на этой функции отклика модель/нейросетка сойдется к бОльшей эффективности, чем построенная на другой?

 

Слепая вера. Хм...

 

Ладно, как верифицировать себя? Я делаю робота и сравниваю его на моей "вере" со статикой. ок! 

Profile

not_cognito

July 2024

S M T W T F S
 123456
789101112 13
14151617181920
21222324252627
28293031   

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 9th, 2025 04:24 am
Powered by Dreamwidth Studios