(no subject)
Oct. 7th, 2021 09:58 pmИтак, имеем...
Мы можем монетарно стимулировать клиентов, выплачивая им всем равные суммы в одни и те же периоды времени (для сравнения). Допустим мы берем миллион человек и платим им X% в период времени Т
Вариант, который я рассматриваю - это платить им меньше - не всегда, не всем, и не во все промежутки времени. На что я рассчитываю? На снижение выплат при том же примерно эффекте. Как мне рассчитать оптимальную функцию стимулирования? Или хотя бы функцию чуть более эффективную чем плоскую?
Возможно я слишком сложно ставлю задачу и пытаюсь научить играть в шахматы, не умея в крестики-нолики.
Я могу рандомизировать выплаты. Допустим. У меня будут разрозненные точки - места, где я "простимулировал" клиентов новым способом - снижая или повышая прогнозные выплаты. Но как понять - это в целом хорошо или плохо? В целом всё упирается в функцию отклика. Ок, я её придумал. Как понять, что она - нужная, то есть, что построенная на этой функции отклика модель/нейросетка сойдется к бОльшей эффективности, чем построенная на другой?
Слепая вера. Хм...
Ладно, как верифицировать себя? Я делаю робота и сравниваю его на моей "вере" со статикой. ок!