not_cognito

Не могу составить постановку задачи. Что ж такое...

Итак, имеем...

Мы можем монетарно стимулировать клиентов, выплачивая им всем равные суммы в одни и те же периоды времени (для сравнения). Допустим мы берем миллион человек и платим им X% в период времени Т

Вариант, который я рассматриваю - это платить им меньше - не всегда, не всем, и не во все промежутки времени. На что я рассчитываю? На снижение выплат при том же примерно эффекте. Как мне рассчитать оптимальную функцию стимулирования? Или хотя бы функцию чуть более эффективную чем плоскую?

Возможно я слишком сложно ставлю задачу и пытаюсь научить играть в шахматы, не умея в крестики-нолики.

Я могу рандомизировать выплаты. Допустим. У меня будут разрозненные точки - места, где я "простимулировал" клиентов новым способом - снижая или повышая прогнозные выплаты. Но как понять - это в целом хорошо или плохо? В целом всё упирается в функцию отклика. Ок, я её придумал. Как понять, что она - нужная, то есть, что построенная на этой функции отклика модель/нейросетка сойдется к бОльшей эффективности, чем построенная на другой?

Слепая вера. Хм...

Ладно, как верифицировать себя? Я делаю робота и сравниваю его на моей "вере" со статикой. ок!

S	M	T	W	T	F	S
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Oct. 7th, 2021

Oct. 7th, 2021

(no subject)

Profile

July 2024

Page Summary

Style Credit

Expand Cut Tags