Si tomamos el modelo de fuga (churn o attrition) como un problema de ordenamiento, es claro que la parte más difícil es establecer el orden de los clientes de acuerdo a su propensión estimada a cancelar sus productos o servicios. Esto puede hacerse con un score calculado a partir de un árbol de decisión, un generador de reglas de decisión, una red neuronal, etc.
Ahora, una vez ordenados los clientes, ¿sobre cuántos se debe efectuar la acción de retención? Una sencilla respuesta es definirlo por el presupuesto que tiene destinado el departamento de Marketing. Si cada acción cuesta $10, y el presupuesto es de $40.000, simplemente se toman los primeros 4.000 clientes de la lista ordenada y se realiza la acción sobre ellos.
El problema con este enfoque es que no toma en cuenta la ganancia esperada de cada cliente de la lista, y puede quedarse corto (no llegando a efectuar la acción sobre clientes que tienen ganancia esperada positiva), o peor aún, pasarse del punto de corte óptimo, efectuando la acción sobre clientes que tienen ganancia esperada negativa. Veámoslo con un ejemplo:
Costo de acción: $10
Ganancia por acierto de predicción: $500
Saldo por acierto: $490
Clientes: 100.000
Clientes que se fugarían: 1.000 (1% del total)
Supongamos que un árbol de decisión nos genera una lista de 5 nodos que clasifican los clientes, para los cuales se estima la siguiente distribución esperada:
Clientes | Fuga | % | |
Nodo 1 | 200 | 50 | 25,00% |
Nodo 2 | 1.000 | 100 | 10,00% |
Nodo 3 | 2.500 | 200 | 8,00% |
Nodo 4 | 80.000 | 600 | 0,75% |
Nodo 5 | 16.300 | 50 | 0,31% |
Total | 100.000 | 1.000 | 1,00% |
La ganancia esperada para cada nodo se puede calcular como la ganancia de los aciertos, menos el costo de realizar la acción sobre el total de clientes del nodo. Para el nodo 1 esto sería $500 * 50 - $10 * 200 = $38.000. Dividiendo esto por el total de clientes se obtiene una ganancia esperada por cada cliente del nodo: $38.000/200 = $190. Completando la tabla anterior:
Clientes | Fuga | % | Ganancia esperada | G.E. por cliente | |
Nodo 1 | 200 | 50 | 25,00% | $38.000 | $190 |
Nodo 2 | 1.000 | 100 | 10,00% | $70.000 | $70 |
Nodo 3 | 2.500 | 200 | 8,00% | $135.000 | $54 |
Nodo 4 | 80.000 | 600 | 0,75% | -$320.000 | -$4 |
Nodo 5 | 16.300 | 50 | 0,31% | -$123.000 | -$8 |
Total | 100.000 | 1.000 | 1,00% |
Entonces, si se toman sólo los nodos de ganancia esperada positiva, se efectuaría la acción sobre 3.700 clientes, obteniéndose una ganancia de $243.000 (sumas de los valores de los 3 primeros nodos). Si se continúa efectuando la acción sobre 300 clientes más (para llegar a 4.000), al pertenecer al siguiente nodo estos tienen una ganacia esperada de -$4, dando un total de -$1.200, disminuyendo la ganancia total a $241.800. Convendría ahorrar los $3.000 que se gastarían en estos 300 clientes y sumarlos a la ganancia de los nodos positivos, dando un total general del proyecto de +$246.000.
4 comentarios:
me imagino que la regresión logística esta dentro de los "etc."?!?!?!
Sí, buen aporte! Para generar el score hubiera estado bien mencionar algún método estadístico, ya que nunca fue mi intención dejarlos afuera.
Andrés, para completar tu análisis del punto de corte, habría que incluir también la probabilidad de que el cliente contactado cambie su decisión de fuga. Normalmente esto se hace contactando los primeros clientes y midiendo la efectividad de la acción.
Por ejemplo, en el caso hipotético de que sólo el 33% decida continuar como cliente, el punto de corte cambiará dramáticamente.
Te felicito por tu blog. Te seguiré en cada artículo y agregaré un link en el mío.
Saludos,
Marcelo
Marcelo:
Sí, hay que tener en cuenta el éxito de la acción de retención. La forma más fácil de hacerlo es multiplicando la ganancia que da un cliente retenido por el porcentaje de éxito. Es decir, si la ganancia real es $1.500, y el porcentaje de éxito esperado del 33%, considerar una ganancia esperada por cliente como $1.500 x 0,33 = $495.
Ahora, lo de contactar a los primeros clientes y medir la efectividad no se me había ocurrido y me parece excelente, aunque hay que tener en cuenta que estás actuando sobre positivos (futuras fugas) y negativos (clientes que en realidad no pensaban irse).
Muchas gracias por las felicitaciones y el valiosísimo link. :)
Publicar un comentario