Opened 14 years ago
Last modified 13 years ago
#685 new enhancement
Segmentación (clustering)
Reported by: | imendez | Owned by: | Pedro Gea |
---|---|---|---|
Priority: | major | Milestone: | Future |
Component: | General | Keywords: | |
Cc: |
Description
Hola, solicito la implementación de las técnicas de segmentación o clustering en MMS.
Seguro que esto no es algo que pueda definirse completamente en un ticket, pero espero que este ticket sirva para originar la discusión sobre cómo debe implementarse.
En #88 se proponía que el análisis Cluster fuera una estrategia de Estimation, pero creo que es más apropiado definirlo como un módulo nuevo.
En este sentido, propongo definir el clustering como un objeto principal al estilo de los DataSets, las Estimations, los Models, etc. Un Clustering podría contener un DataSet de variables, y al menos habría que definir:
- El subconjunto de variables que se utilizarán en la segmentación, al estilo de las M-Variables de un modelo o las C-Variables de una combinación. Dado que Clustering empieza por C, podríamos llamarlas S-Variables (S de segmentación, aunque incumpliríamos la norma de basarnos en el inglés).
- La estrategia de clustering, que podría ser el algoritmo que quiera utilizar el usuario (por ejemplo, K-means).
En la siguiente dirección se puede encontrar más información sobre el clustering: definición, tipos, algoritmos, criterios de evaluación etc.
http://en.wikipedia.org/wiki/Cluster_analysis#Distance_measure
Un saludo.