close Warning: Can't synchronize with repository "(default)" (/var/svn/mms does not appear to be a Subversion repository.). Look in the Trac log for more information.

Opened 14 years ago

Last modified 14 years ago

#523 new task

Muestreo de datos

Reported by: irobles Owned by: Pedro Gea
Priority: major Milestone: Future
Component: General Keywords:
Cc:

Description

Buenos días,

abro un ticket para solicitar muestreos. Entiendo que se podría hacer de varias maneras, entonces lo abro como tema de debate.

En el caso de modelos de regresión logística, podemos tener la matriz output y la matriz de datos con un número x de filas.

A veces, por tiempo, o simplemente por la manera habitual de ejecutar estos modelo (muestra de entrenamiento y muestra de test), nos interesa ejecutar los modelos con solo una muestra de las x filas.

Estabamos pensando en que fuera unos parámetros de la estimación, las settings, con porcentaje de la muestra, número de estimaciones que quiero hacer. Por ejemplo, quiero hacer 8 estimaciones con un 10% de los datos.

Después es discutible como se devuelven los resultados:

Si se combinan los resultados de las n estimaciones, con una combinación de los parámetros (ponderando por varianzas)
Creo que sería util tambien devolver como resultados la extrapolación del modelo en la muestra de entrenamiento y la muestra de test.

Me imagino que de este surgirán varios tickets, pero bueno, por lo menos que este reflejado aqui lo que nos gustaría que se hiciese.

Un cordial saludo

Change History (2)

comment:1 Changed 14 years ago by Pedro Gea

Milestone: Future

comment:2 Changed 14 years ago by Pedro Gea

Véanse #701 y #703.

Note: See TracTickets for help on using tickets.