Home | Develop | Download | Contact
Namespaces
Funciones en el namespace Pds::DataSet

Funciones para trabajar con "Data sets": Pds::DataSet::AllIndices(), Pds::DataSet::Split(), etc. Más...

Namespaces

namespace  Pds
 Nombre de espacio para Pds (Procesamiento Digital de Senales)
 
namespace  Pds::DataSet
 Nombre de espacio para DataSet (Funciones para manipulación de data sets)
 

Trabajar con indices

Salva datos de matrices

Pds::DataSetIndices Pds::DataSet::AllIndices (unsigned int N, double Training, double CrossVal, double Test)
 Calcula indices para {Training, CrossValidation, Test}, selecionados aleatoriamente sin repetición. Más...
 

Trabajar con data sets

Salva datos de matrices

Pds::DataSetBlock Pds::DataSet::Split (const Pds::Matrix &X, const Pds::Vector &Y, double Training, double CrossVal, double Test)
 Divide un data set en 3 data set: {Training, CrossValidation, Test}, selecionados aleatoriamente sin repetición. Más...
 
Pds::DataSetBlock Pds::DataSet::SplitAndScaling (const Pds::Matrix &X, const Pds::Vector &Y, double Training, double CrossVal, double Test, Pds::Vector &Std, Pds::Vector &Mean)
 Divide un data set en 3 data set: {Training, CrossValidation, Test}, selecionados aleatoriamente sin repetición. Más...
 
double Pds::DataSet::Volume (const Pds::Matrix &X)
 Calcula el volumen del dataset. Más...
 
double Pds::DataSet::VolumeInValidDims (const Pds::Matrix &X)
 Calcula el volumen del dataset en dimenciones com min diferente de max. Más...
 
double Pds::DataSet::InterDistance (const Pds::Matrix &X)
 Calcula la interdistancia $d$ entre las $L$ muestras de $\mathbf{X}$, donde cada muestra $\mathbf{x}_l$ de $\mathbf{X}$ tiene dimensión $N$. Más...
 

Trabajar con Information Gain

Salva datos de matrices

bool Pds::DataSet::GetBestIGThreshold (const Pds::Vector &V, const Pds::Vector &Y, double YUmbral, unsigned int MinID, double &ValUmbral, double &BestIG, unsigned int &Sign)
 Retorna el mejor quiebre del vector V para obtener la mayor Information Gain ( $IG$). Más...
 

Descripción detallada

Funciones para trabajar con "Data sets": Pds::DataSet::AllIndices(), Pds::DataSet::Split(), etc.

#include <Pds/FuncDataSet>

Documentación de las funciones

◆ AllIndices()

Pds::DataSetIndices Pds::DataSet::AllIndices ( unsigned int  N,
double  Training,
double  CrossVal,
double  Test 
)

Calcula indices para {Training, CrossValidation, Test}, selecionados aleatoriamente sin repetición.

Parámetros
[in]NNumero de muestras.
[in]TrainingPorcion de las N muestras.
[in]CrossValPorcion de las N muestras.
[in]TestPorcion de las N muestras.
Devuelve
Retorna indices para {Training, CrossValidation, Test}.

◆ Split()

Pds::DataSetBlock Pds::DataSet::Split ( const Pds::Matrix &  X,
const Pds::Vector &  Y,
double  Training,
double  CrossVal,
double  Test 
)

Divide un data set en 3 data set: {Training, CrossValidation, Test}, selecionados aleatoriamente sin repetición.

Parámetros
[in]XData X
[in]YData Y.
[in]TrainingPorcion del total de muestras.
[in]CrossValPorcion del total de muestras.
[in]TestPorcion del total de muestras.
Devuelve
Retorna un bloque de datos con data set para {Training, CrossValidation, Test}.
Ejemplos
example_linearmodel.cpp, example_logisticregression_ce.cpp, example_logisticregression_ms.cpp, example_logisticregression_svm.cpp y example_perceptron_predict.cpp.

◆ SplitAndScaling()

Pds::DataSetBlock Pds::DataSet::SplitAndScaling ( const Pds::Matrix &  X,
const Pds::Vector &  Y,
double  Training,
double  CrossVal,
double  Test,
Pds::Vector &  Std,
Pds::Vector &  Mean 
)

Divide un data set en 3 data set: {Training, CrossValidation, Test}, selecionados aleatoriamente sin repetición.

Parámetros
[in]XData X
[in]YData Y.
[in]TrainingPorcion del total de muestras.
[in]CrossValPorcion del total de muestras.
[in]TestPorcion del total de muestras.
[out]StdDesvio padrao de cada coluna.
[out]MeanMédia de cada coluna.
Devuelve
Retorna un bloque de datos con data set para {Training, CrossValidation, Test}.

◆ Volume()

double Pds::DataSet::Volume ( const Pds::Matrix &  X)

Calcula el volumen del dataset.

\[\prod_i \left(max\{x_i\}-min\{x_i\}\right)\]

Parámetros
[in]XDataset X
Devuelve
Retorna el volumen del dataset.

◆ VolumeInValidDims()

double Pds::DataSet::VolumeInValidDims ( const Pds::Matrix &  X)

Calcula el volumen del dataset en dimenciones com min diferente de max.

\[\prod_i if(max\{x_i\}\neq min\{x_i\})~ \left(max\{x_i\}-min\{x_i\}\right)\]

Parámetros
[in]XDataset X
Devuelve
Retorna el volumen del dataset.

◆ InterDistance()

double Pds::DataSet::InterDistance ( const Pds::Matrix &  X)

Calcula la interdistancia $d$ entre las $L$ muestras de $\mathbf{X}$, donde cada muestra $\mathbf{x}_l$ de $\mathbf{X}$ tiene dimensión $N$.

\[d=\sqrt[N]{\frac{Pds::DataSet::Volume(\mathbf{X})}{L}}\]

Parámetros
[in]XDataset X
Devuelve
Retorna la interdistancia $d$.

◆ GetBestIGThreshold()

bool Pds::DataSet::GetBestIGThreshold ( const Pds::Vector &  V,
const Pds::Vector &  Y,
double  YUmbral,
unsigned int  MinID,
double &  ValUmbral,
double &  BestIG,
unsigned int &  Sign 
)

Retorna el mejor quiebre del vector V para obtener la mayor Information Gain ( $IG$).

Parámetros
[in]VData V de $N$ elementos.
[in]YData Y de $N$ elementos.
[in]YUmbralUmbral de para la binarizacion de Y, Y>=YUmbral.
[in]MinIDMinimo numero de ID a testar. if((2*MinID)>Y.Nel()) return false;
[out]ValUmbralEl mejor quiebre del vector V para obtener la mayor Information Gain ( $IG$).
[out]BestIGLa mayor Information Gain ( $IG$) para la posición $ID$.
[out]SignSi Sign==1 la mayor cantidad de unos esta en la parte superio, si Sign==0 en la inferior.
Devuelve
true si todo fue bien o false si no.

Enlaces de interés

HomePage Bazaar Download Bug report Ayuda Developer Feed