Home | Develop | Download | Contact
Namespaces
Funciones en el namespace Pds::DataSet

Funciones para trabajar con "Data sets": Pds::DataSet::AllIndices(), Pds::DataSet::Split(), etc. Más...

Namespaces

namespace  Pds
 Nombre de espacio para Pds (Procesamiento Digital de Senales)
 
namespace  Pds::DataSet
 Nombre de espacio para DataSet (Funciones para manipulación de data sets)
 

Trabajar con indices

Salva datos de matrices

Pds::DiagnosticIndices Pds::DataSet::AllIndices (unsigned int N, double Training, double CrossVal, double Test)
 Calcula indices para {Training, CrossValidation, Test}, selecionados aleatoriamente sin repetición. Más...
 

Trabajar con data sets

Salva datos de matrices

Pds::DataSetBlock Pds::DataSet::Split (const Pds::Matrix &X, const Pds::Vector &Y, double Training, double CrossVal, double Test)
 Divide un data set en 3 data set: {Training, CrossValidation, Test}, selecionados aleatoriamente sin repetición. Más...
 

Trabajar con Information Gain

Salva datos de matrices

Pds::Vector Pds::DataSet::InformationGainScale (const Pds::Vector &Y, double Umbral)
 Retorna un vector con todos los valores de Information Gain, dependiendo en donde se realice el corte en Y. Más...
 
bool Pds::DataSet::GetBestInformationGainID (const Pds::Vector &Y, double Umbral, unsigned int MinID, unsigned int &ID, double &BestIG, unsigned int &Sign)
 Retorna el ID de la posicion del mejor quiebre del vector Y para obtener la mejor Information Gate. Son analizado Y, Y(0:(ID-1)),Y(ID:end) Más...
 

Descripción detallada

Funciones para trabajar con "Data sets": Pds::DataSet::AllIndices(), Pds::DataSet::Split(), etc.

#include <Pds/FuncDataSet>

Documentación de las funciones

◆ AllIndices()

Pds::DiagnosticIndices Pds::DataSet::AllIndices ( unsigned int  N,
double  Training,
double  CrossVal,
double  Test 
)

Calcula indices para {Training, CrossValidation, Test}, selecionados aleatoriamente sin repetición.

Parámetros
[in]NNumero de muestras.
[in]TrainingPorcion de las N muestras.
[in]CrossValPorcion de las N muestras.
[in]TestPorcion de las N muestras.
Devuelve
Retorna indices para {Training, CrossValidation, Test}.

◆ Split()

Pds::DataSetBlock Pds::DataSet::Split ( const Pds::Matrix &  X,
const Pds::Vector &  Y,
double  Training,
double  CrossVal,
double  Test 
)

Divide un data set en 3 data set: {Training, CrossValidation, Test}, selecionados aleatoriamente sin repetición.

Parámetros
[in]XData X
[in]YData Y.
[in]TrainingPorcion del total de muestras.
[in]CrossValPorcion del total de muestras.
[in]TestPorcion del total de muestras.
Devuelve
Retorna un bloque de datos con data set para {Training, CrossValidation, Test}.
Ejemplos
example_linearmodel.cpp, example_logisticregression_ce.cpp, example_logisticregression_ms.cpp, example_logisticregression_svm.cpp y example_perceptron_evaluate.cpp.

◆ InformationGainScale()

Pds::Vector Pds::DataSet::InformationGainScale ( const Pds::Vector &  Y,
double  Umbral 
)

Retorna un vector con todos los valores de Information Gain, dependiendo en donde se realice el corte en Y.

Pds::Vector Y(10);
Y.FillRandC(0.5);
Pds::Vector IG=Pds::DataSet::InformationGainScale(Y,0.5);
Pds::Vector InformationGainScale(const Pds::Vector &Y, double Umbral)
Retorna un vector con todos los valores de Information Gain, dependiendo en donde se realice el corte...

El valor IG.GetRaw(ID) es el Information Gain si quiebro el vector Y en Y(0:(ID-1)) y Y(ID:end)

Parámetros
[in]YData Y.
[in]UmbralUmbral de para la binarizacion de Y, Y>=Umbral.
Devuelve
Retorna un vector con todos los valores de Information Gain, dependiendo en donde se realice el corte en Y.

◆ GetBestInformationGainID()

bool Pds::DataSet::GetBestInformationGainID ( const Pds::Vector &  Y,
double  Umbral,
unsigned int  MinID,
unsigned int &  ID,
double &  BestIG,
unsigned int &  Sign 
)

Retorna el ID de la posicion del mejor quiebre del vector Y para obtener la mejor Information Gate. Son analizado Y, Y(0:(ID-1)),Y(ID:end)

Parámetros
[in]YData Y.
[in]UmbralUmbral de para la binarizacion de Y, Y>=Umbral.
[in]MinIDMinimo numero de ID a testar.
[out]IDID de la posicion del mejor quiebre del vector Y para obtener la mayor Information Gate.
[out]BestIGLa mejor Information Gate para la posición ID.
[out]SignSi Sign==1 la mayor cantidad de unos esta en la parte superio, si Sign==0 en la inferior.
Devuelve
true si todo fue bien o false si no.

Enlaces de interés

HomePage Bazaar Download Bug report Ayuda Developer Feed