On sʼintéresse à la sélection de variables ou, plutôt, à lʼestimation de lʼensemble des variables pertinentes dans le modèle de bruit blanc gaussien. On suppose que la dimension du dispositif expérimental d est très grande mais que la fonction de régression f dépend dʼun nombre bien plus petit de variables. On présente des conditions suffisantes portant sur la relation entre d, et lʼintensité du bruit qui permettent dʼestimer lʼensemble des variables pertinentes de façon consistante. Ces conditions sont prouvées dʼêtre minimales (à une constante multiplicative près) dans le cadre où nʼaugmente pas lorsque le niveau de bruit diminue, et presque minimales lorsquʼon autorise à grandir quand le bruit diminue.
We are interested in the variable selection task in the Gaussian white noise model. We suppose the dimension of the input variable is very large but the regression function depends on a much smaller number of coordinates. We propose two methods based on thresholding that select the correct subset of variables with high probability, and get minimal conditions od consistency when is a constant, and nearly minimal conditions when is large.
Accepté le :
Publié le :
Laetitia Comminges 1
@article{CRMATH_2011__349_7-8_469_0, author = {Laetitia Comminges}, title = {Conditions minimales de consistance pour la s\'election de variables en grande dimension}, journal = {Comptes Rendus. Math\'ematique}, pages = {469--472}, publisher = {Elsevier}, volume = {349}, number = {7-8}, year = {2011}, doi = {10.1016/j.crma.2011.02.014}, language = {fr}, }
Laetitia Comminges. Conditions minimales de consistance pour la sélection de variables en grande dimension. Comptes Rendus. Mathématique, Volume 349 (2011) no. 7-8, pp. 469-472. doi : 10.1016/j.crma.2011.02.014. https://comptes-rendus.academie-sciences.fr/mathematique/articles/10.1016/j.crma.2011.02.014/
[1] Selection of variables and dimension reduction in high-dimensional non-parametric regression, Electron. J. Statist., Volume 2 (2008), pp. 1224-1241
[2] Sharp adaptive estimation of the drift function for ergodic diffusions, Ann. Statist., Volume 33 (2005) no. 6, pp. 2507-2528
[3] A new algorithm for estimating the effective dimension-reduction subspace, J. Mach. Learn. Res., Volume 9 (2008), pp. 1648-1678
[4] Asymptotic statistical equivalence for ergodic diffusions: the multidimensional case, Probab. Theory Related Fields, Volume 137 (2007) no. 1–2, pp. 25-47
[5] Rodeo: sparse, greedy nonparametric regression, Ann. Statist., Volume 36 (2008), pp. 28-63
[6] Lattice points in high-dimensional spheres, Monatsh. Math., Volume 110 (1991), pp. 47-61
[7] Introduction to Nonparametric Estimation, Springer, New York, 2009
Cité par Sources :
Commentaires - Politique