Machine learning logistic regression for credit modelling in R — R-bloggers

(This article was first published on R Programming – DataScience+, and kindly contributed to R-bloggers) Categories Regression Models Tags Logistic Regression R Programming ROC Machine learning logistic regressions is a widely popular method to model credit modeling. There are excellent and efficient packages in R, that can perform these types of analysis. Typically you will…

via Machine learning logistic regression for credit modelling in R — R-bloggers

Anuncios

Estimación de la Tasa de pobreza Cantabria mediante matching estadístico

Estimación de la tasa de pobreza en Cantabria mediante matching estadístico

Autores: Pablo Lobete López
Francisco J. Parra Rodríguez
DOC. Nº 2/2018

RESUMEN
El objetivo del presente estudio es establecer una metodología para el cálculo de la tasa de riesgo pobreza en Cantabria a partir de los datos de la Encuesta Social de Cantabria (ESOC) 2015, realizando un matching estadístico con la Encuesta de Presupuestos Familiares (EPF) 2016. La ESOC es una encuesta realizada por el ICANE tiene como finalidad conocer las aptitudes sociales y condiciones de vida de la población de Cantabria. La muestra objetivo de la ESOC son 1.800 hogares.
La EPF tiene como objetivo suministrar información anual sobre la naturaleza y destino de los gastos de consumo, así como sobre diversas características relativas a las condiciones de vida de los hogares, en base a una muestra de aproximadamente 4.000 hogares para el conjunto del Estado. Para Cantabria, el tamaño de la muestra en 2016 fue de 762 hogares.
La tasa de pobreza monetaria en Cantabria puede calcularse tanto con los microdatos de la Encuesta de Condiciones de Vida (ECV) como con las de la EPF, si bien en el Documento Técnico 1/2017 del ICANE, se concluye que ambas encuestas se realizan con una muestra insuficiente para obtener medidas de pobreza.

Mediante un matching estadístico entre la ESOC y la EPF se pretende realizar un cálculo la tasa de riesgo de pobreza de Cantabria más consistente en el tiempo. En concreto se trata de estimar los ingresos mensuales de los hogares en la ESOC, a partir de una serie de variables comunes a la EPF y de la respuesta a la pregunta sobre el intervalo en que se sitúa la renta disponible de l hogar ingresos en la primera. Señalar que el matching entre la ESOC y la ECV se descartó por la menor muestra de la ECV (347 hogares).
Finalmente, se realiza una estimación de la tasa de riesgo de pobreza en Cantabria a partir de los ingresos de los hogares de la ESOC.
Palabras clave: Tasa de riesgo de pobreza, matching estadístico, Cantabria.

Estimación_tasa_pobreza_Cantabria_2_2018

 

Modelizar el consumo eléctrico

A partir de nos prévisions pour la température, on peut tenter de prévoir la consommation électrique. Rappelons que la série de consommation électrique ressemble à ca plot(electricite[passe,”Load”],type=”l”) On peut tenter un modèle assez simple, où la consommation à la date Y_t est fonction d’une tendance linéaire a+bt, de la position dans l’année (sous une forme…

via Modéliser la consommation électrique — Freakonometrics

Estadística y Machine Learning con R

 

Estadística y Machine Learning con R recopila apuntes y materiales utilizados en la docencia de cursos de formación para funcionarios sobre estadística para administraciones públicas y estadística con R, y otros materiales utilizados en la docencia de Econometría. El manual ha sido elaborado exclusivamente con R, utilizando las librerias knitr, markdown y bookdown, que permiten editar y compilar documentos en diferentes formatos.

Estadística y Machine Learning con R

 

Outliers Detection and Intervention Analysis

(This article was first published on R Programming – DataScience+, and kindly contributed to R-bloggers) In my previous tutorial Arima Models and Intervention Analysis we took advantage of the strucchange package to identify and date time series level shifts structural changes. Based on that, we were able to define ARIMA models with improved AIC metrics.…

via Outliers Detection and Intervention Analysis — R-bloggers

Regresión logística y datos con grupos linealmente separables

Recientemente, los participantes en una encuesta realizada por la página web kaggle afirmaban que el modelo de regresión logística era la técnica estadística más utilizada en ciencia de datos. Este modelo proporciona una regla lineal de clasificación. Sin embargo, si tratamos de ajustar un modelo de regresión logística a datos con dos grupos linealmente separables (en principio, […]

via Regresión logística y datos con grupos linealmente separables — Caminos aleatorios

Ensemble learning for time series forecasting in R

(This article was first published on Peter Laurinec, and kindly contributed to R-bloggers) Ensemble learning methods are widely used nowadays for its predictive performance improvement. Ensemble learning combines multiple predictions (forecasts) from one or multiple methods to overcome accuracy of simple prediction and to avoid possible overfit. In the domain of time series forecasting, we…

via Ensemble learning for time series forecasting in R — R-bloggers