Exemplo de regressão aplicada à logística

Exemplo Logística
`Peso de descarga` <- sample(seq(500,1000,10), 100, replace = TRUE) # em mil kilos
`Janela de Tempo` <-  0.15 * `Peso de descarga` + rnorm(100, 30,30) # em minutos

Dados <- tibble(`Janela de Tempo`, `Peso de descarga`)

head(Dados)
## # A tibble: 6 x 2
##   `Janela de Tempo` `Peso de descarga`
##               <dbl>              <dbl>
## 1             150.                 520
## 2             144.                 960
## 3              75.4                510
## 4             129.                 830
## 5             148.                 940
## 6             190.                1000
regressao <- lm(`Janela de Tempo` ~ `Peso de descarga`, Dados)

summary(regressao)
## 
## Call:
## lm(formula = `Janela de Tempo` ~ `Peso de descarga`, data = Dados)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -64.773 -24.690   0.231  20.377  76.568 
## 
## Coefficients:
##                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        47.65246   16.50577   2.887  0.00479 ** 
## `Peso de descarga`  0.13345    0.02121   6.291 8.86e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 32.01 on 98 degrees of freedom
## Multiple R-squared:  0.2876, Adjusted R-squared:  0.2804 
## F-statistic: 39.57 on 1 and 98 DF,  p-value: 8.863e-09
ggplot(Dados, aes(`Peso de descarga`, `Janela de Tempo`))+
  geom_point()+
  geom_smooth(method='lm')
## `geom_smooth()` using formula 'y ~ x'

Dados$chuva <- Dados$`Janela de Tempo` > 150
write.csv(Dados, "Dados.csv")
head(Dados)
## # A tibble: 6 x 3
##   `Janela de Tempo` `Peso de descarga` chuva
##               <dbl>              <dbl> <lgl>
## 1             150.                 520 FALSE
## 2             144.                 960 FALSE
## 3              75.4                510 FALSE
## 4             129.                 830 FALSE
## 5             148.                 940 FALSE
## 6             190.                1000 TRUE
regressao2 <- lm(`Janela de Tempo` ~ `Peso de descarga` + chuva, Dados)

summary(regressao2)
## 
## Call:
## lm(formula = `Janela de Tempo` ~ `Peso de descarga` + chuva, 
##     data = Dados)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -49.854 -11.900  -2.484  11.284  52.986 
## 
## Coefficients:
##                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        84.13732   10.97355   7.667 1.36e-11 ***
## `Peso de descarga`  0.05186    0.01517   3.419  0.00092 ***
## chuvaTRUE          54.88207    4.58533  11.969  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.44 on 97 degrees of freedom
## Multiple R-squared:  0.7124, Adjusted R-squared:  0.7065 
## F-statistic: 120.1 on 2 and 97 DF,  p-value: < 2.2e-16
ggplot(Dados, aes(`Peso de descarga`, `Janela de Tempo`, colour = chuva))+
  geom_point()+
  geom_smooth(method='lm')
## `geom_smooth()` using formula 'y ~ x'