Introduzione all’importazione dei dati per i formati
csv
ed excel
. Gli aspetti fondamentali
sono:
csv
abbiamo visto read.csv()
xls
abbiamo visto
readxl::read.xls()
Per approfondire il tema dell’importazione dati potete vedere questo documento che riassume bene gli aspetti principali.
cumsum(table(x) / length(x))
plot(ecdf(x))
pazienti <- readxl::read_xls("../data/pazienti.xls")
par(mfrow = c(1,2)) # 2 grafici sulla stessa schermata
# usando ecdf
plot(ecdf(pazienti$eta))
# calcolando le frequenze cumulate relative e plottando
plot(x = sort(unique(pazienti$eta)),
y = cumsum((table(pazienti$eta)) / length(pazienti$eta))
)
quantile(x, probs = )
dove probs è il
rango percentile espresso da 0 a 1x <- runif(100, 10, 80)
# 25esimo percentile di x
quantile(x, probs = c(0.25))
## 25%
## 27.45033
# rango percentile del primo elemento di x
x[1]
## [1] 60.997
mean(x <= x[1]) * 100
## [1] 75
# con la funzione rank calcolo il rango di ogni osservazione
rp <- rank(x)/length(x)
rp[1] # uguale a quello calcolato in precedenza
## [1] 0.75