카테고리 없음
[아르 자형] 분위수 추정 후 누적 분포 함수 구축
필살기쓰세요
2021. 2. 17. 23:57
각각의 누적 분포 함수 X
의 추정치 Y
각각 분위수에서 tau
함께 X
고정 가졌다. 나는 분위수 회귀 경험하는 것이 아니지만,의 출력이처럼 보인다 rq
있다는 점에서 일치하지 않는 Y
대 tau
주어진에 대한이 X
반드시 단순하지 않다.
예를 들어, 다음은 다음의 네 가지 값에 대한 누적 분포 함수를 얻는 코드입니다 X
.
library(quantreg)
library(reshape2)
library(ggplot2)
taus=seq(0,1,0.01)
Quantis<-rq(Y ~ X, tau=taus, method="br", data=data)
# Get predictions of Y for four X values for all taus
X = seq(min(data$X), max(data$X), length.out=4)
pred = as.data.frame(predict(Quantis, newdata=data.frame(X)))
pred$X = X
의 각 행은 pred
주어진 X
값 ( X
값이의 마지막 열에 있음 pred
)에 대한 누적 분포 함수입니다 . 아래에서는 ggplot으로 플로팅하기 위해이 데이터 프레임을 긴 형식으로 재구성합니다.
# Reshape predictions to long format
pred = melt(pred, id.var="X", variable.name="tau", value.name="Y")
pred$tau = as.numeric(gsub("tau= (.*)", "\\1", pred$tau))
# Plot predictions
ggplot(pred, aes(x=Y, y=tau, color=factor(X))) +
geom_step() + theme_bw()
위의 그림에서 누적 분포 함수가 단조롭지 않음을 알 수 있습니다. 대신 101 개 분위수 (즉,의 101 개 값 tau
)에 대한 개별 회귀선을 플로팅하면 무슨 일이 일어나고 있는지 더 쉽게 알 수 있습니다 . Y
각에 대한 누적 분포 함수는 X
아래 그림을 통한 수직 조각입니다. 그러나 각 분위수에 대한 회귀선이 종종 서로 교차하는 것을 볼 수 있습니다. 이는 위 그림의 비단 조성 (단어입니까?)과 같습니다.
상호 일관성을 유지하려면 분위수 회귀선이 서로 교차하지 않아야합니다. 내가 말했듯이, 나는 분위수 회귀에 대한 경험이 많지 않지만 각 분위수에 대해 안정적인 기울기를 얻기에는 데이터가 너무 희박 할 수 있습니다. 특히 왼쪽 가장자리의 단일 값은 문제가 있지만 해당 값을 제거하더라도 단조 분위수를 얻지 못합니다.
ggplot(pred, aes(x=X, y=Y, colour=tau, group=factor(tau))) +
geom_point(data=data, aes(X,Y), inherit.aes=FALSE) +
geom_line(show.legend=FALSE, alpha=0.7) +
scale_colour_gradient2(low="red", mid="yellow", high="blue", midpoint=0.5) +
theme_bw()
출처
https://stackoverflow.com/questions/39940069