카테고리 없음

[아르 자형] 분위수 추정 후 누적 분포 함수 구축

필살기쓰세요 2021. 2. 17. 23:57

각각의 누적 분포 함수 X의 추정치 Y각각 분위수에서 tau함께 X고정 가졌다. 나는 분위수 회귀 경험하는 것이 아니지만,의 출력이처럼 보인다 rq있다는 점에서 일치하지 않는 Ytau주어진에 대한이 X반드시 단순하지 않다.

예를 들어, 다음은 다음의 네 가지 값에 대한 누적 분포 함수를 얻는 코드입니다 X.

library(quantreg)
library(reshape2)
library(ggplot2)

taus=seq(0,1,0.01)
Quantis<-rq(Y ~ X, tau=taus, method="br", data=data)

# Get predictions of Y for four X values for all taus
X = seq(min(data$X), max(data$X), length.out=4)
pred = as.data.frame(predict(Quantis, newdata=data.frame(X)))
pred$X = X

의 각 행은 pred주어진 X값 ( X값이의 마지막 열에 있음 pred)에 대한 누적 분포 함수입니다 . 아래에서는 ggplot으로 플로팅하기 위해이 데이터 프레임을 긴 형식으로 재구성합니다.

# Reshape predictions to long format
pred = melt(pred, id.var="X", variable.name="tau", value.name="Y")
pred$tau = as.numeric(gsub("tau= (.*)", "\\1", pred$tau))

# Plot predictions
ggplot(pred, aes(x=Y, y=tau, color=factor(X))) +
  geom_step() + theme_bw()
  

여기에 이미지 설명 입력

위의 그림에서 누적 분포 함수가 단조롭지 않음을 알 수 있습니다. 대신 101 개 분위수 (즉,의 101 개 값 tau)에 대한 개별 회귀선을 플로팅하면 무슨 일이 일어나고 있는지 더 쉽게 알 수 있습니다 . Y각에 대한 누적 분포 함수는 X아래 그림을 통한 수직 조각입니다. 그러나 각 분위수에 대한 회귀선이 종종 서로 교차하는 것을 볼 수 있습니다. 이는 위 그림의 비단 조성 (단어입니까?)과 같습니다.

상호 일관성을 유지하려면 분위수 회귀선이 서로 교차하지 않아야합니다. 내가 말했듯이, 나는 분위수 회귀에 대한 경험이 많지 않지만 각 분위수에 대해 안정적인 기울기를 얻기에는 데이터가 너무 희박 할 수 있습니다. 특히 왼쪽 가장자리의 단일 값은 문제가 있지만 해당 값을 제거하더라도 단조 분위수를 얻지 못합니다.

ggplot(pred, aes(x=X, y=Y, colour=tau, group=factor(tau))) +
  geom_point(data=data, aes(X,Y), inherit.aes=FALSE) +
    geom_line(show.legend=FALSE, alpha=0.7) +
      scale_colour_gradient2(low="red", mid="yellow", high="blue", midpoint=0.5) +
        theme_bw() 
        

여기에 이미지 설명 입력



출처
https://stackoverflow.com/questions/39940069