호스머, D. 및 레메쇼, S. (2000). 적용된 물류 회귀(두 번째 버전). 롱, 제이 스콧 (1997). 범주형 및 제한된 종속 변수에 대한 회귀 모델입니다. 예 1: 정치 후보가 선거에서 승리하는지 여부에 영향을 미치는 요인에 관심이 있다고 가정합니다. 결과(응답) 변수는 이진(0/1)입니다. 이기거나 지는.

관심 의 예측 변수는 캠페인에 지출 된 돈의 양, 부정적으로 선거 운동을 보낸 시간의 양, 그리고 후보가 현직인지 여부입니다. 예 2: 연구원은 GRE (대학원 기록 시험 점수), GPA (성적 점수 평균) 및 학부 기관의 명성과 같은 변수가 대학원에 입학하는 방법에 관심이 있습니다. 결과 변수는 이진 변수입니다. 로그 모델이라고도 하는 로지스틱 회귀는 이분형 결과 변수를 모델링하는 데 사용됩니다. 로그 모델에서 결과의 로그 배당률은 예측 변수의 선형 조합으로 모델링됩니다. 아래 데이터 분석을 위해 예제 2에서 대학원에 입학하는 방법에 대해 확장할 예정입니다. 우리는 https://stats.idre.ucla.edu/wp-content/uploads/2016/02/binary.sas7bdat 클릭하여 웹 사이트에서 얻을 수있는 가상의 데이터를 생성했습니다. 원하는 곳에 저장할 수 있지만 아래 구문은 디렉터리 c:data에 저장되었다고 가정합니다. 이 데이터 집합에는 이진 응답(결과, 종속) 변수가 있습니다.이 변수는 인정이라고 하며, 이는 개인이 대학원에 입학한 경우 1과 같으며, 그렇지 않으면 0입니다. gre, gpa 및 순위의 세 가지 예측 변수가 있습니다. 변수 그레와 gpa를 연속으로 다루겠습니다.

변수 순위는 값 1에서 4를 차지합니다. 1등급의 기관은 가장 높은 명성을 가지며, 4등급의 기관은 가장 낮습니다. 먼저 몇 가지 설명적인 통계를 살펴보는 것으로 시작합니다. 아래에서 로지스틱 회귀 모델을 실행합니다. 0이 아닌 1을 모델링하려면 내림차순 옵션을 사용합니다. 기본적으로 proc logistic models 0이 1이 아닌 0으로, 이 경우 대학원에 입학하지 못할 확률을 예측하는 것을 의미하기 때문에(입학=1) 수학적으로, 모델은 동일하지만, 개념적으로, 그것은 아마 에 들어가지 대 대학원에 들어가기의 확률을 모델링하는 것이 더 합리적이다. 클래스 문은 순위가 범주형 변수임을 SAS에게 알려줍니다. 슬래시 후 매개 변수 = ref 옵션은 순위 수준에 대한 기본 효과 코딩이 아닌 더미 코딩을 요청합니다. 덤프 로지스틱에서 더미 와 효과 코딩에 대한 자세한 내용은 FAQ 페이지: PROC LOGISTIC에서 배당률과 일치하는 계수가 아닌 이유는 무엇입니까?를 참조하십시오. 모델은 동일하기 때문에 위의 proc logistic 명령에 의해 생성된 대부분의 출력은 이전과 동일합니다. 유일한 차이점은 대비 문에서 생성된 추가 출력입니다.

제목 대비 테스트 결과 아래에는 자유도, Wald 카지 제곱 통계 및 p 값과 함께 대비(2위 대 3)에 대한 레이블이 표시됩니다. 이 표의 p-값을 기준으로 순위=2의 계수는 순위=3의 계수와 크게 다르다는 것을 알고 있습니다. 두 번째 표는 실제 차이 추정(추정치 미만), 표준 오차, 신뢰도 제한, 테스트 통계 및 p-값을 포함하여 보다 자세한 정보를 보여 주며, 예상 차이는 0.6648로, 2등급의 학부 기관에 다녔다는 것을 알 수 있으며, 3등급의 기관은 입학 배당률이 0.67로 증가합니다. 치료 와 성별의 각 조합에 대한 연령 변수에 대한 모델 예측 확률의 ANCOVA 스타일 플롯은 출력 51.2.11 및 출력 51.2.12에 표시됩니다.