• 원조효과성 고위급회의원조효과성 고위급회의 
  • 1960년대 초 전쟁 이후 싹트게 된 낙관주의와 더불어 국제개발협력은 국제적 개발을 진척시키기 위한 필수 요소중의 하나로 인식되었습니다. 하지만 이것이 항상 성공적인 결과를 도출해왔다고 볼 수 없습니다. 협조 부족, 지나친 의욕을 바탕으로 한 목표 설정, 비현실적인 시간 및 예산 제약, 그리고 정치적인 이해관계는 효과적인 원조 이행에 있어 빈번하게 부딪히게 되는 장애물이었습니다.
  • 현재 100개국 이상이 원조 효과를 극대화하기 위한 청사진으로 여기고 있는 원조효과성을 위한 원칙 형성은 원조가 충분한 개발성과를 내지 못하는 이유를 이해하고 새천년개발목표(MDGs) 달성을 위해 박차를 가하고자 하는 데서 출발했습니다. 원조 개선을 위한 노력을 발단으로 논의되기 시작한 원조효과성에 대한 원칙은 이하 세 번의 중대한 회의들을 통해 윤곽을 드러내게 됩니다.
  • 제 1차 고위급회의, 2002년 로마
  • 제 1차 고위급회의는 원조효과성에 대한 5가지 원칙이 구체적 선언을 통해 수립되었다는 점에 의의가 있다고 할 수 있습니다. 로마선언은 행동사항들을 우선순위로 제시하고 있습니다.
    • 개발원조는 수원국의 우선순위와 시기선택을 바탕으로 시행한다.
    • 공여국은 타 공여국에게 업무를 위임하고 국별 프로그램 및 사업 담당자들의 유연성을 높인다.
    • 수원국이 스스로 개발 진로를 결정하는 리더십을 강화할 수 있도록 돕기 위해 모범 이행사례를 장려하며 모니터링과 연구 분석을 통해 뒷받침한다.
  • 제 2차 고위급회의, 2005년 파리
  • 제 2차 고위급회의는 공여국과 수원국이 원조효과성에 대한 약속과 이를 성취하기 위한 상호 책무성에 처음 합의를 이룬 자리입니다. 이를 담고 있는 파리선언(Paris Declaration)은 원조의 질과 개발에 미치는 영향을 개선하기 위해 보다 실질적이고 행동지향적인 로드맵을 제시하고 있습니다. 특히 파리선언은 구체적인 이행 조치와 더불어 성과 측정과 공여국/수원국 상호책임을 위한 모니터링 체제를 수립하였습니다. 파리선언의 5가지 중점 원칙은 다음과 같습니다.



  • 제 3차 고위급회의, 2008년 아크라
  • 제 3차 고위급회의는 시민 사회 대표들도 참가함으로써원조 효과성 증진에 대한 시민사회의 역할의 중요성이 새롭게 인식되는 계기가 되었습니다. 아크라 회의는 파리선언에서 수립된 목표 이행의 필요성을 강조하고 이를 개선하기 위한 우선순위 분야를 설정했습니다. 이를 위해 수립된 아크라 행동 계획(AAA: Accra Agenda for Action)은 파리선언 이행에 박차를 가하기 위한 진전 사항과 의제를 설정하고 있습니다. 특히 아크라 행동계획은 다음 3가지 영역에서의 개선점을 제안하고 있습니다.
    • 주인의식: 참여 국가들은 개발과정에서 폭넓은 정책을 형성하는 데 참여하여 원조 조화 부분에서 더 강한 리더십을 갖고 국가의 원조 실행 체제를 활용하도록 한다.
    • 포괄적 파트너십: 모든 파트너들(OECD DAC 회원국, 개발도상국, Non-DAC공여국, 재단 및 시민사회)이 충분히 참여하도록 한다.
    • 성과지향: 원조는 개발에 얼마나 실질적이고 측정 가능한 영향을 미치는가에 중점을 두도록 한다.
  • 제 4차 고위급회의, 2011년 부산
  • 부산세계개발원조총회
  • 세계개발원조총회는 국제원조 및 개발협력 분야의 최대 규모 최고 권위의 행사로 2003년 로마, 2005년 파리, 2008년 아크라에서 개최된 바 있습니다.
  • 제 4차 원조효과성 고위급회의인 부산 세계개발원조 총회(4th High Level Forum on Aid Effectiveness, 이하 HLF-4)는 전 세계 160여 개국 고위인사 및 UN, 세계은행, OECD 등 주요 국제기구 대표, 시민사회 인사 등 약 2,000여 명이 참석한 개발원조분야 최고위급, 최대 규모의 회의입니다. 아시아에서는 최초로 11월 29일부터 3일 간 부산 벡스코에서 개최되었으며, 기존 파리선언에서 수립되었던 원조효과성 이행사항에 대한 평가 및 공유, 포괄적 개발효과성 관련 의제, 부산총회 이후 의제에 대해서 논의하였습니다.
  • 한국 정부는 부산 총회에서 기존 원조효과성 논의를 넘어 효과적 개발을 위한 컨센서스 도출을 추진하였습니다. 또한 신흥국, 시민사회, 의회, 민간기업 등 새로운 개발협력주체가 참여하는 포괄적 개발협력 파트너십 도출을 위해 적극적인 외교를 펼친 바 있습니다.
  • 한국은 G20 정상회의와 HLF-4를 개최하였던 글로벌 리더십을 발휘하여 수원국의 자립을 위한 역량개발과 우리의 발전경험 공유, 신흥국과 민간부문의 협력강화, Post-MDGs 구축 등의 향후 과제를 해결해 나가기 위한 논의를 전개하는데 앞장서고 있습니다.
    • 공여국, 수원국, 민간, 비정부 기구 망라하는 모든 개발 단계에서 보다 광범위 하고 심도 깊은 파트너십
    • 개발 성과 달성을 어렵게 하는 정책을 제거하기 위해 설득력 있는 증거를 바탕으로 원조효과성 원칙 수립
    • 새천년개발목표 달성과 국제공공재를 위한 전지구적 노력 활성화
    • 가장 빈곤하고 취약한 국가들은 안보, 역량 및 특별 관리가 필요하다는 점 인식
    • 성과 달성은 모두가 직접적으로 개발 절차에 참여할 수 있도록 장려하는 정책, 법, 기관의 지침을 바탕으로 한다는 점 인식
    • 개발에 있어 모든 주체는 성과를 창출하고 측정하는 데에 상호 책임이 있다는 점 인식. 이는 프로그램의 효과성과 가치를 실증하는 데이터를 수집, 평가, 보고하는 역량을 개발해야 한다는 점을 의미
    출처: OECD DAC 사이트http://www.oecd.org

(출처 : http://www.odakorea.go.kr/oz/object/OdaStaEffCon.jsp)



  • 부산선언 주요 내용
  • 구분주요내용세부내용
    서언새로운 글로벌 
    환경 조망,
    개발협력의 공통원칙 및 
    행동방침 설정
    공통원칙① 주인의식 (Ownership of Development Priorities by Developing Countries)
    ② 결과중심 (Focus on Results)
    ③ 포용적인 개발 파트너쉽(Inclusive Development Partnership)
    ④ 투명성과 상호 책임성 (Transparency and Accountability to each other)
    공동 
    행동방침
    ① 개발정책 및 절차에서 개도국의 민주적 주인의식 심화
    ② 구체적이고 지속가능한 결과를 얻기 위한 노력 강화
    ③ 남남/삼각협력에 대한 지원 확대와 개별국가의 상황과 필요에 맞춘 지원
    ④ 다양한 개발재원의 촉매적 역할 확보
    원조 효과성
    심화
    주인의식, 결과 및 책임성 
    강화
    • 원조의 비구속화 가속화, 2012년 중간점검
    • 수원국 시스템 활용 강화
    • 여성권한, 시민사회 및 의회 역할 강화
    투명하고 
    책임 있는 협력
    • 공적자금 개발활동에 관한 전체 정보의 공개 및 표준화된 정보 공개 방식 활용
    • 2012년까지 중장기 예측 가능성 제고
    취약, 분쟁상황에서의 
    지속가능한 
    개발 촉진
    • 평화구축 및 국가건설 목표 활용
    • 수원국 주도 취약성 평가 활용, 재원의 효과적 활용 및 결과 중심 접근을 통한 상호신뢰 강화
    재난상황에서의 복원력 
    강화 및 취약성 감소
    • 충격을 견디는 인프라 구축 및 사회보호 체제 구축 투자
    효과적 개발을
    위한 협력
    효과적 제도 및 정책• 수원국 주도 하 개발 관련 핵심 국가기능 강화, 정책 제안 이해 지원을 위한 정보 수집, 정책 개혁에 관한 지식 공유 등
    남남/삼각협력• 삼각협력의 확대, 남남 및 삼각협력의 성과 인정
    • 지식공유, 동료학습 및 남남협력 내 조율 권장
    민간분야• 민간분야의 역할 중요성 인정
    • 민간의 성장과 개발 관련 정책 수립 참여, 민간역할 지원하는 제도적 환경 마련
    반부패 및 불법자금• 부패 척결에 관한 공약이행, 자금세탁, 조세회피 대처 위한 장치 마련
    기후변화 재원• 기후변화 대처 문제의 가발전략 포함, 기후변화 재원 활용에 있어 원조 효과성 원칙 적용 권유
    Post-Busan 
    이행체제
    수원국 현장중심 이행과 
    가벼운 형태의 글로벌 
    거버넌스 구축
    • 2012년 중반까지 소수의 선택적 평가지표 개발
    • 효과적인 개발협력을 위한 글로벌 파트너십 출범
    • 2012년 6월까지 각료급 참여대상, 각료급 참여 등을 포함한 실질 운영방안 협의
    • OECD 및 UNDP가 파트너십의 효과적 운영을 지원해줄 것을 요청

    출처 : 외교통상부 (2011)

  • 부산세계개발원조총회 공식 웹사이트 : http://www.aideffectiveness.org/busanhlf4/








'All the others' 카테고리의 다른 글

명언들(2)  (0) 2014.02.03
명언들(1)  (0) 2014.01.28
간접비  (0) 2013.10.08
Rolling Admission  (0) 2013.09.10
호주의 의과대학  (0) 2013.09.10


(전략)


|연구시설·지원인력 유지 위한 실질 경비


그렇다면 연구 간접비란 도대체 무엇이며, 왜 지급되는 것이고, 어떻게 쓰여야 하는 것일까?연구 간접비가 무엇인지 이해하기 위해 우선 연구비에 대해 알아둘 필요가 있다. 연구비는 크게 직접비와 간접비로 나누어진다. 직접비는 연구에 직접 투입되는 예산으로 특정 연구과제와의 인과관계가 명확하여 해당 과제별로 직접 추적할 수 있는 원가항목을 의미한다. 개별 연구과제별로 작성·제출되는 연구계획서 상의 연구비 내역에 기재된 직접경비 항목들, 즉 인건비, 재료비, 장비사용료, 인쇄비, 여비, 자료수집비 등 해당 연구과제의 고유한 목적을 위해 직접적으로 소비된 원가들이다.

 

반면에 간접비란 특정 연구과제와의 인과관계가 불명확하고 간접적이며, 여러 연구과제의 수행에 있어서 공통적으로 발생한 원가이다. 주로 대학의 연구지원 활동에서 발생하는 경비들이 이에 해당되는데, 연구에 사용되는 건물, 연구지원 시설 및 기자재, 연구 인력, 행정 지원 및 지원인력 등 대학이 보유한 유·무형의 자원을 연구수행 과정에서 간접적으로 이용함에 따라 발생하는 비용들이 포함된다. 쉽게 예를 들어 연구자가 해당 연구과제를 수행하기 위해 사용하는 대학 내 공간의 전기값, 물값 등이 대표적인 간접비라 할 수 있다. 이러한 비용은 개별 연구에 직접적으로 분리하여 부과할 수가 없고, 합리적이고 체계적 배부 기준을 이용하여 관련된 모든 연구과제에 적절히 배부해 주어야 한다.

 

대학 간접비에 대해 알기 위해 미국의 간접비 제도를 살펴보면 이해를 좀 더 도울 수 있을 것이다. 미국 연방정부 규정상 대학의 간접비는 ‘시설 및 관리비(Facilities and Administrative Costs)’라고 공식명칭이 정해져 있으나 보통 간접비라고 통칭된다. ‘시설 및 관리비’는 간접비의 성격을 가장 뚜렷하게 표현하는 단어로 ‘시설비’에는 시설과 관련된 제비용, 즉 건물 감가상각비,전기·수도·난방비, 건물의 운영 및 관리·보수, 그리고 안전과 관련된 제반 부수비용이 포함된다. ‘관리비’는 다양한 관리부서의 사무직원에 대한 지출로서 연구지원 인력, 재정담당 학장·행정담당 학장과 같은 각 학부의 행정하부조직, 연구지원실·하급 행정직원·대학 본부와 같이 연구를 지원하는 부문에서 발생하는 비용이다.

 

미국의 경우에도 이러한 성격의 간접비 제도가 처음부터 자리 잡은 것은 아니며, 간접비 산출의 원칙과 관행은 50여 년간의 토론과 협상을 통해 이루어진 결과이다. 미국의 대학 간접비 지급은 연방정부가 국방연구 협약을 하는 과정에서 연구과제 수행에 따라 발생하는 비용을 ‘보상’하기로 한 것에서 출발하였다. 이후 연방정부와 대학 간에 간접비의 적정 보전비율에 대한 본격적인 토론이 전개되었으며, 그 결과 1958년 간접비 산정을 위한 공식적이고 광범위한 가이드라인인 ‘BOB(OMB의 전신) Circular A-21’이 제정되었다. 같은 해에 미국 의회는 간접비 비율을 15%까지 상향조정하는 법률을 통과시킴으로써 직접적으로 간접비 정책에 개입하기 시작했으며,1963년에는 이를 20%까지 인상하였다. 그리고 더 나아가 1965년 20%의 상한선이 대학의 연구과제 수행에 지출된 비용을 보전하는 데 충분하지 못하다는 정부의 보고서에 따라 1966년 의회는 간접비의 상한선을 아예 철폐한다. 이후 간접비율은 지속적으로 상승하여 1990년대 이르러서는 50%에 달하게 되었다. 현재 미국 대학의 간접비율은 40~60%로, 지출한 간접비 원가에 따라 대학과 연방 정부 기관 간의 주기적 협상을 통해 결정되므로 대학별로 상이한 상황이다.

 

미국의 간접비 제도를 살펴보면 대학이 연구과제 수행 시 연구지원에 쓰는 비용을 ‘보상’하기위한 간접비 성격에 대해 명확히 하고 있음을 알 수 있다. 간접비를 연구과제 수행으로 인해 발생하는 시설과 행정비용에 대한 ‘보상’으로서 인식하고 있는 것이다. 그러나 엄밀한 의미에서 본다면 수행한 연구에 소요된 경비를 정확히 보상하는 것이 아니라 일종의 예정원가 개념을 도입하여 전년도를 기준으로 수정된 직접비 대비 연구 간접비를 구하여 이를 개별 연구의 직접비에 적용하여 산출하는 것이다. 따라서 개별 연구과제로 본다면 개별 연구과제별 실제 간접원가가 아닌 해당 대학의 평균 간접연구원가를 보상하는 것이다.

 

이러한 외국의 예와 우리나라 대학 간접비 제도를 고려하여 간접비를 한 문장으로 정리하자면 ‘연구 간접비는 연구를 수행하는 과정에서 공동으로 이용하는 연구시설과 지원인력 등을 유지하기 위해 발생하는 연구수행 기관의 실질 경비’라 할 수 있다. 간접비의 이러한 정의에서 정부나 기업 등 연구 의뢰기관이 직접비 외에 간접비를 연구 수주기관에 지급할 필요성이 생긴다. 간접비는 대학이 연구과정에서 연구지원을 위해 소비하는 실질 경비이기 때문에 이에 대해 연구의뢰 기관이 정해진 기준을 통해 원가를 ‘보전’해 주어야 하는 것이다.


(후략)




 대학연구 간접비.pdf




(http://www.nature.com/srep/2012/121015/srep00735/fig_tab/srep00735_F3.html)



올챙이DontShootMe (2012-04-26 13:10)
 답변추천2   
S.D.와 S.E. 는 완전히 다른 개념입니다.

S.D.는 각 데이터값의 퍼진 정도를 나타내는 값( 즉 평균을 중심으로 데이터의 분포정도를 대표함)입니다. 그래프를 예로들면, +/- 1 S.D. 를 에러바로 표시하면, 그안에 평균을 중심으로 한 전체데이터값의 약 2/3가 들어 있게 되고 +/2 2S.D.로 하면, 전체데이터의 95%가 포함되는 범위를 나타내게 되지요.

S.E.는 전체실험(n번 측정하여 평균m과 S.D. s를 얻을 수 있는 실험)을 여러 번(N번)하였을 때야 비로소 얻어지는 값입니다. 즉 총측정횟수는 n x N 으로 상당히 많은 실험을 해야 얻어지는 값입니다. 보통 여러분이 하시는 실험에서는 얻을 수 없는 값입니다(다수의 측정을 통한 전체 실험을 한 세트로 보고, 그와 같은 실험을 반복해야 얻을 수 있는 값입니다.).

이렇게 n횟수의 측정 x N횟수의 세트실험 후에, 얻어지는 각 세트실험의 평균 m들의 평균 M을 구하고 이때 전체 세트실험의 S.D.가 얻어지지요. 요 S.D.를 root (N)으로 나눈 값이 S.E.입니다. 당연히 S.E.값이 S.D.값보다 작으니 그래프가 더 멋지게(?) 보일 테지만, 그것은 훨씬 많은 (N배 많은) 측정값 때문에 더 참 값에 가까워지기에 그러한 것입니다. 이렇게 N배 많은 측정이 이루어져야 구할 수 있는 값이니, 함부로 S.D.값을 S.E.값으로 혼동하여 적지 마시기 바랍니다. 안타깝게도 논문 중에도 잘 이하지 못하고 사용하는 경우가 있는 듯 하더군요.

아래 문헌 참조 하시길 바랍니다.
 http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2064100/pdf/jcb1770007.pdf


(출처 : http://bric.postech.ac.kr/myboard/read.php?Board=exp_qna&id=63575)




While many colleges and universities in the United States employ a rolling admission policy, very few of the most selective colleges use it. With rolling admission, students have a large window of time during which they can apply to a college or university. The application process typically opens up in the early fall, and it may continue right through the summer.

Unlike a regular admission process with a firm application deadline, rolling admission applicants are often notified of their acceptance or rejection within a few weeks of applying. A college with rolling admission typically accepts applications for as long as spaces are available.

Applicants should realize, however, that it is a mistake to view rolling admission as an excuse to put off applying to college. In many cases, applying early improves an applicant's chance of being accepted. Also, while there may be no application deadline, there typically are deadlines for scholarships, financial aid and housing. A late application may make it impossible to get any decent financial aid.

If handled wisely, rolling admission offers a student several perks:

  • applicants may receive a decision long before the March or April notification period of regular admission colleges
  • applying early can improve an applicant's chance of being accepted
  • applying early may improve an applicant's chance of receiving a scholarship
  • applying early may give an applicant first choice for housing
  • some rolling admission colleges still give students until May 1 to make a decision; this allows an applicant to weigh all options
  • a student who applies early and is rejected may still have time to apply to other colleges with winter deadlines
  • rolling admission colleges may remain an option if a student gets rejected elsewhere; some rolling admission colleges accept applications right up until classes start

Some sample rolling admission policies:

  • University of Minnesota: Application review begins September 15; priority is given to applications received by December 15; after December 15th, applications are considered on a space-available basis.
  • Rutgers University: December 1st priority deadline; February 28th notification date; May 1st decision deadline; after December 1st, applications are considered on a space-available basis.
  • Indiana University: November 1st priority date for merit-based scholarships; February 1st priority date for admission; April 1st deadline to be considered for admission.
  • Penn State: November 30 priority date for admission
  • University of Pittsburgh: Applications accepted until class is full; January 15th deadline for scholarships





(출처 : http://collegeapps.about.com/od/admissionstimeline/a/rolling.htm)






Rolling Admissios:

While many schools have a hard deadline for applications (meaning they won't accept applications received after the deadline), colleges with rolling admissions accept applications until they've filled all the spots. The Rolling admission policy means that there is no application deadline; admission is offered on an ongoing basis to qualified students until the class is filled.
 

Rolling admissions in the college admissions process

As each application comes in, it's reviewed. Decisions are then made on a case-by-case basis and you'll usually hear back within 3-8 weeks. There are few schools that accept applications under a rolling admission policy and then send out decisions all at once. If they didn't find required number of suitable profiles they are looking for, they will continue with admissions. If they have not issued admissions to targeted number of incoming students, they will continue accepting application after deadlines (some rolling admission schools have deadlines for international students). In such cases if you are late in submitting application, you will get second chance to get in your application.
 

  

The advantages of rolling admissions:

There are some advantages to applying to colleges with rolling admissions.
If you are looking for a decision from particular school, you will probably find out the admission decision early. Based on the decision you can adjust application strategy. When you apply early you have good chances of get in. Because you won't be compared with the applicants applying in Feb or March.

The disadvantages of rolling admissions:

If you haven't applied early you have less chance of admission.

Financial Aid in Rolling Admissions:

Most of the universities with rolling admissions follow first come first served basis for the financial aid. So, apply early to get financial aid from a rolling admission school.

(출처  : http://www.msinus.com/rolling-admissions.htm)







Rolling admission is a policy used by many colleges to admit freshmen to undergraduate programs. Many law schools in the United States also have rolling admissions policies.[1] Under rolling admission, candidates are invited to submit their applications to the university anytime within a large window. The window is usually over six months long, and some schools do not have a previously specified end date (the window simply closes when all spots are filled). The university will then review the application and notify the applicant of their decision within a few weeks from submission.


Advantages of rolling admission[edit source | editbeta]

Rolling admission might be less stressful for students, and university admissions offices have less data to process because applications do not all flow in at the same time. Students can finish their application anytime between the summer before their senior year and midway through their senior year and can submit it at leisure, taking the time to carefully review their application and not getting anxious about a nearing deadline. The organization receives applications continuously rather than in one or two bursts and is thus able to spend more time on each application individually.

Disadvantages of rolling admission[edit source | editbeta]

Most college guidance counselors advise that students submit their application soon after the school begins to accept them as many believe that colleges look more favorably on students who apply earlier in the year. Other times, universities may underestimate the number of students who will take the offer of admission, resulting in the number of spots filling rapidly; this can lead to more-qualified applicants' being denied. This can create pressure on students who wait a little longer. Also, schools often use a first-come-first-served method to grant housing and aid to students.[2] Applicants who believe rolling admission to mean no deadlines may miss the chance at housing or aid that they would have had if there were one set deadline.[2]




(출처 : http://en.wikipedia.org/wiki/Rolling_admission)






Rolling Admissions and the College Process

By Brendan Conway updated on Wednesday, January 30, 2013

Part of checking out college admission requirements is learning about admission deadlines, and in doing so you may find out that some of the schools you're applying to offer rolling admissions. It might sound a bit like the "Wheel of Fortune," but it can actually put the odds in your favor when it comes to getting accepted.

While many schools have a "hard" deadline for applications (meaning they won't accept those either postmarked or received after that date), colleges with rolling admissions accept applications until they've filled all the spots in their freshman class.

Rolling admissions in the college admissions process

Some schools go this route right from the start. As each application comes in, it's reviewed. Decisions are then made on a case-by-case basis and you'll usually hear back within 4 to 8 weeks.

However, there are some schools that accept applications under a rolling admission policy and then send out decisions all at once. Depending on whether they've found the students they're looking for, they may then continue to review applications — or not.

In certain situations, schools may use rolling admissions after the normal deadline. This can happen if they haven't yet granted admission to their targeted number of incoming students, and it could offer you an unusual second chance to get your application in. If you're down to the wire and want to know if applying is still a possibility, call the school's admission office. If they're still accepting applications, get yours in ASAP!

The process that a school follows in regard to its rolling admission policy likely depends on its overall college admission requirements.

If you want to know more about how to use rolling admissions, check out our other article. 

The advantages of rolling admissions 
There are some advantages to applying to colleges with rolling admissions.

  • If you've got your eye on a certain school, you can probably find out early if you've been accepted and adjust your application strategy accordingly. Keep this in mind when plotting out your overall college application plans and schedule.
  • Rolling admission policies offer you some flexibility if you applied to just one school and didn't get in, or if you want to add an extra safety school to your list.
  • There may also be less competition, but this depends on you. If you apply in December, the school won't wait until March to compare you with all the other applicants, and you could actually improve your chances of being accepted. Remember though, the reverse also holds true: the later you apply, the more competition there may be for fewer spots.

Click the link if you want to know more about the advantages and disadvantages of rolling admissions.

 

Financial aid and rolling admissions 
Applying to a school with rolling admissions late in the game can also impact your financial aid offer. A school's admission and aid policies are not one and the same. If you're accepted after the free money's been doled out, you could be out of luck and limited to taking out loans.

Before you apply, call your potential school and find out what aid may be available to you. Knowing what you can expect to pay can help you fine tune your list. (For that reason, this is a good idea at any time during the college admission process whether you apply under "regular," rolling, or early admission.) To find out more about how financial aid and rolling admissions interact, follow the link.

No restrictions with rolling admissions 
Unlike some early application policies, you're not restricted from applying to other schools when you apply to one with rolling admissions. In addition, some schools may not require you to make your final decision until May 1, under a practice known as the Candidates Reply Date Agreement (CRDA).

If you're not applying to a CRDA school, the college may request your commitment before May 1, and possibly force you into making a decision before you hear from other schools. Make sure you'll be granted a delay, in the event that you need one; don't be afraid to request this kind of college admissions assistance. You don't want to be forced into committing to a school further down your list when you haven't yet heard from your top choices.

(출처 : http://www.petersons.com/college-search/rolling-admissions-college-process.aspx)





Which Colleges and Universities Offer Late and Rolling Admission?

For a list of schools who offer late and rolling admissions, visit Peterson’s list of late and rolling deadline schools.


What is Rolling Admission?

Some colleges and universities offer students the option of applying under the Rolling Admission process.

This type of admission allows students to apply to college anytime during their senior year of high school and sometimes until college classes begin in the fall.

With this type of admission the applicant is notified of acceptance or denial within a few weeks of applying. Under this type of admission the applicants are accepted until all spots are filled in the program.



What are the Benefits of Applying Rolling Admission?

  • Applying early can increase your chances of getting accepted.
  • Applying early may increase your chances of getting a good financial aid package.
  • Applying early can help you qualify for certain scholarships.
  • Applying early may qualify you for the best housing options.
  • You can receive a decision much earlier than regular admission.
  • You can apply to other colleges and make a final decision later in the year.
  • There is less pressure to meet application deadlines.

 

What Are the Disadvantages of Applying Rolling Admission?

  • You may get denied because all of the available spaces are filled.
  • If you wait to apply, you may not qualify for housing or financial aid.
  • You may miss out on scholarships and grants.


(출처 : http://www.collegeresourcenetwork.com/college-planning/admissions/rolling-admission/)





Medical school[edit source | editbeta]

Various models of medical education exist in Australia. 

Undergraduate-entry program typically last 5–6 years, and permit entry from secondary school matriculation. Applicants are usually assessed by a combination of high school leaving certificate performanceUMAT (Undergraduate Medicine and Health Sciences Admission Test) score and interview.

Graduate medical programs typically last 4 years, and require the entrant to have attained a previous bachelor degree qualification at a certain level of achievement in addition to aptitude tests and interviews. The most common selection test used is the GAMSAT (Graduate Australian Medical Schools Admission Test).


In early years, theoretical domains of study predominate, with increasing clinical focus during the program. 

However, early clinical exposure — in which students commence clinical skills from very early in the course, concurrently with theoretical study — is a component of many degrees, most notably the graduate medical programs. In recent years medical school learning and teaching in Australia has taken on a new direction. At most universities there has been a move away from the more traditional methods of teaching with a shift towards the Problem Based Learning (PBL) pedagogy including the use of Objective Structured Clinical Examinations (OSCEs).


Historically Australian medical schools have followed the British tradition by conferring MBBS degrees to medicine graduates. The notable exception is the Bachelor of Medicine (BMed) joint program of the University of Newcastle and the University of New England. Australian MBBS degrees are graduate-entry Bachelor's degrees at Level 7 of the Australian Qualifications Framework (AQF) and take four years to complete. The Newcastle/New England BMed is again an exception, being a five year undergraduate-entry Level 7 degree.


A recent revision to the AQF permits certain Level 9 Master's degree programs to use "Doctor of" in the degree title. As a result, several Australian universities are in the process of revising their Level 7 Bachelor's degrees to become Level 9 Master's degrees with the title Doctor of Medicine (MD). The University of Melbourne was the first to introduce the MD degree in 2011, and many other Australian universities are in the process of replacing their MBBS degrees with MDs.


UniversityDegreePrevious degreeDurationEntry levelYear available
University of MelbourneMDMBBS4 yearsPostgraduate2011
Flinders UniversityMDMBBS4 yearsPostgraduate2013
University of Western Australia[1]MDMBBS4 yearsPostgraduate2014
University of Sydney[2]MDMBBS4 yearsPostgraduate2014
Griffith University[3]MDMBBS4 yearsPostgraduate2014
University of Queensland[4]MDMBBS4 yearsPostgraduate2015
University of Adelaide[5]MDMBBS4 yearsPostgraduate2013
University of New South Wales[6]BMed/MDMBBS6 yearsUndergraduate2014 (TBC)
University of Newcastle[7]BMedSci/MDBMed5 yearsUndergraduate2015 (TBC)
University of New England[8]BMedSci/MDBMed5 yearsUndergraduate2015 (TBC)
Australian National University[9]MChDMBBS4 yearsPostgraduate2014

Many universities previously offered an MD as an AQF Level 10 doctoral degree akin to the PhD or as a higher doctorate. Since the introduction of the Master's level MD, universities have renamed their previous medical research doctorates. For instance, the University of Melbourne renamed its research degree the Doctor of Medical Science (DMedSci).






(출처 : http://en.wikipedia.org/wiki/Medical_education_in_Australia)






AQF Levels[edit source | editbeta]

The Framework is structured around levels of descriptive criteria, with formal qualifications aligned to the appropriate levels.[2]

Framework
AQF LevelDescription summariesQualificationsTime
Level 10Graduates at this level will have systematic and critical understanding of a complex field of learning and specialised research skills for the advancement of learning and/or for professional practice
  • 3 to 4 years
Level 9Graduates at this level will have specialised knowledge and skills for research, and/or professional practice and/or further learning
  • Masters degree (extended)
  • Masters degree (coursework)
  • Masters degree (research)
  • 3 to 4 years
  • 1 to 2 years
  • 1 to 2 years
Level 8Graduates at this level will have advanced knowledge and skills for professional/highly skilled work and/or further learning 
  • Graduate diploma
  • Graduate certificate
  • Bachelor honours degree
  • 1 to 2 years
  • 6 months to 1 year
  • 1 year
Level 7Graduates at this level will have broad and coherent knowledge and skills for professional work and/or further learning .
  • Bachelor degree
  • 3 to 4 years
Level 6Graduates at this level will have broad knowledge and skills for paraprofessional/highly skilled work and/or further learning
  • Associate degree
  • Advanced diploma
  • 2 years
  • 1.5 to 2 years
Level 5Graduates at this level will have specialised knowledge and skills for skilled/paraprofessional work and/or further learning 
  • Diploma
  • 1 to 2 years
Level 4Graduates at this level will have theoretical and practical knowledge and skills for specialised and/or skilled work and/or further learning
  • Certificate IV
  • 6 months to 2 years
Level 3Graduates at this level will have theoretical and practical knowledge and skills for work and/or further learning
  • Certificate III
  • 1 to 2 years
Level 2Graduates at this level will have knowledge and skills for work in a defined context and/or further learning  
  • Certificate II
  • 6 months to 1 year
Level 1Graduates at this level will have knowledge and skills for initial work,community involvement and/or further learning
  • Certificate I
  • 6 months to 1 year


(출처 : http://en.wikipedia.org/wiki/Australian_Qualifications_Framework)






How to be a Specialist  호주의대 뉴질랜드 

2008/10/09 02:32

(출처 : http://blog.naver.com/gmliving/120056936959)


1. 일반적으로 어떤 분야의 전문의가 되든 간에, 전문의가 되기 위해 의사가 되기 위한 첫 과정은 일반적인 훈련 과정을 거친다.


2. 호주에는 의사가 되기 위해 최초 학위를 취득하는 방법으로 두 가지가 있다. 

그 첫 번째는 전통적으로 이어져 내려온 6년제 의대에서 의학 및 외과 학사(MBBS)를 취득하는 것이다. 뉴캐슬 이나 모나쉬와 같은 일부 대학은 5년제로 학사제도를 운영하고 있다. 이 과정을 통해 의대를 졸업하려면, 12년제의 초,중,고(Primary, Secondary school)을 졸업해야 하며, 매우 높은 대입 성적(졸업성적)을 필요로 한다. 대부분의 의대 지원자들은 의사로서의 적성을 측정하는 ‘의대 및 보건 과학 학사 입학 시험(UMAT)’을 치러야만 한다. 일반적으로 높은 경쟁률 관계로, 인터뷰를 요구하기도 한다.


3. 최근 많은 퀸즐랜드, 시드니, 플린더스 대학과 같은 많은 대학 들이 4년제 의학전문 대학원을 운영하고 있다. 지원자들은 학사학위를 소지하고 있어야 하며(보건 과학분야 졸업자가 아니어도 상관없다.), 이들은 반드시 호주 의학 대학원 입학 시험(GAMSAT)을 치러야 하며 선발 과정에 인터뷰도 포함된다.


4. 모든 호주 의대들은 세부 수업은 다를 지 몰라도 각 대학들은 호주 의학 위원회(AMC)의 인가를 받아 AMC가 정하는 일정한 기준과 학습 결과를 만족해야 한다.


5. 의대 학위를 완료하고 나면, 졸업생들은 의료현장에 들어가게 된다. 주로 주요 공공 교육 병원에서 인턴으로 12개월을 일한다. 

이것은 각 주의 의료 위원회에서 요구하는 정식 의사 등록을 위한 ‘1년 인턴 교육제도’의 규정에 따른 것일 뿐이지, 이것이 Madicare 시스템에서 (의료보험제도) 개인 개업의가 되기 위한 조건을 의미하는 것은 아닙니다. 


1996년 개정된 의료보험 법의 조항에 따르면, 국가의료보험이 적용되는 개인 병원 개업을 위해서는, 의사는 긴 시간의 졸업 후 전문 교육 프로그램을 수료해야 하며, medical College의 fellowship을 획득해야 한다. 전문 교육 프로그램을 시작하기 전에 대부분의 의사들은 전문 교육 프로그램의 높은 경쟁 때문에 공공 병원에서 1년의 인턴생활 후에도 1년 정도 더 의사 경험을 쌓기 위해 병원에 머문다.
**확실하지는 않으나 medical College는 일종의 의사 협회(학회)를 의미하며 Fellowship의 경우 회원자격을 의미하는 것 같습니다.


6. 1년의 인턴 교육은 각 주의 졸업 후 의사과정에 관한 협회(PMCs)에서 정해진 가이드 라인에 따라 병원의 여러 과를 경험하는 것이 포함되어 있습니다. 이는 교육의 새내기 의사를 교육 중인 견습의 방식으로 다양한 의료 현장과 환경을 경험하도록 하는 것을 목표로 하고 있습니다. PMCs는 최근 10년간 인턴(혹은 대학원 1년생,PGY1)과 PGY 2에 해당하는 레지던트 메디컬 오피서의 교육과 개발에 책임을 지고 활동해왔습니다. 또한 그들은 그 후 인정받은 medical College의 Fellowship으로 이어지는 정규적인 직업 교육 프로그램에 들어가지 못한 의사들을 관리하고 책임지고 있습니다.


7. 인턴 교육을 수료하고, 주 의사 협회에 등록을 한 이후에도 새내기 의사들은 일반적으로 일년이나 그 이상을 공공 병원의 어려 분과나 다양한 병원을 돌며 경험을 쌓고 때때로 그들은 다른 지역이나 시골 병원들 사이에서 돌아다니며 경험을 쌓기도 하는데, 이는 병원들의 서비스와 직업적 요구를 만족시키며 새내기 의사를 다양한 의료 현장과 상황에 경험을 쌓을 수 있도록 하기 위해서 입니다. 이러한 과정에 있는 의사들은 일반적으로 Resident Medical Officers (RMO)라고 일컬으며 (빅토리아 주에서는 HMO-Hospital Medical Officer라고 부름) 이러한 용어들은 일반적으로 industrial awards and agreements에서 직업 분야로 인정되고 있습니다. 
** industrial awards and agreements에서 award는 시간에 지남에 따라 임금이 오르는 것을 의미하고 agreements는 각종 협정, 합의를 의미하는 것 같습니다. 쉽게 말해 산업현장, 각종 계약을 의미하는 것 같습니다.


8. PGY 2와 3(졸업후 2년차, 3년차)등등 이 끝날 무렵, 인턴쉽이 끝나고 1~2년의 RMO로서 추가적 경험을 쌓은 후 대다수의 젊은 의사들은 인정받은 medical Colleges 중 한군데의 Fellowship으로 이어지는 직업 교육 프로그램을 알아보게 됩니다. 전문의가 되기 위한 교육과정을 제공하는 모든 이들은 AMC의 인가를 받도록 되어 있습니다. 프로그램들은 별첨된 리스트의 medical College들에서 제공되고 있습니다. 일반개업의의 훈련은 General Practice Education and Training (일반 개업의 교육과 훈련) Ltd (GPET)에서 담당하고 있습니다. 최종 자격은 ‘Fellowship of the Royal Australian College of General Practitioners’ 입니다.


9. 교육프로그램은 College 별로 다르지만 일반적으로 수료하기까지 3년에서 5년 정도 소요됩니다. Royal Australasian College of Surgeons(RACS)의 경우는 교육생들에게 세부 전문 분과를 교육하기 위한 심화 교육에 들어가기 전 기본 교육 프로그램을 완료하기를 요구하고 있습니다. 이는 수료하기 까지 2년에서 4년 정도를 필요로 하는 심화 교육에 들어가기에 앞서 의대를 졸업하고 일을 해야 하는 시기는 일반적으로 6년을 넘지 않습니다. 2~4년의 기간은 풀타임 의사들에 해당하는 것이며 파트타임이나 중간에 휴학/휴직을 하는 의사들의 경우는 더 긴 시간이 소요될 수 있습니다.


10. College의 교육 프로그램에 들어가는 것심화 교육과정에 들어가기 위한 요구사항에 맞추는 것은 의사가 되기위한 교육과 과정에 있어서 아직 이른 단계입니다. 많은 경우 새내기 의사들은 별도로 관련 College에 의해 인정되는 Registrar이라는 직위에 지원하고 고용을 확실시 해야 합니다. 이러한 직위는 일반적으로 주요 공공 병원에서 찾으실 수 있습니다. Registrar이라는 직업는 다양한 산업 인상금 및 협정의 산업 분류에서 인정되고 있는 직업입니다. 모든 College에서 교육생 직위를 인정해주는 것은 아니고, 공립 병원에서 Registrar로 고용/등록 하여 교육 받는 기간 동안 교육생이 자신들의 감독자가 되어줄 College의 Fellow로부터 보증된, 특정한 의료 활동을 수료했다는 증거를 보여주어야 할 것입니다.


11. 많은 경우, 인정되는 레지스트랄 자리가 지역적으로 없거나, 가능한 자리들의 특정한 교육적 요구가 의사들의 개인적 요구와 부합하지 않을 때가 있습니다. 이러한 경우, 교육생들은 다른 지역의 레지스트랄 자리에 지원해야 합니다. 대개 College들은 다른 지역에서 자리를 찾는데 도움을 주지 않습니다. 그것은 개개인의 교육생들과 그들을 고용하는 병원들간의 문제입니다. 때로는 College가 교육 프로그램의 일원으로 시골 지역 순회 근무를 요구하기도 합니다. 이 또한 College가 도움을 제공하지는 않습니다. 일부 전공에서는 교육생들이 일련의 순회 근무 동안 같은 고용주 밑에 있을 수 있도록 하는 네트워크화 된 교육 프로그램이 개발되는 등 변화가 있기는 하지만, 이 또한 예외적인 상황일 뿐 일반적 상황이 아닙니다. 중요한 것은 교육생들은 자신의 레지스트랄 자리를 스스로 찾아야 한다는 것이며 자신들이 근무할 각각의 병원에서 제공하는 교육 의무에 관한 고용계약을 잘 점검해야 하며, 재취업(다른 장소로 이전하기 위한)에 관한 비용은 자신이 부담해야 한다는 것입니다.


12. 대부분의 전문의 교육은 공립병원에서 이루어 집니다. General Practice(일반 개업의)는 예외인데, 이들은 그들의 심화 교육을 지역 상황에 맞춰져 있는 지정된 개인(사설) GP 교육 병원에서 교육을 받습니다. 현재 더 많은 전문의 교육을 개인 병원과 공립 병원 외에서 받을 수 있도록 바뀌어 가고 있지만, 아직은 매우 적은 수준에 불과합니다.

 

13. 호주에는 마취과(anesthetics), 외과(surgery), 정신과(psychiatry), 집중 치료(intensive care), 피부과(dermatology), 응급치료과(emergency medicine), 일반의학과(general practice), 산부인과(obstetrics and gynecology), 안과(ophthalmology), 병리과(pathology), 성인의학과(adult medicine), 소아과(paediatrics), 방사선과(radiology), 방사선 종양과(radiation oncology), 병원 관리(medical administration), 직업병의학과(occupational medicine), 공중보건의학과(public health medicine), 재활의학과(rehabilitation medicine) 등 매우 다양한 분야의 전문의과가 있습니다. 또한 세부적으로, 더 많은 심화 분과가 있습니다. 예를 들어 외과에는 일반 외과(general), 심장 외과(cardiothoracic), 신경외과(neuro), 정형 외과(orthopedic), 이비후외과(otolaryngology), 소아외과(paediatric), 성형 및 재건 외과(plastic & reconstructive), 비뇨기 외과(urology), 혈관 외과(vascular) 등이 있습니다. 어떤 경우에는 더욱 세부적인 ‘초 세부 전문의과’가 있기도 합니다.


14. 의사 전문 교육 과정과 관련 College 다른 요구사항들을 성공적으로 수료한 의사는 College의 Fellowship을 획득하게 됩니다. 그들은 다양한 산업 법정 문서나 협정서, 건강 보험 법 1973호, 주립 의료 위원회에 의해 전공분야의 전문의로 인정됩니다. 추가적으로 세부 전공 교육을 더 받을 수도 있습니다. 예를 들어, 마취과 의사가 추가적 세부 전공 교육으로 집중치료를 배울 수 있습니다. 인정되는 일반개업의사나 전문의는 호주 어디서든지 개별적으로 병원을 개업할 수 있는 제한사항 없는 의료보험 제공자 번호를 부여 받게 됩니다.


15. 이제는 일반개업의(GP)를 제외한 대부분은 공립병원에서만 근무를 했었을 것이지만 전문의 과정이나 GP 교육 과정을 마치고 나면 훨씬 다양한 열린 선택을 할 수 있을 것입니다. (대부분 이들은 30대일 것입니다.)


 개인 개업의


 개인 개업을 하면서 공립병원의 ‘외래의사’로 계약, 공립병원의 전문의 직원으로 고용 : 이러한 다양한 의료 행위 종류는 대부분 모든 전문의에게 해당됩니다.

 

 

 

출처 :  http://www.ama.com.au/web.nsf/doc/WEEN-6NK4LM



'All the others' 카테고리의 다른 글

Rolling Admission  (0) 2013.09.10
호주의 의과대학  (0) 2013.09.10
상황판단검사(Situational Judgement Tests)  (1) 2013.08.09
Strategic Planning (전략적 계획 수립)  (0) 2013.08.05
Race(인종) vs Ethnicity(민족성)  (0) 2013.08.05



타당도(妥當度)란 평가의 도구가 무엇을 재고 있느냐의 문제인 동시에 그 평가의 도구가 어느 특정한 개인이나 집단에 대해서 평가해 내려는 목표를 얼마나 정확하게 재어 내느냐의 문제이다. 바꾸어 말하자면, 당초에 평가해 내려는 목표와 실제평가의 결과 사이의 관련성이 얼마나 높으냐 하는 문제이다. 타당도를 검증하는 방법에는 ① 내용적 타당도(content validity), ② 예언적 타당도(predictive validity), ③ 공인적 타당도(concurrent validity), ④ 요인적 타당도(factorial validity)의 4가지가 있다.


1. 내용적 타당도[편집]

내용적 타당도(內容的妥當度)란 평가하려는 내용을 분석 정의함으로써 평가도구의 내용이 주어진 준거(準據)에 어느 정도 일치하는지를 나타낸다. 논리적 타당도(logical validity), 정의에 의한 타당도(validity by definition), 안면 타당도(face validity)라고도 한다. 

예컨대 교사가 제작하는 검사의 내용적 준거는 교육목적이 되겠고,
지능검사의 준거는 지능의 정의가 된다. 

이때 정의는 반드시 분석적이고 포괄적이어야 한다. 그 정의된 바가 실제 문항의 표준과 작성에 구체적인 지침이 되고, 문항의 논리적·심리적 타당성을 판단하는 데 기준이 될 정도로 상세히 정의되어야 한다. 

이 내용적 타당도에서 정의를 내리는 방법으로 조작주의적 정의(操作主義的定義,operational definition)를 주로 사용하고 있다. 이것은 종래의 순환논리(循環論理)에 빠지기 쉬운 정의에서 탈피하여 과학적 정의방법을 도입한 것으로, 예컨대 '지능'이란 '한 개인의 전체환경에 대한 적응' '학습하는 능력' '추상적 사고능력' 등으로 정의하지 않고 "지능검사로 측정해서 나온 수치"를 지능이라고 정의하는 것이 바로 조작주의의 특색이다.

2. 기준 타당도[편집]

기준 타당도란 하나의 측정도구를 이용해 측정한 결과를 이미 타당성이 입증된 기존 측정도구의 결과와 비교하는 경우를 말한다. 동시적 타당도와 예언적 타당도로 세분화할 수 있다.

예언적 타당도[편집]

예언적 타당도(豫言的妥當度)란 그 검사가 측정해 내려는 피험자의 장래의 행동을 어느 정도로 정확하게 예언하느냐에 따라 결정된다. 예언적 타당도가 내용적 타당도와 다른 점은, 내용적 타당도는 논리적 근거를 내부에 두고 있으며(inside criterion), 예언적 타당도는 외부준거(outside criterion)를 문제삼고 있다

예컨대, 입학성적과 학교생활의 성취도간에 나타나는 상관(相關)은 예언적 타당도가 하게 된다. 즉, 검사 X와 준거 Y와의 상관계수로 표시되는 것이 예언적 타당도다. 이때 문제는 측정도구가 자연과학에서처럼 완전치 못하기 때문에 오차(誤差)의 부분이 따르게 되는데 이를 '예언의 오차'라 한다. 예를 들어 입학성적이 좋은 학생이 그 후 학교성적이 나빠졌다면 그 검사는 예언적 타당도가 낮다고 말할 수 있으며, 예언의 오차가 커서 바람직한 검사가 되지 못한다.

3. 공인적 타당도[편집]

공인적 타당도(共因的妥當度)란 행동의 준거를 현재에 둔 일종의 예언적 타당도라 할 수 있다. 

즉, 예언적 타당도에서는 준거가 반드시 예언에 관계되어 장래에 두고 있지만,
공인적 타당도의 경우에는 외적 준거검사 사이의 상관을 내게 된다. 

즉, 평가도구에 의해서 밝혀진 피험자(被驗者)의 행동특성평가도구 밖의 행동준거와 현재 어느 정도 일치하느냐를 따져 보는 일이다. 

가령 흥미검사에서 미술에 많은 흥미를 나타낸 학생이 실제 그림을 그리는 데 얼마나 적극적으로 활동하며 잘 그리느냐를, 비교 상관을 내는 경우와, 지능검사와 인성검사와의 상관을 내어 이들 사이의 변량(變量)의 합치도를 알아보는 경우가 있다.

4. 요인적 타당도[편집]

요인적 타당도(要因的妥當度)란 두 검사 사이에 공동으로 존재하는 어떤 요소(factor)가 작용해서 나타난 결과라고 할 수 있다. 

예컨대, A·B 두 검사의 상관계수가 +1.00이라면 둘은 이름은 다르지만 재고 있는 내용은 같은 것임을 알 수 있다. 

이와 같이 요인적 타당도란 요인분석(要因分析,factor analysis)이라는 실험적·통계적 측정이론을 기초로 하는 것이고, 요인분석은 여러 검사간의 상호상관계수(相互相關係數-inter correlation)를 계산한 표를 자료로 해서 그 여러 검사 간에 존재하는 공통된 요인과 어떤 검사만이 지니고 있는 고유한 요인으로 분해 작업하는 방법이다. 

예컨대, '수학검사'를 요인분석했더니 수(數)요인 50%, 공간지각요인 10%, 언어요인 30%, 오차(誤差)요인 10%의 결과를 얻는 것과 같이 어떤 검사에 구성된 여러 요소를 분해해 내는 것이다 그런데 요인적 타당도는 예언적 타당도처럼 직접 예언에 사용되는 실용적인 방법은 못 되며, 이론적 연구와 한 검사의 실용적 타당도를 높이기 위한 제작 내지 개작(改作)에 도움을 준다.

개념 타당도[편집]

개념 타당도란 측정되는 개념을 관련 구성개념이나 가정에 비추어 봄으로써 평가하는 타당도를 말한다. 예를 들어 지능을 언어와 수리 능력으로 정의한다면, 언어와 수리 능력은 구성개념이 된다. 만약 새로 만든 검사 도구가 언어나 수리 능력과 상관이 높다면, 이 검사도구는 지능을 측정하는 타당한 도구라고 할 수 있다. 개념 타당도는 동일 개념을 측정할 경우 측정방법이 상이하더라도 측정값이 하나의 차원으로 수렴해야 한다는 수렴적 타당도, 다른 개념을 측정할 경우 측정방법이 동일하더라도 측정값이 구분되어야 한다는 판별적 타당도로 구분된다.



http://ko.wikipedia.org/wiki/검사_타당도





Test validity[edit source | editbeta]

Reliability (consistency) and validity (accuracy)[edit source | editbeta]

Validity & Reliability

Validity of an assessment is the degree to which it measures what it is supposed to measure. This is not the same as reliability, which is the extent to which a measurement gives results that are consistent. Within validity, the measurement does not always have to be similar, as it does in reliability. When a measure is both valid and reliable, the results will appear as in the image to the right. Though, just because a measure is reliable, it is not necessarily valid (and vice-versa). Validity is also dependent on the measurement measuring what it was designed to measure, and not something else instead.[3] Validity (similar to reliability) is based on matters of degrees; validity is not an all or nothing idea. There are many different types of validity.

An early definition of test validity identified it with the degree of correlation between the test and a criterion. Under this definition, one can show that reliability of the test and the criterion places an upper limit on the possible correlation between them (the so-called validity coefficient). Intuitively, this reflects the fact that reliability involves freedom from random error and random errors do not correlate with one another. Thus, the less random error in the variables, the higher the possible correlation between them. Under these definitions, a test cannot have high validity unless it also has high reliability. However, the concept of validity has expanded substantially beyond this early definition and the classical relationship between reliability and validity need not hold for alternative conceptions of reliability and validity.

Within classical test theory, predictive or concurrent validity (correlation between the predictor and the predicted) cannot exceed the square root of the correlation between two versions of the same measure — that is, reliability limits validity.

Construct validity[edit source | editbeta]

Construct validity refers to the extent to which operationalizations of a construct (i.e., practical tests developed from a theory) do actually measure what the theory says they do.

 For example, to what extent is an IQ questionnaire actually measuring "intelligence"?

Construct validity evidence involves the empirical and theoretical support for the interpretation of the construct. Such lines of evidence include statistical analyses of the internal structure of the test including the relationships between responses to different test items. They also include relationships between the test and measures of other constructs. As currently understood, construct validity is not distinct from the support for the substantive theory of the construct that the test is designed to measure. As such, experiments designed to reveal aspects of the causal role of the construct also contribute to construct validity evidence.

Convergent validity[edit source | editbeta]

Convergent validity refers to the degree to which a measure is correlated with other measures that it is theoretically predicted to correlate with.

Content validity[edit source | editbeta]

Content validity is a non-statistical type of validity that involves "the systematic examination of the test content to determine whether it covers a representative sample of the behavior domain to be measured" (Anastasi & Urbina, 1997 p. 114).

 For example, does an IQ questionnaire have items covering all areas of intelligence discussed in the scientific literature?

Content validity evidence involves the degree to which the content of the test matches a content domain associated with the construct

For example, a test of the ability to add two numbers should include a range of combinations of digits. A test with only one-digit numbers, or only even numbers, would not have good coverage of the content domain. 

Content related evidence typically involves subject matter experts (SME's) evaluating test items against the test specifications.

A test has content validity built into it by careful selection of which items to include (Anastasi & Urbina, 1997). Items are chosen so that they comply with the test specification which is drawn up through a thorough examination of the subject domain. Foxcroft, Paterson, le Roux & Herbst (2004, p. 49)[4] note that by using a panel of experts to review the test specifications and the selection of items the content validity of a test can be improved. The experts will be able to review the items and comment on whether the items cover a representative sample of the behaviour domain.

Representation validity[edit source | editbeta]

Representation validity, also known as translation validity, is about the extent to which an abstract theoretical construct can be turned into a specific practical test

Face validity[edit source | editbeta]

Face validity is an estimate of whether a test appears to measure a certain criterion; it does not guarantee that the test actually measures phenomena in that domain. Measures may have high validity, but when the test does not appear to be measuring what it is, it has low face validity. Indeed, when a test is subject to faking (malingering), low face validity might make the test more valid. Considering one may get more honest answers with lower face validity, it is sometimes important to make it appear as though there is low face validity whilst administering the measures.

Face validity is very closely related to content validity. While content validity depends on a theoretical basis for assuming if a test is assessing all domains of a certain criterion (e.g. does assessing addition skills yield in a good measure for mathematical skills? - To answer this you have to know, what different kinds of arithmetic skills mathematical skills include) face validity relates to whether a test appears to be a good measure or not. This judgment is made on the "face" of the test, thus it can also be judged by the amateur.

Face validity is a starting point, but should never be assumed to be probably valid for any given purpose, as the "experts" have been wrong before—the Malleus Malificarum (Hammer of Witches) had no support for its conclusions other than the self-imagined competence of two "experts" in "witchcraft detection," yet it was used as a "test" to condemn and burn at the stake tens of thousands women as "witches."[5]

Criterion validity[edit source | editbeta]

Criterion validity evidence involves the correlation between the test and a criterion variable (or variables) taken as representative of the construct. In other words, it compares the test with other measures or outcomes (the criteria) already held to be valid

For example, employee selection tests are often validated against measures of job performance (the criterion),
and IQ tests are often validated against measures of academic performance (the criterion).

If the test data and criterion data are collected at the same time, this is referred to as concurrent validity evidence. If the test data are collected first in order to predict criterion data collected at a later point in time, then this is referred to as predictive validity evidence.

Concurrent validity[edit source | editbeta]

Concurrent validity refers to the degree to which the operationalization correlates with other measures of the same construct that are measured at the same time. When the measure is compared to another measure of the same type, they will be related (or correlated). Returning to the selection test example, this would mean that the tests are administered to current employees and then correlated with their scores on performance reviews.

Predictive validity[edit source | editbeta]

Predictive validity refers to the degree to which the operationalization can predict (or correlate with) other measures of the same construct that are measured at some time in the future. Again, with the selection test example, this would mean that the tests are administered to applicants, all applicants are hired, their performance is reviewed at a later time, and then their scores on the two measures are correlated.

This is also when your measurement predicts a relationship between what you are measuring and something else; predicting whether or not the other thing will happen in the future. This type of validity is important from a public view standpoint; is this going to look acceptable to the public or not?



http://en.wikipedia.org/wiki/Validity_(statistics)





  1. [HWP]

    제 4-2 강: 신뢰도와 타당도 (4강 보충) - 미래정보통계연구소

    www.papersea.com/bbs_download.php?tmp_name...9060.2.0...
    ① 안면타당도(face validity). ② 내용타당도(content validity). 나) 준거관련 타당도. ① 예언타당도. ② 공인타당도. 다) 구인 타당도. 2. 타당도의 내용. 타당도의 내용은 ...


방법26샘플신뢰도와타당도.hwp






2. 타당성

(1) 개념

타당성이란 측정하고자 하는 개념이나 속성을 정확히 측정하였는가를 말한다. 즉 특정한 개념이나 속성을 측정하기 위하여 개발한 측정도구가 그 속성을 정확히 반영할 수 있는가의 문제이다. 아무리 측정값들의 신뢰도가 높게 나타났다 할지라도 측정된 값 자체가 다른 속성이나 다른 개념을 측정한 것이라면 아무런 쓸모가 없다.


예를 들어, 한국대학생들의 지능검사를 영어로 된 검사지로 조사하였다고 하자. 이 때 평가된 점수가 과연 학생들의 지능을 측정한 결과라고 할 수 있을까? 이 경우는 타당성이 없는 개념의 측정결과일 가능성이 높다. 왜냐 하면 영어로 된 검사지를 사용함으로써 지능보다는 학생들의 영어실력에 의해서 지능점수가 좌우될 소지가 충분히 있기 때문이다. 따라서 이 경우에는 지능이 아닌 영어실력이라는 개념을 측정한 것이 될 수 있다.


타당성은 측정도구 자체가 측정하고자 하는 개념이나 속성을 정확히 반영할 수 있어야 한다는 것이며, 이는 측정하려고 하는 개념을 어떻게 조작적 정의화하느냐에 상당히 영향을 받는다. 어떠한 개념이나 속성을 하나의 조작적 정의로 표현하고, 이것으로 측정할 수도 있으나 하나의 조작적 정의에 의한 측정결과만으로 해당 개념을 정확히 측정하였는지는 판단하기가 어렵다. 따라서 몇 가지의 조작적 정의를 이용하여 측정을 하고, 각 측정값간의 상관관계를 조사하여 측정의 타당성을 평가하는 방법을 취하여야 한다. 이를 도표로 설명하면 [그림 8-11]과 같다.


[그림 8-11]에서는 하나의 측정하고자 하는 개념이 빗금을 친 원으로 나타나 있고 조작적 정의 1과 2가 다른 원들로 나타나 있다. 여기에 조작적 정의 1과 측정하고자 하는 개념이 완전히 일치된다면, 조작적 정의가 측정하고자 하는 개념을 완벽하게 측정하였다고 할 수 있으며, 이 때의 타당도는 1.0이라고 할 수 있다. 또한 중복되는 범위가 점점 적어지면 타당성이 적어진다고 할 수 있다.


이렇게 중복되는 정도는 r21T(상관관계)로 표현할 수 있으며 r2는 타당성의 정도를 나타낸다. 그러나 보통의 경우 하나의 개념을 측정하는 데 서로 다른 여러 개의 조작적 정의를 사용할 수 있으며, 이 때 서로 다른 조작적 정의 1과 조작적 정의 2가 중복되는 부분이 다음에 설명되는 집중타당성(convergent validity)이라 할 수 있다. 따라서 두 개 이상의 서로 다른 조작적 정의간의 공통변량(이 경우 중복되는 정도 또는 r122)이 클 수록 서로 다른 조작적 정의들이 동일한 개념을 측정하였다고 할 수 있다.


따라서 타당성을 평가하기 위해서는 동일한 개념의 측정을 위해 매우 서로 다른 조작적 정의(항목)를 이용하여 측정한 값들간의 상관도가 매우 높아야 할 것이다. 이러한 원리를 이용하여 타당성을 평가하는 방법으로는 다속성다측정방법(multi-trait multi-method matrix)이 있다. 타당성은 측정하고자 하는 것을 정확히 측정하였는가에 대한 문제, 즉 정확성과 관련이 되는 것이므로 체계적인 오차와 비체계적인 오차에 의해서 영향을 받는다고 볼 수 있으나 비체계적인 오차는 신뢰성과 관련이 있는 것이므로 이를 분리하여 보통 체계적인 오차에만 관심을 두게 된다.




(2) 타당성의 종류

타당성은 그 평가방법에 따라 [그림 8-12]와 같이 ① 내용타당성(content validity), ② 기준에 의한 타당성(criterion-related validity) 및 ③ 개념타당성(construct validity)의 개념으로 나누어 볼 수 있다.

기준에 의한 타당성에는 예측타당성(predictive validity)이 있으며, 개념 타당성으로는 집중타당성(convergent validity), 판별타당성(discriminant validity) 및 이해 타당성(nomological validity)이 있다.


(가) 내용타당성

측정도구 자체가 측정하고자 하는 속성이나 개념을 측정할 수 있도록 되어 있는가를 평가하는 것이다. 내용타당성(content validity 또는 face validity)공식적 또는 비공식적으로 주관적인 판단에 의해서 평가하게 된다. 


예를 들어, 소비자의 상표인지도를 측정하기 위해서 두 가지 측정도구를 개발하였다고 하자. 하나는 그 상표를 좋아하느냐를 묻는 항목이고, 다른 하나는 그 상표를 알고 있느냐를 묻는 항목이라고 할 때, 어느 정도 상식을 갖춘 사람이면 후자의 경우가 상표인지도의 측정도구로 적합하다고 판단을 내리게 될 것이다. 

* 이처럼 주관적으로 전문지식에 근거하여 판단한 타당성이 바로 내용타당성이다. 

* 내용타당성은 측정도구가 갖추어야 할 최소한의 타당성이 될 것이다. 

* 따라서 일단 내용타당성이 없다고 판단되면 그 측정도구는 채택되지 못한다.


(나) 기준에 의한 타당성

하나의 속성이나 개념의 상태에 대한 측정이 미래 시점에 있어서의 다른 속성이나 개념의 상태변화를 예측할 수 있는 정도를 말한다. 대표적인 기준에 의한 타당성(criterion-related validity)의 개념으로 예측타당성(predictive validity)이 있다. 예를 들어, 입학시험은 입학당시의 지적능력을 측정하는 것이지만 이의 평가는 입학 후의 수학능력을 예측하기 위하여 실시되는 것이라고 볼 수 있다. 이 때 입학시험성적이 입학 후의 학업성적과 높은 상관관계를 갖는다면 입학시험이라는 측정은 예측타당성이 높다고 평가된다.


(다) 개념타당성

측정도구가 실제로 무엇을 측정하였는가, 또는 조사자가 측정하고자 하는 추상적인 개념이 실제로 측정도구에 의해서 적절하게 측정되었는가에 관한 문제로서, 이론적 연구를 하는 데 있어서 가장 중요한 타당성이다. 측정하고자 하는 개념이 추상적일수록 측정의 개념타당성(construct validity)을 갖기는 더욱 어려워진다. 예를 들어, 판매원의 직무만족, 역할갈등이나 소비자의 구매에 대한 불만과 같은 개념을 측정할 때 개념타당성의 문제가 대두된다. 이러한 개념타당성은 측정에 의해서 부여되는 숫자체계, 즉 측정값 자체보다는 측정하고자 하는 속성에 초점을 둔 측정의 타당성이다. 따라서 개념타당성은 논리적인 분석과 이론적인 체계하에서 개념간의 관계를 밝히는 데 중점을 두고 평가되며 이론의 구축에 매우 중요하게 고려되어야 한다.

이 개념타당성은 크게 집중타당성, 판별타당성, 이해타당성으로 구성되어 있다.


http://edu.advertising.co.kr/edu-data/contents/34/course4_img/book9/2.html






Ⅱ. 타당도(validity)


1. 의의
타당도는 측정하고자 하는 원래 의도한 개념을 얼마나 정확하고 충실하게 측정하는 가를 나타낸다.

2. 주의해야 할 개념

⑴ 타당도에는 무선적 오차뿐 아니라 체계적 오차도 영향을 주므로
    타당도는 신뢰도보다 높을 수가 없다.
    타당도가 보장된 측정은 항상 신뢰성이 있고, 신뢰성 없는 측정은 타당도가 보장되지 않으므로
    신뢰도는 타당도의 필요조건이다.

⑵ 체계적 오차(systematic error)란
    측정대상에 대해 어떤 영향이 체계적으로 영향을 미치는 것으로서
    오류가 항상 일정한 방향으로 발생하게 되므로 결과가 편향된 경향을 보이게 되는 것을 말한다.
 
⑶ 진점수의 분산
               S2T = S2V + S2I  (측정하고자 하는 것을 반영하는 분산 + 관련되지 않은 분산)

⑷ 타당도               
               rXY = S2V  / S2X (측정하고자 하는 것을 반영하는 분산 / 전체 분산)


3. 타당도 설명 방법 

⑴ 내용타당도(content validity ;  논리적 타당도, 이론적 타당도, 표면 타당도)

① 문항이 전집을 얼만큼 대표할 수 있는가에 따른다.
② 그렇다면 어떤 문항을 어떻게 구성해야 대표성 있는 문항이 되는 것일까?
    일단은 논리적이고 합리적으로 전집을 계층화 하여 분류해야 한다.
    분류하였다면 각 영역에 해당하는 구체적인 문항을 표집한다.
    물론, 전문가에 의해 다양한 기준으로 심도있게 분석하여 표집하므로
    이 점에서 표면타당도(face validity)와는 차이가 있지만
    반대로, 전문가의 주관적 해석과 판단이 개입될 여지가 있다는 단점도 있다.
   
⑵ 준거타당도(criterion validity ; 공인 타당도, 실용적 타당도, 동시적 타당도, 예측타당도)

① 이미 공인된 도구로 측정한 검사점수를 통해 외적 준거를 추론하는 방법
② 이러한 경험적 타당도는
    검사를 실시한 후 일정 시간 후에 준거 자료를 수집하여 비교하는 예언타당도(predictive validity)
    검사와 함께 기준변인의 자료를 구하여 관계를 알아보는 동시타당도(concurrent validity)로 구분해볼 수 있다.
③ 대학원 입학 전형에서 대학 성적 뿐 아니라 공인 어학성적, 자격증, 추천서 등을 요구하는 것은 예언타당도 때문이다.

⑶ 구성타당도(construct validity)

① 직접 관찰할 수 없는 것에 대한 구성개념을 측정하기 위한 것으로서
    측정하고자 하는 구성 개념을 정의하고 가설을 설정하여 경험적인 자료로서 검증한다.

같은 개념을 측정하는 경우에는 상이한 측정방법을 사용하더라도 측정값 간에는 상관관계가 커야 하며 =>   (집중혹은수렴타당성, convergent validity)

    상이한 개념을 측정하는 경우에는 같은 측정방법을 사용하더라도 측정값 간에는 차별성이 있어야 하며 =>   (판별타당성, discriminant validity)

    이론에 근거한 구성개념 간의 관계가 예상한대로 나타나고 있는지 여부를 평가해야 한다 =>  (이해타당성nomological validity). 

③ 통계적인 방법으로는 요인분석(factor analysis), 상관관계분석(Correlation Analysis), 집단차이검증, 실험처치 비교(experimental treatment) 등이 있다.



4. 종합 : 타당도에 영향을 주는 요인

① 문항 수 : 측정항목이 많아질 수록 응답자가 실증을 느껴 형식적 응답이 발생하기 때문이다.
② 문화적 요인 : 응답자가 속한 문화의 일반적 범주 외의 단어 등을 포함할 시 문제가 될 수 있고 해당 문화 내에서의 바람직성을 기준으로 응답할 가능성이 있다.

③ 문항형태 : 개방형질문은 응답자의 사회경제적 환경에 따른 편차가 크다.



http://sjpsyche.tistory.com/entry/%EC%8B%A0%EB%A2%B0%EB%8F%84validity-%ED%83%80%EB%8B%B9%EB%8F%84reliability












Situational judgment tests (SJTs) or Inventories (SJIs) are a type of psychological test which present the test-taker with realistic, hypothetical scenarios and ask the individual to identify the most appropriate response or to rank the responses in the order they feel is most effective.[1] 


SJTs can be presented to test-takers through a variety of modalities, such as booklets, films, or audio recordings.[2] SJTs represent a distinctpsychometric approach from the common knowledge-based multiple choice item.[1][3] They are often used in industrial-organizational psychology applications such as personnel selection


Situational judgment tests tend to determine behavioral tendencies, assessing how an individual will behave in a certain situation, and knowledge instruction, which evaluates the effectiveness of possible responses.[4] Situational judgment tests could also reinforce the status quo with an organization.[4]

Unlike most psychological tests SJTs are not acquired 'off-the-shelf'((특별히 디자인하거나 주문하지 않고) 규격품으로[바로 살 수 있는]), but are in fact designed as a bespoke((개인 주문에 따라) 맞춘) tool, tailor-made to suit the individual role requirements.[1] This is because SJTs are not a type of test with respect to their content, but are a method of designing tests.



Advantages over other measures[edit source | editbeta]

성별이나 민족에 따른 불이익 정도가 적다.
직무 관련 행동을 곧바로 측정할 수 있다. 
대량으로 시행 가능하다.
다른 psychometric assessment보다 SJT의 설계과정이 더 높은 내용관련도를 보인다.
문제해결능력부터 의사결정, 대인관계까지 다양한 면을 볼 수 있다.

  • They show reduced levels of adverse impact, by gender and ethnicity,[11] compared to cognitive ability tests.[1][12]
  • They use measures that directly assess job relevant behaviours.[1]
  • They can be administered in bulk, either via pen and paper or on-line.[1]
  • The SJT design process results in higher relevance of content than other psychometric assessments[12][13] They are therefore more acceptable and engaging to candidates compared to cognitive ability tests since scenarios are based on real incidents[1]
  • It is unlikely that practice will enhance candidate performance as the answers cannot be arrived at logically – a response to a situation may be appropriate in one organisation and inappropriate in another.[1]
  • They can tap into a variety of constructs – ranging from problem solving and decision making to interpersonal skills.[1] Traditional psychometric tests do not account for the interaction between ability, personality and other traits.[12]
  • Conscientiousness can be built into a test as a major factor of individual differences.[14]
  • They can be used in combination with a knowledge based test to give a better overall picture of a candidate's aptitude for a certain job.[15]



Criticisms[edit source | editbeta]

시나리오가 너무 단순하다(짧다).
실제로 직무 관련 능력을 구분하기가 어렵다.
지원자가 실제로 자기 행동과는 맞지 않는 답을 선택할 수 있다.
특정 구조(업무 지식)등을 측정하는 타당도에 대한 논쟁이 있다.

  • The scenarios in many SJTs tend to be brief; therefore candidates do not become fully immersed in the scenario. This can remove some of the intended realism of the scenario and may reduce the quality and depth of assessment.[12]
  • SJT responses can be transparent, providing more of an index of best practice knowledge in some cases and therefore failing to differentiate between candidates' work-related performance.[12]
  • The response formats in some SJTs do not present a full enough range of responses to the scenario. Candidates can be forced to select actions or responses that do not necessarily fit their behavior. They can find this frustrating and this can affect the validity of such measures[17][18][19]
  • Because of the adaptability of SJTs, arguments persist about whether or not they are a valid measurement of a particular construct (Job Knowledge), or a measurement tool which can be applied to a variety of different constructs, such as cognitive ability, conscientiousness, agreeableness, or emotional stability[20]
  • SJTs are best suited for assessing multiple constructs, and as such, it is difficult to separate the constructs assessed in the test. If one construct is of particular interest, a different measure may be more practical.[21]
  • Due to the multi-dimensional nature of SJTs, it is problematic to assess reliability through the use of standard measures.[22]


(http://www.ncbi.nlm.nih.gov/pubmed/?term=situational+judgement+tests)






Tackling situational judgment tests

Authors: Mahibur Rahman 

Publication date:  19 5월 2007


Mahibur Rahman looks at how to approach this new assessment for GP specialty training

지식을 알고있는지를 평가하기 위한 시험에서 지식을 적용하는 것을 평가하기 위한 시험으로의 전환이 있고, 그러한 것 중 하나가 SJT (딜레마 검사)

Doctors face many different types of assessment throughout their careers—from traditional multiple choice questions and extended matching questions to essay papers. Over recent years there has been a shift away from testing knowledge of facts, to tests that look at application of that knowledge. One of the ways that a person's judgment in various work based situations can be assessed is the situational judgment test (SJT), also known as a professional dilemma test.

Background

Situational judgment tests have been used as far back as the 1940s. They have become increasingly popular as tools for recruitment because they can assess job related skills not tapped by other measures—ranging from problem solving and decision making, to interpersonal skills. SJTs are useful for assessing soft skills and non-academic, practical intelligence. They are often used in combination with a knowledge based test to give a better overall picture of a candidate's aptitude for a certain job. SJTs have been used as a recruitment tool by the Federal Bureau of Investigation, the Canadian Civil Service, the Department of Work and Pensions, and the NHS Graduate Management Training Scheme.

The SJT paper in selection for general practice specialty training

The SJT was trialled in 2006 as an alternative to the competency based essay paper as part of the assessment for entry into general practice specialty training (GP ST). In 2007, all candidates applying to enter GP ST programmes at any level (ST1, ST2, or ST3) will be required to sit a 90 minute SJT paper and a 90 minute clinical problem solving paper as part of the shortlisting process.

The SJT paper has been set to assess the candidate against some of the competences in the national person specification for GP ST (box 1).

The paper has two sections, with different styles of questions. Both sections consist of work based scenarios that could be faced by a junior doctor, with multiple possible options to choose from. Scenarios range from ethical dilemmas to difficulties with colleagues or patients. Each scenario has been written to assess one or more of the competences in the national person specification.


Box 1 | Core competences in selection for entry to general practice specialty training (ST1-ST3)

Empathy and sensitivity: Capacity and motivation to take in other people's perspectives and treat others with understanding

Communication skills: Capacity to adjust behaviour and language as appropriate to needs of differing situations

Conceptual thinking and problem solving: Capacity to think beyond the obvious, with analytical and flexible mind

Coping with pressure: Capacity to recognise own limitations and develop appropriate coping mechanisms

Organisation and planning: Capacity to organise information and time effectively in a planned manner

Managing others and team involvement: Capacity to work effectively in partnership with others

Professional integrity: Capacity and motivation to take responsibility for own actions and demonstrate respect for all

Learning and personal development: Capacity and motivation to learn from experience and constantly update skills and knowledge



Box 2 | Ten tips for the SJT paper

  • Make sure you are familiar with the competences in the national person specification

  • Read through the Good Medical Practice booklet

  • Read each scenario twice, highlighting any keywords as you go

  • Look at all the options before assigning any rankings (section 1)

  • Remember you are not being asked to judge if an option is right or wrong

  • Use only the information provided in the question—do not make assumptions

  • Look out for paired or contradictory statements (section 2)

  • Make sure your choices make sense when taken together (section 2)

  • Keep an eye on the clock—don't spend too long on any one question

  • Double check you have marked/circled the correct options—transcription errors are a silly way to lose marks




What are Situational Judgment Tests used by EPSO?

Situational Judgment Tests (or 'SJT', 'SJTs' as abbreviated) are used to measure your behavior and attitudes in work-related scenarios. They measure your decision-making skills that cannot be easily measure in other aptitude tests (numerical, abstract or verbal). SJTs present to candidates a range of different work-related situations that they might experience in a job. For each situation, a number of possible actions are suggested. The objective of SJT is to identify the 'most effective' and 'least effective' actions on that particular situation.

Download the SJT examples of EPSO


(http://www.epsosjt.com/)












Strategic planning is an organization's process of defining its strategy, or direction, and making decisions on allocating its resources to pursue this strategy. In order to determine the future direction of the organization, it is necessary to understand its current position and the possible avenues through which it can pursue particular courses of action. Generally, strategic planning deals with at least one of three key questions:[1]

  1. "What do we do?"
  2. "For whom do we do it?"
  3. "How do we excel?"

Many organizations view strategic planning as a process for determining where an organization is going over the next year or—more typically—3 to 5 years (long term), although some extend their vision to 20 years.

George Friedman in The Next 100 Years summarises "the fundamental principle of strategic planning: hope for the best, plan for the worst".[2]


1. 우리는 무엇을 하는가?

2. 누구를 위해서 하는가?

3. 어떻게 잘할수 있는가?



Key components

The key components of 'strategic planning' include an understanding of an entity's vision, mission, values and strategies. (In the commercial world a "Vision Statement" and/or a "Mission Statement" may encapsulate the vision and mission).

  • Vision: outlines what the organization wants to be, or how it wants the world in which it operates to be (an "idealised" view of the world). It is a long-term view and concentrates on the future. It can be emotive[citation needed] and is a source of inspiration. For example, a charity working with the poor might have a vision statement which reads "A World without Poverty."
  • Mission: Defines the fundamental purpose of an organization or an enterprise, succinctly describing why it exists and what it does to achieve its vision. For example, the charity above might have a mission statement as "providing jobs for the homeless and unemployed".
  • Values: Beliefs that are shared among the stakeholders of an organization. Values drive an organization's culture[citation needed] and priorities and provide a framework in which decisions are made. For example, "Knowledge and skills are the keys to success" or "give a man bread and feed him for a day, but teach him to farm and feed him for life". These example maxims may set the priorities of self-sufficiency over shelter.
  • Strategy: Strategy, narrowly defined, means "the art of the general".[citation needed] - a combination of the ends (goals) for which the firm is striving and the means (policies) by which it is seeking to get there. A strategy is sometimes called a roadmap - which is the path chosen to plow towards the end vision. The most important part of implementing the strategy[citation needed] is ensuring the company is going in the right direction - defined as towards the end vision.


Organizations sometimes summarize goals and objectives into a mission statement and/or a vision statement. Others begin with a vision and mission and use them to formulate goals and objectives.

Many people mistake the vision statement for the mission statement, and sometimes one is simply used as a longer term version of the other. However they are distinct; with the vision being a descriptive picture of a desired future state; and the mission being a statement of a rationale, applicable now as well as in the future.[citation needed] The mission is therefore the means of successfully achieving the vision. This may be in the business world or the military.

For an organization's vision and mission to be effective, they must become assimilated into the organization's culture. They should also be assessed internally and externally. The internal assessment should focus on how members inside the organization interpret their mission statement. The external assessment — which includes all of the businesses stakeholders — is valuable since it offers a different perspective. These discrepancies between these two assessments can provide insight into their effectiveness.


비전 vs 미션 

비전 : 이상적인 미래의 모습을 그리는 것

미션 : Statement of rationale. 이유를 설명하는 것. 비전을 달성하기 위한 수단.


Strategic planning process

There are many approaches to strategic planning but typically one of the following approaches is used:

Situation-Target-Proposal
  • Situation - evaluate the current situation and how it came about.
  • Target - define goals and/or objectives (sometimes called ideal state)
  • Path / Proposal - map a possible route to the goals/objectives
Draw-See-Think-Plan
  • Draw - what is the ideal image or the desired end state?
  • See - what is today's situation? What is the gap from ideal and why?
  • Think - what specific actions must be taken to close the gap between today's situation and the ideal state?
  • Plan - what resources are required to execute the 'plan'?



프로세스

(1) 상황파악 - 목표설정 - 방향설정

(2) 이상적인 모습 그리기 - 현재 상황 파악하기 - 구체적 행동 정하기 - 필요한 자원 구하기



Tools and approaches

Among the most widely used tools for strategic planning is SWOT analysis which means (Strengths, Weaknesses, Opportunities, and Threats). The main objective of this tool is to analyze internal strategic factors, strengths and weaknesses attributed to the organization, and external factors beyond control of the organization such as opportunities and threats.

Other tools include:

  • Balanced Scorecards, which creates a systematic framework for strategic planning;
  • Scenario planning, which was originally used in the military and recently used by large corporations to analyze future scenarios.
  • PEST analysis (Political, Economic, Social, and Technological)
  • STEER analysis (Socio-cultural, Technological, Economic, Ecological, and Regulatory factors)
  • EPISTEL (Environment, Political, Informatic, Social, Technological, Economic and Legal).
  • ATM Approach (Antecedent Conditions, Target Strategies, Measure Progress and Impact).[3] Once an understanding of the desired endstate is defined, the ATM approach uses Root Cause Analysis (RCA) to understand the threats, barriers, and challenges to achieving the endstate. Not all antecedent conditions identified through RCA are within the direct and immediate control of the organization to change. Therefore, a review of organizational resources, both human and financial, are used to prioritize which antecedent conditions will be targeted. Strategies are then developed to target the prioritized antecedent conditions. Linking strategies to antecedent conditions ensures the organization does not engage in activity traps: feel good activities that will not lead to desired changes in the endstate. Once a strategy is defined then performance measures and indicators are sought to track progress toward and impact on the desired endstate.

Situational analysis[edit source | editbeta]

When developing strategies, analysis of the organization and its environment as it is at the moment and how it may develop in the future, is important. The analysis has to be executed at an internal level as well as an external level to identify all opportunities and threats of the external environment as well as the strengths and weaknesses of the organizations.

There are several factors to assess in the external situation analysis:

  1. Markets (customers)
  2. Competition
  3. Technology
  4. Supplier markets
  5. Labor markets
  6. The economy
  7. The regulatory environment

It is rare to find all seven of these factors having critical importance. It is also uncommon to find that the first two - markets and competition - are not of critical importance. (Bradford "External Situation - What to Consider")

Analysis of the external environment normally focuses on the customer. Management should be visionary in formulating customer strategy, and should do so by thinking about market environment shifts, how these could impact customer sets, and whether those customer sets are the ones the company wishes to serve.

Analysis of the competitive environment is also performed, many times based on the framework suggested by Michael Porter.

With regard to market planning specifically, researchers have recommended a series of action steps or guidelines in accordance to which market planners should plan.[4]



(출처 : http://en.wikipedia.org/wiki/Strategic_planning)





(출처 : http://evansoc.blogspot.kr/)


"Stereotypes are devices for saving a biased person the trouble of learning."

-Unknown



The distinction between race and ethnicity is considered highly problematic. 

Ethnicity is often assumed to be the cultural identity of a group from a nation state, 

while race is assumed to be biological and/or cultural essentialization of a group hierarchy of superiority/inferiority related to their biological constitution. 


It is assumed that, based on power relations, there exist 'racialized ethnicities' and 'ethnicized races'. Ramón Grosfoguel (University of California, Berkeley) notes that 'racial/ethnic identity' is one concept and that concepts of race and ethnicity cannot be used as separate and autonomous categories.[1]


(출처 : http://en.wikipedia.org/wiki/Race_and_ethnicity)






Race is associated with biology, whereas ethnicity is associated with culture


In biology, races are genetically distinct populations within the same species; they typically have relatively minor morphological and genetic differences. 


Though all humans belong to the same species (Homo sapiens), and even to the same sub-species (Homo sapiens sapiens), there are small genetic variations across the globe that engender diverse physical appearances, such as variations in skin color.


Although humans are sometimes divided into races, the morphological variation between races is not indicative of major differences in DNA. For example, recent genetic studies show skin color may drastically change in as few as 100 generations, spanning 2,500 years, as a result of environmental influences. Furthermore, the DNA of two humans chosen at random generally varies by less than 0.1 percent. This is less genetic variation than other types of hominids (such as chimpanzees and orangutans), leading some scientists to describe all humans as belong to the same race — the human race.


Ethnicity is the term for the culture of people in a given geographic region, including their language, heritage, religion and customs. To be a member of an ethnic group is to conform to some or all of those practices.

Race and ethnicity can obviously overlap, but they are distinct. For example, a Japanese-American would probably consider herself a member of the Japanese or East Asian race, but, if she doesn't engage in any of the practices or customs of her ancestors, she might not identify with the ethnicity, but might instead consider herself to be American.


(출처 : http://www.livescience.com/33903-difference-race-ethnicity.html)




The traditional definition of race and ethnicity is related to biological and sociological factors respectively. Race refers to a person's physical appearance, such as skin color, eye color, hair color, bone/jaw structure etc.Ethnicity, on the other hand, relates to cultural factors such as nationality, culture, ancestry, language and beliefs.


For example, take the Caucasian race. The physical characteristics of Caucasians were described by M. A. MacConaill, as being "light skin and eyes, narrow noses, and thin lips. Their hair is usually straight or wavy". Caucasoids are said to have the lowest degree of projection of the alveolar bones which contain the teeth, a notable size prominence of the cranium and forehead region, and a projection of the midfacial region. A person whose appearance matches these characteristics is said to be a Caucasian. However, there are many ethnicities within the Caucasian race e.g. Irish, Welsh, German, French, Slovak etc. What differentiates these ethnic groups from each other is their country of origin, language they speak, cultural heritage and traditions, beliefs and rituals.

   

"Race relations" is one of the dominant themes in American politics from time to time, and refers to relationships between the major race groups - white, black, Latino and Asian. Note that use of the word "Asian" as a race includes a vast variety of ethnicities such as Chinese, Japanese, Korean and Vietnamese. America has also had a sometimes troubled history with ethnic strife e.g. during the waves of Irish and Italian immigration to the U.S. These immigrants were Caucasian but had a different ethnicity compared to the Anglo Saxons who preceded them, and were forced to face ethnic discrimination.


Comparison chart</> EMBED THIS CHART

Improve this chartEthnicityRace
Definition:An ethnic group or ethnicity is a population of human beings whose members identify with each other, on the basis of a real or a presumed common genealogy or ancestry. (Cultural, Language, Location)The term race refers to the concept of dividing people into populations or groups on the basis of various sets of physical characteristics which result from genetic ancestry. (Physical, Skin color, Hair, Features)
Significance:Ethnicity connotes shared cultural traits and a shared group history. Some ethnic groups also share linguistic or religious traits, while others share a common group history but not a common language or religion.Race presumes shared biological or genetic traits, whether actual or asserted. In the early 19th century, racial differences were ascribed significance in areas of intelligence,health, and personality. There is no evidence validating these ideas.
Genealogy:Ethnicity is defined in terms of shared genealogy, whether actual or presumed. Typically, if people believe they descend from a particular group, and they want to be associated with that group, then they are in fact members of that group.Racial categories result from a shared genealogy due to geographical isolation. In the modern world this isolation has been broken down and racial groups have mixed.
Distinguishing Factors:Ethnic groups distinguish themselves differently from one time period to another. They typically seek to define themselves but also are defined by the stereotypes of dominant groups.Races are assumed to be distinguished by skin color, facial type, etc. However, the scientific basis of racial distinctions is very weak. Scientific studies show that racial genetic differences are weak except in skin color.
Nationalism:In 19th century, there was development of the political ideology of ethnic nationalism -- creating nations based on a presumed shared ethnic origins (e.g. Germany, Italy, Sweden...)In 19th century, the concept ofnationalism was often used to justify the domination of one race over another within a specific nation.
Legal System:In the last decades of the 20th century, in the U.S. and in most nations, the legal system as well as the official ideology prohibited ethnic-based discrimination.In the last decades of the 20th century, the legal system as well as the official ideology emphasized racial equality.
Conflicts:Often brutal conflicts betweenethnic groups have existed throughout history and across the world. But most ethnic groups in fact get along peacefully within one another in most nations most of the time.Racial prejudice remains a continuing problem throughout the world. However, there are fewer race-based conflicts in the 21st century than in the past.

(출처 : http://www.diffen.com/difference/Ethnicity_vs_Race)








로지스틱 회귀분석 (Logistic Regression)

 

-       로지스틱 회귀분석의 R^2 해석은 선형분석에서의 해석과 다르다.

n  종속변수가 범주형이므로, 오차의 등분산성 가정이 만족되지 않는다.

n  오차분산이 예측된 확률에 따라 달라진다.

u  Var(e_i) = p_i x (1-p_i)

n  종속변수의 값에 따라 R^2 값이 변하므로 종속변수의 R^2와 같이 해석할 수 없다.

n  또한, 로지스틱 회귀분석에서 R^2값은 대개 낮게 나오는 편이므로, 모형평가에서 R^2에 너무 의존할 필요는 없다.

 

-       로지스틱 회귀계수의 검증

n  t-distribution, chi-square distribution 모두 표집분포이다.

n  유의성검증

u  선형 회귀분석 : t검증 ~ t

u  로지스틱 회귀분석 : Wald ~ chi-square : 자유도 1인 카이스퀘어 분포를 따른다. Chi-square 또는 wald 검증이라고 부른다.

-       Wald 검증의 문제점

n  로지스틱 회귀계수의 절대값이 큰 경우, 표준오차도 따라서 커지는 경향이 있다

n  따라서 회귀계수의 절대값이 크면 Wald 검증에만 의존할 것이 아니라, 해당 변수를 포함하지 않은 모형과 포함한 모형의 -2LL 차이를 구하고

n  그 차이값이 자유도 1에서 유의미한지 우도비 검증(LR test)도 실시해 볼 필요가 있다.

 

u  F test할 때 변수 하나 넣었을 때, 변수 하나가 통계적으로 유의하면 변수 test안해도 된다. 하나만 넣었을 때 하나의 변수가 통계적으로 유의미한 변수라고 하면, F test하면 변수 하나 추가된 모델이 더 좋은 모델이다.

 

-       Wald 검증과 우도비 검증 비교

n  공통점 : 자유도 1에서 chi-square 검증을 한다.

u  Wald 검증과 우도비 검증은 표본이 커질수록 결과가 일치한다.

n  하지만 한정된 표본크기를 이용하면 두 검증으로부터 얻은 결과는 다를 수도 있다. : 그럼 Wald 쓸까 -2LL 쓸까? 할 수 있는데, Wald보다는 -2LL을 지지하는 편이다.

n  어느 검증을 사용할 것인가? : 더 많은 학자들이 우도비 검증을 지지한다.  

u  이런 경우는 표본의 크기가 크지 않은 상황이다. 그 상황에서는 우도비 검증을 따른다.

 

-       로지스틱 회귀계수의 표준화?

n  output보면 표준화회귀계수값 보고 안한다..

n  통계 프로그램에서 로지스틱 회귀계수에 대한 표준화 값을 제공해 주지 않을 뿐만 아니라

n  표준화된 값에 대한 해석 역시 선형 회귀분석에서처럼 간단하지 않다.

u  로짓에 대한 표준편차를 구해야 하므로…(복잡하다. 두번 세번 transform한 것에 대해서 구해야 하므로)

n  위계선형모형도 SAS를 쓰면 간편하게 돌릴 수 있다.

n  Cf. 선형 회귀분석에서는 비표준화 계수(b) SDx/SDy를 곱해서 표준화 계수 도출

u  Beta = b(SD_x/SD_y)

 

-       SPSS procedure

n  Analyze à regression à binary logistic

n  Model specification : 종속변수가 이항형 변수일 때

n  SPSS syntax for logistic regression

u  ITERATE(20) : 20번 정도 반복하면 수렴한다고 생각한다. 디폴트로 설정되어 있으며, 20번을 반복하라는 명령인데, 이 정도면 충분하다.


-       로지스틱 회귁수의 해석

n  1. 로짓을 이용한 해석

u  로지스틱 꼐수가 b일 때, 독립변수의 단위를 하나 증가시키면 종속변수에서 b로짓 만큼의 증가가 있다고 해석한다.

l  ) 종속변수 : 수학시험 합격여부, 독립변수 : 과학점수

l  로지스틱 계수 = 2

l  과학 점수가 1점 증가할 때마다 종속변수에서 2로짓 만큼의 증가가 있다

u  회귀계수를 그대로 보고하면 되는, 가장 간단한 방법.

n  2. 확률을 이용한 해석

u  로지스틱 함수는 선형관계가 아니므로 독립변수의 증가분이 어디에서 이루어졌느냐에 따라 종속변수인 확률의 변화량이 달라진다. (Linear Regression과 다르게 직선이 아니다! Sigmoid curve!)

u  따라서 특정 확률 값(종속변수)에서 독립변수의 효과를 계산한다.

u  확률이 k인 지점에서 독립변수의 효과는 편미분을 이용해서 순간 변화율을 계산 : bk(1-k)

l  확률이 k인 지점에서 독립변수가 1만큼 증가할 때 종속변수인 확률으 ㅣ증가량

u 

l  확률이 0.7인 지점에서 과학점수가 1점 증가할 때마다 합격할 확률?
è bk(1-k) = 0.2 * 0.7 * 0.3 = 0.042

l  즉 과학점수가 1점 증가할 때마다 합격할 확률은 4.2% 증가한다.

l  로지스틱은 확률이 증가하는 것이 아니라 승산이 증가하는 것. “확률이 아니라 확률의 비율이다.

u  x값에 따라서 모든 지점에서 확률이 변한다. 로지스틱 회귀에서 확률이 몇 배라고 말한 것은 틀린 것. “어느 지점에서가 들어가야 한다.

u  K값은 어떻게 정하나?

l  K값을 정하는 특별한 규칙은 없고, 연구자의 관심에 따라 정한다.

l  가장 대표적인 값을 이용

l  Ex. 종속변수 : 수학시험에서 합격여부 (200명 중 120명이 합격, 80명이 불합격) è 합격자의 비율인 0.6 k값으로 정한다.

u  로짓 해석은 적용하기에 단순하나 의미가 불명확

u  확률 해석은 의미있는 해석이 가능하나 k값을 정해야 하는 문제점이 있다.

n  3. 승산비를 이용한 해석

u  적용이 용이하고, 해석의 의미도 명확하므로 가장 많이 쓰이는 방법.

l  독립변수(종속변수?) 자체는 승산이다(ln p/1-p). 그러나 독립변수가 들어가면 [한 단계 변할 때 찬성반대 확률 변함] 이다.

l  그런데 승산비로 하면 모든 점에서 다 같다.

u  독립변수 x의 로지스틱 회귀계수 b exp(b)로 변환

l  Exp(b) = 승산비(odds ratio; OR)

l  변수 x 1 증가시키면 얻어지는 종속변수의 승산의 증가 배수

l  종속변수는 승산이었는데(ln p/1-p), 왜 승산비가 되지요? 종속변수는 승산이지만, 독립변수와의 관계로 가면 승산비가 된다.

l  종속변수 자체는 1, 0 상태인데, 독립변수의 전상태와 다음상태를 비교하는 것. 그러면 2by2 table이 되어서 승산비가 된다.

l  독립변수의 변화에 따른 종속변수의 승산이 변화하는 것. 독립변수가 한 단위 증가할 때 종속변수의 승산이 몇 배 증가한다.

u  b가 아닌 exp(b) 값을 보고

l  과학점수 à 수학시험 합격여부; b=0.2

n  과학점수가 1점 증가할 때마다 종속변수의 승산에 있어서 exp(0.2), , 1.22배 만큼의 증가가 있다

n  만일 60점일 때 합격할 확률이 50%라면, 이 때의 승산은 1이 되고,

n  1점이 증가해서 61점이 되면, 이 때의 승산은 1.22

n  이 때 합격할 확률 : p/(1-p) = 1.22, p=0.55

n  합격할 확률은 약 55%가 된다

n  승산을 이용한 해석은 기본적으로 두 개의 승산을 비교한 승산비(odds ratio)에 근거한다.

l  승산비는 (확률과는 달리) 독립변수의 값을 무얼로 하느냐에 따라 달라지지 않는다.

 

u  Exp(b)에서 1을 뺀 뒤에 100을 곱해주면

l  독립변수가 1 증가할 때 승산에 있어서 변화 백분율

l  Delta% = 100(exp(b)-1) ß 1은 관계가 ㅇ벗음을 뜻하니까, 1을 빼주어 +/- 구분하기.

l  방금 전의 예에서 승산비가 1.22였으므로, 위의 식에 대입해보면 변화백분율은 22%가 된다.

l  해석 : 과학점수가 1점 증가하면 수학시험에 합격할 승산이 22% 증가한다

 

u  Delta% = 100(exp(b)-1)

l  exp(b) > 1 : the odds are “exp(b) times larger”

l  exp(b) < 1 : the odds are “exp(b) times smaller”

 

l  선형회귀분석 : 회귀계수가 0일 때 종속변수에 대한 X의 효과가 없다.

l  로지스틱 회귀분석 : exp(b)는 종속변수의 승산에 대한 변화량이 아니라, 변화 배수.

n  따라서 회귀계수 b에 대한 exp(b) 1이면 종속변수에 대한 X의 효과는 없다.

 

u  독립변수 x의 로지스틱 회귀계수가 0이면, 이 변수는 로짓에 대해 효과가 없는 것

u  Exp(b) 1이면 승산에 대해 효과가 없고, Exp(0)=1 이므로 로짓에 대한 효과가 없는 변수는 당연히 승산에 대해서도 효과가 없다.

 

u  If 로지스틱 회귀계수가 양수(positive)

l  이 변수는 로짓에 대해 정적(positive)효과 (positive “association”)

n  “effect”라고 쓰면 인과관계를 의미하는 것처럼 되어서 리뷰어가 인과관계 자신할 수 있느냐는 코멘트를 한다.

l  Exp(b) 1보다 크게 되어 승산에 정적인 효과

u  예를 들어 b=0.3 è exp(0.3) = 0.74

l  승산 이용: X점수가 1 증가하면 승산이 0.74배로 줄어들게 된다.

l  변화백분율 이용 : X점수가 1 증가하면 합격할 승산이 26% 줄어든다.

 

u  bàexp(b)로 변화시키면 변환된 값이 왜 승산비의 의미를 가지는가?

l  로지스틱 회귀계수 b exp(b)로 변환시키면 이 변환된 값이 승산비의 의미를 가진다.

 

u  하지만, 변수 x 1단위 unit이 아닌, 다른 단위로 변할 경우, x의 승산을 어떻게 이해할 것인가?

l  OR = exp(b1*x)

u  )

l  Exp(b) = 1.2라면, Exp(b*x) = 1.2^5 = 2.48832. x 1에서 5단위로 증가한 경우, 승산이 2.58832배 증가하는 것으로 해석한다.

l  Income이 만원 단위로 변화하고, exp(b)=1.01 이라면, 소득이 만원 증가한다면, 1.01^10000 = 1.635e+43이다.

 

다항 로지스틱 회귀분석

-       이항 로지스틱 분석 : 종속변수가 dummy 변수

n  종속변수 값이 1도는 0이므로

n  승산을 정의할 때 A가 일어날 확률과 일어나지 않을 확률을 대비

-       다항 로지스틱 분석 : 종속변수는 카테고리가 3개 이상인 명목 변수 ( : 지지하는 정당)

n  이항 로지스틱 분석의 단순한 확장

n  이항 로지스틱과 차이점은 각 사건이 일어날 확률을 특정 사건(reference)과 대비시킨다는 점.

-       예를 들어 종속변수 값이 A B C D이고 Reference category D라면

n  A D, B D, C D를 각각 대비시키는 식이 필요.

-       A-B, B-C, C-A등을 비교한 식은 필요하지 않을까?

n  AD, BD를 비교한 식으로 A-B관계를 추정할 수 있다.

n  종속변수의 category K개라면, K-1개 만큼의 식이 필요하다.

n  다항 로지스틱 분석에서는 각 식의 다항 로짓개수 b가 모두 미지수가 되며, 이를 모두 추정하는 것이 목적이다.

-       다항 로짓분석의 목적 : 로짓계수를 추정하여 이를 바탕으로 특정 범주를 선택할 확률 또는 특정 범주에 속할 확률을 계산하는 것.

-       상훔 1, 2, 3중에서 어떤 것을 선택할 것인가?

 

-       기준 범주는 따로 구할 필요 없이 1-(P1+P2)를 이용하면 된다.

n  Ex. A, B, C 중에서 하나를 선ㅌ개해야 한다면, A를 선택할 확률 0.6, B를 선택할 확률 0.3일 때 C를 선택할 확률은 0.1

 

-       ) 선거 참여 여부를 결정짓는 요인들

n  종속변수 : 2010년 투표 여부

n  독립변수

u  Male : 남성 더미(남성 1 여성 0)

u  Age : 10~80대 이상

u  EDUC(교육수준) : 무학~박사

u  PARTYLRs(정치적 성향) : 보수~진보

u  SATPOLs(한국정치만족도) : 매우 불만족~매우 만족

u  Loginc : 월평균 로그소득




로지스틱 회귀분석 (Logistic Regression)

 

-       이처럼 확률을 로짓으로 변환시키면 독립변수와 선형관계를 가지게 되는 이유는?

n  확률을 로짓으로 변환한 모형은

u  Ln(p/1-p) = b0 + b1x1 + b2x2 + b3x3 +…+ bkxk

u  이것은 직선의 방정식이다!

-       로지스틱 모형의 추정 : 최대우도법(Maximum likelihood)

n  회귀분석에서는 최소 자승화 기준(least squares)을 가장 잘 만족시키는 값으로 회귀계수를 추정

u  E(YX) = Y_hat = b0 + b1X

n  하지만 종속변수가 연속변수가 아닌 이항형 변수인 경우에는 최소 자승화 대신 최대우도법(maximum likelihood)이라는 추정방법 적용

u  관찰 자료의 가능성을 최대화하는 값으로 미지수의 추정치를 구하기 : ‘표본을 뽑을 때 잘 뽑았다라는 전제가 깔려 있다.

 

n  앞에서는 Least Square Method를 사용했다. 독립변수를 고려하고 나서 편차의 제곱합을 최소화하는 것이 estimation하는 방법이었음. 이것을 최소화하는 수학적 algorithm은 미분하는 것. Least square method에 숨어있는 논리는 평균!! 평균이 error의 총량을 최소화하므로. 단순평균에서 종속평균으로 넘어간 것이다.

 

-       관찰 자료의 가능성을 최대화…?

n  전체 population의 남성 비율이 어느정도인지 모르는 상황에서 10명의 random sample subjects가 있으며, 그 중에 3명이 남성이라고 하자. (추출확률이 다 같은 상태에서 무작위로 뽑았다 라면..)

n  우리는 최대우도법(ML)을 사용해 전체 population의 성별 구성(gender composition)을 알고자 한다.

n  직관적으로 생각할 때 전체 성별 구성에서 남성이 몇 %를 차지할 경우에, 우리가 랜덤하게 뽑은 샘플에서 30%가 남성일 확률이 가장 높을까? è 30%

 

-       최대우도법

n  우도함수를 설정하고, 이 우도함수를 최대화하는 값으로 미지수의 추정치를 결정한다.

n  우도함수 : 미지수에 따른 관찰자료의 가능성을 함수로 표현한 것이다.

u  L = Π [Pi^Yi x [1-Pi]^Yi]

-       어떤 경우에 Pi^Yi x [1-Pi]^Yi 이 최대화되는가?

n  Yi = 1일 때, 위의 식의 값은 Pi가 되므로 Pi가 최대한 1에 가까운 값일 때 우도함수 최대화

n  Yi = 0일 때, 위의 식의 값은 1-Pi가 되므로 Pi가 최대한 0에 가까운 값일 때 우도함수 최대화

 

-       정리해보면,

n  예측된 Pi를 실제값 Yi에 최대한 근접하게 하여 우도함수(L, likelihood function)을 최대화 할 수 있는 값으로 로지스틱 함수의 미지수 b0 b1값을 구해야 한다.

 

-       최대우도법으로 추정치 구하기

n  수학시험을 본 5명의 학생들 : 3명은 합격, 2명은 불합격

u  B0=3, B0=5를 넣으면 L = 0.3628

u  B0=7, B1=9를 넣으면 L = 0.00024

n  컴퓨터에서 일어나는 일

u  실제로 값을 넣어본다(iteration) è likelihood가 올라간다 è 유의미하게 올라갈 때까지 계속 다른 값을 넣는다(iteration) è 그러다가 어느 선에서 멈춘다면(수렴한다면) iteration을 중단한다

u  이러한 방식의 문제는 실제 likelihood function의 모양에 따라 진짜최대값을 얻지 못할 수도 있다. 예를 들면 쌍봉형일 때 작은 봉우리의 최대치에서 멈춰버릴 수도 있다. (큰 봉우리의 최대치가 더 큼에도 불구하고)

-       하지만 0~1 사이인 우도함수 값

n  더구나 사례수가 많은 경우에는 대단히 작은 값이 되므로 계산이 용이하도록 약간의 변형을 가해준다.

n  어떻게? : 로그 우도함수

n  우도함수와 로그 우도함수의 범위

u  0 L 1

u  -∞ < lnL ≤ 0

 

n  -∞ < lnL ≤ 0

n  로그 우도함수는 0d을 제외하고 항상 음수. 0에 가까울수록 모형의 적합도가 좋은 것이다 (ln 1 = 0이기 때문에)

n  모형 적합도가 완벽하다” : 예측된 Pi와 실제값 Yi가 정확히 일치한다.

 

-       최대우도법 적용에 필요한 표본 크기는?

n  Long (1997, p54)이 제안한 가지 기준 :

u  1) 미지수 하나를 추정하는데 최소 10명이 필요

l  K개의 독립변수 è 미지수는 K+1(절편값이 있으니)

l  이런 경우에 10(K+1)만큼 표본이 필요

u  2) 표본 크기가 최소 100명은 되어야 한다.

 

n  두 가지 조건 중에서 더 많은 표본 크기를 제시하는 조건을 따르면 된다. : 미지수가 아무리 적어도 100개는 필요하고, 샘플이 100개를 넘는다면 미지수X10개 만큼은 필요하다.

 

-       로그 우도함수를 이용한 유의성 검증

n  적합도 평가를 위해 분석모횽(M)과 포화모형(saturated model: S) 비교

u  포화모형 : 자료수만큼 미지수(parameter)를 포함하여 자료를 완벽하게 설명하는 모형

l  만약 사례수 2개로 선형 단순회귀분석(독립변수 1, 종속변수 1)을 수행하는 경우, 포화모형이 됨

l  예측된 값 = 실제값


n  -2ln(L_m) – (-2ln(L_s))

u  -2LL : -2 log likelihood

u  -2를 곱해준 이유는 -∞ < lnL ≤ 0 è 0 < -2lnL ≤ ∞ 이 된다. è chi-square 분포를 따르게 된다.

l  로그 우도함수 값 자체가 음수이기 때문에 이를 양수로 바꿔주고

l  위식의 차이 값이 카이스퀘어 분포를 따르게 하기 위해서.

u  모형의 적합도가 좋아질수록 -2ln(L)에 가까워진다.

u  선형회귀분석의 R-square는 클수록 모델의 설명력이 증가, 반대로 -2LL(=deviance)은 작을수록 설명력이 증가된다고 해석가능.

 

-       L vs lnL vs -2lnL

n  -2ln(L_m) – (-2ln(L_s)) : 분석모형 포화모형 è 포화모형에 비해 분석모형의 적합도가 얼마나 나쁜가를 계산하는 식

 

-       로그 우도함수를 이용한 유의성 검증

n  -2ln[L_m/L_s]에서 L_m/L_s을 우도비(likelihood ratio, LR)이라고 부른다.

n  여기에서 얻은 통계치를 이용한 검증을 우도비 검증이라고 한다.

n  이를 통해 얻어진 통계치는 deviance (D)라고도 불림

u  모델이 포화모형으로부터 얼마나 떨어져 있는가?

u  완벽한 적합도에서의 deviance=0 (설명력 100%의 포화모형?)

 

n  포화모형은 0 이어야 한다. -2lnL_s = 0

u  따라서 D = -2lnL_m – (-2lnL_s) = -2lnL_m

n  하나의 모형이 다른 모형에 내재되어(nested) 있는 경우에 한해서, D값의 차이 역시 카이스퀘어 분포를 따른다.

u  독립변수 1, 2, 3 가 있는 모형에 대해 1, 2 만 넣은 것은 1, 2, 3 있는 모형에 내재되어있는 것이다. 그러나 1, 3, 4 있는 것은 내재된 것이 아니다

u  따라서 D 값은 추가된 독립변수의 유의성을 검증하는데 사용된다.

 

-       독립성 검증의 예

n  기저모형(baseline model) :

u  독립변수를 제거한 모형, 즉 독립변수가 없고 절편만 있는 모형. -2ln(L)

u  -2LL 값이 클 것이다.

n  -2LL값이 최대인 기저모형에서 독립변수 K가 고려된 모형A -2LL을 얼마나 줄였는가를 카이스퀘어 검정을 통해서 통계적 유의성을 확인!

 

n  모형 A -2LL = 10, 기저모형의 -2LL = 20이라고 하면

u  그 둘의 차이는 20-10 = 10, 10 chi-square 값이 된다. 자유도는 4-1 = 3

u  b0=b1=b2=b3=0 이라는 영가설을 검증하기 위해서, 자유도 3에서 10이 유의미한 값인지를 카이스퀘어 분포 표를 통해서 확인하면 된다.

 

n  다시한 번 정리 : 독립변수를 추가해서 -2LL 0에 가깝게 만들어 적합도를 좋게 만드는 것이 우리의 바람

 

-       모형 비교

n  1. 경쟁모형이 내재된 경우

u  A : 작은모형, B : 큰 모형(A에서 변수가 추가된 모형)

u  여기서 카이스퀘어 분포는 표집분포(sampling distribution)이다. 검정을 할 때는 표집분포에 기초해서 한다. 샘플을 또 뽑고, 또 뽑고, 또 뽑고 해서 표집분포로 이런 분포를 보인다는 것.

u  두 모형의 차이는 G : G=-2LL_A – (-2LL_B) ~chi_square

u  작은 모형 A의 적합도는 B보다 나쁘다. 왜냐하면 -2LL값이 더 클 것이니. -2LL값은 0에 가까워야 적합도가 좋은 것.

 

n  작은모형과 큰모형의 -2LL차이가 별로 없다면, 관찰된 자료의 확률을 높이는데 추가된 독립변수가 작동을 안 한다는 이야기이다. “추가된 변수들의 유의성이 전혀 없다

n  변수의 설명력이 전혀 없는 경우 두 모형의 -2LL값이 같게 되여 G값이 0이 된다.

n  어느 모형을 선택할 것인가?

u  Chi-square 검증이 유의미 : 두 모형의 적합도가 유의미하게 다른 것이므로 더 많은 변수를포함한 큰 모형 선택

u  Chi-square 검증이 무의미 : 간명한 모형 A 선택(간결성 원칙)

u  이러한 검증은 LR test라고 한다.

 

n  2. 경쟁모형이 내재되지 않은 경우

u  두 모형의 로그우도 함수 값 차이는 chi-square 분포를 따르지 않게 되고, 우도비 검증을 적용할 수 없다.

u  대신 정보 지수(information criterion)를 이용!

l  Akaike’s information Criterion (AIC)

l  Bayesian Information Criterion (BIC)

 

-       AIC

n  AIC = -2LL + 2q

u  -2LL : 모형의 적합도

u  2q : 모형의 간명성. 모형의 미지수의 수

 

n  독립변수가 많으면 2q가 커지고, 그러면 좋은 모델이 아니라는 뜻.

n  경쟁모형이 여러 개인 경우 AIC가 가장 작은 모형 선택

n  AIC는 모형의 적합도와 간명성을 동시에 고려하는 지수 : 독립변수의 수가 많으면 적합도에서 유리하나, 간명성은 떨어지게 된다(상쇄)

 

n  각각 다른 표본을 이용하여 계산한 경우에는 표본의 크기를 고려한다.

u  AIC’ = (-2LL + 2q) / N

u  표본의 크기가 크면 -2LL값은 커진다. 그래서 그것을 교정하기 위해서 표본 사이즈(N)로 나눠준다.

-       BIC

n  BIC = -G + (df)(lnN)

u  df : 해당 모형의 독립변수 수

n  기저모형의 -2LL에 비해서 분석모형의 -2LL이 얼마나 작어졌는지를 보여줌

n  BIC도 모형의 적합도와 간명성을 고려하는 지수

n  BIC가 가장 낮은 모형을 선택한다.

 

-       AIC BIC는 내재된 모형 사이의 비교를 위해서도 사용할 수 있다. (LR test보다 더 일반화된 방식이므로)

-       SPSS의 다항로지스틱 회귀분석의 통계량에서 정보지수를 체크하면 얻을 수 있다.

 

-       로그 우도함수 값을 이용한 결정계수 R^2계산

n  로그 우도함수 값을 이용해 계산한 결정계수 R^2를 의사R^2(pseudo R^2)라고 한다.

u  Cox Snell이 개발한 R^2

u  Nagelkerke가 개발한 R^2

-       교수님은 보고해본 적 없음. 보통 -2LL 보고한다.

 

-       로지스틱 회귀분석의 R^2 해석은 선형분석에서의 해석과 다르다.

 

n  종속변수가 범주형이므로, 오차의 등분산성 가정이 만족되지 않는다.

n  오차분산이 예측된 확률에 따라 달라진다.

u  Var(e_i) = p_i x (1-p_i)

n  종속변수의 값에 따라 R^2 값이 변하므로 종속변수의 R^2와 같이 해석할 수 없다.

n  또한, 로지스틱 회귀분석에서 R^2값은 대개 낮게 나오는 편이므로, 모형평가에서 R^2에 너무 의존할 필요는 없다.

 

 

 

-       4. P-value

n  P value는 검정값이 모집단에서 값이라고 전제했을 때 표본에서 이 값이 얻어질 확률.

n  검정값을(0가설 값을) 전제했을 때, 포본에서 얻어진 관찰값을 얻을 수 있는 확률.

n  P value가 크면, 0가설을 기각할 수 없다. 왜냐하면 0가설을 전제했을 때 관찰값을 얻을 확률이 크면 0가설을 기각할 수 없다.

n  Estimation least estimation, likely…등등 나오는데, 이것을 잘 외고 있어야 한다.

 

 

 






중다회귀분석(Multiple Regression)

 

-       Influential outliers

n  Unsual case는 분석결과에 영향을 준다면 교정해야 한다.

n  모든 이상치가 문제가 되는 것은 아니다.

u  그러나 이상치로 인해 문제가 생긴다면 지워버릴 수도 있다.

-       Outlier를 발견하는 방법

n  Distance from the regression line : Residual

n  Distance from the center : Leverage

-       SPSS

n  Analyze è Regression è Linear Regression

n  Check “Case labels” to distinguish each case

-       어떻게 처리해야 하나?

n  기본적으로는 제거할 수 있다.

n  그러나 Outlier를 포함한 분석과 포함하지 않은 분석이 별 차이가 없으면 버리지 말아야 한다.

u  이상치를 판단하는 기준은 연구자의 주관에 따른다.

u  하지만 너무 많은 사례를 지우면 문제가 될 수 있다.

-       포함해서 분석했을 때 vs 포하하지 않고 분석했을 때

n  결과치가 어떻게 다른지 보고, 문제가 있으면 drop한다.

n  추정한 회귀계수 값들이 어떻게 나타나는지, significance test 값이, R-square 값이 어떤지 등을 비교한다.

-       Case 12~13개 밖에 안되는데 outlier가 존재한다면,…?

 

-       Compare results (Syntax)

-       Influential case를 어떻게 해야 할까?

n  Influential case가 있다면 regression결과가 robust 하지 않다!

n  다음의 경우에는 Influential case를 제외하면 안된다.

u  Coding error가 의심될 때

u  Unusual cases which your analysis doesn’t want to consider.

-        

로지스틱 회귀분석 (Logistic Regression)

 

-       원칙적으로 독립변수와 독립변수가 모두 연속변수여야 한다.

-       그러나 Logistic regression종속변수가 명목척도이다. 그리고 보통 2개로 나눠져 있다. (성공-실패, 찬성-반대)

-       왜 로지스틱 회귀분석인가?

n  지금까지 살펴본 회귀분석 모형들은 종속변수로 연속형 변수를 사용했다.

n  하지만 종속변수가 비연속 또는 범주형 변수일 경우에는..? : 우울증 여부, 합격/불합격, 특정 정당 지지 여부

n  이런 경우 실제 종속변수 값은 0 1로 코딩된 값을 지니게 되는 반면, 예측된 종속변수 값은 확률의 개념을 가지게 되므로 선형회귀분석을 사용할 수 없다.

-       종속변수가 이항형 변수일 때 왜 선형회귀분석을 사용할 수 없는가?

n  종속변수 : 합격여부(불합격=0, 합격=1)

u  독립변수 값이 증가함에 따라 Y는 확률 1에 가까워진다

u  독립변수 값이 감소함에 따라 Y는 확률 0에 가까워진다.

n  E(YX) 범위는 0~1사이 : 선형회귀분석에서는 E(YX) 는 독립변수에 따라 어떠한 값도 가질 수 있다는 점과 비교해볼 때, 이항형 변수는 특이하다.

 

-       로지스틱 함수 : 종속변수 0~1사이

n  독립변수의 값이 아무리 커도 예측된 확률 값은 1에 근접하지만 1을 넘어서지는 않는다

n  독립변수 값이 아무리 작더라도 0 이하로 내려가서 음수가 되지 않는다.

n  X Y의 관계가 선형인 경우에는 X의 효과가 항상 동일하지만(=기울기 b =고정효과) 두 변수의 관계가 로지스틱 함수를 따르는 경우에 X효과의 크기는 X의 위치에 달려있다.

 

-       로지스틱 함수를 수식으로 표현하면..

n  독립변수가 1개일 경우

n  E(YX) = p(X) = exp(b0 + b1X) / [1+exp(b0+b1X)]

 

-       확률의 변환

n  상한계 1, 하한계 0을 가지므로,

n  확률 값과 같이 0에서 1사이의 값을 취하는 이항형 종속 변수를 분석하는 데 문제가 있다.

n  따라서 S자 곡선 로지스틱 함수를 이용하는데

n  확률을 로짓(logit)으로 변환하면 확률의 상/하한계가 사라지며, 독립변수와 로짓의 관계를 선형함수로 표현할 수 있다!

 

-       확률을 로짓으로 변환하기

n  승산(odds) 구하기

u  p/1-p

u  The ratio of two probabilities

u  Odds of A versus B = P(A)/P(B) = Fa/Fb

n  승산비(Odds ratio) : the ratio of two odds

u  theta = (Fa/Fb) / (Fc/Fd) = FaFd / FbFc

u  찬성한 사람들 중에 남자 : 여자 / 반대한 사람들 중에 남자 : 여자

n  Theta 1보다 작으면, 1/theta로 표현하는 것이 더 자연스럽다.

-       확률과 로짓의 관계

n  비선형

u  확률-독립변수 관계는 비선형인데다, 확률을 로짓으로 변환하는 것도 비선형 변환

u  따라서 로짓-독립변수의 관계는 선형이 된다.

n  찬성-반대만 있으면 승산만 계산가능하며, 독립변수 요인이 있어야 승산비가 계산가능하다.

 

-       Chi-square 값이 더 높다고 관계가 더 크다고 할 수 없다. (6.06 vs 8) 통계적인 유의성만 말하는 것.
Theta
값이 같기 때문에, 관계의 강도는 똑같다고 할 수 있다. (2.25 vs 2.25)

-       따라서 2 by 2일 경우, chi-square계산하고 나서 odd ratio 계산하면 된다. Chi square odd-ratio에 대한 유의성 test이다. “독립적인지” (=관계가 없는지)

 

-       왜 확률을 로짓으로 변환하는가? 

n  확률을 승산으로 변화시키면 상한계가 사라진다.

n  승산을 로짓으로 변환시키면 하한계가 사라진다.

u  Odds 1보다 작으면 negative association이다.


-       최종적으로 회귀계수를 해석할 때는 승산비’(독립변수를 고려하는 것이니)로 해석하게 된다.

 






중다회귀분석(Multiple Regression)

 

기본가정에 위배되는지 여부 어떻게 찾을 수 있나?

-       가설(1) Expected e_i=0 è 이론적 검토.

n  통계적 기법으로 확인하는 방법은 없다.

n  이론적 사고에 근거해서 빠진 변수가 없는지


-       가설(2) Linearity è 산점도(univariate distribution)

n  선형성을 충족하고 있다면, 잔차(prediction을 그리고 나서 남은 것들)가 독립변수에 관계없이 잔차의 평균값은 다 같아야 한다.

n  Univariate distribution

u  Prediction하기 전에 변수 자체의 분포가 normal distribution인지 확인. 그러나 여기서 highly skewness가 있다고 해서 linearity assumption을 위배한 것은 아니고, 위배될 수 있다는 신호(signal)을 주는 것.

l  (1) Bivariate distribution을 본다. (2) 예측값과 잔차 사이의 분포를 본다. 산점도를 통해서 선형성을 위반하고 있는지 아닌지 확인.

n  Partial regression plot

u  사용해서 선형성의 가정에 위배되는지 확인한다.

u  다른 변수들이 고려된 상태에서 PRP를 봐서 이것이 선형성을 위반하는가 본다.

u  다른 변수 통제 안한 상태에서 bivariate보는 것과 통제하고 Partial 보는 것의 plot이 다른 경우가 왕왕 있다.


-       가설(3) Homoscedasticity è partial regression plot

n  Linearity homoscedasticity가 충족된다면 Studentized(=standardized) residual은 독립변수의 값이 달라져도 variance가 같아야 한다.

n  등분산성이 나타나지 않으면 방법을 바꾸어야 한다.

n  Partial regression plot

u  Y=B0 + B1X1 + B2X2 +… 의 식에서 X1을 빼고 계산하면 X1에 의한 부분은 error에 남아있게 된다.

u  B1이란 값은 X1이 한 unit올라갈 때 Y에 어떤 효과가 있는지 보는 것. Partial effect라는 뜻임.

u  Partial effect가 무슨 뜻인지 아는 것이 중요하다. X1하나만 넣은 단순회귀분석하고는 다른 것임.

n  SPSS procedure

u  Linear regression è Plot

u  Check “Produce all partial plots”

n  등분산선은 prediction하고 나서 남은 error의 양에 각 X에 고정된 값이 있는데, 독립변수의 값에 관계없이 분산의 양이 다 같다.


-       가설(4) No correlated error è time series, spatical, cluster sampled data일 경우 아니면 문제 안됨.


-       가설(5) No perfect multicollinearity è VIF

n  회귀분석 모형에 독립변수들 간에 나타나는 상관관계

n  높은 다중공선성 자체가 회귀분석 가정을 위반한 것은 아니다.

n  그러나 표준오차를 왜곡시키기 때문에 중요한 것!

u  사실은 통계적으로 유의미한 효과가 나타나야 하는 변수를 왜곡시킴

n  Inflated standard error : 표준오차를 높인다. 표준오차가 커지면 t값이 작아지고, 통계적 유의성은 떨어진다.

n  VIF :

u  독립변수가 x1 x2 … 가는데, 특정 변수를 넣었을 때의 R^2값이다. 특정 변수의 R^2값이 높으면 문제가 된다는 뜻.

u  특정 변수에 대해서 다 계산을 해준다. 그러면 변수에 따라서 VIF값이 다 나오게 됨.

u  R^2가 분산/회귀계수의 standard error(표준오차)를 높이는데, 이것을 어느정도나 높이는지 보는 것.

u  VIF값이 크면 다중공선성 값이 의심되는 것. à 통상 10 이상이면 높다 함.

l  그러나 경험적으로는 10은 너무 큰 것 같다. 학자에 따라서 4 이상이면 의심하라 하기도.

l  기억해야 할 값은 VIF = 4.

n  Tolerance : VIF와 역으로 같은 값..

n  VIF Tolerance 값 둘 중에 하나만 확인하면 된다. VIF는 커지면 문제가 되고, Tolerance는 작으면 문제가 된다.

n  (1)VIF넣는 법, (2)숫자 4, (3)어떻게 처리하는지 이 세 가지만 알면 된다!

n  SPSS

u  Linear regression è statistics

u  Click “collinearity diagnostics”

n  VIF값이 매우 높거나 Tolerance 값이 낮더라도, 해당 변수의 회귀계수 자체가 significant 하지 않으면 공선성 문제는 신경쓰지 않아도 된다.

u  But 연구자가 원하는 관심변수가 유의하지 않고, 다중공선성이 높다면, 공선성 문제를 해결하고 분석에 사용하여야 한다.


-       가설(6) Normally distributed error è normal probability plot histogram

n  잔차(조건평균에서 뺀 값) 0을 중심으로 모여있으면서 대칭적으로 분포되어야 한다.

n  정상성의 가정을 위반했는지 살펴보려면

u  Normal probability plot (P-P plot, Q-Q plot)

u  히스토그램을 사용하여

u  Residual distribution을 살펴본다.

 

-       또 한가지 고려해야 할 사항 : Outlier.

n  특시 사례수가 적은 분석을 할 때 outlier문제는 매우 중요하다.

 

 

Assumption

Remedies of violation

(1)

Expected ei=0

Add missing variables (이론적 사고를 통하여)

(2)

Linearity

Correct functional form

1.     Log transformation

2.     Polynomial equation

※ log

- for linearity

- to reduce

Heteroscedasticity

(3)

Homoscedasticity

1.     Change functional form(log)

2.     HLM

A.     개인이 특정한 집단에 embedded, nest된 경우에 사용한다.

3.     Weighted least squares

(4)

No correlated error

Multilevel/mixed model

Autoregressive model(자기회귀모델)

(5)

No perfect multicollnearity

If perfect multicollinearity .. drop the variable (combine collinear variables) Or get better data

(6)

Normally distributed error

Residual analysis

 

-       Log transformation : May or may not work

n  등분산성과 선형성은 맞물려 돌아갈 수 밖에 없다.

n  선형성, 등분산성 가정을 위반한 경우 이를 교정하기 위해 사용한다.

-       e is normally distributed

n  잔차의 분포는 어떻게 확인하는가?

u  Predicted value of X=x, Residual = Y

n  SPSS

u  Analyze > Regression > Linear

u  Define X and Y vriables

u  “Save”

l  Unstandardized predicted values

l  The standardized residuals

u  변수창에 “pre_1”“zre_1”변수가 생성된 것을 확인

n  Make a scatter plot Y=zre_1, X=Pre_1

 

-       잔차를 가지고 scatterplot을 해보니

n  높은 점과 낮은 점에서 residual (+)이고 가운데는 (-)값이 더 많다.

n  이런 그림이 나오면, 본래의 종속변수(original response variable)과 독립변수 사이에 비선형관계(curved relationship)이 있다고 함.

n  è Square했다. Regression을 독립변수^2 값으로 넣었다.

n  è 처음 모델보다는 나아졌으나 여전히 가운데가 내려가고 양 쪽이 높은 형태의 curve가 남아있다.

n  è Linear term Square term을 모두 넣는다(면적, 면적^2 변수 둘 다 넣음)

n  è 그리고나서 잔차분석을 해보니 이것이 가장 낫다. 그러면 이 모델을 채택함.

 

-       Unstandardized Predicted Value : Y값의 특정 value들이다.

-       Standardized Residual : 표준화된 잔차

 

-       ANOVA table이 나온다.

n  ANOVA : 집단이 여러 개일 때 차이가 있는지 확인하는 방법

u  측정의 수준이 올라간다 : 명목è서열è등간è

u  단순하게 6, 9, 12를 명목척도화 한 다음에 소득에 차이가 있는지 없는지 확인해보니 집단간 소득의 차이가 존재한다! 라고 결론을 내는 것이 분산분석

n  아버지의 사회경제적 지위에 따라서 그룹을 나누면 자식의 사회경제적 지위가 차이가 있는가?”를 본 것이다. ANOVA에서 본 것과 같은 것이다.

u  Regression에 나온 분산분석 표도 논리가 같은 것.

 

-       R^2

n  단순평균에서 자승합을 TSS라고 하고, SSE는 남은 양, RSS regression해서 설명해낸 양.

n  R^2 = 0.117이라면 TSS에서 11.7%를 설명해냈다는 것.

-       F-test

n  H0 : B1=B2=B3=…=0 // H1 : 하나는 0이 아니다.

n  RSS/k (k:독립변수 숫자), 의 평균이 SSE/[N-(k+1)]  보다 별로 크지가 않다.

n  F= (RSS/k) / (SSE/[N-(k+1)])

 

-       ANOVA of Two Variables

n  그륩이 세 개 이상이고, 그룹에 number가 들어가고, 이 경우는 dummy변수이다. 연속변수를 명목척도화한다.

n  특정한 그룹의 종속변수의 평균

-       F-test

n  H0 : 그룹 간 분산의 평균이 그룹 내 분산의 평균보다 크지 않다.

n  …..a..a..a……..b.b…b……….c…c..c……..

u  그룹 간 분산이 더 크면, 그 그룹들은 서로 평균이 차이가 있을 것

-       평균값을 이어도 회귀선이 나오지 않는다. 왜냐하면 독립변수와 종속변수 사이에 선형 관계가 없기 때문이다. 선형성을 위반하고 있는 상황으로부터 새로운 분석의 레벨로 나아갈 수 있다.

-       Linearity를 점검하기 위해 ANOVA를 해볼 수 있다. 선형성을 충족시키고 있다고 하면, 잔차는 그룹별로 차이가 없어야 한다. 독립변수를 고려하고 나서 잔차는 패턴이 없어야 한다. 잔차는 패턴이 없어야 선형성이 충족되는 것이다.

-       만약 선형성 가정이 충족된다면, residual(그리고 standardized residual)은 독립변수의 값과 상관없이 동일한 평균을 가져야 한다.

-       예시)

n  일단 모델을 돌리고, 잔차값을 구한다.

n  Regression model을 돌리고 개별 사례들의 잔차를 구하자.

n  Regression model을 보니 t값이 41로 높게 나왔다. 그러나 여기서 멈추면 안된다.

n  왜냐하면 이러한 결과는 독립변수와 종속변수 사이에 linear association suggest하지만, coefficient significance linearity validity에 대해서는 아무것도 알려주지 않는다.

n  독립변수1-독립변수1에 따른 잔차, 독립변수2-독립변수2에 따른 잔차  ANOVA해보니 F값이 significant하게 나온다.

n  그러면 어떻게 해결해야 할까?

n  아버지의 직업지위점수를 소수점 이하를 버리고(TRUNC), 10으로 나눴다. 그리고 Residual create하라는 명령도 넣었다.

n  그리고 나서 ANOVA를 돌리니까 아버지의 직업지위점수에 대한 것은 insignificant해졌다










중다회귀분석(Multiple Regression)

 

F-test for R^2

-       방법1) 처음에 기본적 통제변수 넣고 돌린 값 보여주고, 관심있는 변수를 넣은 모델을 보여주고, 기존에 변수들과 비교했을 때 내 것이 얼마나 설명력 있는가를 보여주는 것.

n  단계적으로 독립변수를 넣는다고 하는데, 어느 교과에서 위계라고 했다. 위계가 아니라 단계이다.

-       방법2) 관심있는 변수 먼저 넣고, 그 다음에 통제변수 넣기

n  반드시 통제변수 넣고, 내가 추가한 변수가 효과 있다라고 할 필요는 없다.

n  통제하고 난 이후에도 효과가 줄어들거나 insignificant해지지 않는다면 그렇게 할 수도 있다.

n  통제 안한상태에서 효과 어떤지위해서 새로운 회귀계수값이 통제하든 안하든 변하지 않는 것이 좋은 것이다.

 

F t statistics와의 관계

-       t 값이 충분히 나오면 모델 비교하는 F statistics를 굳이 볼 필요가 없다. 같은 값이다.

n  변수 하나 넣었을 때 변수값이 유의미하게 나오면 모델 비교 안 해도 된다.

-       t분포의 자유도가 d라고 할 때, t분포의 제곱값은 df1=1이고 df2=d F분포를 갖는다.

-       오히려 실용적이 정보는 F test하는 경우와 t test하는 경우에 무슨 관계가 있는지를. 모델 비교 위해서는 F test하는 것이 맞는데, 최근에는 그냥 단순 regression에서는 모델 비교 잘 안한다. 모델비교보다는 추가한 변수의 통계적 유의성을 보는 것이 중요하다.

-       기존에 사용되었던 독립변수에 내가 관심있는 독립변수를 추가한 뒤가 어떤지가 더 중요하다.

-       Parsimony의 원칙에 근거하서 간결하게 더 많은 분산을 설명해내는 과정에서 F test를 했는데, 기존의 모델이 갖춰진 다음에 새롭게 변수를 구축하거나 변형하거나 해서 improve하는 경우가 대부분이고, 그렇기 때문에 모델 비교하는 일이 많지는 않다. 그리고 실제로 손으로 계산해서 모델 비교할 일은 거의 없다

-       모델 비교할 때 하나의 원칙은,, Y=a + b1x2 + b2x2 , Y=a+b1x2 + b2x2 + b3x3 + b4x4 정도 되어야 모델비교 하는 것이지, Y=a + b1x1 + b2x2 + b3x3 만 있을 때는 b3의 유의성만 보면 된다. 기존 모델에 있는 a, b1 ,b2는 포함된 상태에서(nested) 모델 비교가 가능하다.

n  작은 모델에 있는 독립변수가 들어가 있어야 한다. x1 x2뺀 상태에서 보는 것은 안된다.!

 

진단

-       진단을 잘 안하는 경우가 많다. 모델을 잘 만들면 문제가 없다. 모델을 잘 못 만들면 문제가 있고.

 

회귀분석의 기본가정

-       기본 가정이 중요한 이유는, b를 구할 때 sigma(Xi-X_bar)*(Yi-Y_bar) / (sigma(Xi-X_bar))^2

-       이것이 구하는 공식이었는데이것이 공분산이니까, x가 평균적으로 변하는 정도이다. 독립변수가 평균적으로 흩으져 있는 정도. X가 변화할 때 같이 Y가 얼마나 변화하는지이다.

n  회귀계수를 구하는 방식이 공분산을 분산으로 나누는 것이다.

-       잘 생각해보면 이 공식 자체에 assumption이 들어 있다.

-       )교육-소득 관계 :5à6년 변할 때와 15à16년 변할 때의 변화량이 동등하다가고 받아들이기가 힘들 것임

n  이처럼 직선관계가 아닌 사회가 많다.

n  자료가 이런 식으로 흩어져있지 않다면 회귀분석을 하지 말라!”라는 전제가 있다는 것.

-       실제 자료들을 보면 직선관계가 안 나타나는 경우가 많다는 것.

 

-       종속변수 : 종속변수가 연속변수가 아니면 회귀분석을 하면 안된다.

n  Logistic Regression에서는 명목변수도 한다면서요! è 0/1로 되어있는 것을 linear하게 바꾸는 것.

-       Ordinal도 원칙적으로는 그 간격을 모두 동일하다고 할 수 없으니 안되는데, 5분변수든 4분변수든, 심지어 3분변수만 있어도 … ordinal일 경우에 사용하는 ordered logit이 있지만할 수 있다.

 

-       기본 가정들을 보면 모두 error에 대한 것이다.

n  Expected error term, e_i=0 (population error)

n  Linearity

u  직선관계가 아니면 직선으로 만들어야 회귀분석 할 수 있다. Logistic 0/1관계를 직선관계로 바꿔야 분석 가능하다.

n  Homoscedasticity(등분산성)

n  Errors (e_i, e_j) are not correlated

n  No perfect collineraity

n  Normality(정상성)

 

선형성 : 평균들을 이어보니 직선이 나온다.

등분산성 : 예측하고 나서 분산의 양의 크기가 같다.

정상성 : 조건평균을 중심으로 정상분포를 보인다.

 

-       이 세 가지 조건이 충족되지 않으면 회귀분석 할 수 없다.

-       모두 회귀분석을 하고 난 다음의 편차(error, prediction을 했기 때문에 error라고 부른다)에 대한 것들이다. 이 때 error의 분산의 양이 분산이 다 같아야하고, 개별 조건에서 (조건평균에 대한) error의 분포가 정상성을 보이고, 독립변수와 종속변수의 관계가 직선관계이다.

-       예측한 이후에 독립변수의 특정 값에서 분산의 크기가 같아야 한다.

-       Error term이 정상 분포를 보인다.

 

 

1)    오류항의 기대값은 0이라고 가정한다.

-       현실적으로 종속변수에 영향을 미치는 모든독립변수를 고려한다는 것은 불가능하다.

n  불가능할 뿐더러 통계학의 목적도 아니다. 통계학의 목적은 uncertainty reduction.

-       따라서 회귀분석 모델에는 포함되지 않았지만, 종속변수와 연관이 있을 것으로 예상되는 기타 변수들은

n  우리가 예측한 종속변수의 평균값에 systematic한 영향을 주지 않았을 것이라고 가정한다.

u  어떤 변수가 사실은 종속변수에 영향을 주나, 모델이 포함을 안 시켰다면 error로 남을 것이다. 그 변수가 포함이 안 되었기 때문에 분산의 양을 못 줄였으니 error로 남아야 한다. 그러나 이 변수를 안 넣는다고 정상성으로 안 보이는 것은 아니다.

n  e_i=0이 아니라면, 모델에 포함되지 않은 어떤 변수에 의해서 종속변수의 기대값이 달라질 수 있다.

n  모델에 포함되지 않은 변수가 모델 안의 다른 변수들과 상관관계를 맺고 있다면, 추정된 회귀계수의 값이 biased 된다.

u  매우 중요한 변수를 빠뜨렸다. 그런데 모델에 포함된 독립변수하고 상관관계 없다면 진단을 해봐도 문제가 나타나지 않는다.

 

n  중요한 변수가 모델에 빠졌으면, 이것은 error에 남을 것. 그런데 이 error가 모델에 포함된 독립변수와 상관관계를 맺고 있으면 빠진 변수도 상관관계를 맺고 있을 것이다.

 

2)    선형성

3)    등분산성

-       퍼진 정도가 회귀선을 따라서 일정한 간격을 이루고 있다.

-       Prediction 값을 중간에 긋고 scatter를 보게 된다.

n  오른쪽으로 삐죽한 삼각형이라면 à Y값이 커질수록 X값이 Y값의 변화에 미치는 영향이 작다.

-       표준오차가 왜곡되면 유의미했어야 할 회귀계수가 유의미하지 않게 나올 수 있다.

-       등분산성의 가정이 위배되더라도

n  다행히 회귀계수가 biased 되는 문제는 없다.

n  하지만 다음과 같은 2 가지 문제가 뒤따른다.

u  Inefficiency : 이분산성인 경우 최소자승화 방법으로는 더 이상 최적의 모델을 얻을 수 없다. Minimum standard error라는 보장이 없기 때문

u  Biased standard error : 이분산성인 경우 표준오차가 편파적으로 측정되어 결과적으로 통계적 검증(t-test)을 하거나 신뢰구간을 측정하는 데에도 bias를 초래한다.

4)    Errors across cases are not correlated

-       COV는 곧 correlation이다. COV(e_i, e_j)=0이어야 한다. 사례들이 independent해야 한다는 것.

-       사실 independent하지 않은 사례들이 있다. Sampling 방법 자체가 사례들을 독립적이지 않게 만든다.

-       어떤 경우에 이 문제가 발생하는가?

n  시간에 따라 수집된 데이터들에서 흔히 나타나는 문제 (1학년 성적 - 2학년 성적)

n  또는 지리학적 데이터에서 발생하는 spatial correlation

u  다음과 같은 사례 : 전국의 교육비 수준을 측정한다고 할 때, 강남구(서초동-반포동) case는 타지역에 비해 밀접한 상관이 있을 가능성이 높다.


-       다른 예

n  자신의 이웃에 대한 만족도 조사에서 100커플을 조사한다면 2명씩(=부부)은 자신 이웃에 대한 만족도에서 서로 높은 상관을 가지고 있을 것. 부부 중 한 사람만 조사하는 방법을 써야 한다.

n  Time series data

-       만약 가정이 위배되면

n  다행히 회귀계수가 bias 되는 문제는 발생하지 않는다.

n  하지만 추정된 회귀계수의 standard error에서 bias가 발생하게 된다.

-       하지만, 다행히 앞에서 살펴본 데이터의 종류(time series )를 제외하고는 크게 문제될 일이 없다.

 

5)    다중공선성

-       변수 하나를 빼든가, correlation이 높은 두 변수를 합해버리면 된다.

-       독립변수 두 개가 너무 상관성이 높다면, 어느 하나는 불필요하다(redundant)하다는 것.

-       상관계수가 0.4~0.6 이상이면 사실상 같은 변수일 가능성.

-       그런데, 다중공선성은 상관관계와 어떻게 다른가?

n  상관성 : 피어슨 상관계수 등에 의해 계산

u  두 변수 간의 상관정도를 계산하고

u  독립변수와 종속변수를 구분하지 않는다.

n  반면, 다중공선성은

u  두 개 이상의 변수들 간의 상관정도를 계산하고

u  독립변수들 간의 관계만을 고려한다.

u  VIF(variance inflation factor : 분산팽창계수) 또는 Tolerance(공차한계)로 측정한다.

-       완전공선성 : R^2=1, 완전공선성일 때 회귀계수를 추정할 수 없다.

-       다중공선성이 높다는 것 자체만으로는 회귀분석의 기본가정을 위배했다고 판단할 수는 없다. 다만

-       Highly multicollinearity일 경우 여러가지 문제들이 뒤따르므로 이를 주의깊게 살펴야 한다.

n  VIF Tolerance 값을 보면 되기 때문에 굉장히 손쉽게 찾을 수 있다.

 

6)    e is normally distributed

-       normality는 등분산성을 포함한 이야기는 아니다.

-       정규성을 따르지 않을 경우 outlier 를 제거해서 해결하기도 한다.







중다회귀분석(Multiple Regression)

상호작용

-       Y = a + b1X1 + b2X2 + b3X1X2

n  X1 X2가 연속형이든 범주형이든 그냥 곱해주는 것이다.

 

상호작용

-       상호작용 항을 넣으면 다중공선성 효과가 나타난다. 독립변수간 상관관계가 높을 때 나타나는 현상임.

-       X1 X1X2, X2 X1X2간에 상관관계가 높을 수 밖에 없음.

n  그래서 B3가 유의미한지만 확인해보라

n  B1 B2가 유의하지 않아질 수 있다. 그러나 무시하라! B3가 유의한지 아닌지만 보면 된다.

 

-       Main effect : B1 & B2

-       Interaction Effect : B3

 

예시) stata regression 포함한 syntax가 딱 한줄로 된다. powerful하고, 단순하다.

-       Stata는 사례수를 알려준다. SPSS는 자유도를 보고 계산해야 함. (Intn : interaction)

-       Interaction을 넣기 전과 비교한다고 하면..

-       Root MSE :

n  MSE(Mean Squared Sum of Error) = SSE / df.

u  Root MSE를 하면 è 종속변수의 표준편차인데, 독립변수를 다 고려하고 난 후 종속변수의 표준편차가 된다.

u  여기서는 df n-4이다. 절편까지 독립변수가 4개이니까(절편, edyrs, race, edyrs*race)

-       단순평균에서의 분산은 n-1이 되어서 5562가 되고.

-       결과를 보니, race coeff 10.54, edyrs coeff 4.60, intn coeff -1.74이다.

n  흑인이 race에서 1 coding 되었으니 흑인이면 인종에 따라 더 높아진다는 뜻인가?!

 

-       흑인이 아닌 사람들과 흑인인 사람들을 비교하면..

n  교육의 효과는 (4.60-1.74race) 만큼의 효과가 있는 것.

u  Non-black è 교육의 효과가 4.60

u  Black è 교육의 효과가 2.86

l  , 흑인이면 교육이 올라가도 SES상승에 미치는 효과가 적다. 이러한 상호작용의 효과 때문에 race coeff 10.54 (+)가 나왔을 것.

l  만약 상호작용향을 넣지 않았으면 race에 따른 coeff가 흑인에서 (-)가 나왔을 것.

 

-       그래프를 보면 6년에서 black non-black의 그래프가 교차한다. , 6년 이후로는 흑인이 disadvantage가 있는 것.

-       이 경우 moderator race이다. Race가 교육년수의 효과를 조절한다.

 

상호작용 효과

-       독립변수 X1 X2가 독립적으로 갖는 각각의 영향력 이상의 어떤 효과

n  Main effect를 낮추거나, 높이거나.

n  방금의 예에서는 race가 교육의 효과를 약화시킨다.

 

Regression이라 이야기를 하느냐하면

-       교육이 6, 9 ,12, 16이렇게 있다면. 이것은 그룹화 한 것이라고 할 수 있다.

n  그러면 교육을 6년받은 사람의 평균, 9년 받은 사람의 평균, 12년 받은 사람들의 평균, 16년 받은 사람들의 평균을 분석하는 것이 분산분석이다.

n  차이가 있다고 생각하고 분석하는 것이 regression

-       Regression을 해도 ANOVA table이 나온다.

-       F결과가, 이 평균점들이 (6, 9, 12, 16) 차이가 있다는 것을 말해주는 것이다.

 

상호작용 예시)

-       남자와 여자가 기본적으로 2600달러 차이가 있다(절편이 다르다)

-       성별과 교육 사이의 상호작용 효과는 통계적으로 유의하지 않다. 따라서 임금에 대한 교육의 효과는 남/여 차이가 없다.

-       결과적으로 상호작용이 없는 회귀분석 모델을 채택하는 것이 바람직하다 (간결성의 원칙, Parsimony의 원칙)

 

Modeling non-linear effect

-       Scatterplot을 그려보면 모양이 exponential할 수 있다.

-       선형관계는 낮은 쪽이든 높은 쪽이든 x한단계 올라갈 때 y 한단계 올라가야 한다. Exponential비선형관계임.

-       보통은 두 가지를 활용한다. : original metric이 있지만, 자연로그를 이용하거나, 제곱하거나 세제곱하는 식으로 power를 높여서 선형으로 만든다 아이디어.

n  Natural logarithm

n  Polynomial transformation

-       Regression은 직선관계만 할 수 있는 것이므로 직선관계가 아니라면, assumption을 위반하지 않기 위해서는 직선으로 펴서해야 한다.

 

비선형(nonlinear)관계의 예

-       낮은 단계에서는 일인당 소득이 조금만 올라가도 평균수명은 매우 빠르게 올라간다.

-       그러나 높은 단계에서는 일인당 소득이 많이 올라가도 평균수명이 더 이상 증가하지 않는다.

 

-       어떻게 수정할 것인가?

n  변수 변환하기(variable transformation) : usually natural (Log transformation)

n  Polynomial equation : Raise the variable to a certain power, usually square the variable.

 

종속변수는 normal distribution 형태가 되도록 만든 다음에 분석해야 한다.

-       따라서 소득분포곡선에 log 값을 취하여 분포를 보면

n  1 à 0

n  10 à 2.3

n  1000 à 6.9

-       왜도/첨도 값이 높은 분포를 log 점수로 변환함으로서 정상분포와 유사하게 만든다. 물론, 개별값들의 순서는 변하지 않는다.

-       왜도와 첨도가 조정되어 정상분포처럼 된다.

 

로그를 취하면 정적편포일 경우 정상분포에 가갑게 만들어준다.

 

Y=B0 + B1X1 + B2X1^2

-       여기서 B2가 유의미하다면, 비선형관계가 있다는 의미일 것.

-       평균수입 = B0 + 1600x나이 - 20x나이^2이라고 하면,

n  나이가 올라갈 때 초반에는 수입이 증가하나, 일정 나이를 넘어가면 감소하기 시작함.

 

R-squared : the coefficient of multiple determination

-       다중회귀분석에도 R^2이 있다. 설명된 분산의 비율.

-       1-R^2 = residual

-       특성

n  0 1사이이다.

n  R^2값이 크면 클수록 이것이 포함된 독립변수의 설명력이 높다는 뜻.

n  다른 변수 하나를 포함시키면 대개 R^2는 증가한다.

 

Adjusted R-squared

-       독립변수 하나 추가하면 R^2가 증가하나 aR^2는 많이 증가하지 않는다.

-       사례가 10개인데, 독립변수 10개를 넣으면 R^2 1이 나온다고 함.

n  독립변수 숫자 = Sample 숫자 è R^2 = 1

-       aR^2는 이것을 고려한 것. 변수 수가 많을수록, 표본 적을수록 R^2 증가하는데, 이러한 단점을 보완하기 위해서 aR^2를 사용한다. (사회학에서는 대규모 표본을 사용하기 때문에 R^2 주로 사용)

-       적은 수의 표본을 사용하는 사람은 aR^2 사용해야 함.

 

-       aR^2는 그냥 R^2보다는 작다.

 

-       aR^2 = R^2 – L(1-R^2)/(N-K-1)

-       K는 독립변수 숫자, N은 사례숫자.

-       aR^2는 독립변수 숫자가 고려된 R^2라고 할 수 있다.

-       오히려 독립변수 숫자를 넣으면 자꾸 작아질 수 있다.

-       사례가 많지 않아도 독립변수가 많지 않으면 굳이 쓸 필요 없는 듯.

 

F-test for R2

-       모델의 유의성을 검증하고….

-       근데 F-test가 별로 재미없는 이유는, 변수를 여러 개 넣은 상태에서, 이 모델이 변수를 안 넣은 모델과 비교해서 improve했는지 안 했는지

-       방법1) 처음에 기본적 통제변수 넣고 돌린 값 보여주고, 관심있는 변수를 넣은 모델을 보여주고, 기존에 변수들과 비교했을 때 내 것이 얼마나 설명력 있는가를 보여주는 것.

n  단계적으로 독립변수를 넣는다고 하는데, 어느 교과에서 위계라고 했다. 위계가 아니라 단계이다.

-       방법2) 관심있는 변수 먼저 넣고, 그 다음에 통제변수 넣기

n  반드시 통제변수 넣고, 내가 추가한 변수가 효과 있다라고 할 필요는 없다.

n  통제하고 난 이후에도 효과가 줄어들거나 insignificant해지지 않는다면 그렇게 할 수도 있다.

n  통제 안한상태에서 효과 어떤지위해서 새로운 회귀계수값이 통제하든 안하든 변하지 않는 것이 좋은 것이다.

n  기존의 변수에 매개되지도 않고 영향 받지도 않는다.

.

-       K는 독립변수의 숫자.

-       MSS = TSS - ESS

 

F-test

-       유의미하다는 것은 8개 넣었다고 할 때, 8개중에 최소 1개가 유의미하다는 것이다. 별로 의미 없다.

-       요즘에는 앞에 통제변수 되게 많기 때문에, 새롭게 넣은 변수의 coefficient sig.한지 안한지가 중요하다.

 




(출처 : http://www.minimalwall.com/2010/05/10/keep-it-simple-5/)





3. 문장, 입맞춤의 원칙(KISS RULE) 


 일반적으로 명문장이라는 것은 한번 듣고서는 알 수 없는 것이 많다. 이들은  어떤 면에서는 특히 간단명료하게 의사전달을 생명으로 하는 보고서 상에서는 졸문이라고 할 수도 있다. 보고서작성의 제1원칙으로 서구에서는 KISS RULE(keep it simple and special)을 고수하고 있다. 즉 간단하면서(simple)도 보고자의 독특한 모양과 문체로 개성(special)을 표현하라는 것이다.


□ 제목(headline, title)은 미녀의 얼굴이다.


중요성에 대하여 Harvard대학 언어학 Charls H. Brown 교수는 


“제목(헤드라인)은 그 보고의 종합이요, 결정이요, 독자가 삼키기 쉽도록 캡슐에 집어넣은 증류물

( Headline is a synthesis, a crystallization, a distillation put into a capsule for easy swallowing)"


이라고 정의하기도 하였다. 


이렇게 하기 위하여 제목을 붙이는데 지켜야 할 것은 

1) 동적인 표현으로, 

2) 구체적인 표현으로, 

3) 내용을 상징하기보다는 암시적이고 설명적으로, 

4) 그리고 명사 혹은 동사를 사용할 것


등이 될 것이다.


□ 간명하고 명확하면서도 정확한 표현


누구나 쉽게 이해할 수 있는 간명(concise)하고, 명확(clear)하면서도 정확(correct)한 표현


 ○ 간결한 표현


간결한 표현을 하기 위하여서는 

1) 순접, 역접 혹은 전환의 접속사를 적절히 사용하여 고속도로와 같이 직설적인 표현, 

2) 제목을 미리 정하여 주제의 분열을 방지, 

3) 수식어, 접속사 및 삽입부분과 같은 쓸데없는 꼬리는 과감히 떼어버리기, 

4) 주부와 술부를 떼어놓지 말며, 

5) 역접(그러나), 순접(그리고), 전환접속사(그런데)를 남발하지 말아야 한다.


 ○ 명확한 표현


누구나 쉽게 이해하도록 표현하기 위하여서는 적어도 

1) 전문용어 이외는 되도록 쉬운 용어를 사용, 

2)짧은 문장은 강한 이미지를 심어 준다. 

쥬라이 시저(July Cesare)의 “왔소, 보았소, 이겼소”는 짧기 때문에 명문이다). 

3)긴 문장보다는 몇 개의 단락을 나누어 쉽게 이해를 도와야 한다. 

즉 때와 장소에 따라, 서술대상에 따라, 입장과 관점에 따라, 사고의 순서에 따라 단락을 나누어라. 

4) 숫자나 비유를 통해서 구체적인 표현을 한다.


 ○ 살아 있는 표현 

살아 있는 표현을 위해서 적어도, 

1) 구두점을 정확히 활용하되 특히 쉼표(comma)사용, 

2) 상투적이고 관용적인 용어 사용을 지양, 

3) 같은 말, 같은 표현은 식상하게 할지 모르니 지양, 

4) 최근 시사용어를 사용하여 세대차이를 없애야 한다. 

예로 복명서는 결과보고서로 행정용어 순화된 것으로 사용하는 등










출처 : http://www.tec-writing.com/mac1/sucess/upload/file_20081219120183.hwp







(출처 : http://www.uwo.ca/oncology/oncologydept/annual_report.html)



4. 참신한 보고서 작성 비밀


□ 어떻게 지시를 받아야 하는가 ? 


일반적으로 지시를 잘 받는 비결이라고는 

① 평소에 자기의 업무분야에 대하여 제1인자가 되어야 한다. 

② 현행업무에 대하여 문제발견의식과 해결의식을 갖고 늘 생각하여 여하한 질문이나 지시에도 정곡을 찌를 수 있다.

③ 지시를 받을 때는 반드시 적을 수 있도록 필기도구나 소형 녹음기 등을 갖고 간다.

④ 지시사항을 적으면서 분위기, 참석자 등을 파악하여 의중을 파악해야한다. 

⑤ 동시에 주요하다고 생각되는 것에 대하여 “ 님께서 말씀하신 것은 ...와...와로 알고 있습니다.” 라고 복창을 한다. 이렇게 하지 않고서는 제1,2,3안 등을 마련하느냐고 인력소모만 한다.

⑥ 반드시 처리기한과 견해를 달리하거나 문제점에 대해서는 진언하여 명확히 하여 둔다. 지시현장에서  확정하지 않고서는 수 차례 보고를 해도 짜증만 사고 만다. 

⑦ 예스맨(yes-man)으로서는 절대로 정확하게 지시를 받을 수 없고, 사전지식 없이는 더욱 어렵다. 

⑧ 마지막으로 중간보고 기한 등과 방향 등을 복창하고 처리기한 내에 보고 및 조치를 치하고 보고서를 작성한다.


□ 보고 받을 사람의 입장에서 생각하라


요령 있는 공무원은 새로 기관장이 오면 전부서나 직장을 방문하여 인근직원으로부터 

 ① 잘 했다고 칭송을 받은 문서를 2 ~3 건 복사를 하여 성향을 분석한다.

 ② 인근직원으로부터 잘 사용하는 용어, 문체, 글자체, 색상, 보고서 양식, 배열 등에 대하여 정보를 수집

 ③ 기존직원들이 의중을 파악한 방법, 귀띔해 주는 사항(유의사항, 조심할 사항 등)에 대하서 간파한다.  


그리고, 보고서를 작성할 때는 입장을 바꿔 생각해서 

① 보고를 받기에 가장 편리한 시간인가 생각한다. 

감정이 격화된 시간, 배가 고플 때, 중식 후 오수가 오는 시간, 명상하는 시간대 등을 파악한다. 

② 보고를 받는 사람이 준비할 사항을 생각한다. 

기념식장에 참석한다면 대회사(식사, 기념사, 축사등), 회비, 동령부인(同令婦人), 보조직원 등을 보고서에 넣어야한다. 

③ 관련된 인적사항, 사전에 알아야 할 사항 등을 생각한다. 

가령 개소식에 참석한다면 참석하는 국회의원, 유지 분의 인적사항 등을 사전에 알려야 한다. 향교 향음주례(鄕飮酒禮)에 참석한다면 유교적 주법과 용어 등을 익혀야 한다.

④ 과거와 현장의 분위기를 사전에 파악하여 보고한다. 

집단민원 시에는 사건의 전말과 과거경위 및 주동자의 난폭행위 경계등에 대하여 사전에 준비해야 한다. 경찰동원 및 안전관리 직원을 충분히 고려해야 한다.



□ 제갈공명의 상황독파법(outline map)을 익히자.


① 조감도(鳥瞰圖, bird's-eye view)적인 견해

전문가일수록 전체를 생각하지 않는 실수를 범한다. 이런 실수를 두고 「열 개 기둥의 오류(ten-post error)」라고 한다. 판자 10개로 담장을 만들자면 현실적으로 기둥은 11개가 필요하나 10개라고 하는 실수를 두고 말한다. 

② “입장 바꿔 생각해봐“(易地思之) 

③ 앞뒤, 좌우를 연결하여 보고, 부분을 종합해 보면 전체적 윤곽이 나타난다.

④ 마지막으로 행간을 읽어라(read  between  the lines). 


□ 염라대왕의 수명부(checklist)를 활용하자. 


인간이 만든 것 중에서 체크리스트만큼 결과를 확실하게 보장하는 것은 없다. 보고서를 작성할 때에는 포함할 사항을 평시에 기록하여 놓았다가 작성 시에 하나하나 점검하는 방법이 필요하다. 


독일의 문호 괴테는 “인류발명 중에 가장 위대한 것은 복식부기와 체크리스트만이 완벽하게 한다.”고 말한 적이 있다. 

복식부기 역시 우리 나라 개성상인들이 이탈리아 베니스 상인에게 전하여 오늘날의 복식부기(double-entry bookkeeping)가 되었다고 한다. 


□ 보고서는 미니스커트(Mini-skirt) 차림의 미녀와 같다.


○ 손에 잡힐 듯이 구체화하라

① 판례, 사례나 구체적인 실례를 2 개만 들어라 (3 개는 너무 많고, 1 개는 무성의하거나 못 믿는다.)

② 현장에 데리고 가서 설명하는 것이 민원해결에서는 최고다. 아니면 현장 사진을 전후 비교하는 방법도 있다.

③ 통계는 수학의 매춘부다

남성에게는 매춘부가 없으면 아쉬운 존재임은 틀림없으나 믿을 수 있는 것은 아니다. 그러나 남성의 혼을 빼앗는데는 매춘부 이상 없다고 한다. 통계숫자 역시 확신을 심어주는 마력을 지녔다. 그래서 계량화하거나, 통계를 인용하라. 

④ 사진, 도면, 지도, 그림표, 모형, 조감도 등을 활용하여 한 눈에 볼 수 있도록 만들어라.

⑤ 최신 영상소프트웨어를 활용하여 이미지처리를 하여 시청각매체를 통해서 보고를 드려라.


○ 섹시하게 분장시켜라. 

같은 얼굴이라도 화장의 여부에 따라 달리 보이는 경우가 많다. 보고서는 문서라기보다는 자기의 의견을 피력하기 위한 상품이라고 생각하여야 한다

여기서『한 장 보고서(one-page report)』를 강조하는 이유로는 가장 짧으면서 강력한 인상을 줄 수 있는 보고서가 바로 한 장 짜리 보고서라는 것이다. OPR(한 장 짜리 보고서)의 마력은 

① 요사이 스피드 시대에 푸근한 마음으로 보고를 받고, 이야기를 나눌 뜸이 없어 대부분이 부재보고(不在報告)이고, 

② 1면으로 보고받는 사람의 심리적 부담을 최소한으로 줄이고, 

③ ‘60년대 시골 할아버지들이 초미니 아가씨를 보고서 아연실색(啞然失色)한 이유는 감출 것은 철저하게 가리고 보여 줄 것은 다 보여 주었다는 것이다. 

④ 어스름한 달밤에 한복 입은 여인처럼 오랫동안 아쉬움을 두고, 강렬한 인상을 남길 수 있다는 것이다. 

⑤ 무엇보다도 가장 경제적이라는 것이다.  


2면 이상이면 요지(gist)를 달고, 

10면 이상이면 목차(contents)를 작성하며, 

동시에 4면 이상이면 쪽번호를 붙여야한다. 


물론 보고서를 받는 사람의 편의도 생각하지만 그것보다는 보고서를 돋보이도록 하는 것이다. 최근에서는 상사에게 보고서의 좌측상단에 색지(色紙)로 귀지(dog-ear, 일명 아첨지, 아양지)를 붙이기도 한다. 요지는 적어도 제목, 주요항목과 행정사항에 상사가 선호하는 색으로 밑줄을 그어서 눈에 들게 한다. 보고서 내에는 색지(色紙)로 간지(間紙)를 넣기도 한다.







출처 : http://www.tec-writing.com/mac1/sucess/upload/file_20081219120183.hwp






(이미지 출처 : http://www.police.midland.on.ca/content/chiefs-monthly-report-board)



가. 공무원은 보고서로 말한다.


"특히 행정은 요식적 행위를 중히 여기기에 “공무원은 서류로 말하고, 서류를 위해서 존재한다”고 하기도 한다. 공무원이 작성하는 공문서 중 내부의사결정 문서인 보고서는 문서중의 문서라고 하겠다. 선진국일수록 보고서를 중시하여 미국에서는 지난 1972년부터 보고서 망국론을 제창하여 왔으나 아직도 공무원은 보고서를 작성하기 위하여 존재한다고 할만큼 활용되고 있다. 지난 1991년 “사막의 폭풍(storm of sands)”의 암호명으로 중동 전을 하는 도중 전장에서도 보고서를 작성하려고 컴퓨터를 짊어지고 다녔다고 한다."


나. 보고서 작성의 일반원칙 


최근 문서작성의 경향이 많이 변하고 있다. 직감할 수 있는 것으로 신문이나 잡지를 보면 쉽게 알 수 있다. 1985년부터 시사잡지의 대명사인 타임(Time)지와 뉴스위크(News Week)지에서는 “읽는 잡지”에서 “보는 잡지”“로 변모를 하였고, 흑백신문을 고집하던 뉴욕타임(New York Times)지도 지난해부터 칼라 판을 내고 있다. 


“읽는 문서→보는 문서”의 변모 특색 : ① 박스 혹은 역상으로 요약하는 린(lean)방식 혹은 리드(lead)방식 도입, ② 사진이나 도표 등 시각적인 이미지처리를 강조, ③ 단색에서 칼라로, ④ 상징적인 표현보다는 구체화 작업을 중시, ⑤ 현장감을 강조하여 행동(연출방법)화를 용이하게 함.



이에 보조를 맞추어 국내의 잡지에서도 린(lean) 방식 편집법리드(lead)방식을 도입하고 있다. 레이아웃에 있어서도 균형(balance), 대조(contrast) 등을 중시하여 중앙배치 등의 과거관행에서 탈피하여 “여백으로 말한다” 는 불균형․파격 배치법(unbalance & broken layout)을 도입하고 있다. 행정기관의 보고서 역시 이런 경향에 편승하여 문자표현 중심에서 과감히 탈피하여 논리표현(logic-type), 통계(statistics-type)표현 및 이미지표현(image-type) 보고서를 작성하고 있다.


긴 문장을 다 읽지 않아도 알도록 요약하여 보다 눈에 띄게 여백에 요지를 다는 형식 

리드서양식 잡지나 신문에 많이 사용, 첫 단락에서 전체를 요약하는 방식

여백으로 말한다White space says more than a sentence does(여백은 문장이상을 말한다.) : 일반적으로 행간을 읽는다고도 표현하는데, ① 보고하는 목적이 무엇인가를 면책인지 정보전달인지 등, ② 보고서 작성상의 의사여과과정 및 왜곡상태, ③ 주로 누구의 생각을 담고 있는지?, ④ 보고 후에 어떤 후속사건이 있을지 등, ⑤ 최악의 경우 이 보고서로 인하여 어떻게 당할 지 등

이미지표현이미지(image)란, 미라의 얼굴을 덮던 가면(imago)에서 나온 단어로 환상적인 잔영을 의미하고, 광학에서는 실상이 렌즈를 통해서 맺혀진 허상(虛象)을, 멀티 미디아에서는 사진 등의 영상을 의미함.



1. 절대적 금지사항


□ 틀린 글자와 빠진 글자를 없애라.

1923년경 일본에서 모신문에서는 “천황(天皇)”을 야간에 작업을 하느라고 하늘천(天)자를 잘못하여 개견(犬)자로 식자하는 바람에 견황(犬皇)으로 인쇄된 사례나 1950년대 우리 나라에서도 모신문에서 “이승만 대통령”을 한자로 표기하는데 식자공의 실수로 견통령(犬統領)으로 출간한 적이 있었다. 


□ 아무리 긴 문장이라도 40 단어 미만으로

사람은 한눈에 볼 수 있는 문장은 글자수로 40 단어 미만의 길이라고 한다. 그 이상은 읽기를 기피하고 건성으로 읽는다는 것이다. 실존주의 철학자인 하이데거의 문장은 장문으로 유명하다. 한 문장이 두 페이지나 되는 것도 있으나 한 두 번 읽어서 알 수 없다. 법원에서 사용하는 판결문도 장문이라서 한 두 번 읽어서는 알지를 못 한다. 보고서는 짧은 시간에 읽어서 이해를 할 수 있어야 하기 때문이다. 긴 문자는 잘라서 표현해야 한다.


□ 보고서 1면에 17줄 이상은 적지 말라.

17 줄 이상은 답답한 느낌을 준다. 특히 업무보고서를 전문으로 하는 기획부서에서는 각실․과에서 제출한 보고서 줄 수만 세어서 조정하는 사람이 있다. 상위직에 갈수록 노안을 갖는 분이 많아서 글자의 크기(포인트 수)는 대략 13~15포인트 이상의 활자가 많이 쓰인다.


□ 명사로 끝나는 문장은 마침표를 찍지 않고, 명사형으로 끝나는 문장은 반드시 마침표를 찍는다.

개조식 보고서에서는 “...다”로 끝내기보다는 “하였음” 혹은 “이미지 만들기”와 같이 명사형으로 끝내는 경우가 많다. 이 경유는 제1 명사형“ㅁ” 혹은 제2  명사형 “기”로 끝내는 문장에는 반드시 마침표를 찍어야 한다. 예를 들면 “...하기 바람.” 혹은 “ 미녀 만들기.”와 같이 종지부를 찍는다. 


□ 문장 제일 마지막에 여는 부호가 오는 것을 금지한다. 

즉 소괄호((), 중괄호({), 대괄호([), 큰 따온표(“), 작은 따온표(‘), 부등호(<), 큰 부등호(≪), 작은 꺾쇠표시(「),큰 꺾쇠표시(『), 및 오른쪽 오목블록표(【) 등과 같은 여는 부호가 오는 경우는 있으나 이와 반대인 경우는 절대로 올 수 없다. 


□ 문단 앞이 아니고서는 문장 앞에서 띄우지는 말라.

문단의 모양을 내는 방법으로 들어 쓰기(indent), 내어 쓰기(out-dent)와 가지런히 쓰기가 있는데 문단 앞에서는 들어 쓰기를 하는 경우가 있으나 문장에서는 들어 쓰기가 없고, 문장 끝에서 띄우기 위해서 문장 앞에서는 빈칸을 두지 않는다. 최근에서는 첫 번째 문단의 첫글자를 더 크게 확대하는 경우도 있다.


 2. 상대적 금지사항


□ 외톨이를 만들지 말라

번호를 붙이든, 문자표(□, ○,ㅇ,-등)를 사용하여 나열하든 간에 외톨이를 만들지 말아야 한다.


잘못된 예 

1. 유명한 장군은

  ① 김유신

2. 우리 나라 : 대한민국


잘된 예

 1. 신라장군 : 김유신(하나인 경우는 번호를 붙이지 않음)

 2. 우리 나라 : 대한민국 


□ 같은 체계급수(hierarchy grade)는 개요번호(槪要番號) 및 부호를 같이 하라.


□ “머리를 무겁게 하는 보고서” 에서 박스 내에는 4줄 미만으로 하라.

일반적으로 박스(글상자)를 보고서 위에 놓는 것을 “머리를 무겁게 하는 보고서”로 동양에서는 80% 이상 대부분의 보고서가 이런 형식으로 되어 있을 만큼 선호하고 있다. 이에 반하여 밑을 무겁게 하는 보고서는 기피하고 있다. 머리를 무겁게 하는 경우는 박스(Box)내에 주로 결론, 요약, 목적, 지난 사건의 개요, 내역 등을 적기에 가장 적합한 형식이다. 


□ 적어도 유능한 공무원이 되자면 “보고서 1면주의(one-page report principle)” 원칙을 어기지 말라. 

공무원 사회에 사용하는 보고서의 대부분은 한 장짜리 보고서다. 연구보고서, 귀국보고서, 출장결장보고서 등 특별한 보고서가 아니면 일반적으로 한 장 짜리 보고서를 보고서라고 부르고 있을 정도다. 


□ 중간에 끝나는 보고서는 가급적 만들지 말라.

비록 한 장이지만 중간에서 끝내는 보고서는 무엇인가 성의부족을 의미하고, 주요한 내용을 빠뜨린 감을 준다. 심지어는 무언인가를 잘린 감을 주어서 문서작성에 까다로운 상사는 “그것을 자를지언정 보고서를 중간에서 자르지 말라”고 농담을 하기도 한다. 한 면이 원칙이나 2 면으로 하거나 3 면은 좋으나 반장 짜리가 나오면 글자의 크기나 줄 간격 등을 조정하여 중간에서 끝나지 않게 해야 한다






출처 : http://www.tec-writing.com/mac1/sucess/upload/file_20081219120183.hwp






표준화 회귀식 도출하기

1)     Subtract mean

2)     Divide by standard deviation

 

-       평균이 0이되기 때문에 이 과정을 거치면 절편이 사라지게 된다.

-       회귀계수에다가 표준화화는 값을 곱해주면 표준화회귀계수만 구할 수 있다.

-       요즘에는 표준화된 회귀계수는 거의 보고하지 않는다.

n  연구가 처음 시작되던 시절에는, 여러 독립변수 중 종속변수를 가장 잘 설명하는 것이 무엇인가를 비교하는 것이 의미있던 시기가 있었다.

n  그러나 이제는 비슷한 연구를 하는 학자들이 늘어나면서, 기본적으로 통제되어야 하는 독립변수가 setup된 상태가 되면서 의미가 없어졌다.

n  또한 새로운 변수를 새롭게 construct할 때 어떻게 영향을 주는지 보는 것이 더 중요해졌다. 새로 넣은 변수가, 새롭게 구축된 변수가 실질적인 의미가 있는지 없는지를 봐야 한다.

u  실질적인 의미는 본래의 metric으로 봐야 의미가 있는 것. “substantiality”가 있어야 한다.

n  그러나 여전히 만약 새로운 분야를 개척한다면 변수의 중요성을 밝힐 필요가 있다.

n  독립변수가 1SD움직일 때 종속변수가 몇 SD 움직이나? 이것이 표준화회귀계수의 의미.

n  표준점수로 바꾸고 나서 회귀식 돌리면 표준화된 회귀계수 나올 것.

 

 

표준화 vs 비표준화 계수

-       표준화 하면 절편이 없어진다!

-       나이가 1살 올라가면 173달러 올라간다. 나이가 1SD 올라가면, 소득의 0.157SD만큼 올라간다. 교육수준이 1SD올라가면 소득의 0.579SD 만큼 올라간다. 교육이 소득에 미치는 영향이 더 큰 것.

n  실제로 할 때는 분석에 포함된 n 을 고려해야한다.

n  요즘에는 별표보다는 표준오차를 표시해서 독자가 판단할 수 있도록 한다.

 

표준화 계수의 의미를 일반화해보면

-       다른 독립변수가 고려딘 상황에서 어떠한 독립변수의 1단위 변화가 초래하는 종속변수의 변화량

-       따라서 종속변수의 변화량에 영향을 미치는 독립변수를 비교가능.

 

다양한 변수 활용하기 : Dummy Variable

-       회귀분석에서 독립변수가 범주형일 때 어떻게 그 차이를 볼 수 있는지.

-       성별이라고 쓰지 않고, ‘남성이라고 쓰면 남성을 기준으로 여성을 봤다는 의미로 자연스럽게 해석될 수 있다.

n  1로 코딩을 한 것이 남성인지 여성인지 밝혀야 한다.

-       Reference category : 0이 되는 category.

n  0 vs 1의 관계

n  0이 되는 범주를 reference category라고 한다.

-       이론적인 관심이 없을 때는 N수가 가장 많은 것을 reference category로 설정하는 것이 관례.

-       소득의 disadvantage를 보려면, 여성을 1, 남성을 0으로. Coefficient (-)로 나오면, 그만큼 불리하다는 이야기. 금방 판단을 내릴 수 있다.

-       회귀계수값은 1, 2로 하든, 0, 1로 하든, 0, 10000으로 하든 똑같다.

n  코딩을 어떻게 해도 값이 2개밖에 없으면, 2개의 다른 상태를 비교하는 것으로 보여준다.

n  그런데 왜 1로 하느냐? 남자 일 때, 남자 아닐 때. 이렇게 구분하기 위해서이다.

n  여성의 코딩을 2로하면, 0.3x여성 에서 여성에 2를 넣어야 한다.

u  0, 1 코딩 : 어떤 사람의 사례가 남성이다. 그러면 0.3 x 0, 여성이면 0.3 x 1

u  1, 2 코딩 : 어떤 사람의 사례가 남성이다. 그러면 0.3 x 1, 여성이면 0.3 x 2

n  0 1로 하는 이유가 있는 것!

 

다양한 변수 활용하기 : Dummy variable

-       범주의 개수가 N이라면, N-1개의 더미 변수를 새롭게 만든다.

n  예를 들어 종교라면, 무교가 제일 많다. è 종교가 없다고 응답한 사람은 변수를 안 만들고, 없는사람-개신교, 없는사람-카톨릭, 없는사람-불교, 없는사람-그외. 이런 식으로.

n  종교가 없는 사람에 비해서


-       N-1?

n  Because if one knows the answer to all but one category, one can predict the last category

n  The last category is perfectly predictable from the previous set.

 

 

Multivariate Relationships

-       변수들 사이의 관계에 대해서 알아야 한다.

n  허위상관(Spurious) : X2 X1에 대해서, X2 Y에 대해서 각각 영향을 주면 X1 Y가 관계가 있는 것처럼 보이나, 실제로 그렇지 않다.

n  Chain : 연쇄. X1 è X2 è Y 일 때, X2를 고려하면 X1 Y의 관계가 사라진다.

n  Interaction : X2에 따라서 X1 Y의 관계가 달라진다.

n  Multiple causes : X1 X2 사이에는 관계가 없으나 각각은 Y에 영향을 미친다.

n  Mediation : X1 Y를 봤더니, 관계가 있는데, X2를 넣으니 여전히 X1 Y 관계는 있지만, 뚝 떨어진다.

 

-       Chain Mediation은 무엇이 다른가? 라는 문제가 조금 있다.

 

-       ※ interaction moderator 라고 한다. (not mediator).

 

상호작용 효과(interaction effect between 2 independent variables)

-       어느 하나를 moderator로 지칭하는 것이다. 사회학에서는 상호작용이라고 한다. 경우에 따라서 X1이 조절자일 수도 있고 X2가 조절자일 수도 있다. 독립변수 2개가 상호작용 한다는 것인데, 상호작용을 formal하게 화살표로 그리는 방법은

n         X2
     
 
X1
è Y

u  이렇게 쓴다. X1 X2의 상호작용.

-       Y = a + b1X1 + b2X2 + b3X1X2 에서 b3가 유의미하게 나왔다고 할 때..

n  b3가 통계적으로 유의미하다고 나왔다면 X1 Y에 미치는 영향이 X2의 값에 따라 달라진다. X1X2를 곱하면 상호작용 항을 만들 수 있다.

u  X1(effect) = b1 + b3X2

u  X2(effect) = b2 + b3X1

n  ) 여성이 갖는 효과가 교육 수준에 따라 달라진다.

n  ) 교육의 효과는 gender에 따라서 달라진다.

u  만약 X1이 남/(0/1)로 되어있다면 X2(소득)에 대한 영향의 계수(b3) (-)가 될 수 있다.

 

자녀를 좋은 대학에 보내기 위해서는 대학 경험이 없는 부모는 학교 교사에게 컨설팅을 받는 것이 좋고, 대학 경험이 있는 부모는 대학 tour를 하고 다니는 것이 좋다는 데이터가 있다. 이것을 부모의 정보해석능력에 따라 차이가 난 것이라고 해석했다.

-       부모의 대학 경험 + 부모의 전략 + 부모의 대학경험X부모의 전략 è 자녀의 좋은 대학

 

-       B3만 유의미하다고 나오고 B1 B2의 유의성이 사라졌다. è 다중공선성 때문에(?)그러함.

-       B1 B2만 유의미하고 B3가 유의성 없으면 빼주면 된다.

 

-       X1 X2가 연속형이든 범주형이든 그냥 곱해주는 것이다.






단순평균 vs 조건평균

-       단순평균과 조건평균일 경우에 조건평균의 제곱합 < 단순평균의 제곱합

n  , Scatterplot 을 그렸을 때 경향성이 있어야 이러한 것.

 

회귀식 추정하기

-       Y_hat = a + bX 에서 a가 음수가 될 수도 있다.

-       X Y의 공분산을 X의 분산으로 나누어준다.

-       독립변수와 종속변수의 공분산이라고 하는 것은, 이것이 서로 상관이 있는 정도. 관계를 맺고 있는 수준을 x(독립변수)가 변화하는 정도로 나누어주면 회귀계수(=기울기=b)가 구해진다.

n  S_xy / (S_x)^2 = b

-       b값이 커지면 a가 음수로 갈 수도 있으나, 실질적인 의미는 없는 경우가 많다.

n  X의 범위가 예컨대 3~10 사이라고 하고, 기울기가 가파르다면, X<3일 때 절편이 음수일 수도 있다.

 

독립성 검증(t-test) for the regression coefficient

-       t값이 작으면 0가설에 가깝다는 의미이다.

n  얻어진 회귀계수가 독립이다 = 관계가 없다 = 0이다.

n  t = (b-0) / se(b)

u  0을 표시해주는 이유는 검정값이 있다는 뜻. 그리고 검정값이 항상 0은 아니다.


-       독립변수 하나를 도입하고나서, TSS에서 남은 양, SSE를 자유도(= n-2)로 나눠줬다. n-2냐면 a b는 정해졌기 때문에 2만큼 자유도가 줄어드는 것. 그리고나서 sqrt를 했다.

n  s=sqrt(SSE/(n-2)). 이것은 독립변수 고려한 이후에 종속변수의 표준편차.

n  이것을 다시 x의 편차의 합을 루트씌운 값으로 나눠준다.

u  이것을 종합하면 SSE가 커지면 표준편차 커지고, n이 커지면 표준편차 작아지고. 표준편차 작아지면 표본으로부터 얻은 회귀계수 값이 모집단의 회귀계수 값을 더 정확하게.

u  표준편차가 작아진다는 말 = 표준오차가 작아진다는 말 = 표준오차는 모수에 대해서 떨어져있는 거리..가 작아진다는 것

u  이러기 위해서는 표본의 숫자를 높이거나, 훌륭한 독립변수를 찾아내거나 해야한다.

n  또한 df = N-p (p : parameter) 모집단에서 알고자 하는 값의 숫자가 두 개가 있어서 이것을 빼주면 자유도가 된다.

 

회귀분석이 인과관계를 말해주나?

-       아니다!

-       시간적으로 선후 관계가 있으면 인과관계를 인정하기도 하나꼭 그런 것도 아니다.

-       Counter factual analysis를 해야 한다.

 

 

회귀실의 설명력

-       독립변수를 고려하고 나서 TSS ESS로 줄어든 양

n  R^2 .49라면 49%를 설명한다는 것.

-       R^2해놓고 모델비교를 하는데, F분포를 보고 모델비교를 할 때, 단순회귀분석에도 F-test를 할 때 비교되는 모델은 Y=Y_bar와 비교하는 것이라고 했다.

-       독립변수 하나 고려했을 때 독립변수-종속변수 상관관계를 제곱하면 R^2가 된다. 상관관계가 .50으로 높아도, 설명력은 25%밖에 안되는 것.

 


상관관계와 기울기

-       기울기(b)는 공분산을 독립변수의 분산으로 나누는 것.

-       상관관계(r)는 공분산을 표준화 한 것

-       둘의 관계를 정리하면

n  r = S_x / S_y X b

n  b = S_y / S_x X r

u  표준화하면 (회귀계수)가 상관계수와 같아진다.

u  표준편차가 다 1이 된다.

-       독립변수가 한 단위 증가했을 때 종속변수는 r X SD 만큼 증가한다.

n  상관관계계수는 1보다 작다. 그래서 회귀분석을 해놓으면 X 1 SD 증가했을 때, Y Y 1 SD 이상으로 증가하는 경우는 없다!

n  회귀” : 아버지 키가 작으면 조금 커지고, 아버지 키가 크면 조금 작아진다. 결국 mediocre(평균)으로 회귀한다.

 

 

 

중다회귀분석(Multiple Regression)

 

통제변수를 충분히 통제해야 한다. 그러기 위해서는 연구문헌 검토를 잘 해야하고.

 

이민자라는 변수를 통제하고 나서, 교육이 미치는 영향만을 보자.

통제를 하지 않으면 교육의 영향을 부풀리게 되는 것.

 

통제하기(controlling, partition of variance)

-       Unique effect of migrant on income
Unique effect of education on income
Joint effect of migration and education on income

 

어떻게 해석할 것인가?

-       Partial relationship : controlling for other variable. 모델에 포함된 다른 변수 다 통제한 후에, partial relationship이 어떻게 나타나는지를 보는 것. Multivariate 분석에서는 변수 하나가 다른 변수의 영향력을 제거한 상태에서 특정 변수의 효과를 보면, control 되었다고 표현하는 것.

-       이 말을 다시 하면, 이민자 중에서 교육의 효과 / 비이민자 중에서 교육의 효과, 남자 중에서 교육의 효과 / 여자 중에서 교육의 효과.

n  일부러 dummy 변수인 경우만 말하는 것임

-       특정한 그룹 내에서의 관심갖는 변수의 효과를 보는 것. 비슷한 교육수준을 묶고.. 꼭 같은 값이 아니더라도 비슷한 수준으로 묶는 경우. 이런 식으로 통제를 한다.

 

간단한 예를 살펴보면

-       앞의 동일한 예제를 활용했음에도, 겹치는 부분을 통제하고 나니 값이 달라졌다. 이민자들 사이에서도 교육이 높으면 소득이 높다는 뜻이다.

-       분석 결과 이민자들은 교육수준을 통제한 후 매달 2520달러 덜 번다이런 식으로 설명해야 하는 것. 즉 같은 교육수준에 있는 사람들의 평균을 비교했을 때 이민자는 6년이든 9년이든 12년이든…2520달러 덜 번다..라고 하는데 현실적으로는 이렇지 않지만 현실적으로는 여기까지다.

 

회귀분석 결과 해석

-       상호작용이 없다고 하면, 이민자와 원주민 사이에서는 어느 교육수준에서도 항상 2520$ 있다는 식으로 그래프가 그려진다.

-       그러나 상호작용이 있다면 그래프가 이렇게(평행하게) 그려지지 않을 것.

 

회귀방정식 with 2 predictors : the Least Squares

-       이 식으로 예측하고 난 이후에도 제대로 맞추지 못한 것을 error라고 한다. 이 모델이 설명하지 못하는 것.

n  기대값( E(YlX1, X2)) error term이 없다.

n  기대값에 hat을 하면, Y_hat, error 값은 Yi – Yi_hat

n  이러한 error을 최소화하는 회귀선을 찾는 것.

-       Linearity assumption : 독립변수와 종속변수에 선형관계를 가진다는 전제를 하는 것.

-       회귀분석에 숨어있는 논리는 조건평균이다. 이것을 기억하자!!

-       조건을 추가할수록 error의 양이 줄어든다. = R^2가 증가한다.

n  그러나 변수를 추가하더라도 종속변수와 관계가 없는 변수를 추가하면 error가 줄어들지 않을 수 있다.

 

표준화계수(Standardized Coefficients)

-       중다회귀분석에는 2개 이상의 독립변수가 포함되므로, 상대적으로 어느 것이 더 중요한지 볼 때 표준화계수를 보는 것.

-       표준화한다는 것 = 평균에서부터 개별값을 빼고 표준편차로 나누는 것.

-       변수값들을 다 Z-score로 하고 돌리는 것이다. 이렇게 하면 표준화된 회귀계수 나오고, 상대적인 값을 비교할 수 있게 된다.

-       한 단위 변한다 = 1SD만큼 변한다. 표준화시켰을 때 평균은 0, 표준편차는 1.

-       1 표준편차에 준하는 실제 측정값은 각 변수의 분산에 따라 다르다.

-       표준화된 변수들은 그 퍼져있는 정도(dispersion)가 같다.

      

-       표준화해서 본다’ = ‘표준화회귀값을 구한다’ = 회귀계수값을 표준편차로 나눠줘서 봐도 된다.











연속변수의 확률분포라는 말의 의미가 와닿나요?

-       빈도가 확률을 나타낸다. 전체 빈도가 있고, 특정한 값을 갖는 빈도가 있을 때 그것이 확률이다.

n  특정 값에서 frequency/Total frequency = 특정 값에서의 확률

 

Large Sample(N >= 30)의 신뢰구간 구하기.

-       보통 30을 기준으로 이야기한다.

-       s라고 쓰면 표본의 표준편차, 우리는 보통 표본의 표준편차를 쓴다.

n  모집단에서는 표준편차 구할 줄 모르니까.

n  신뢰구간의 폭을 구하는 기본적 공식이다.

-       표본의 크기는 같은데

n  신뢰수준이 높아지면, è 신뢰구간의 폭이 더 커진다.

n  신뢰수준이 낮아지면 è 신뢰구간의 폭이 더 좁아진다.

 

t-분포

-       평균값 0을 중심으로 대칭이나 표준편차가 다른 것.

-       표준편차는 1보다는 크고, 실제 t분포의 모양은 표본의 크기나 자유도에 따라서 달라진다.

n  자유도가 얼만큼이냐에 따라서 모양이 달라진다.

n  양쪽이 대칭이니 왜도는 없고자유도가 떨어지면 첨도가 떨어진다.

-       그런데 t분포는 기본적으로 정규분포와 유사한 분포이고, 표본의 크기가 커지면(=자유도가 커지면) 표준정규분포에 수렴한다.

n  t분포를 활용해서, 자유도가 커지면 표준정규분포와 같아지기 때문에 보통 통계패키지에 built-in 되어있는 분포는 t분포이다.


“Robust” Statistical Method

-       Robust하다는 말이 많이 나온다. 강건하다/굳건하다라는 뜻인데,

-       통계학적인 의미는 따로 있다. 어떤 통계분석을 하려면 assumption이 있어야 한다. 검정을 배우면서 assumption이 있었다. 가장 기초적인 assumption은 표본 추출을 잘 해야한다는 가정. 이러한 가정이 위배되면 분석을 할 수 없다.

-       이러한 assumption이 위반되어도, 쓰려고 하는 통계적 방법이 유용할 때, 그 통계적 방법을 robust하다고 한다.

-       Robust라는 말을 기억해 둘 필요가 있다. “이 결과가 robust한 결과다라는 말을 쓰고.

-       “Assumption이 위반되도 이 SE를 적용하면 믿을 수 있다.” 이런 뜻.

-       t분포에서 이 이야기를 하는 이유는, t분포는 모집단이 10000개인데, 30개만 표본을 뽑았을 때 모집단의 분포 모양을 따르리라는 보장이 없다. 그래서 표본 수가 작을 때는 모집단이 정규분포를 따라야 하는데 그렇지 않은 경우가 많다. 이럴 때 t분포를 활용을 해도 검정할 수 있다. 그래서 assumption이 위반되었다는 것이며 그래서 robust라는 표현 쓴다.

 

표준정규분포는 자유도가 무한대인 t분포와 같다.

-       자유도가 30 이상이면 t점수는 z점수에 비슷하게 수렴한다.

 

실질적으로는..

-       사례수가 올라가면 z점수가 t점수가 같기 때문에, t값을 쓴다.

-       “t값이 1.96넘었나?” “t값이 얼마야?” 라고 확인하다. t값이 얼마인지.

 

 

모집단의 평균에 대한 가설검정

-       Agresti. Statistical Methods for the Social Sciences. 이 분은 categorical data 쪽으로 유명한 분. 수학을 많이 잊어버린 사회과학자들을 위해서 쓰신 책임.

-       검정을 하는 순서..

n  1. Assumption

u  quantitative variable (평균을 낼 수가 있는 변수)

u  Randomization : 표본추출법. 표본이 모집단 잘 반영하는가

u  Normal population : 충분히 n이 크면, 모집단이 반드시 정상분포를 따를 필요가 없다. 표집분포가 정상분포가 되니까.

n  2. Hypothesis

u  등가설이면 양방검증, 부등가설이면 일방검증

u  영가설이 항상 0은 아니다. 하지만 보통 0인지 아닌지를 궁금해한다. 독립적인 것은 관계가 없는 것이고, 의존적인것은 관계가 있는 것.

n  3. Test statistic

u  검정값을 빼주고, SE로 나누고, 평균일 경우는 이런 공식(se = s/sqrt(n))을 쓴다.

l  표준오차공식이 경우마다 다른데, 이건 기억을 해두자

n  4. P-value

u  P value는 검정값이 모집단에서 값이라고 전제했을 때 표본에서 이 값이 얻어질 확률.

u  검정값을(0가설 값을) 전제했을 때, 포본에서 얻어진 관찰값을 얻을 수 있는 확률.

u  P value가 크면, 0가설을 기각할 수 없다. 왜냐하면 0가설을 전제했을 때 관찰값을 얻을 확률이 크면 0가설을 기각할 수 없다.

u  표준오차하고 통계량을 알려준다. 그럼 통계량(test statistics)을 표준오차(SE)로 나눈다. 계수값에 대해서 t값을 알면, 이것이 0가설을 기각할 수 있는지 아닌지 아니까. t값이 2 이상이면 아는 것이죠. 종속변수에 영향이 있구나라고.

n  5. Conclusion

 

P value의 두 가지 의미

-       보통은 “0가설이 진실일 때의 확률이 P value이다. 그래서 이 확률이 충분히 커야 0가설을 기각할 수 없다.

n  0.05보다만 크면 0가설을 기각하지 못한다. 상당히 보수적인 것이다. 그러나 경우에 따라서 0.1보다 작으면, 다음 연구를 기대해 봐야한다든가, 다른 표본을 봐야한다고 한다. 혹은 사례수가 너무 작으면 표준오차값이 크니까, 사례수 늘리면 의미가 있을 것이다. 또는 이미 그 분야에서 확립된 관계인데, 사례수가 작아서 0.05 0.1사이인 경우가 왕왕 있다.

-       Likelihood of the observed data, if H0 were true. 이것이 사실일 때 관찰된 자료의 확률. 관찰값의 확률.

n  이것이 사실인데, 관찰값의 확률은 0.05보다 작다.

n  관찰값이 모집단에서 0인데, 관찰값이 10, 20 나왔다. 그런데 이 확률이 너무 작다. 그러면 관찰값이 이 전제(0이라는 전제)에서 나왔다고 볼 수가 없는 것.

n  표본을 뽑아서 관찰된 값의 확률이 0.05보다 작으면, 0가설의 값이 사실이라고 받아들일 수 없다.

n  관찰된 자료의 확률 이라는 표현을 기억해두세요. Maximum Likelihood Estimation (최대우도법) 에 가면 이 논리가 다시 적용된다

 

상관관계(Correlation)

-       연속변수에서 두 변수의 관계를 표현하는 것.

-       상관관계는 관계의 정도를 표현하기도 하고, 방향을 표현하기도 함.

-       -1은 최대 상관관계값. 상관관계의 최소값은 0이지 -1이 아니다.


상관관계 이해하기

-       상관관계는 어떻게 측정하나? 상관관계는 공분산에서 시작한다.

-       (연속)변수 둘의 관계에서 공분산이 나온다.

-       공분산에서 시작한다. 점을 찍어보면 상관관계가 있는 것을 생각할 수 있고. X Y pair의 좌표가 있다. coordination의 값을 보는 것. X가 얼만큼 증가하면 Y. 증가한다거나.

 

상관관계 이해하기 : 공분산

-       상관관계는 표준화해서 최소값이 0이고 최대값이 1이다

-       본질적으로 이해해야 하는 것은 공분산(covariance)이다.

n  Covariate : 연속변수인 독립변수를 covariate이라고 많이 부른다. CoVARIATE. 연속변수가 독립변수인 경우. 뭐하고 covariate한다는 이야기? 종속변수와! (함께 변한다는 이야기)

n  공분산은 x의 개별값을 x의 평균에서 뺀 값, y의 개별값을 y의 평균에서 빼고 곱한 것을 다 더해서 사례수로 나눠주는 것.


n  단위가 다르면 되면 소득-교육의 상관관계가 강한지, 교육-연령 상관관계가 강한지 알 수 없다. 따라서 표준화 하려는 것이다.

n  표준화하는 것은 평균을 빼고, SD로 나누는 것이다. 표준편차로 나누면 상관관계이다.

 

-       통계에서 괄호안의 이 식을 표현하는 말이 있다. “편차” “Deviation”

n  편차를 곱한 값을 더해서 사례수로 나눈 것을 공분산(covariance)라 부른다.

n  여기서는 다른 변수를 곱한 것이지만, 같은 변수 (X-평균)(X-평균)라고 하면 Sum of Square라고 부르고, 이것을 사례수로 나누면 분산이다

n  Sigma는 모집단의 표준편차이고 Sigma_xy 라고 되어있으면 공분산이고, Sigma_(x^2)은 분산이다.

-       표본인 경우에 n-1 해주는 것은 배웠다. 표본은 과대추정하므로, 이것을 adjust하기 위해서.

 

상관관계 이해하기

-       그러고보면, 분산(variance)은 공분산(covariance)의 특별한 케이스이다!!

 

상관관계 구하기

-       상관관계는 그 핵심에 공분산이 있다. 두 개 변수의 표준편차로 나눠준 것인데, substantially 측정단위를 통제한다는 의미이다. 상관관계의 크기, 상관의 정도, 상관의 강도, 상관의 수준을 비교할 수 있게 해주는 것.

-       상관관계는 공분산을 표준편차로 나눈 것이다.

-       Rho : 모집단의 상관관계를 rho로 표현한다.

 

상관관계의 범위

-       최대값은 두 개이다. 1 -1. ‘관계가 없다 0일때이다.

-       상관관계의 부호는 관계의 방향을 나타내는 것이지 크기를 말하는 것이 아니다!!

-       회귀계수도 마찬가지다. (-)붙었다고 작은 것이 아니다.

 

Mean : Center of Gravity for Values

-       아무런 정보가 없을 때, 평균에서 뺀 값이 편차인데, 이 편차를 제곱해서 다 더한 값을 다른 어떤 값으로 빼서 그 편차를 제곱해서 더한 값보다 더 작다.

-       단순평균에서 구해진 Sum of Square TSS라고 한다. Regression은 총자승합에서 출발하는 것이다. 총자승합의 값이 있다.

 

단순회귀분석

 

 

회귀분석의 의미

-       사람마다 소득이 다 다르다. R^2 값에 어느 정도 설명을 했는지가 나타나는 것. 소득이 사람마다 차이가 있는데, 교육 년수를 고려해보니, 소득 차이 중 R^2 만큼을 설명해내더라.

-       종속변수가 사례마다 다른 값이 나오는데, 그 이유를 찾으려고 하는 것이 회귀분석 하는 이유이다.

-       독립변수를 어떻게 찾느냐, 이것은 자기분야의 공부를 열심히 해서 찾는 것이다!!!!

 

 

최적화된 회귀선(Best Fitting Line)

-       조건평균 : x가 특정한 값의 범위에 있을 때 y. 회귀분석의 논리는 이것이다. 단순평균에서 조건평균으로 넘어간 것이 회귀분석.

-       Sum of Squared Errors(SSE) : 조건을 고려했음에도 불구하고 남은 것. Prediction이후에 남은 것이므로 Error이다. 모델을 만들었는데 모델이 딱 맞추지 못한 값이니까.

-       회귀분석은 이런 조건평균을 이으면직선이 될까요? 안된다.

-       Assumption이 있으며, 이것을 100% 충족시키는 자료는 없다. 그래서 robust라는 이야기를 하는 것이다.

-       SSE가 최소로 되도록 하는 직선을 찾는 것.

 

Regression model with error terms

-       x라는 조건하에서 y의 기대값 그래서 E(YlX)라 하는 것이고, 이것을 Y_hat  이라고 하고, 이것은 다시 a+bX로 표현될 수 있다.

-       x값이 같은 사례가 있다면, 단순평균에서의 거리가 더 큰 것들이 있다. 이것을 줄여나가는 것이 회귀분석의 목적이다.

-       단순평균과 조건평균을 비교하는데, 어떤 것이 error를 최소화하는가를 보려면 전제조건이 있다. 독립변수 x가 종속변수 y와 관계가 있어야 한다.

n  Y_bar는 단순평균 Y_hat은 조건평균.

n  조건평균의 값이 총합을 줄이려면, , 단순평균에서 얻어진 총합(TSS)보다 SSE가 더 작은 값이 되려면 독립변수-종속변수간 상관관계가 있어야 한다. 없으면 줄어들지 않는다.

-       Y=a+bx 한 다음에도 F test 값이 올라온다. F test는 모델을 비교하는 것인데, 그러면 무슨 모델과 비교했다는 것인가? Y=Y_bar와 비교한 것이다. 단순평균과의 비교. 고려한 독립변수 하나의 효과가 Y에 미치는 영향이 유의미한 경우이다.

 

총자승합

-       TSS. TSS는 단순평균을 중심으로 사람들이 평균 밑에 있고 위에 있고 왔다갔다 한다.

-       n-1, degree of freedom을 말씀드리는 이유는, missing data가 있어서 이 변수를 지워버리게 된다. y 값 혹은 x 값의 missing이 있을 수 있다. 어느 경우든 지워버린다.

-       분석 끝난 후 사례수를 보고 해야하는데, missing된 자료가 포함된 사례 개수보면 안된다.

 

오차자승합(SSE or ESS)

-       overall mean Y=Y_bar parameter가 하나니까 1을 빼주는데, 여기서는 a b의 두 개니까 n-2를  빼준다. SSE를 보고, 분석에 포함된 사례수에 2를 더해준다.

-       root mean of square error에 이 값이 보고가 된다. 이것을 나눴을 때 SSE...독립변수를 고려한 후의 종속변수의 분산이다. 종속변수의 분산인데 독립변수 고려하기 전의 분산이 있고 후의 분산이 있다.

-       SSE/(n-2)는 독립변수를 고려한 후의 분산. 따라서 root하면 독립변수 고려한 후의 종속변수의 표준편차이다.

-       이 값들이 output에 보고가 된다. 왜 보고되는지를 알아야 하니까.

 

Relations among Sum of Squares

-       TSS = SSE + Model SS

-       설명된 양이라고 표현한다. .49라면 49%가 설명된 것.

-       (TSS-SSE)/TSS = 0.49 = R^2이다. 종속변수의 값이 다른 값을 취하는...종속변수가 막 다른 값을 취하는데 왜 다른 값을 취하는지, .다른 값을 취하는 이유를 49% 설명해낸 것.

 

Cf. 제곱합 또는 자승합

-       Proportion reduction in Error. PRE. 이 값이 R^2값으로.

-       분석을 했다면 분석에 사용된 사례수가 몇 개고 설명된 분산의 양이 얼만지 설명해야 한다.

 

Ordinary Least Square (OLS)

-       단순회귀분석에서는 a b. a가 음수가 될 수도 있다. b 값이 x y의 관계를 반영하는데,관계가 steep해지면 말이 안되도 음수가 되기도 함.

-       그러나 절편값을 의미있게 만드는 방법이 있고 centering한다고 하는데, 여기서는 안 다룰 것.

-       Yi_hat Y_i 사이에는 예측오차가 존재한다. 따라서 error값을 더해주면 개별 사례값이 나온다. error의 절대값의 총합을 최소화시키는 것이 좋은 회귀식이다.

-       왜 절대값을 안 쓰고 제곱을 하는가? 몇 가지 이유가 있다.












 

분포를 이해하기 두 가지를 알아야 한다. ‘집중경향성’ ‘산포도

 

예측을 하고도 남는 것을 error라고 부르고, error의 양을 줄여나가는 것이 통계의 목적. 통계는 error에 관한 것. 이것을 어떻게 줄일 것이냐의 것이지, 정답을 찾는 것이 아니다. 독립변수가 종속변수와 상관관계가 있어야 error가 준다. 없으면 안 줄어든다.

 

그럼 상관관계가 있는 변수는 어떻게 찾나? 이것은 통계학이 알려주는 것이 아니다.

(신념이 없는 과학은 불구, 과학이 없는 신념은 맹목 – 아인슈타인)

 

평균이 가지고 있는 어마어마한 의미가 무엇인가?!

-      평균은 sum of square를 최소화한다. TSS(total sum of square).      

-      회귀분석은 조건평균이다. 독립변수를 고려한, 그 조건하에서 평균을 구하는 것.

n  독립변수라는 조건(초졸 중졸 고졸 대졸) 사이의 소득수준을 본다. 그러면 전체 소득수준의 평균과는 다르게 나타날 것.

 

표본일 경우는 n-1 한다. 표본은 분산을 과소추정하는 경향이 있어서 이것을 adjust하기 위해서 n-1을 하는 것.

본래의 matric으로 돌아가기 위해서(측정단위) 자승을 한 다음 다시 root를 한다.

 

단순평균을 사용한 경우는 TSS라고 한다.

-       총자승합 = TSS = 단순평균에서. 아무런 조건을 고려하지 않은.

-       조건이라고 하면 독립변수라는 뜻이다.

 

1,2,3,4,5 붙여놓은 것을 흔히들 Likert라고 생각하는데이 자체가 Likert는 아니다. 

조사방법론 책 읽어보세요 Likert가 무얼 했는지. 순서정해놓은 것이 Likert가 한 것이 아니다!!


정규분포는 이론적인 개념이다.

-       현실을 보기 위해서 표준이 되는 것을 개념적으로 구성하는 것. 현실에서 절대로 발견되지는 않지만, 무용지물은 아니다.

n  정규분포를 따른다라고 해야지 정규분포 이다라고 하면 틀린 것.

 

표준정규분포

-       어떠한 정규분포도 표준편차로 나눠주면 표준정규분포가 된다.

-       평균은 0이 되고, 표준편차는1이 되니까.

 

z-score를 우리말로 하면 뭐지? 표준점수!

-       분포안에서 점수의 위치를 묘사하기 위해서 표준점수를 사용하는 것.

-       평균으로부터 표준편차가 얼마나 떨어져있는지를 계산하는 것. 왜냐하면 표준편차로 나눠주니까.

-       Z-score는 평균을 구하고, 개별점수에서 평균을 빼서 표준편차로 나눠준다. 개별점수와 평균 사이의 거리.

-       95% 신뢰도를 기준으로 삼으니까….1.96이 중요하다.

 

표집분포는 정규분포를 따른다.

-       1000명 표본을 무한히 반복해서, 이것의 평균을 가지고 만든 분포.

-       실질적으로 불가능하다. 그래서 가상적/이론적 분포라고 한다.

-       1번 표본의 평균, 2번 표본의 평균, 3번 표본의 평균이 평균값 1000개를 가지고 분포를 그려본다. 그러면 그 분포는 정규분포를 따른다. 이것이 표집분포.

n  이것은 이론적인 분포. 그러나 요즘엔 bootstraping 이라고 해보기도 한다.

-       표본분포의 모양은 모집단 문포의 모양과 같아야 할테지만, 우리는 모집단 분포를 모른다. 단지 표본을 잘 뽑았으니까 모집단 분포가 이럴 것이다..라고 예측하는 것.

-       그렇지만 쌍봉으로 생긴 모집단에서 표본을 뽑고 평균을 구하면, 표본을 잘 뽑았다면 모집단의 평균값의 frequency가 가장 높아야 한다. 그러면 표본집단의 평균은 모집단의 평균이 된다. 이것이 중심극한정리이다.

-       모집단의 평균값이 가장 많이 나와야 하기 때문이다.

 

 

-       그러나 개별 표본들은 조금씩 벗어나 있을 것이고, 이것을 sampling error라고 부른다. sampling과정에서 우리의 목표는 표집오차를 최소로 하는 것. 그 방법이 모집단에서 표집단에 추출될 확률을 같게 만든 다음 무작위 추출하는 것.

 

평균을 맞췄더라도 표준편차까지 딱 맞추기는 어렵다. 표준편차의 오차도 표집오차이다. 평균도 표집오차일 뿐만 아니라. 왜 오차라고 부르냐면 모집단 값에 대해서 이야기하니까’ error, 오차라고 부른다. 편차라고 부르지 않고.

 

표집분포의 분산은 모집단 분산보다 작을 수 밖에 없다.

-       표집분포의 표준편차는 모집단 표준편차보다 작을 수 밖에 없다.

n  실제 데이터가 흩어져 있는 것이 아니라, (표집분포에 나타난 표준편차는) 평균들 사이의 거리이다.

n  그래서 이것을 adjust해주기 위해서 사례수로 나눈다. 표집분포의 표준편차를 표준오차라고 한다.

n  표준오차도 결국 표준편차이다. 그런데 구태어 표집분포의 표준편차만 표준오차라 부른다.

u  ? 오차라고 부르는 이유가, 표집분포의 평균은 모집단의 평균에 수렴한다. 우리가 알고자 하는 값은 모집단의 평균이다. 여기서 벗어나 있으니 error인 것. 알고자 하는 값은 모집단의 평균이데 이것을 알면 sample 뽑을 필요 없을 것. 여기서 벗어나 있으니..

u  표준오차는 표집분포의 표준편차.

-       표본의 크기가 커지면 오차의 양은 줄어든다. 1000 vs 10000명 하면 10000명이 모집단에 가까워질 것. 1000명에서 10배다 더 뽑아보 별로 안 줄어든다. 그래서 error의 양을 줄이기 위해서 표본을 줄이면 되잖아~ 라고 하지만 비용 때문에 표본을 키우는 것은 쉽지 않은 일이다. 10만명은 돌려야 하는데.

 

그래서 sample이 큰 것을 가지고 regression 돌리면 웬만한 것은 다 significant하다.

-       그래서 substantially 봐야지 통계적 유의미성만 보면 안된다. 회귀계수값이 실질적으로 가지는 의미를 봐야 한다.

-       통계적으로 유의미한데, 1년 교육 더 받으면 0.5원 올라간 것이 통계적으로 significant하게 보일 수 있다.

 

표준오차

-       표본평균들의 표준편차, 표집분포의 표준편차

-       모집단에 대해서 벗어난 것이다. 궁극적으로 알고자 하는 것은 모집단 값이다. 우리의 목표는 표준오차를 줄이는 것!

  

표집분포

-       표준편차와 표준오차는 다르다.

-       표준오차는 표집분포에서만 나타난다.

 

모집단분포 표본분포 표집분포

-       모집단분포와 표본분포는 닮아야 하는데, 그러나 표집분포와 닮을 필요는 없다.

-       t분포, F분포, Chi-square 등등 다 표집분포이다. 모든 분포의 기초는 표준정규분포.

 

표집분포는 이론적인 확률분포이다.

-       서울에서 1000명을 무작위 표본 뽑는다고 했을 때, 이것은 표본이고, 이것을 반복한다. 그러면 여기서 수많은 평균들을 구한 다음에, 그 평균들을 통계량이라고 부른다. Statistics.

-       그리고 이 평균들을 분포시켜보는 것이다. 그러면 이것이 (평균들의) 표집분포가 되는 것.

 

점 추정

-       추정하는 것이다. 추정하는 것이니 error가 당연히 있다.

-       그러나 점 추정은 이렇게 평균이렇게 single number로 나오는 것이 점 추정.

 

구간추정

-       0이 아니라고 결론을 내린 다음에, 교육의 효과가 0이라고 할 수 없어라고 한 다음에 어느 범위 안에 있는가를 구한다.

-       최소 떨어져봐야 10만원, 최대 30만원 사이에 나타날거야하는 것이 구간추정

 

 

신뢰구간

-       0.05에서어떻다 하는 것은 95%...이고

-       Alpha level error의 확률이다.

n  99%는 신뢰수준이고, alpha level은 그럼에도 불구하고 20만원이 0일 확률.

-       귀무가설을 기각해도 그것이 잘못될 수 있다.

n  100번 중 5번은 영가설이 맞는 확률이다.

 

Q. 표준화는 왜 하나?

-       측정 단위가 다르니까

-       표준정규분포를 따르게 되는 것은표준화하면 평균은 다 0이되교 표준편차는 1이 된다.

 

 

 

 







A "I"EAM is not a TEAM


2013. 7. 6. 


(사진 출처 : http://www.inven.co.kr/board/powerbbs.php?come_idx=2097&l=62589&iskin=lol)




좋은 팀웍이란 

불확실하고 잠재적인 팀의 이득을 위하여 

자신의 확실하고 즉각적인 이득을 포기하는 것에 있어

망설이지 않을 수 있는 

구성원간의 

신뢰.




(사진 출처 : http://www.anxiety.net/anxiety-disorders-in-children.html)




긍정적인 사고는 좋지만,
근거없는 낙관보다는
조금의 불안감을 적절히 활용한다면
상황을 더 객관적으로 바라볼 수도 있다.




우연히 한 병원에 붙은 '줄기세포 설명회' 라는 현수막을 보았다. 그리고 문득 "줄기세포"라는 단어에서 상당한 어색함을 느꼈다. 저 이상한 이름은 도대체 누가 지은걸까? 이제서야 이 "줄기세포(stem cell)"이란 단어의 어색함을 느꼈던 것은 아마도 이미 학부생때부터 너무나 자연스럽게, 많이 들어왔기 때문일터다.

즉흥적으로 생각해보았다. 줄기세포(stem cell)를 간단히 "생명체의 근원이 되는(즉, totipotent 혹은 적어도 pluripotent)"의 개념으로 도입했다면 도대체 왜 '줄기'인가? (당연히 아니겠지만) 만약 우리나라 사람이 이러한 개념을 처음 도입했다면 아마도 '뿌리세포'라고 이름을 짓지 않았을까. '근원' '근본' 이란 단어에서 '근(根)'자가 '뿌리 근'임을 생각하면 더욱 그렇다. 그렇다면 영어로는 다른가? 그렇지 않다. 영어에서도 root는 "MAIN CAUSE OF PROBLEM | [C] [주로 단수로] (문제의) 근원[핵심]", "ORIGIN | [C] [주로 복수로] 기원, 뿌리" 이란 뜻을 가지고 있다(네이버 영어사전). 짐작컨데, 아마도 영어를 모국어로 쓰는 사람이 이러한 개념을 처음 도입했더라도 그 사람은 "root cell"이라 이름을 붙였지 "stem cell"이라 명명하진 않았을 것이다.

그렇다면 도대체 왜 "뿌리세포"가 아니라 "줄기세포"인 것일까? 

몇 번의 검색을 통해 On the Origin of the Term “Stem Cell” (Cell Stem Cell, Volume 1, Issue 1, 35-38, 7 June 2007, doi:10.1016/j.stem.2007.05.013)을 찾을 수 있었다. 본문의 내용을 옮기면 아래와 같다. 

『'줄기세포'라는 용어는 일찍이 저명한 독일 생물학자 Ernst Haeckel의 1868년 저술에서 등장한다. 다윈의 진화론의 주된 추종자였던 Haeckel은 이 책에서 생물체(organism)의 진화를 '공통의 조상에서부터 내려오는 계통수(phylogenic tree)'로 묘사하고, 이 계통수를 "Stammbaume"(Family tree의 독일어)이라 칭했다. 이러한 맥락에서, Haeckel은 [모든 다세포 생물체의 진화에 있어 조상이 되는 단세포 생물체]를 "Stammzelle"(Stamm(Stem)+Zelle(Cell))이라 하였다.』

요약하자면, 줄기세포의 "줄기"는 한 독일 생물학자의 단어선택으로부터 유래했다는 것이다. (거창한 시작에 비해서 결론은 너무 단순했다.)

결론이 심심하니, 여기에 덧붙여 한가지 느낀 점이 있다면 새로운 전문 용어를 도입할 때, 용어 자체를 잘 만드는 것도 중요하지만 사실 더 중요한 것은 그 용어보다 그것의 '본질'이라는 점이다. 

※참고로 위에서 언급된 Ernst Haeckel의 이 책은 (http://openlibrary.org/books/OL23408631M/Natürliche_Schöpfungsgeschichte)에서 볼 수 있다.



+ Recent posts