한국노동연구원 전자도서관

로그인

한국노동연구원 전자도서관

자료검색

  1. 메인
  2. 자료검색
  3. 신착자료 검색

신착자료 검색

단행본

STATA로 배우는 경제경영통계학: Version 18

청구기호
330.015195 STA2024
발행사항
고양 : 지필미디어, 2024
형태사항
449 p
일반주기
색인 포함
ISBN
9791193187289
소장정보
위치등록번호청구기호 / 출력상태반납예정일
지금 이용 불가 (1)
한국노동연구원20004923대출중2024.09.27
지금 이용 불가 (1)
  • 등록번호
    20004923
    상태/반납예정일
    대출중
    2024.09.27
    위치/청구기호(출력)
    한국노동연구원
책 소개
통계학은 모든 데이터 관련 과학의 기본적 학문이다. 경제통계학이나 계량경제학은 경제경영 분야에서는 필수적이다. 의약학계, 이공계 및 인문사회계 분야에서도 데이터 분석은 필수이므로 다양한 응용 통계 방법론이 활용된다. 상경 계열 분야 전공 여부와 무관하게, 문과.이과 여부와 무관하게 누구라도 통계학은 현대의 교양인이라면 필수적으로 알아야 한다. 통계학과 계량경제학은 AI(인공지능) 기법을 다루는 데이터 사이언스의 기초가 된다. 승용차나 버스의 자율 주행이 되고, 사람이 Chat GPT와 채팅하여 답을 얻는 시대를 우리는 살고 있다. 이들 모두 대량의 데이터와 그 데이터를 분석함으로써 가능하게 된 것이다. 컴퓨터 기술은 눈부시게 발달되어, 임상, 관찰 횟수가 상당히 많고 변수의 개수도 상당히 많은 데이터를 체계적으로 보관하고 이동하는 것은 물론 수 많은 변수가 관여되는 계산도 컴퓨터로 빠르게 이루어진다. 기계학습(machine learning), 심층학습(deep learning) 등을 포괄하는 AI 모형을 컴퓨터로 구현하는 것이 과거에는 불가했으나, 지금은 개인 PC에서도 가능하다. 때로는 유무선 인터넷으로 연결하여 클라우드를 이용하면 된다. 이러한 과정과 분석을 포함하는 데이터 사이언스라는 분야가 크게 부각되는 중이다. 데이터 사이언스를 알기 위해서는 통계학은 기본으로 알아야 한다. 과거에는 통계학 책이든 수리통계학 책이든 열심히 풀고 외우고 연습문제 잘 풀면 통계학을 잘 한다고 했다. 아마 지금도 그런 관행은 여전할 것이다. 그런데, 그렇게 통계학이론에 관련된 문제를 잘 푸는데도 불구하고, 단지 변수 2개의 데이터만 주고 분석하라고 하면 어디서부터 무엇을 어떻게 해야 할지 모른다. 통계학 이론은 알려진 모집단과 거기에서 추출된 자료를 생각해가면서 머리, 손, 연필로 하면 된다. 하지만, 현실에서는 잘 정리되지 않은, 여기 저기서 얻어진, 어디서부터 손대야 할지 모르는, 지저분한 자료만 덩그러니 있을 뿐이다. 통계학 교과서를 열심히 공부했지만, 데이터에 훈련이 되지 않은 이는 아무것도 할 수 없다. 억지로 뭔가를 한다고 하더라도 엉터리 분석과 근거 없는 해석을 하게 된다. 예를 들어, 선형회귀분석에서 계수 베타에 대한 추정량 공식, 그것이 불편 추정량이고 일치 추정량인 것을 증명하고 외워 보았자, 현실 문제를 다룰 때는 별로 필요하지 않다. 데이터만 컴퓨터에 인식시켜주면 컴퓨터가 처음부터 끝까지 다 해주는 일이다. 그간 외웠던 것이 허망할 정도이다. 본고의 전반부는 확률과 통계학이고 후반부는 계량경제학이다. 본고는 확률.통계학 이론에 치중하지 않는다. 통계학적 내용에 Stata를 강력하게 결합해 놓았다. 국내 통계학 및 계량경제학 교과서 중 이러한 시도는 최초라고 자부한다. 모든 문제를 Stata 기반으로 설명하고 독자가 Stata를 쓸 수 있도록 하는데 초점을 맞추었다. 이론적인 확률과 통계 논의조차도 Stata를 이용하여 머리 속에서 끝나는 것이 아니라 눈 앞에 보여지도록 하였다. 예를 들어, LLN과 CLT는 그 식을 열심히 외울 것이 아니라 그 본질을 느껴야 한다. 그것이 실제 문제에 응용될 수 있어야 한다. 후반부의 계량경제학도 어렵고 그다지 현실 문제를 다룰 때 쓸모가 없는 이론적 내용은 최대한 배격하고, 하나 하나 따라하면 Stata로 계량경제학 모형을 추정하고 해석할 수 있도록 하였다. 전체적으로 독자가 Stata를 이용하여 실제로 데이터 분석을 곧바로 할 수 있도록 구성하였다. 경제학, 통계학은 물론 모든 학문은 물리학 같은 자연과학까지도 이론, 가설, 모형의 영역이 있고, 실험, 실습, 실증, 경험, 임상, 관찰의 영역이 있다. 현실에서 관찰되는 데이터는 질은 고사하고 양적으로도 없다 보니, 오래 전부터 많은 학문은 이론, 가설, 모형을 선호하는 경향이 있다. 우리 일상의 대화도 여전히 실증적 근거보다는 자기 머리 속에서 나름대로의 합리, 이성 및 논리를 바탕으로 가설적 추론에 기반하는 경우가 적지 않고, 이를 기반으로 서로 논쟁하는 경우도 많다. 실증적 근거가 나와도 이를 무시하거나 자기 가설에 맞추어 왜곡하여 주장하기도 한다. 하지만, 우리는 빅데이터의 시대를 살고 있다. 매일 매시간 지금 현재 시점에도 데이터가 쌓이는 양은 천문학적이다. 이론과 가설에 머물지 않고 아니 오히려 무시하고, 데이터를 중시하는 이들이 자율 주행 AI, 챗GPT 등을 만들어냈다. 아마 이론과 가설만을 중시했다면 이들은 지금도 운전자 머리 속의 주행 원리, 언어의 원리를 어렵게 찾고 있을 것이다. 이 책에서도 통계학에 국한하여 이론과 원리보다는 데이터를 얻고 이를 Stata로 분석하는 것에 큰 중점을 둔다. 그 이론과 원리 중 중요한 사항도 Stata로 그 의미를 보여주고자 노력한다. 이러한 실증을 지향하는 실용주의적 태도가 통계학과 계량경제학에 쉽게 접근하면서도 그걸 잘 활용하는 방식이라고 확신한다. 또한, 데이터 기반으로 통계학을 공부하는 것이 현실 문제를 푸는 가장 빠른 해법이다. 주어진 문제의 해를 손으로 풀려고 애쓰지 말기 바란다. 그런 문제는 이미 다 풀려 있다. 문제를 찾고 그 문제를 풀기 위한 데이터를 얻으려고 노력하고, 그렇게 얻어진 데이터를 Stata로 분석하여 문제의 해에 가까이 가고자 노력하길 바란다. 아울러, 사회과학 적 문제에서나 통계학적 실무에서 정확한 해를 정확히 찾으려 하지 말라. 그 해에 가까이 가면 되는 것이며 여러 가지 대안적 해를 찾는 것이다. 특히, 통계학에서는 근사적 사고를 할 필요가 있다. 통계학은 정확한 해를 찾는 것을 추구하지 않는다. 잘 근사하는 것만으로도 충분하다
목차
01 서론 02 확률변수 및 확률분포 03 경제 분석에서 자주 나오는 분포 04 대수의 법칙과 중심극한정리 05 확률변수의 기대값 06 다변량(다변수) 분포 07 표본, 표본추출 및 표본분포 08 추정 09 구간추정과 가설검정 10 Stata에서 자료 관리 11 단순회귀분석 12 단순회귀분석에서의 추론 13 다중회귀분석 14 다중회귀모형의 응용 15 회귀분석에서 발생할 수 있는 여러 문제들 16 이분산과 계열상관 17 패널자료분석