단행본데이터 사이언스 시리즈 063
(직장인을 위한) 데이터 분석 실무 with 파이썬: 마케팅, 영업, 기획 실무 담당자를 위한 데이터 분석의 기술
- 단체저자
- Play with data
- 청구기호
- 005.133 데이2020
- 발행사항
- 파주 : 위키북스, 2020
- 형태사항
- 349 p
- 서지주기
- 색인 포함
- ISBN
- 9791158391836
- 분류기호
- 듀이십진분류법->005.133
소장정보
위치 | 등록번호 | 청구기호 / 출력 | 상태 | 반납예정일 |
---|---|---|---|---|
지금 이용 불가 (1) | ||||
한국노동연구원 | 20004198 | 대출중 | 2021.05.27 |
지금 이용 불가 (1)
- 등록번호
- 20004198
- 상태/반납예정일
- 대출중
- 2021.05.27
- 위치/청구기호(출력)
- 한국노동연구원
목차
★ 이 책에서 다루는 예제 ★
◎ 사드(THAAD) 배치의 영향으로 중국인 관광객이 얼마나 줄었을까?
- 사회 이슈에 따른 외국인 관광객수 변화 분석
◎ 가장 뜨는 제주도 핫플레이스는 어디일까?
- 인스타그램으로 살펴보는 트렌드 분석
◎ 왜 우리동네에는 스타벅스가 없을까?
- 스타벅스 입지전략 분석
◎ 어떤 무선청소기가 인기가 좋을까?
- 다나와(가격비교 사이트)를 통한 무선청소기 브랜드별 제품 비교 분석,▣ 01장: 준비하기
1.1 마케팅, 영업, 기획 실무 담당자를 위한 파이썬 데이터 분석
1.2 실습 자료 내려받기
1.3 파이썬 준비
___1.3.1 아나콘다 내려받기
___1.3.2 아나콘다 설치
___1.3.3 주피터 노트북 준비
___1.3.4 주피터 노트북 시작하기
___1.3.5 주피터 노트북 사용하기
1.4 파이썬 맛보기
___1.4.1 파이썬 코드 입력 및 실행
___1.4.2 값 입력 및 출력
___1.4.3 리스트
___1.4.4 반복문
___1.4.5 문자열
___1.4.6 조건문
___1.4.7 함수
▣ 02장: 데이터 분석 맛보기
2.1 pandas 맛보기
___2.1.1 pandas란?
___2.1.2 데이터 불러오기(read_excel)
___2.1.3 데이터 선택 ① - 칼럼 기준
___2.1.4 데이터 선택 ② - 로우 기준
___2.1.5 데이터 통합 ① - 옆으로 통합(merge)
___2.1.6 데이터 통합 ② - 아래로 통합(append)
___2.1.7 데이터 저장(to_excel)
___2.1.8 데이터 집계(pivot_table)
2.2 웹 크롤링 맛보기
___2.2.1 selenium과 크롬드라이버 설치
___2.2.2 크롬드라이버 활용하기
___2.2.3 웹 페이지 접속
___2.2.4 웹 페이지(HTML) 다운로드
___2.2.5 HTML 구조 살펴보기
___2.2.6 크롬 브라우저에서 웹 페이지의 HTML 살펴보기
___2.2.7 BeautifulSoup을 이용한 정보 찾기
___2.2.8 HTML 정보 찾기 ① - 태그 속성 활용
___2.2.9 HTML 정보 찾기 ② - 상위 구조 활용
___2.2.10 정보 가져오기 ① - 태그 그룹에서 하나의 태그 선택하기
___2.2.11 정보 가져오기 ② - 선택한 태그에서 정보 가져오기
___2.2.12 멜론 노래 순위 정보 크롤링①
___2.2.13 selenium을 활용한 크롤링
▣ 03장: 사드 배치의 영향으로 중국인 관광객이 얼마나 줄었을까?
3.1 외국인 출입국 통계 데이터 구하기
3.2 데이터 불러오기 및 전처리
___3.2.1 불러올 데이터의 형태 파악
___3.2.2 파이썬에서 엑셀 데이터 불러오기
___3.2.3 데이터 전처리
___3.2.4 데이터 전처리 과정을 함수로 만들기
___3.2.5 반복문을 통해 다수의 엑셀 데이터를 불러와서 합치기
3.3 데이터 시각화
___3.3.1 데이터 시각화의 중요성
___3.3.2 시계열 그래프 그리기
___3.3.3 히트맵 그래프 그리기
3.4 시각화 해석하기
3.5 정리
▣ 04장: 가장 뜨는 제주도 핫플레이스는 어디일까?
4.1 인스타그램 크롤링
___4.1.1 크롤링 과정
___4.1.2 인스타그램 검색 결과 URL을 만들어서 접속하기
___4.1.3 첫 번째 게시글 열기
___4.1.4 게시글 정보 가져오기
___4.1.5 다음 게시글 열기
___4.1.6 여러 게시글 정보 수집하기
___4.1.7 수집 데이터 저장
___4.1.8 여러 엑셀 파일의 중복을 제거한 후 통합 저장
4.2 워드 클라우드
___4.2.1 워드 클라우드를 만드는 과정
___4.2.2 해시태그 데이터 불러오기
___4.2.3 해시태그 출현 빈도 집계
___4.2.4 막대차트로 해시태그 살펴보기
___4.2.5 워드 클라우드 그리기
4.3 지도 시각화
___4.3.1 지도 시각화 과정
___4.3.2 데이터 준비
___4.3.3 네이버 지도 API 가입
___4.3.4 네이버 지도 API를 활용한 장소 검색
___4.3.5 위치 정보별 인스타 게시량 정리
___4.3.6 folium을 이용한 지도 시각화 ① - 개별 표시
___4.3.7 folium을 이용한 지도 시각화 ② - 그룹으로 표시
4.4 정리
▣ 05장: 왜 우리 동네에는 스타벅스가 없을까?
5.1 데이터 수집
5.1.1 크롤링을 이용한 서울시 스타벅스 매장 목록 데이터 생성
5.1.2 서울열린데이터광장의 OPEN API를 활용한 공공데이터 수집
5.2 데이터 전처리
___5.2.1 서울시 스타벅스 매장 목록, 인구, 사업체 데이터에 시군구명, 시군구코드 추가
___5.2.2 스타벅스 분석 데이터 만들기
5.3 데이터 시각화
___5.3.1 스타벅스 매장분포 시각화
___5.3.2 시군구별 스타벅스 매장 수 시각화
___5.3.3 스타벅스 매장 수와 인구수 비교
___5.3.4 스타벅스 매장 수와 사업체 수 비교
5.4 정리
▣ 06장: 어떤 무선청소기가 인기가 좋을까?
6.1 데이터 수집 1 - 한 페이지 크롤링
___6.1.1 다나와 소개
___6.1.2 다나와 검색 페이지 접속
___6.1.3 다나와 검색 웹 페이지에서 상품 정보 가져오기
6.2 데이터 수집 2 - 여러 페이지에 걸친 다나와 검색 페이지 크롤링
___6.2.1 다나와 검색 결과 페이지 URL 분석
___6.2.2 주피터 노트북의 진행표시줄 처리
___6.2.3 여러 페이지에 걸친 상품 정보 수집
___6.2.4 수집 데이터 저장
6.3 다나와 크롤링 데이터 전처리
___6.3.1 다나와 크롤링 데이터 불러오기
___6.3.2 회사명, 모델명 정리
___6.3.3 스펙 목록 데이터 살펴보기
___6.3.4 스펙 목록에서 카테고리, 사용시간, 흡입력을 추출해서 정리
___6.3.5 무선청소기 사용시간 단위 통일시키기
___6.3.6 무선 청소기 흡입력 단위 통일시키기
___6.3.7 다나와 전처리 결과를 엑셀로 저장
6.4 무선청소기 모델별 비교 분석
___6.4.1 데이터 살펴보기
___6.4.2 가성비 좋은 제품 살펴보기
___6.4.3 데이터 시각화
___6.4.4 인기 제품의 데이터 시각화
6.5 정리