분류 전체보기
-
[나도 코딩]웹 스크래핑 2. XpathPrograming Language/Python 2020. 11. 2. 16:25
웹 스크래핑 Xpath 이 글은 나도코딩님의 [파이썬 코딩 무료 강의 (활용편3)]을 보고 공부한 내용입니다. 웹 스크래핑 1.HTML 편 공부하고 오기 1. Xpath 이해하기 Xpath(XML path language)란? HTML 문서의 특정 부분의 위치를 찾을 때 사용하는 언어 Xpath 구성 /html/body/div/div/div/div/span/a... '/' : '/' 아래의 한단계 아래에 자식 요소 지정 '//' : '//' 아래의 모든 요소 지정 @ : xpath에서 속성을 지정할 때 사용 예시 /학년/반 '학년' 아래 자식인 모든 '반' 요소를 선택 //@반 '반'이라는 속성을 모두 선택 //반[@학생='1번'] 학생이라는 속성이 1번인 모든 반 요소를 선택 Xpath 용어 부모: 현..
-
[Python] Visual studio 환경설정Programing Language/Python 2020. 10. 30. 14:45
주제: Python file을 생성 후 환경설정 이 글은 나도코딩님의 [파이썬 코딩 무료 강의 (기본편)]을 보고 공부한 내용입니다. 1. work space 만들기 바탕화면 or 자신의 폴더에 작업공간 만들기 ex) _Python_workspace visual studio code 프로그램 설치하기 code.visualstudio.com/ Visual Studio Code - Code Editing. Redefined Visual Studio Code is a code editor redefined and optimized for building and debugging modern web and cloud applications. Visual Studio Code is free and availabl..
-
[나도 코딩] 웹 스크래핑 1.HTMLPrograming Language/Python 2020. 10. 29. 11:20
웹 스크래핑 HTML 이 글은 나도코딩님의 [파이썬 코딩 무료 강의 (활용편3)]을 보고 공부한 내용입니다. 주제: 웹 스크래핑 이해하고 실습해보기 1. 소개 및 오리엔테이션 웹 스크래핑? 웹에서 내가 원하는 정보를 추출해오는 행위 웹 스크래핑 vs 웹 크롤링 웹 스크래핑 웹 크롤링 웹에서 내가 원하는 부분만 떼어오는 개념 웹 페이지 내에서 허용된 데이터를 필요한 부분만 가져오기 웹 페이지 내에서 모든 내용을 가져오는 개념 웹 페이지 내에서 허용된 데이터를 모두 가져오기 웹 Naver, Daum, google 등과 같은 홈페이지 HTML(웹 뼈대) + CSS(웹 구성 및 디자인) + Java Script(웹이 살아있게 하기?)로 구성 주의사항 웹 스크래핑 교육을 위해서는 HTML 정도는 알고 넘어가기 웹..
-
코로나 바이러스(COVID-19)로 조건부확률 이해하기Data Analysis/베이지안 통계학(Bayesian statistics) 2020. 10. 19. 11:49
코로나 바이러스(COVID-19)로 조건부확률 이해하기 이 글은위니버스님의 [전 국민을 코로나 진단키트로 검사하지 않는 수학적 이유 | 조건부확률] 동영상을 참고하여 정리하는 자료입니다. 전 국민을 코로나 진단키트로 검사하지 않는 수학적 이유 전염병 확산 방지 전염병이 인류를 위협할 때, 진단 키트 활용해서 발병 유무를 확인할 수 있음 전염병 진단 키트의 성능? 불행하게도 100% 완벽한 진단 키트를 만들어내기는 어려움 의문1. 진단 키트의 검사 결과를 얼만큼 신뢰해야할까? 의문2. 전 국민(전수조사)를 대상으로 진단 검사를 하면 전염병 확산 방지에 도움이 될까? 의문1. 진단 키드의 검사 결과를 얼만큼 신뢰해야할까? 1. 양성과 음성의 의미를 정확하게 이해하기 우리는 상황을 매우 단순하게 보는 경향이 ..
-
R 함수 : 특정 변수 기준으로 통계 테이블 만들기Programing Language/R 2020. 10. 5. 08:53
필요한 특정 변수 추출하기특정 변수 기준으로 통계 테이블 만들기 aggregate 함수 특정한 변수를 기준으로 통계치를 낼 때 사용 R에서 내장되어 있는 iris data 활용 Code # iris data활용: 따로 불러올 필요없음 names(iris) [1] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" "Species" # Species별 Petal.Width 합계 구하기 aggregate(Petal.Width ~ Species, data = iris, sum) # 결과값 Species Petal.Width 1 setosa 12.3 2 versicolor 66.3 3 virginica 101.3 # Species별 Petal.Width 평균 ..
-
R 함수 : 특정 변수 추출하기Programing Language/R 2020. 9. 24. 15:10
필요한 특정 변수 추출하기 subset 함수 특정한 변수를 추출할 때 사용 조건이 And인 경우 : | 조건이 Or인 경우: & R에서 내장되어 있는 iris data 활용 Code # iris data활용: 따로 불러올 필요없음 names(iris) [1] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" "Species" # Species가 setosa인 data 추출 subset(iris, Species == 'setosa') # Species가 setosa이고 versicolor인 경우 # version1 subset(iris, Species == 'setosa' & Species == 'versicolor') # version2 subset(..
-
데이터 살펴보기 : 상자그림(Box plot) 그리기Data Analysis/데이터분석(Data Analysis) 2020. 9. 24. 14:32
데이터 살펴보기 상자그림(Box plot) 그리기 상자그림 연속형 변수의 특성이 요약된 그래프 연속형 변수의 전체적인 모습을 한 눈에 파악하기 아웃라이어 등의 이상치를 바로 확인 할 수 있음 Code # df_movie의 변수 살펴보기 names(df_movie) [1] "영화명" "관객수" "매출액" "상영횟수" # 관객수의 히스토그램 그리기 관객수 = movie$관객수 boxplot(관객수, main = "히스토그램") 여러 상자그림 Code # df의 변수 살펴보기 names(df) [1] "age" "sex" "bmi" "children" "smoker" "region" "charges" # 관심변수를 그룹변수 기준으로 Box plot 그리기 # 지역별 청구금액의 상자금액 그리기 # 관심변수: 청..
-
데이터 살펴보기 : 히스토그램(Histogram) 그리기Data Analysis/데이터분석(Data Analysis) 2020. 9. 24. 14:12
데이터 살펴보기 히스토그램(histogram) 그리기 히스토그램 연속형 데이터를 이용하여 자료의 분포나 흐름 등을 파악하기 주어진 연속형 데이터를 적당한 구간으로 나누어, 구간별 빈도수를 나타낸 그래프 # df_movie의 변수 살펴보기 names(df_movie) [1] "영화명", "관객수", "매출액", "상영횟수" # 관객수의 히스토그램 그리기 관객수 = movie$관객수 hist(관객수, main = "히스토그램")