-
[나도 코딩] 웹 스크래핑 1.HTMLPrograming Language/Python 2020. 10. 29. 11:20반응형
웹 스크래핑
HTML
이 글은 나도코딩님의 [파이썬 코딩 무료 강의 (활용편3)]을 보고 공부한 내용입니다.
주제: 웹 스크래핑 이해하고 실습해보기
1. 소개 및 오리엔테이션
웹 스크래핑?
- 웹에서 내가 원하는 정보를 추출해오는 행위
웹 스크래핑 vs 웹 크롤링
웹 스크래핑 웹 크롤링 웹에서 내가 원하는 부분만 떼어오는 개념
웹 페이지 내에서 허용된 데이터를 필요한 부분만 가져오기웹 페이지 내에서 모든 내용을 가져오는 개념
웹 페이지 내에서 허용된 데이터를 모두 가져오기웹
- Naver, Daum, google 등과 같은 홈페이지
- HTML(웹 뼈대) + CSS(웹 구성 및 디자인) + Java Script(웹이 살아있게 하기?)로 구성
주의사항
- 웹 스크래핑 교육을 위해서는 HTML 정도는 알고 넘어가기
- 웹페이지는 실시간으로 변동되기때문에 실습 후에는 실습 코드에서 에러 혹은 실행이 안될 수가 날 수 있음
- 실습 후에 변경된 부분을 직접 개선해보기
2. HTML 이해하기
HTML(Hyper Text Markup Language)
- 웹페이지를 만들 때 쓰는 언어
- Naver, Daum, Google 등 모든 사이트는 HTML로 만들어짐
HTML(Hyper Text Markup Language) 만들어보기
1. 환경 설정하기
- 1) 작업 폴더에 파일명.html 파일 만들기
- 2) [open in browser] Extensoin 설치
- open in browser: 웹 브라우저에서 만든 html 파일 바로 열어줌
- 3) 1_html.html 파일 만들기
- 4) 만든 1_html.html 파일 열어보기
2. hmtl 생성해보기
- 기본 홈페이지 만들어보기
기본 코드
<html> <head> <title> Data-ssung의 홈페이지 </title> </head> <body> <h1> 안녕하세요, Data-ssung입니다.</h1> </body> <html>
- 기본 홈페이지 로그인 창과 링크 창 만들어보기
코드
<html> <head> <title> Data-ssung의 홈페이지 </title> </head> <body> <h1>안녕하세요, Data-ssung입니다.</h1> <input type="text" value="아이디를 입력하세요"> <input type="password"> <input type="button" value="로그인"> <a href="http://data-ssung.tistory.com"> Data-ssung의 티스토리 블로그 </a> </body> </html>
이 글은 [나도코딩]님의 훌륭한 무료강의 [파이썬 무료 강의 활용편3]를 보고 공부한 글입니다.
반응형'Programing Language > Python' 카테고리의 다른 글
[나도 코딩]웹 스크래핑 2. Xpath (0) 2020.11.02 [Python] Visual studio 환경설정 (0) 2020.10.30 자료구조와 알고리즘 (0) 2020.08.10 Python HackerRank : Forming a Magic Square (0) 2020.08.07 Python HackerRank : Grading Students (0) 2020.08.01