파이썬 102

[웹 크롤링 - Python] User-Agent

1. User-Agent란? 우리가 보통 컴퓨터로 들어가는 사이트의 화면과 휴대폰으로 들어가는 사이트의 화면은 다르다. pc에서의 네이버 화면과, 휴대폰에서의 네이버 화면이 다르다. 이는 우리가 웹사이트에 접속할 때, 우리의 정보를 가지고 웹사이트에서 스마트폰인지 데스크탑인지 판단해서 보여주는 그런 정보를 담고 있다. 더보기 더보기 더보기 소프트웨어 에이전트가 네트워크 프로토콜 안에서 동작할 때, 문자적 식별 문자열을 피어(peer)에 제출함으로써 종종 자기 자신과 애플리케이션 유형, 운영 체제, 소프트웨어 업체, 소프트웨어 리비전을 식별한다. HTTP,[2] SIP,[1], NNTP[3] 프로토콜에서 이러한 식별 정보는 User-Agent라는 헤더 필드를 통해 전달된다. 웹 크롤러와 같은 봇은 종종 U..

[웹 크롤링 - Python] Requests 라이브러리

1. Requests란? Requests란 Python용 HTTP 라이브러리이다. Python에서 특정 웹사이트에 HTTP 요청을 보내는 모듈이라고 생각하면 될 것 같다. 좀 더 쉽게 말해서 특정 웹사이트에 HTTP 요청을 보내 HTML 문서를 받아올 수 있는 라이브러리이다. 근데 정확히 말하면 얘가 가져오는 HTML 문서는 문서가 아닌 그냥 단순한 String이고, 뒤에서 배우는 BeautifulSoup에 의해 살아있는 HTML 문서로 바뀌게 된다. 2. 설치 터미널 창에 "pip install requests" 를 치면 알아서 설치가 된다. 근데 나는 파이참을 쓰기도 했고, 이때는 pip를 잘 몰라서 그냥 File -> Setting -> Project:Python -> Python Interpret..