user agent

몽자비루 ㅣ 2023. 4. 17. 13:41

 

import requests
url = "<https://www.melon.com>"
# uster_agent를 입력함으로서 실제 크롬에서 접속하는것과 동일한 결과를 받을 수 있음.
header = {'User-Agent':("Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
                   "AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Safari/537.36")}
# 응답코드가 403이면 권한없음.
res = requests.get(url, headers=header)
# res.raise_for_status()
print("응답코드 : ",res.status_code)
# mygoogle.html 을 쓰기모드로 열고 res.text를 입력.
with open("tistory.html", "w", encoding="utf8") as f:
    f.write(res.text)
  • 무분별한 크롤링과 서버 과부하를 막기 위해 프로그램을 통한 접속을 차단하는 사이트가 있음.
  • user_agent를 통해 직접 접속하는 것처럼 속임.

'python > python_selenium' 카테고리의 다른 글

BeautifulSoup4 활용2  (0) 2023.04.22
BeautifulSoup4 활용1  (0) 2023.04.19
BeautifulSoup4 기본  (0) 2023.04.18
정규식  (0) 2023.04.17
웹스크래핑에 필요한 이론  (0) 2023.04.16