공부 발자취

  • 홈
  • 태그
  • 방명록

크롤링 1

robots.txt > 22.01.20

백준의 유저 페이지에 들어가면 아래의 사진과 같이 맞은 문제와 시도했지만 맞지 못한 문제들의 번호, 개수 등을 알 수 있다. 무슨 문제를 얼마나 풀었는 지 확인하기 위해서는 위의 내용을 스크래핑 해오는 과정이 꼭 필요하다 판단했다. 크롤링과 스크래핑의 차이 크롤링은 웹 상에 존재하는 데이터를 자동으로 수집하는 것을 말한다. 조직화 된 방식으로 크롤링하는 프로그램을 크롤러라 한다 스크래핑은 데이터 중 필요한 부분을 가져와 가공하는 것을 말한다. 크롤링/스크래핑에서 빼놓을 수 없는 것이 robots.txt이다 robots.txt는 웹 크롤러의 접근에 제약을 주기 위한 규칙이다 절대 준수해야 한다! 이건 아니지만 홈페이지에서 하지 않았으면 좋겠다는 거니까 안하는게 좋겠다 robots.txt는 홈페이지의 루트 ..

프로젝트/백준 풀이 인증 프로그램 2022.03.06
1
더보기
프로필사진

  • 분류 전체보기 (122)
    • 공부 (6)
      • 도커 (3)
      • 리버싱 (2)
      • 시스템 (3)
      • 웹 (3)
      • 안드로이드 (12)
    • 프로젝트 (9)
      • 백준 풀이 인증 프로그램 (9)
    • 책과 논문 (3)
      • 파이썬 웹 프로그래밍 (2)
    • 프로그래밍 언어 (54)
      • 파이썬 (30)
      • C언어 (20)
      • JAVA (4)
    • 잡글 (26)
      • 알바 후기 (6)
      • 목표 (6)
      • 라섹 (2)

Tag

후킹, 후기, 설치, 합격, Frida, 도커, 토이 프로젝트, 파이썬, 필기, 목표, 연습문제, c언어, 녹스, 백준, 코드 그라운드, 실습, 안드로이드, 알바, 자바, 에러,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바