지난 글을 보면 알다시피 백준의 유저 페이지에서 스크래핑, 크롤링 등의 행위는 지양된다 나도 robot.txt에 대해 알기 전 몇 번 해보긴 했지만.. 그래서 내 블로그에 올라오는 코드들 전부 원래는 URL이 백준의 유저 페이지였지만 변경해서 업로드 한다. 자바 크롤링/스크래핑에 대해 검색하면 json과 jsoup이 많이 나왔다 나는 그 중 jsoup을 사용하기로 했다 jsoup은 html을 파싱해주는 자바 오픈 소스 라이브러리이다. jsoup을 설치하고 (이때 Libraries에서 파일을 정확한 위치에 넣자!! 난 엉뚱한 곳에 넣어 계속 에러 떴다..) 본격적인 스크래핑을 시작했다 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 package main; import java.io.IOE..