스크래핑
-
파이썬을 이용한 웹크롤링 연습computer_IT 2022. 6. 19. 20:25
사이트 크롤링하기(CLI) mkdir '폴더이름' cd '폴더이름' # 한빛미디어 도서목록 가져오기(다운로드) wget https://www.hanbit.co.kr/store/books/full_book_list.htm # 다른 파일로 저장할 경우(test.txt) wget https://www.hanbit.co.kr/store/books/full_book_list.htm -q -O test.txt # 원하는 텍스트만 추출 후 공백제거하기 cat full_book_list.html | grep '