265일차 스크래피(Scrapy) - 환경 설정 및 기초

265일차 스크래피(Scrapy) - 환경 설정 및 기초

2021. 9. 20. 18:27ㆍDiary/201~300

스크래피(Scrapy)

# 참고 : 스크래피(Scrapy)는 프레임워크이다. (사용방법 숙지하고 규칙에 따라줘야함)

특징

사용방법

설치

- pip install scrapy

또는

- pip install --upgrade setuptools

- pip install pypiwin32

- pip install twisted[tls]

그래도 안된다면

- https://visualstudio.microsoft.com/ko/downloads/

Visual Studio Tools 다운로드 - Windows, Mac, Linux용 무료 설치

Visual Studio IDE 또는 VS Code를 무료로 다운로드하세요. Windows 또는 Mac에서 Visual Studio Professional 또는 Enterprise Edition을 사용해 보세요.

visualstudio.microsoft.com

스크래피 프로젝트 생성

- scrapy startproject {프로젝트이름}

크롤러(spider) 작성

# Scrapy 프로젝트인 ../Test/Test/ 폴더에서 명령어를 입력해야함.

- scrapy genspider {크롤러이름} {크롤링페이지주소}

크롤러(spider) 실행

- scrapy crawl gmarket

내장 함수인 parse의 response로 값이 떨어진다.

확인해보자.

스크래피 쉘 ( Scrapy Shell )

- scrapy shell '크롤링할 페이지 주소'

명령어

정규 표현식 사용

- response.css( ' CSS 셀렉터 ' )[인덱스].re( ' 정규 표현식 ' )

267일차 스크래피(Scrapy) - 지마켓(Gmarket) 전체 카테고리 상품 크롤링 (0)	2021.09.22
266일차 스크래피(Scrapy) - 지마켓(Gmarket) 크롤링 (0)	2021.09.21
264일차 셀레니움(Selenium) - XPATH를 활용한 페이스북(Facebook), 트위터(Twitter) 로그인 (0)	2021.09.19
263일차 셀레니움(Selenium) - 다음 뉴스 댓글 크롤링 (0)	2021.09.18
262일차 셀레니움(Selenium) - 다음 뉴스 크롤링 (0)	2021.09.17

Kwonputer: Developer Diary