262일차 셀레니움(Selenium) - 다음 뉴스 크롤링
2021. 9. 17. 20:47ㆍDiary/201~300
[ 크롤링할 뉴스 기사 ]
https://news.v.daum.net/v/20210916215439825
출시 1년된 카카오워크, 누적 가입자 45만 돌파
(지디넷코리아=임유경 기자)카카오엔터프라이즈(대표 백상엽)는 출시 1주년을 맞은 카카오워크의 누적가입자가 45만 명을 돌파했다고 16일 밝혔다. 카카오엔터프라이즈에 따르면 동원그룹, GC
news.v.daum.net
[ 다음 뉴스 크롤링 ]
- head 태그 관련 : get_attribute("text")
- body 태그 관련 : text
1. daum_title.py
2. 결과
크롤링은 보면 알겠지만, 코드가 길지 않다. 대신에, 정확하게 가져오기 위해서 제대로 지칭해줘야 한다. 예전에 웹을 개발해보기 전에는 그냥 그렇구나 하면서 크롤링을 익혔었는데, 웹을 개발해보고나서 크롤링을 다시 접하니, 안보였던 부분들이 보이기 시작했다. 역시 개발 지식은 다 연결되어있다.
'Diary > 201~300' 카테고리의 다른 글
264일차 셀레니움(Selenium) - XPATH를 활용한 페이스북(Facebook), 트위터(Twitter) 로그인 (0) | 2021.09.19 |
---|---|
263일차 셀레니움(Selenium) - 다음 뉴스 댓글 크롤링 (0) | 2021.09.18 |
261일차 - 팬텀JS (phantomJS), 헤들리스 크롬(Headless Chrome) (0) | 2021.09.16 |
260일차 - 셀레니움(Selenium) (0) | 2021.09.15 |
259일차 - 간단한 일기 (0) | 2021.09.14 |