개인용 복습공간

[Python] 파이썬으로 유튜브 크롤링 - 1 본문

Python

[Python] 파이썬으로 유튜브 크롤링 - 1

taehwanis 2021. 5. 14. 23:49

 

 

 

간단하게 유튜브에 text를 크롬 드라이버와 셀레니움을
이용해 가져와보려고 한다.

 

 

 

 

유튜브 채널에 들어가 우클릭 - 검사를 눌러서 가져올 텍스트를 확인한다. ctrl + shift+ i를 눌러서 할 수 있다.

우클릭 - 검사

 

 

동영상의 제목, 유튜버, 동영상 업로드 시기, 동영상 길이, 조회수, 동영상 url이 들어있는 text의 요소를 찾는다.

동영상 text 요소

 

 

XPath를 복사해서 코드에 넣어준다.

XPath 복사

 

 

셀레니움은 pip install selenium으로 cmd창에서 설치할 수 있다.

crawling_one.py

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
import selenium
from selenium import webdriver
from time import sleep
import time
 
URL = 'https://www.youtube.com/c/yangdailOfficial/videos'
 
driver = webdriver.Chrome(executable_path='chromedriver')
driver.get(URL)
 
time.sleep(1)
 
title = driver.find_element_by_xpath('//*[@id="video-title"]')
print(title.get_attribute('aria-label'))
print(title.get_attribute('href'))
 
sleep(1)
 
driver.close()
cs

 

결과 화면

 

Comments