# 작업에 필요한 패키지를 불러옵니다
from selenium import webdriver
from selenium.webdriver.chrome.service import Service as ChromeService
from webdriver_manager.chrome import ChromeDriverManager

# Chrome 브라우저를 오픈합니다
driver = webdriver.Chrome(service=ChromeService(ChromeDriverManager().install()))

url = "https://ldjwj.github.io/webPage/"
driver.get(url)

path = "../img/selenium01.png"
display(Image.open(path))

url = 'https://ldjwj.github.io/webPage/'
driver.get(url) # url 접속

url = 'https://ldjwj.github.io/webPage/'
driver.get(url)

selected_id = driver.find_element(By.ID, 'rank')  
print(selected_id)  
print(selected_id.tag_name)  # 해당 요소의 태그 이름  
print(selected_id.text)      # 해당 요소의 텍스트 정보

<selenium.webdriver.remote.webelement.WebElement (session="c9b318ebcedcd7dc79d1941f88f35b41", element="f.E9F922E055FFC68C99BA7D6F17DD25CE.d.A8CFFFCB0A785633E07E608CE7E4D0D7.e.2")>
a
10. 랭킹 정보 가져오기(웹 크롤링)

from selenium import webdriver  

url = 'https://ldjwj.github.io/webPage/'  
driver.get(url)  

selected_tag_h1 = driver.find_element(By.TAG_NAME, 'h1')  
print(selected_tag_h1)  
print(selected_tag_h1.tag_name)  
print(selected_tag_h1.text)

<selenium.webdriver.remote.webelement.WebElement (session="c9b318ebcedcd7dc79d1941f88f35b41", element="f.E9F922E055FFC68C99BA7D6F17DD25CE.d.DE9A340F2C276E5C6E6434C6E87F36C2.e.4")>
h1
my web page

from selenium.webdriver.common.by import By

## 전체 a태그 정보 가져오기
# selected_tags_a = driver.find_elements_by_tag_name('a')
selected_tag_a = driver.find_elements(By.TAG_NAME, 'a')
print(selected_tag_a)

[<selenium.webdriver.remote.webelement.WebElement (session="c9b318ebcedcd7dc79d1941f88f35b41", element="f.E9F922E055FFC68C99BA7D6F17DD25CE.d.DE9A340F2C276E5C6E6434C6E87F36C2.e.5")>, <selenium.webdriver.remote.webelement.WebElement (session="c9b318ebcedcd7dc79d1941f88f35b41", element="f.E9F922E055FFC68C99BA7D6F17DD25CE.d.DE9A340F2C276E5C6E6434C6E87F36C2.e.6")>, <selenium.webdriver.remote.webelement.WebElement (session="c9b318ebcedcd7dc79d1941f88f35b41", element="f.E9F922E055FFC68C99BA7D6F17DD25CE.d.DE9A340F2C276E5C6E6434C6E87F36C2.e.7")>, <selenium.webdriver.remote.webelement.WebElement (session="c9b318ebcedcd7dc79d1941f88f35b41", element="f.E9F922E055FFC68C99BA7D6F17DD25CE.d.DE9A340F2C276E5C6E6434C6E87F36C2.e.8")>, <selenium.webdriver.remote.webelement.WebElement (session="c9b318ebcedcd7dc79d1941f88f35b41", element="f.E9F922E055FFC68C99BA7D6F17DD25CE.d.DE9A340F2C276E5C6E6434C6E87F36C2.e.9")>, <selenium.webdriver.remote.webelement.WebElement (session="c9b318ebcedcd7dc79d1941f88f35b41", element="f.E9F922E055FFC68C99BA7D6F17DD25CE.d.DE9A340F2C276E5C6E6434C6E87F36C2.e.10")>, <selenium.webdriver.remote.webelement.WebElement (session="c9b318ebcedcd7dc79d1941f88f35b41", element="f.E9F922E055FFC68C99BA7D6F17DD25CE.d.DE9A340F2C276E5C6E6434C6E87F36C2.e.11")>, <selenium.webdriver.remote.webelement.WebElement (session="c9b318ebcedcd7dc79d1941f88f35b41", element="f.E9F922E055FFC68C99BA7D6F17DD25CE.d.DE9A340F2C276E5C6E6434C6E87F36C2.e.12")>, <selenium.webdriver.remote.webelement.WebElement (session="c9b318ebcedcd7dc79d1941f88f35b41", element="f.E9F922E055FFC68C99BA7D6F17DD25CE.d.DE9A340F2C276E5C6E6434C6E87F36C2.e.13")>, <selenium.webdriver.remote.webelement.WebElement (session="c9b318ebcedcd7dc79d1941f88f35b41", element="f.E9F922E055FFC68C99BA7D6F17DD25CE.d.DE9A340F2C276E5C6E6434C6E87F36C2.e.14")>]

from selenium import webdriver  
from selenium.webdriver.common.by import By  

url = 'https://ldjwj.github.io/webPage/'  
driver.get(url)  

selected_name = driver.find_element(By.NAME, 'text_get')  
print(selected_name)           # WebElement 객체 확인  
print(selected_name.tag_name)  # 태그 이름 확인   

selected_names = driver.find_elements(By.NAME, 'link_get')  
print(len(selected_names))     # name이 'link_get'인 요소가 하나이므로 길이가 1인 리스트가 반환됨

<selenium.webdriver.remote.webelement.WebElement (session="c9b318ebcedcd7dc79d1941f88f35b41", element="f.E9F922E055FFC68C99BA7D6F17DD25CE.d.375B43B6472AF4E494275D71A61B6548.e.16")>
a
2

url = 'https://ldjwj.github.io/webPage/'  
driver.get(url)  

content = driver.find_element(By.CSS_SELECTOR, 'body ul a#rank')  
print(content.text)

10. 랭킹 정보 가져오기(웹 크롤링)

url = 'https://ldjwj.github.io/webPage/'  
driver.get(url)  

# '03. 링크 가져오기(a)'라는 링크 텍스트를 가진 요소를 찾습니다.  
continue_link = driver.find_element(By.LINK_TEXT, '03. 링크 가져오기(a)')  
print(continue_link.text)

03. 링크 가져오기(a)

from selenium import webdriver  
from selenium.webdriver.common.by import By  

url = 'https://news.naver.com/'  

# 웹 드라이버를 사용하여 지정된 URL로 이동합니다.  
driver.get(url)

from selenium.webdriver.common.by import By  

# 검색 아이콘 요소 찾기  
search_icon = driver.find_element(By.XPATH, '/html/body/section/header/div[1]/div/div/div[2]/div[3]/a/span')  
print(search_icon.tag_name)  
print(search_icon.text)  
search_icon.click()  

# 검색창 요소 찾기  
search_input = driver.find_element(By.XPATH, '//*[@id="u_hs"]/div/div/input')  
print(search_input.tag_name)  
print(search_input.text)  

# 검색 버튼 요소 찾기  
search_button = driver.find_element(By.XPATH, '//*[@id="u_hs"]/div/div/button[2]')  
print(search_button.tag_name)  
print(search_button.text)  

# 검색어 입력 및 검색 실행  
search_input.send_keys("패션")  
search_button.click()

span
검색
input

button
뉴스검색

from selenium.webdriver.common.by import By  

# 웹 페이지 URL 접속  
url = 'https://ldjwj.github.io/webPage/'  
driver.get(url)

base_xpath = '/html/body/ul/a['
end_xpath = ']'

for i in range(1,10,1):
    one_xpath = base_xpath + str(i) + end_xpath
    data = driver.find_element(By.XPATH, one_xpath)
    print(data.text)

01. 제목 가져오기(title)
02. 텍스트 가져오기(p)
03. 링크 가져오기(a)
04. 이미지 정보 가져오기(img)
05. 리스트 정보 가져오기(ul,ol)
06. id를 활용한 정보 획득
07. class를 활용한 정보 획득
08. 하나의 이미지 다운로드
09. 여러개의 이미지 다운로드

셀레니움 실습(동적)을 통해 알아보기¶

학습 내용¶

(1) Selenium은 무엇인가요?

사전 준비¶

설치¶

01. 요소 찾기¶

하나의 DOM(객체)에 접근 - element¶

여러개의 DOM(객체)에 접근 - elements¶

(1) 웹 브라우저를 자동으로 띄워보기

(2) 웹 페이지에 접속해 보기

(3) 일부 정보 id를 이용하여 가져오기

(4) 태그이름을 이용하여 접근

(5) name을 이용하여 접근¶

(6) 클래스 이름을 이용한 찾기

(7) selector를 이용한 접근

(8) Link Text를 이용하여 접근하기

(9) 웹 제어하기

9-1 마우스 제어¶

(10) 여러개의 정보를 xpath를 이용해서 가져와 보기

history¶