1) HTML 문서 소스 코드
<div class="direct_area">
<a href="http://news.naver.com/" class="link_news" data-clk="newshome">네이버뉴스</a>
<a href="http://entertain.naver.com/home" class="link_direct" data-clk="entertainment">연예</a>
<a href="http://sports.news.naver.com/" class="link_direct" data-clk="sports">스포츠</a>
</div>
* HTML 문서는 '태그'의 조합으로 이루어져 있다.
(<div></div>, <a></a>)
<태그명 속성명1="속성값1" 속성명2="속성값2"> 콘텐츠 </태그명>
: 태그는 콘텐츠를 감싸서 그 정보의 성격과 의미를 정의한다.
ex) <div> ~ </div>
* a 태그
하이퍼링크를 걸 수 있다는 특징이 있다. (a 태그만 가능!)
> a 태그의 사이에 있는 글자를 클릭하면, a 태그에 걸린 하이퍼링크로 넘어갈 수 있다.
2) selector
태그도 이름이지만, 데이터를 직접적으로 선택할 때에는 태그가 아닌 '선택자'를 이용하여 지칭을 해주어야 한다.
- 선택자가 없는 경우의 HTML 코드
<html>
<head>
</head>
<body>
<h1> 장바구니
<p> 라운드티
<span> 25 </span>
<span> 29000 </span>
<span> 의류</span>
<a href = 'http://www.naver.com'> 이동 </a>
</p>
<p> 시계
<span> 28 </span>
<span> 32000 </span>
<span> 액세서리 </span>
<a href = 'http://www.facebook.com'> 이동 </a>
</p>
</h1>
</body>
</html>
- 선택자가 있는 경우의 HTML 코드
id, class라는 선택자를 이용하여서 위치를 지정해준 것.
<html>
<head>
</head>
<body>
<h1> 장바구니
#얘가 선택자! id, class, title
<p id='clothes' class='name' title='라운드티'> 라운드티
<span class = 'number'> 25 </span>
<span class = 'price'> 29000 </span>
<span class = 'menu'> 의류</span>
<a href = 'http://www.naver.com'> 바로가기 </a>
</p>
<p id='watch' class='name' title='시계'> 시계
<span class = 'number'> 28 </span>
<span class = 'price'> 32000 </span>
<span class = 'menu'> 액세서리 </span>
<a href = 'http://www.facebook.com'> 바로가기 </a>
</p>
</h1>
</body>
</html>
'Development > Python' 카테고리의 다른 글
크롤링 기초 : BeautifulSoup (0) | 2022.07.26 |
---|---|
class, 객체, try& except, package (0) | 2022.07.26 |
크롤링 : select, find, attribute error (0) | 2022.05.17 |
Network Analysis (1) networkX in Python (0) | 2022.03.17 |