Jsoup
자바에서 사용가능한 HTML 파서
HTML 문서를 읽어들인 후 문서를 DOM객체로 변환
AsyncHttpClient와 같은 네트워크 전용 라이브러리로 HTML을 읽은 후 String을 Jsoup으로 변환
*Jsoup은 네트워크 라이브러리가 아님으로
Jsoup 다운로드 & 참조
http://hc.apache.org/downloads.cgi
Jsoup 사용방법
(1)HTML 문서 읽기
(2)DOM객체로 변환
(3)Selector API를 이용하여 Element에 접근
전통적인 방식의 Navigating API
getElementById();
: Id는 고유 속성임으로 element를 사용ㅁ
getElementsByTag();
getElementsByClass();
getElementsByAttribute();
Jquery 방식의 Navigating API
전통적인 방식에서 메소드를 여러번 호출해야하는 일을 한번에 할 수 있음
select메소드 사용
Jquery의 selector와 비슷한 String인자 입력
Elements값 리턴
Traversing API
Node에 직접 접근하는 API가 아닌 특정 노드와 연관된 Element를 찾는 API
siblingElements()
firstElementSibling()
lastElementSibling()
nextElementSibling()
previousElementSibling()
parent(), children(), child(int index)
특정 노드의 data를 가져오는 API
attr(String key), attributes()
id()
className(), classNames()
text()
html(), outerHtml()
data()
tag(), tagName()
'학습 log (이론) > web' 카테고리의 다른 글
'UML과 클래스다이어그램' (0) | 2017.07.27 |
---|---|
'json과 xml' (0) | 2017.07.27 |
'Spring MVC' Maven 프로젝트 (0) | 2017.07.27 |
'myBatis' (0) | 2017.07.27 |
'MongoDb' (0) | 2017.07.17 |