본문 바로가기
학습 log (이론)/web

'Jsoup'

by abbear25 2017. 8. 9.

Jsoup

자바에서 사용가능한 HTML 파서

HTML 문서를 읽어들인 후 문서를 DOM객체로 변환

 AsyncHttpClient와 같은 네트워크 전용 라이브러리로  HTML을 읽은 후 String을 Jsoup으로 변환

*Jsoup은 네트워크 라이브러리가 아님으로


Jsoup 다운로드 & 참조 

http://hc.apache.org/downloads.cgi

https://jsoup.org/apidocs/


Jsoup 사용방법

(1)HTML 문서 읽기

(2)DOM객체로 변환

(3)Selector API를 이용하여 Element에 접근

전통적인 방식의 Navigating API

getElementById();

: Id는 고유 속성임으로 element를 사용ㅁ

getElementsByTag();

getElementsByClass();

getElementsByAttribute();

Jquery 방식의 Navigating API

전통적인 방식에서 메소드를 여러번 호출해야하는 일을 한번에 할 수 있음

select메소드 사용

Jquery의 selector와 비슷한 String인자 입력

Elements값 리턴

Traversing API

Node에 직접 접근하는 API가 아닌 특정 노드와 연관된 Element를 찾는 API

siblingElements()

firstElementSibling()

lastElementSibling()

nextElementSibling()

previousElementSibling()

parent(), children(), child(int index)

특정 노드의 data를 가져오는 API

attr(String key), attributes()

id()

className(), classNames()

text()

html(), outerHtml()

data()

tag(), tagName()


반응형

'학습 log (이론) > web' 카테고리의 다른 글

'UML과 클래스다이어그램'  (0) 2017.07.27
'json과 xml'  (0) 2017.07.27
'Spring MVC' Maven 프로젝트  (0) 2017.07.27
'myBatis'  (0) 2017.07.27
'MongoDb'  (0) 2017.07.17