헤르메스 LIFE

[Source] HTML Parsing Source 본문

Spring Framework

[Source] HTML Parsing Source

헤르메스의날개 2016. 3. 29. 13:47
728x90


JSoup : http://jsoup.org/

Jericho : http://jericho.htmlparser.net/docs/index.html


대략 살펴본 내용을 정리한거라 혹시 실무에 사용할 일이 있으면 다시 확인해야 하겠습니다.


 Jsoup

 Jericho

가독성 조금 좋음

- Row 단위로 Level별 Space구분


<HTML Loading 후 출력 결과>

<table class="confluenceTable">

 <tbody>

  <tr>

   <th class="confluenceTh">라이브러리 </th> 

   <th class="confluenceTh"> 기능 </th>

   <th class="confluenceTh"> URI 식별자 </th>

   <th class="confluenceTh"> 접두어</th>

  </tr>

 </tbody>

</table>

가독성 0 ( 제로 ) 

- 그냥 한 줄


<HTML Loading 후 출력 결과>

<table class="confluenceTable">

<tbody>

<tr>

<th class="confluenceTh">라이브러리 </th> 

<th class="confluenceTh"> 기능 </th>

<th class="confluenceTh"> URI 식별자 </th>

<th class="confluenceTh"> 접두어</th>

</tr>

</tbody>

</table>

HTML Validation 은 별루 임.


<HTML Source>

<input type="hidden" id=editLabel value="Edit">

<input type=hidden id="addLabel" value="Add Labels">

<input type="hidden" id="domainName" value=http://wiki.gurubee.net>


<HTML Loading 후 출력 결과>

<input type="hidden" id="editLabel" value="Edit">

<input type="hidden" id="addLabel" value="Add Labels">

<input type="hidden" id="domainName" value="http://wiki.gurubee.net">


" 쌍따움표로 Value는 처리해줌.

종료처리 하지 않음.


HTML Validation 은 괜찮음.


<HTML Source>

<input type="hidden" id=editLabel value="Edit">

<input type=hidden id="addLabel" value="Add Labels">

<input type="hidden" id="domainName" value=http://wiki.gurubee.net>


<HTML Loading 후 출력 결과>

<input type="hidden" id="editLabel" value="Edit" />

<input type="hidden" id="addLabel" value="Add Labels" />

<input type="hidden" id="domainName" value="http://wiki.gurubee.net" />


" 쌍따움표로 Value는 처리해줌.

/> 종료처리 해 줌.

종료되지 않음 Tag는 경고 출력해줌.

Dom 사용 방식과 유사한 문법

jQuery 처럼 Tag를 찾아 갈 수 있음.

일반적이지 않음 문법 ( 어렵진 않음 )


원하는 HTML Tag를 Dom 메소드 방식으로 찾을 수 있음.

각 Tag를 확인 하여 찾아야 함

 

 

 

 










728x90