HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치 및 그 방법
등록번호 10-1992748조회수 122
- 기술구분
- 국방특허기술
- 기술분야
- 정보/통신
- 상세분야
- 소프트웨어
- 등록일
- 2019/06/19
- 발명자
- 이동환
기술 내용
-민수사업화명 : 머신러닝을 이용한 웹페이지 정보 추출 기법
-개요 : 본 발명은 기존에 학습된 웹페이지의 태그정보를 이용하여 정보 추출 대상 웹페이지의 태그정보에 대해 추론하거나, 정보 추출 대상 웹페이지의 태그정보에 대해 사용자 학습을 통해 태그정보를 등록하여 정보를 추출함으로써 높은 정확도를 가지고 정보를 추출하기 위한, HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치 및 그 방법에 관한 것이다.
-특징 : 기존에 학습된 웹페이지의 태그정보를 이용하여 정보 추출 대상 웹페이지의 태그정보에 대해 추론하거나, 정보 추출 대상 웹페이지의 태그정보에 대해 사용자 학습을 통해 태그정보를 등록하여 정보를 추출함으로써 높은 정확도를 가지고 정보를 추출하기 위한, HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치 및 그 방법을 제공한다.
-민수활용분야 : 인공지능 기반의 웹 봇, 크롤러, 웹 취약점 탐지 도구의 제작 등
-출원일 : 2017-06-16
-등록일 : 2019-06-19