TECH SEARCH

기술검색

창업 아이디어에 활용할 수 있는 국방기술 검색 방법과 기술멘토링 신청 안내를 확인합니다.

정보/통신

HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치 및 그 방법

등록번호 10-1992748조회수 122

기술구분
국방특허기술
기술분야
정보/통신
상세분야
소프트웨어
등록일
2019/06/19
발명자
이동환
첨부파일

기술 내용

-민수사업화명 : 머신러닝을 이용한 웹페이지 정보 추출 기법

-개요 : 본 발명은 기존에 학습된 웹페이지의 태그정보를 이용하여 정보 추출 대상 웹페이지의 태그정보에 대해 추론하거나, 정보 추출 대상 웹페이지의 태그정보에 대해 사용자 학습을 통해 태그정보를 등록하여 정보를 추출함으로써 높은 정확도를 가지고 정보를 추출하기 위한, HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치 및 그 방법에 관한 것이다.

-특징 : 기존에 학습된 웹페이지의 태그정보를 이용하여 정보 추출 대상 웹페이지의 태그정보에 대해 추론하거나, 정보 추출 대상 웹페이지의 태그정보에 대해 사용자 학습을 통해 태그정보를 등록하여 정보를 추출함으로써 높은 정확도를 가지고 정보를 추출하기 위한, HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치 및 그 방법을 제공한다.

-민수활용분야 : 인공지능 기반의 웹 봇, 크롤러, 웹 취약점 탐지 도구의 제작 등

-출원일 : 2017-06-16

-등록일 : 2019-06-19