◆ 출원일 : 2020.11.05
◆ 등록일 : 2021.04.28
◆ 등록번호 : 10-2248294
요약 : 본 발명에 따르면, 동일 구조의 데이터를 추출하는 방법에 있어서, 웹 사이트에 복수 개의 객체 및 상기 복수 개의 객체 각각에 포함된 속성 값이 디스플레이되어 있는 상태에서, 상기 복수 개의 객체 각각에 대응하는 복수 개의 태그 집합체가 본문 범위에 포함된 상태로 웹 언어로 표현되어 상기 웹 사이트를 이루고 있다고 할 때, 컴퓨팅 장치가, 검색 대상에 해당하는 객체의 속성 값에 해당하는 텍스트 정보를 획득하는 단계; 상기 컴퓨팅 장치가, 상기 본문 범위에 포함된 복수의 태그 각각을 검색하여, 특정 태그 집합체에 포함되어 있고 상기 텍스트 정보에 해당하는 특정 태그를 확인하는 단계; 상기 특정 태그가 다른 태그 집합체에 형제 태그를 가지고 있지 않은 경우, 상기 컴퓨팅 장치가, i) 상기 특정 태그 집합체에 포함되어 있고, ii) 상기 특정 태그의 상위 태그에 해당하며, iii) 상기 다른 태그 집합체에 형제 태그를 가지고 있는 특정 항목 태그를 검색하는 단계; 및 상기 컴퓨팅 장치가, 상기 특정 항목 태그와 형제 태그에 해당하는 항목 태그를 최상위 태그로 포함하면서 상기 본문 범위에 포함된 복수의 소정 태그 집합체를 획득하고, 이에 대응하는 복수의 소정 객체를 디스플레이하는 단계를 포함하는 방법을 제시한다.