KR20000056924A - Data conversion method for converting text file searched for art data into master table for art information analysis - Google Patents
Data conversion method for converting text file searched for art data into master table for art information analysis Download PDFInfo
- Publication number
- KR20000056924A KR20000056924A KR1019990006685A KR19990006685A KR20000056924A KR 20000056924 A KR20000056924 A KR 20000056924A KR 1019990006685 A KR1019990006685 A KR 1019990006685A KR 19990006685 A KR19990006685 A KR 19990006685A KR 20000056924 A KR20000056924 A KR 20000056924A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- master table
- text file
- record
- file
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/11—Patent retrieval
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 특허 또는 기술정보에 관한 검색자료들을 특허 또는 기술정보 분석용 마스터테이블로 자동변환하는 방법에 관한 것으로, 보다 상세하게는, 국내외적으로 널리 이용되고 있는 다양한 특허검색 시스템을 활용하여 얻어진 특허에 관한 검색자료들을 특허정보 분석용 마스터테이블이라는 특허정보 데이터베이스의 데이터로 자동변환하여 주는 방법에 관한 것이다.The present invention relates to a method for automatically converting search data related to a patent or technical information into a master table for patent or technical information analysis, and more particularly, a patent obtained by using various patent search systems widely used at home and abroad. The present invention relates to a method of automatically converting search data for a patent information database called patent information analysis master table.
오늘날 산업활동을 함에 있어서 특허권이나 실용신안권 등과 같은 산업재산권의 지위는 날로 그 중요성이 높아지고 있다. 특허권 등을 앞세운 기업은 그렇지 못한 기업에 비해 기술경쟁과 시장개척 등의 면에서 보다 유리한 조건을 확보할 수 있는 가능성을 더 많이 가진다. 따라서, 기업활동에 있어서 특허권 등과 같은 산업재산권에 관한 정보를 효과적으로 활용하는 것은 아무리 강조해도 지나치지 않을 것이다.In today's industrial activities, the status of industrial property rights, such as patents and utility model rights, is increasingly important. Companies that have advanced patent rights have more possibilities to secure more favorable conditions in terms of technological competition and market development than those that do not. Therefore, the effective utilization of information on industrial property rights such as patent rights in corporate activities cannot be overemphasized.
산업재산권에 관한 정보는 다양한 형태로 이용되고 있으며, 특히 중복연구나 중복투자를 회피하기 위한 유력한 도구로 이용되고 있다. 산업재산권에 관한 정보는 일차적으로 특허자료 검색시스템을 통해 구할 수 있다. 예컨데, 각국의 특허청 또는 특허자료 검색 서비스업체의 홈페이지에 접속하여 이들 기관들이 제공하는 특허자료 검색시스템을 이용한 정보검색 혹은 영리업체가 제공하는 특허자료 검색용 시디-롬(CD-ROM)을 통한 정보검색 등이 그 예이다.Information on industrial property rights is used in various forms, and in particular, it is used as a powerful tool for avoiding duplication of research or overlapping investment. Information on industrial property rights can be obtained primarily through patent data retrieval systems. For example, you can access the homepage of each country's patent office or patent data retrieval service company and search for information using the patent data retrieval system provided by these institutions or through CD-ROM for patent data retrieval provided by commercial companies. Search is an example.
그렇지만 위와 같은 검색시스템들은 자료검색 서비스를 제공해주는 데 그칠 뿐, 기업들이 요구하는 보다 유익한 정보들을 제공해주지는 못한다. 기존의 특허권과의 중복연구 및 중복투자의 회피, 침해의 검색 또는 회피 및 경쟁기업체의 연구개발의 정도 및 개발방향 등과 같은 2차적인 정보는 위의 일차 정보를 분석 가공하여 얻어질 수밖에 없는 것이다.However, such search systems provide only data retrieval services and do not provide the more informative information that companies require. Secondary information such as duplicate research with existing patent rights, avoidance of duplicate investment, search or avoidance of infringement, and the degree and direction of R & D of competitors can only be obtained by analyzing and processing the above primary information.
이와 같은 2차적인 정보는 특허정보 분석 전문가가 검색된 자료를 직접 분석하는 매뉴얼방식에 의해 얻어질 수 있지만 효율성이 낮다. 따라서, 컴퓨터의 자료처리기능을 이용하여 검색된 자료를 가공 분석하는 별도의 분석시스템을 이용하는 것이 보다 효율적이다. 이를 위한 선행적인 과정은 검색자료를 데이터베이스화하는 작업이 된다. 즉, 특허자료 검색시스템을 통해 얻을 수 있는 검색자료는 텍스트정보와 이미지정보가 될 수 있는데, 그 중에서 특히 텍스트정보를 일정한 데이터구조를 갖는 데이터베이스로 자료변환을 하여 특허자료 분석용 마스터테이블을 구축하는 작업을 우선적으로 하여야 한다. 마스터테이블은 기술주제별로 각각 별도로 구축하면 보다 유용할 것이다. 나아가 위 마스터데이블에는 특허자료 뿐 만 아니라 각종의 기술관련 논문자료 검색시스템을 통해 얻어진 기술자료 등도 함께 정리되어 있으면 그 유용성이 더욱 강화될 수 있을 것이다.Such secondary information can be obtained by a manual method in which a patent information analysis expert analyzes the retrieved data directly, but the efficiency is low. Therefore, it is more efficient to use a separate analysis system that processes and analyzes the searched data using the computer data processing function. The preliminary process for this is to database the search data. In other words, the search data obtained through the patent data search system can be text information and image information. Among them, the text data is converted into a database having a certain data structure, and a master table for analyzing patent data is constructed. Work should be a priority. It would be more useful to build master tables separately for each technical topic. Furthermore, if the master table contains not only patent data but also technical data obtained through various technical papers retrieval systems, its usefulness may be further enhanced.
본 발명은 위와 같은 요구에 부응하기 위한 것으로서, 현존하는 다양한 특허자료 혹은 기술자료 검색 시스템들을 통하여 획득된 다양한 형식의 컴퓨터파일에 담겨진 특허 및 기술 정보를 컴퓨터를 이용하여 일정한 데이터구조를 갖는 특허 및 기술 정보 분석용 마스터테이블의 데이터로 자동변환시켜 주는 자료변환방법을 제공함을 그 목적으로 한다.The present invention is to meet the above requirements, the patent and technology having a certain data structure using a computer to the patent and technical information contained in various types of computer files obtained through various existing patent data or technical data retrieval systems Its purpose is to provide a data conversion method that automatically converts data from a master table for information analysis.
나아가, 본 발명은 위와 같은 자료변환방법을 컴퓨터에서 실행가능하게 해주는 프로그램이 기록된 컴퓨터용 기록매체를 제공함을 또 다른 목적으로 한다.Furthermore, another object of the present invention is to provide a computer recording medium having a program recorded thereon that makes the above data conversion method executable on a computer.
도 1은 본 발명에 의한 자료변환방법을 적용할 수 있는 시스템의 구성을 예시적으로 도시한 도면이다.1 is a diagram showing the configuration of a system to which the data conversion method according to the present invention can be applied.
도 2는 본 발명에 의한 자료변환방법의 실행순서를 도시한 흐름도이다.2 is a flowchart showing the execution procedure of the data conversion method according to the present invention.
도 3은 특허자료 검색용 검색시스템으로부터 검색한 자료를 이용하여 기술주제별 마스터테이블을 구축하는 본 발명의 개념을 설명하기 위한 도면이다.FIG. 3 is a view for explaining the concept of the present invention for constructing a master table for each technology topic using data retrieved from a patent data retrieval system.
도 4는 검색결과를 다운로드받아 확보된 텍스트파일을 마스터테이블로 구축하는 방법을 구체적으로 도시한 도면이다.4 is a diagram illustrating in detail a method of building a master file from a text file obtained by downloading a search result.
도 5는 중복레코드가 존재하는 경우 중복레코드의 필드통합을 실행하는 개념을 도시한 도면이다.FIG. 5 is a diagram illustrating a concept of performing field integration of duplicate records when duplicate records exist.
도 6은 중복레코드가 존재하는 경우 중복레코드의 필드대체를 실행하는 개념을 도시한 도면이다.FIG. 6 is a diagram illustrating a concept of performing field replacement of a duplicate record when a duplicate record exists.
도 7은 본 발명에 따른 자료변환방법을 수행시 컴퓨터모니터에 표시되는 주메뉴화면의 구성을 도시한다.7 shows the configuration of the main menu screen displayed on the computer monitor when performing the data conversion method according to the present invention.
도 8은 도 7의 주메뉴화면에서 사용자가 "변환화일선택" 버튼을 실행하여 자료변환 대상파일을 선택하기 위한 화면을 도시한다.FIG. 8 is a screen for selecting a data conversion target file by executing a "Select Conversion File" button on the main menu screen of FIG.
도 9는 사용자가 자료변환 대상파일을 선택한 경우 그에 따른 자료변환의 실행개시를 묻기 위한 화면을 도시한다.9 shows a screen for asking the start of data conversion according to the user selecting a data conversion target file.
도 10은 자료변환의 실행을 모두 끝마친 후 그 변환결과를 나타내는 도면으로서 특히 중복레코드가 없는 경우를 도시한다.Fig. 10 is a view showing the result of conversion after all data conversion has been executed. In particular, Fig. 10 shows a case where there is no duplicate record.
도 11은 자료변환의 실행을 모두 끝마친 후 그 변환결과를 나타내는 도면으로서 특히 중복레코드가 있는 경우를 도시한다.Fig. 11 is a view showing the result of conversion after all data conversions have been executed. In particular, Fig. 11 shows a case where duplicate records exist.
도 12는 도 11의 화면에서 변환파일명을 더블클릭한 경우 중복된 레코드의 리스트를 화면에 부가표시하는 도면이다.12 is a diagram in which a list of duplicate records is additionally displayed on the screen when the conversion file name is double-clicked on the screen of FIG.
〈도면의 주요부분에 대한 부호의 설명〉<Explanation of symbols for main parts of drawing>
100A : 특허자료 검색시스템 100B : 기술논문 검색시스템100A: Patent data search system 100B: Technical paper search system
100C : 시디-롬 130 : 컴퓨터 본체100C: CD-ROM 130: computer body
140 : 모니터 150 : 입력수단140: monitor 150: input means
160 : 보조기억수단 400 : 텍스트파일160: auxiliary storage means 400: text file
410 : 어레이 420 : 마스터테이블410: array 420: master table
본 발명의 첫번째 목적을 달성하기 위하여, 본 발명에 의한 기술자료검색 텍스트파일을 특허 및 기술 정보 분석용 마스터테이블로 변환하는 자료변환방법은, 적어도 중앙연산처리장치와 메모리와 보조기억수단을 구비한 컴퓨터본체, 컴퓨터모니터, 입력수단을 구비한 컴퓨터시스템에 있어서,In order to achieve the first object of the present invention, a data conversion method for converting a technical data search text file according to the present invention into a master table for analyzing patent and technical information comprises at least a central processing unit, a memory and auxiliary storage means. In a computer system having a computer body, a computer monitor, input means,
상기 컴퓨터모니터에는 적어도 사용자가 기술주제를 신규로 설정하거나 기설정된 기술주제를 선택할 수 있는 기술주제설정메뉴, 사용자가 선택한 기술주제에 대응하는 마스터테이블의 데이터내용을 디스플레이해주는 윈도우, 상기 마스터테이블로 변환입력시켜야 할 검색데이타를 포함하고 있는 변환대상 텍스트파일을 선택할 수 있는 파일선택메뉴를 구비한 화면을 표시해주는 제1 단계;The computer monitor includes a technology topic setting menu for allowing a user to at least set a new technology topic or select a preset technology topic, a window for displaying data contents of a master table corresponding to the technology topic selected by the user, and a conversion to the master table. A first step of displaying a screen having a file selection menu for selecting a text file to be converted including a search data to be input;
사용자가 선택한 기술주제에 대응되는 마스터테이블이 보조기억수단에 존재하면 그 마스터테이블을 열고, 존재하지 않으면 동일한 데이터구조를 갖는 신규 마스터테이블을 생성한 후 그 마스터테이블을 여는 제2 단계;A second step of opening the master table if the master table corresponding to the technology topic selected by the user exists in the auxiliary storage means, creating a new master table having the same data structure if the master table does not exist, and opening the master table;
사용자가 상기 파일선택메뉴를 통해 선택한 상기 변환대상 텍스트파일을 상기 보조기억수단에서 찾아서 변환가능한 파일인지를 파일구분자를 이용하여 검사하는 제3 단계;A third step of checking whether the text file selected by the user through the file selection menu is a file that can be converted and found by the auxiliary storage means using a file separator;
변환가능한 파일이면 상기 변환대상 텍스트파일에 대응하는 소정의 변환모듈을 인이에블시켜 상기 변환대상 텍스트파일을 여는 제4 단계;A fourth step of opening the conversion target text file by enabling a predetermined conversion module corresponding to the conversion target text file if the file is convertible;
상기 변환대상 텍스트파일을 라인단위로 파싱(parsing)하여 필드구분자를 찾고, 레코드구분자를 만날 때까지 각 필드구분자에 대응되는 필드데이타들을 어레이에 임시저장하고, 상기 어레이에 저장된 레코드데이타를 상기 마스터테이블에 임포트(import)시키는 제5 단계; 및Parsing the converted text file line by line to find a field separator, and temporarily storing field data corresponding to each field separator in an array until a record separator is encountered, and storing the record data stored in the array in the master table. Importing to the fifth step; And
상기 제5 단계를 상기 텍스트파일의 끝을 만날 때까지 반복하는 제6 단계를 구비함을 특징으로 한다.And a sixth step of repeating the fifth step until the end of the text file is met.
상기 자료변환방법은 상기 제5 단계의 실행중, 상기 어레이에 저장된 레코드데이타와 중복되는 레코드가 상기 마스터테이블에 존재하는지를 검사하는 중복검사단계를 더 구비한다. 이를 위해, 상기 제1 단계에 관련된 상기 컴퓨터모니터의 화면은 상기 어레이에 저장된 레코드데이타와 중복되는 레코드가 상기 마스터테이블에 존재하는 경우 이를 처리하는 기준을 설정하는 중복처리메뉴를 더 구비하며, 상기 중복처리메뉴는, 상기 어레이와 상기 마스터테이블간에 레코드 중복이 검출될 경우, 상기 어레이가 저장하고 있는 필드데이타들중 상기 마스터테이블에는 널(null)인 필드에 대응하는 필드데이타들만을 상기 마스터테이블에 통합(merge)할 것을 지정하는 통합버튼(merge button)과 상기 마스터테이블와 상기 어레이 사이의 널이 아닌 중복필드가 존재하면 상기 마스터테이블의 중복필드를 상기 어레이에 저장된 필드데이타로 대체할 것을 지정하는 대체버튼(replace button)을 구비한다.The data conversion method further includes a redundancy check step of checking whether a record duplicated with record data stored in the array exists in the master table during the execution of the fifth step. To this end, the screen of the computer monitor according to the first step further includes a duplicate processing menu for setting a criterion for processing a record duplicated with the record data stored in the array when the record exists in the master table. The processing menu, when record duplication is detected between the array and the master table, integrates only the field data corresponding to a field that is null in the master table among the field data stored in the array in the master table. a merge button specifying to merge and a replacement button specifying to replace the duplicate field of the master table with field data stored in the array if a non-null duplicate field exists between the master table and the array. (replace button).
본 발명의 다른 목적을 달성하기 위하여, 본 발명은 적어도 중앙연산처리장치와 메모리와 보조기억수단을 구비한 컴퓨터본체, 컴퓨터모니터, 입력수단을 구비한 컴퓨터시스템에 적용가능하며,In order to achieve the other object of the present invention, the present invention is applicable to a computer system having at least a central processing unit, a computer body having a memory and an auxiliary storage means, a computer monitor, an input means,
상기 컴퓨터모니터는 적어도 사용자가 기술주제를 신규로 설정하거나 기설정된 기술주제를 선택할 수 있는 기술주제설정메뉴, 사용자가 선택한 기술주제에 대응하는 마스터테이블의 데이터내용을 디스플레이해주는 윈도우, 상기 마스터테이블로 변환입력시켜야 할 검색데이타를 포함하고 있는 변환대상 텍스트파일을 선택할 수 있는 파일선택메뉴를 구비한 화면을 표시해주게 하고,The computer monitor includes a technology topic setting menu for allowing a user to at least set a new technology topic or select a preset technology topic, a window for displaying data contents of a master table corresponding to the technology topic selected by the user, and a conversion to the master table. Display a screen with a file selection menu for selecting a text file to be converted containing search data to be entered,
사용자가 선택한 기술주제에 대응되는 마스터테이블이 보조기억수단에 존재하면 그 마스터테이블을 열고, 존재하지 않으면 동일한 데이터구조를 갖는 신규 마스터테이블을 생성한 후 그 마스터테이블을 열며,If the master table corresponding to the technology topic selected by the user exists in the auxiliary storage means, open the master table.If not, create a new master table having the same data structure and open the master table.
사용자가 상기 파일선택메뉴를 통해 선택한 상기 변환대상 텍스트파일을 상기 보조기억수단에서 찾아서 변환가능한 파일인지를 파일구분자를 이용하여 검사하며,A file separator is used to check whether the conversion target text file selected by the user through the file selection menu can be converted and found in the auxiliary storage means.
변환가능한 파일이면 상기 변환대상 텍스트파일에 대응하는 소정의 변환모듈을 인이에블시켜 상기 변환대상 텍스트파일을 열고,If the file is convertible, a predetermined conversion module corresponding to the conversion target text file is enabled to open the conversion target text file,
상기 변환대상 텍스트파일을 라인단위로 파싱(parsing)하여 필드구분자를 찾고, 레코드구분자를 만날 때까지 각 필드구분자에 대응되는 필드데이타들을 어레이에 임시저장하고, 상기 어레이에 저장된 레코드데이타를 상기 마스터테이블에 임포트(import)시키며, 이 과정을 상기 텍스트파일의 끝을 만날 때까지 반복하므로써,Parsing the converted text file line by line to find a field separator, and temporarily storing field data corresponding to each field separator in an array until a record separator is encountered, and storing the record data stored in the array in the master table. By importing and repeating this process until the end of the text file is encountered,
기술자료검색 텍스트파일을 특허정보 분석용 마스터테이블로 자동변환시켜주는 기능을 갖는 프로그램이 기록된 컴퓨터용 기록매체를 제공한다.Technical Data Retrieval Provides a computer-based recording medium on which a program having a function of automatically converting a text file into a master table for patent information analysis is recorded.
상기 컴퓨터용 기록매체는 시디-롬(CD-ROM)이 될 수 있다.The computer recording medium may be a CD-ROM.
이하에서는 첨부한 도면을 참조하여 본 발명의 바람직한 실시예에 관하여 상세하게 설명하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명에 의한 자료변환방법을 적용할 수 있는 시스템의 구성을 예시한 도면이며, 도 3은 도 1에 도시된 특허/기술자료 검색용 시디-롬이나 컴퓨터통신을 통해 억세스한 특허/기술자료 검색시스템으로부터 검색한 자료를 이용하여 기술주제별 마스터테이블을 구축하는 본 발명의 개념을 설명하기 위한 도면이다. 또한, 도 4는 검색결과를 다운로드받아 보조기억수단에 미리 저장된 텍스트파일을 본 발명에 의한 자료변환방법을 이용하여 마스터테이블로 자동으로 변환하는 방법을 구체적으로 도시한 도면이다.1 is a view illustrating a configuration of a system to which the data conversion method according to the present invention can be applied, and FIG. 3 is a patent / patent for accessing a technical data search CD-ROM or a computer accessed through computer communication / A diagram for explaining the concept of the present invention for constructing a master table for each technical topic using data retrieved from a technical data search system. 4 is a diagram illustrating a method of automatically converting a text file pre-stored in an auxiliary storage means into a master table by using the data conversion method according to the present invention.
본 발명에 의한 자료변환방법을 실행하기 위해서는, 특허/기술자료 검색용 데이타베이스(300)로부터 다운로드받은 텍스트파일(310)을 마스터테이블(320)로 자동변환하기 위하여, 적어도 컴퓨터 모니터(140), 하드디스크와 같은 보조기억수단(160), 키보드 및 마우스 등과 같은 입력수단(150), 그리고 중앙연산처리장치(CPU)(132) 및 메인메모리(134) 등과 같은 자원을 구비한 통상의 컴퓨터장치를 필요로 한다. 위 컴퓨터장치는, 텍스트파일(310)을 특허/기술자료 검색용 데이터베이스(300)를 포함하는 특허/기술자료 검색시스템(100A, 100B) 및 시디-롬(100C)으로부터 다운로드받기 위해, 컴퓨터통신을 가능하게 해주는 모뎀(110)및 시디-롬(100C)을 구동하기 위한 시디-롬 드라이버(120)를 더 구비하면 편리하다.In order to execute the data conversion method according to the present invention, in order to automatically convert the text file 310 downloaded from the patent / technical data search database 300 into the master table 320, at least the computer monitor 140, A conventional computer device having resources such as an auxiliary storage means 160 such as a hard disk, an input means 150 such as a keyboard and a mouse, and a central processing unit (CPU) 132 and a main memory 134, etc. in need. The computer device, computer communication to download the text file 310 from the patent / technical data retrieval system (100A, 100B) and the CD-ROM (100C) including a database for patent / technical data retrieval (300) It is convenient to have a CD-ROM driver 120 for driving the modem 110 and the CD-ROM 100C that make it possible.
도 1에 예시된 컴퓨터장치를 이용하여 본 발명이 추구하는 마스터테이블(320)로 자료변환을 실행하기 위해서는 우선, 특허/기술자료 검색용 데이터베이스(300)를 이용하여 자료변환 대상인 텍스트파일(310)을 다운로드 받아 보조기억수단(160)에 저장해두어야 한다. 따라서, 컴퓨터통신 혹은 시디-롬을 통하여 서비스되는 상기 검색시스템(100A, 100B, 100C)들은 변환대상 텍스트파일(310)이 적어도 하나 이상의 레코드를 포함하도록 하고 레코드가 복수개의 필드구분자(404)들과 이들 필드구분자(404)에 대응하는 필드데이타(406)들로 구성되도록 하며 필드구분자(404)들과 필드데이타(406)들을 일정한 규칙에 따라 변환대상 텍스트파일내에 기록하는 텍스트파일 출력기능을 가지는 검색시스템이어야 한다. 본 발명이 적용가능한 특허자료 검색시스템의 예로서는, 한국, 일본, 미국 및 유럽특허청의 홈페이지에서 제공해주는 각국의 특허검색서비스 시스템외에도, QPAT, KIPRIS, PATROM Windows 5.0 버젼, KINITI-IR 한국공개특허/실용, PatentView CD, PAJ-CD, DACOM-DERWENT WPI, KINITI-IR WPI, Dialog DB (348번, 347번, 351번), IBM 미국특허 검색시스템 등이며, 기술논문자료 검색시스템의 예로서는 FSTA, MEDLINE, Food & Human Nutrition, KFRI-문헌정보, JOIS, COMPENDEX, SAE Paper 등이다. 사용자에게 편리성을 제공해주기 위해 본 발명이 적용될 수 있는 검색시스템에 관한 정보는 도 7에 도시된 메인메뉴화면의 하단에 표시해준다. 본 발명이 적용가능한 검색시스템은 계속적으로 추가가 가능하다. 한편, 도 7에 도시된 메인메뉴 화면에는 기술자료 검색시스템이 인터넷웹(internet web)상에서 서비스되는 것인 경우에는 사용자의 컴퓨터를 바로 해당 검색시스템의 홈페이지에 연결시켜주는 연결버튼(740)을 더 마련한다.In order to perform data conversion to the master table 320 according to the present invention using the computer apparatus illustrated in FIG. 1, first, a text file 310 that is a data conversion target using a patent / technical data search database 300. To download it should be stored in the auxiliary storage means (160). Accordingly, the retrieval systems 100A, 100B, and 100C, which are serviced through computer communication or CD-ROM, allow the text file 310 to be converted to include at least one or more records, and the record includes a plurality of field delimiters 404. A retrieval having a text file output function to be composed of field data 406 corresponding to these field delimiters 404 and to record the field delimiters 404 and field data 406 in a text file to be converted according to a predetermined rule. It must be a system. Examples of patent data retrieval system to which the present invention is applicable include QPAT, KIPRIS, PATROM Windows 5.0 version, and KINITI-IR Korea Patent Publication / Utility, in addition to the patent retrieval system of each country provided on the homepages of Korea, Japan, USA and European Patent Office. , PatentView CD, PAJ-CD, DACOM-DERWENT WPI, KINITI-IR WPI, Dialog DB (# 348, # 347, 351), IBM U.S. Patent Search System, etc. Examples of technical paper search systems include FSTA, MEDLINE, Food & Human Nutrition, KFRI-Literature Information, JOIS, COMPENDEX, SAE Paper. Information about the search system to which the present invention can be applied is provided at the bottom of the main menu screen shown in FIG. 7 to provide convenience to the user. The search system to which the present invention is applicable can be continuously added. On the other hand, the main menu screen shown in Figure 7, if the technical data search system is serviced on the Internet (internet web), the connection button 740 for connecting the user's computer directly to the homepage of the search system further Prepare.
사용자는 이들 검색시스템을 이용하여, 도 3에 도시된 바와 같이, 기술주제별로 특허/기술자료를 검색하여 텍스트파일을 미리 다운로드를 받아둔다. 예컨데, 특허 데이터베이스(A)로부터 DRAM에 관한 특허자료를 파일(S)로, 그리고 텔레비젼에 관한 특허자료를 파일(B)로 각각 다운로드 받는다. 또한 특허 데이터베이스(B)로부터는 DRAM에 관한 특허자료를 파일(K)로 다운로드를 받으며, 기술자료 데이터베이스(N)로부터 텔레비젼기술에 관한 논문검색자료를 파일(A)로 다운로드 받는다. 이와 같이 다운로드 받은 파일들(A, B, K, S)은 보조기억수단(160)에 저장되어 있어야 한다.Using these search systems, a user searches for patents / technical data for each technical subject and downloads a text file in advance, as shown in FIG. 3. For example, from the patent database A, patent data about DRAM is downloaded to a file S, and patent data about television are downloaded to a file B, respectively. In addition, the patent database (B) downloads the patent data on DRAM as a file (K), and the paper search data on television technology is downloaded to the file (A) from the technical data database (N). The downloaded files (A, B, K, S) should be stored in the auxiliary storage means (160).
다운로드받은 텍스트파일들은 검색시스템들의 출력기능에 따라 다양한 형태의 파일구조를 가지며, 그 파일을 열어 포함된 문자정보를 취할 수 있는 한 파일의 종류 내지 형식이 단순 텍스트파일로 제한되지 않는다. 예컨데, 상기 텍스트파일에는 하이퍼 텍스트파일의 형식을 갖는 것도 가능하다. 따라서, 다양한 파일구조의 텍스트파일들을 동일 데이터구조의 마스터테이블(320)로 자료변환을 위해서는 각 검색시스템별로 텍스트파일의 파일구조를 분석하여 텍스트파일에 쓰여진 단어나 표시자들중에서 파일구분자(408), 레코드구분자(402) 및 필드구분자(404)를 미리 정의해두어야 한다. 여기서, 파일구분자(408)라 함은 검색시스템을 유니크하게 대표할 수 있는 단어나 표시자이어야 한다. 예컨데, QPAT의 미국특허 검색시스템을 이용하여 다운로드 받은 텍스트파일에는 "United States Patent"라는 단어가 한 레코드안에 규칙적으로 존재하면서 다른 검색시스템에 의해 다운로드 받은 텍스트파일에는 포함되지 않은 단어이므로 이를 파일구분자로 할 수 있다. 또 다른 예로 KINITI-IR의 한국공개특허 검색시스템을 이용하여 다운로드 받은 텍스트파일에는 "KUPA"라는 단어가 파일구분자로 활용할 수 있을 것이다. 위에서 예로 들은 파일구분자들은 앞서 설명한 조건을 만족하는 한 다른 단어나 표시자를 이용할 수 도 있음은 물론이다. 레코드는 특허자료 1건에 관련된 필드정보들, 예컨데, 출원번호, 출원일자, 우선권번호, 우선권주장일, 발명의 명칭, 발명자, 출원인, 국제특허분류, 특허번호, 초록, 검색어, 청구범위 등과 같은 필드구분자(404)들에 각각 짝지워져 기록된 실제 데이타들(406)의 집합을 의미하며, 이들 레코드는 하나의 텍스트파일(310)내에 적어도 한 개 이상이 포함되어 있다. 복수개의 레코드를 각각 레코드단위로 자료변환을 하기 위해서는 레코드구분자(402)를 정의해두어야 한다. 레코드구분자(402)는 상기 파일구분자(408)가 레코드단위로 반복되는 경우에는 그 파일구분자를 레코드구분자로 사용할 수 있을 것이며, 그렇지 않는 경우에는 첫 번째 필드구분자(F1)를 레코드구분자로 사용할 수도 있을 것이다. 필드구분자(404)들은 텍스트파일(310)내에서 필드데이타들(406)과 짝을 이루어 기록되어 있으므로 텍스트파일을 분석하면 용이하게 정의할 수 있을 것이다.The downloaded text files have various types of file structures according to the output functions of search systems, and the types or formats of the files are not limited to simple text files as long as the files can be opened to take the character information included therein. For example, the text file may have a hypertext file format. Therefore, in order to convert the data files of various file structures into the master table 320 of the same data structure, the file separators of the words or markers written in the text files are analyzed by analyzing the file structure of the text file for each search system. The record separator 402 and the field separator 404 must be defined in advance. Here, the file separator 408 should be a word or indicator that can uniquely represent the search system. For example, a text file downloaded using QPAT's U.S. patent search system contains the word "United States Patent" in one record and is not included in a text file downloaded by another search system. can do. As another example, the word "KUPA" may be used as a file separator in a text file downloaded using KINITI-IR's Korean Patent Publication System. Of course, the file delimiters in the above example may use other words or markers as long as the above conditions are met. The record includes field information related to one patent data, such as application number, date of application, priority number, priority date, name of invention, inventor, applicant, international patent classification, patent number, abstract, search word, claims, etc. Each of the field separators 404 is a pair of real data 406 recorded and paired with each other. These records include at least one of the records in one text file 310. In order to convert a plurality of records into record units, record separators 402 must be defined. The record separator 402 may use the file separator as the record separator when the file separator 408 is repeated in record units. Otherwise, the first field separator F1 may be used as the record separator. will be. Since the field separators 404 are recorded in pairs with the field data 406 in the text file 310, it may be easily defined by analyzing the text file.
마스터테이블(320)의 구조는 "표 1" 에 예시한 구조로 할 수 있다.The structure of the master table 320 can be the structure illustrated in "Table 1".
"표 1"에 데이터구조는 보다 유용한 특허정보의 관리, 가공 및 분석을 위해 포괄적으로 작성한 것으로, 이 데이터구조는 필요에 따라 변화를 가할 수도 있을 것이다.The data structure in "Table 1" is written comprehensively for the management, processing and analysis of more useful patent information, and this data structure may be changed as necessary.
이상과 같은 준비를 전제로 하여, 본 발명에 의한 자료변환방법은 도 2에 도시된 실행순서에 의거하여 자료변환을 수행한다. 도 7 내지 도 12는 자료변환의 각 단계별로 모니터(140)에 표시되는 화면 구성을 도시한다.Under the premise as described above, the data conversion method according to the present invention performs the data conversion based on the execution procedure shown in FIG. 7 to 12 show the screen configuration displayed on the monitor 140 for each step of data conversion.
우선, 기술주제별로 마스터테이블을 선택하는 단계(S100)를 수행한다. 이는 도 7에 도시된 메인메뉴에서 수행한다. 즉, 사용자는 기술주제설정메뉴(700)를 통해 원하는 기술주제에 해당하는 마스터테이블의 이름을 설정한다. 마우스를 이용하여 기술주제설정메뉴(700)를 클릭하여 이미 존재하는 이름을 선택하거나 혹은 신규 이름을 입력한다. 기존 이름을 선택하면 그 이름에 대응하는 마스터테이블(320)을 보조기억수단(160)으로부터 오픈하며, 신규 이름을 입력한 경우에는 "표 1"의 데이터구조를 갖는 마스터테이블을 새로이 보조기억수단에 생성한다. 예컨데, "EDLC"라는 이름을 갖는 기존의 마스터테이블을 설정하면 "EDLC" 마스터테이블이 가지고 있는 데이타내용이 마스터테이블창(710)에 표시된다. 설정된 마스터테이블은 데이터입력 또는 갱신이 가능한 인에이블상태로 전환된다.First, a step of selecting a master table for each technical topic (S100) is performed. This is done in the main menu shown in FIG. That is, the user sets the name of the master table corresponding to the desired technical topic through the technical topic setting menu 700. Click on the technical topic setting menu 700 using the mouse to select an existing name or enter a new name. If an existing name is selected, the master table 320 corresponding to the name is opened from the auxiliary storage means 160. If a new name is entered, the master table having the data structure of "Table 1" is newly added to the auxiliary storage means. Create For example, if an existing master table named "EDLC" is set, the data contents of the "EDLC" master table are displayed in the master table window 710. The set master table is switched to an enabled state where data input or update is possible.
이와 같은 상태에서, 사용자가 메인메뉴의 하단에 마련된 "변환화일선택버튼"(730)을 마우스로 클릭하면, 도 8과 같이 자료변환 대상인 텍스트파일을 선택하기 위한 파일선택창(800)이 표시된다. 사용자는 파일선택창(800)을 통해 보조기억수단에 미리 다운로드 받아 저장되어 있는 텍스트파일을 선택하고 "열기" 버튼을 클릭하여 실행하면 도 9와 같이 선택한 텍스트파일명(예 : PAJ01.txt)과 이 파일을 출력해준(export) 검색시스템의 이름(예: PAJ-CD 일본특허)을 표시하여 사용자의 확인을 구하기 위한 확인창(900)을 표시한다(S110).In this state, when the user clicks the "conversion file selection button" 730 provided at the bottom of the main menu with a mouse, a file selection window 800 for selecting a text file to be converted into data is displayed as shown in FIG. . The user selects a text file that has been previously downloaded and stored in the auxiliary storage means through the file selection window 800 and clicks the "open" button to execute the selected text file name (for example, PAJ01.txt) as shown in FIG. A confirmation window 900 for requesting confirmation of the user is displayed by displaying the name of the export search system (eg, PAJ-CD Japanese Patent) that outputs the file (S110).
사용자가 확인창(900)의 확인버튼을 마우스로 클릭하면, 컴퓨터장치는 사용자가 선택한 텍스트파일(400)을 보조기억수단(160)에서 찾아 그 파일을 열고 파일의 처음부터 라인단위로 파싱(parsing)하여 파일구분자를 찾는 작업을 수행하므로써 선택된 텍스트파일(400)이 변환가능한 파일인지를 검사한다(S120). 이 검사를 위해 보조기억수단(160)에는 변환가능한 파일의 파일구분자들을 모아둔 파일구분자 리스트를 미리 저장해두거나 혹은 이 파일구분자 리스트를 프로그램내에 직접 정리해두던지 해야 한다. 결국, 라인단위로 파싱하여 얻어진 단어들을 파일구분자테이블의 내용과 비교하므로써 위 검사의 목적은 달성될 수 있다.When the user clicks the OK button of the confirmation window 900 with the mouse, the computer device finds the text file 400 selected by the user in the auxiliary storage means 160, opens the file, and parses the line unit from the beginning of the file. In step S120, the selected text file 400 is converted into a convertible file by performing the operation of searching for a file separator. For this inspection, the auxiliary storage means 160 must store a file separator list in which file separators of convertible files are stored in advance, or arrange the file separator list directly in the program. Consequently, the purpose of the above check can be achieved by comparing the words obtained by parsing line by line with the contents of the file separator table.
검사결과 파싱된 단어들이 상기 파일구분자 리스트에 기록된 단어가 아니면 자료변환이 불가능하다는 뜻을 메시지로 표시하고 프로그램의 실행을 종료한다(S130).If the parsed words are not words recorded in the file separator list, a message is displayed indicating that data conversion is impossible and the execution of the program is terminated (S130).
그러나, 자료변환이 가능한 경우에는 변환대상인 텍스트파일(400)의 종류에 대응하는 변환모듈을 인에이블 시킨다(S140). 변환모듈은 검색시스템별로 마련한다. 즉, 텍스트파일의 구조가 다르면 별도의 변환모듈을 적용하여 자료변환을 한다. 도 7의 하부에는 "사용가능한 DB명"을 나타내는 창(720) 즉, 자료변환이 가능한 텍스트파일을 다운로드시켜주는 검색시스템의 목록을 나타내는 창이 제공되는데, 이 목록에 열거된 검색시스템별로 별도의 변환모듈을 마련해둔다.However, if data conversion is possible, the conversion module corresponding to the type of text file 400 to be converted is enabled (S140). The conversion module is prepared for each search system. In other words, if the structure of the text file is different, data conversion is performed by using a separate conversion module. In the lower part of FIG. 7, a window 720 indicating "usable DB name", that is, a window indicating a list of search systems for downloading a text file capable of data conversion is provided, and a separate conversion for each search system listed in the list is provided. Have a module available.
인에이블된 변환모듈은 다시 텍스트파일(400)을 연 다음 라인단위로 파싱해나가면서 하나의 레코드에 해당하는 필드데이타들(406)을 메모리(134)에 설정된 어레이(410)에 임시로 저장한다(S150). 여기서, 어레이에의 임시저장은 마스터테이블에 데이터를 임포트(import)하는 속도를 향상시키기 위한 방편으로 활용된다. 데이터를 어레이에 임시저장하는 과정을 생략하고 곧바로 마스터테이블로 임포트시키는 것도 가능하다. 마스터테이블이 데이터베이스 형식을 가지므로 어레이를 활용하지 않으면, 각 필드데이타를 임포트할 때마다 마스터테이블의 열기와 닫기를 반복하여야 하고 그 결과 데이터처리 속도가 느려지는 문제가 생길 수 있으며, 마스터테이블의 엔진의 기능에 따라 그 영향은 달라질 수 있다. 인에이블된 변환모듈은 우선 파싱되는 텍스트파일(400)의 내용으로부터 레코드구분자(408)를 찾아 레코드의 시작을 알아낸다. 그후 계속적인 파싱을 수행해나가면서 필드구분자(F1, F2, ... , Fi, ..)(404)를 찾고 그에 대응되는 필드데이타(FD1, FD2, ... , FDi, ..)를 읽어서 어레이(410)에 저장한다. 이후, 어레이(410)에 저장된 하나의 레코드에 관한 데이터(FD1, FD2, ... , FDi, ..)는 마스터테이블(420)로 임포트시킨다(S190).The enabled conversion module opens the text file 400 again and parses it line by line, temporarily storing the field data 406 corresponding to one record in the array 410 set in the memory 134 ( S150). Here, temporary storage in the array is used as a way to improve the speed of importing data into the master table. It is also possible to skip the process of temporarily storing data in an array and import it directly into the master table. Since the master table has a database format, if the array is not utilized, the opening and closing of the master table must be repeated every time each field data is imported. As a result, the data processing speed may be slowed. Depending on the function of the effect may vary. The enabled conversion module first finds the record separator 408 from the contents of the parsed text file 400 and finds the beginning of the record. After continuing parsing, find the field delimiters (F1, F2, ..., Fi, ..) (404) and read the corresponding field data (FD1, FD2, ..., FDi, ..) Stored in the array 410. Thereafter, the data FD1, FD2, ..., FDi, ... for one record stored in the array 410 are imported into the master table 420 (S190).
이와 같은 어레이에의 저장에서 마스터테이블로의 임포트까지의 과정은 파일의 마지막을 만나지 않는 한 다음번 레코드구분자(409)를 만날 때까지 순환적으로 반복한다(S160, S190, S220, S150 루프). 여기서, 텍스트파일(400)의 파싱된 내용중 무엇이 레코드구분자(408)이고 무엇이 필드구분자(404) 인지는 상설한 파일구분자 검사방법과 같은 방법을 이용한다. 즉, 레코드구분자 리스트 및 필드구분자 리스트를 보조기억수단(160)에 미리 저장해두거나 각 변환모듈이 이에 관한 정보를 가지게 하여 파싱된 단어와 위 정보를 비교하여 그 단어가 레코드 또는 필드구분자인지를 알아낸다.The process from the storage to the import into the master table is repeated cyclically until the next record separator 409 is met unless the end of the file is met (S160, S190, S220, and S150 loops). Here, what is the record delimiter 408 and what is the field delimiter 404 among the parsed contents of the text file 400 uses the same method as the method of checking the constant file delimiter. That is, the record delimiter list and the field delimiter list are stored in the auxiliary storage means 160 in advance or each transformation module has information on it, and the parsed word is compared with the above information to find out whether the word is a record or a field delimiter. .
어레이(410)에 저장된 레코드와 중복되는 레코드가 마스터테이블(420)에 존재하는 지를 검사하여 그 결과에 따른 일정한 처리를 하는 중복레코드 처리기능을 부가하려면, 레코드 구분자를 검사하는 단계(S160)와 파일의 마지막을 만났는 지를 검사하는 단계(S200) 사이에서 그 절차(S170, S180, S190)를 수행하면 된다.In order to add a duplicate record processing function that checks whether a record duplicated with a record stored in the array 410 exists in the master table 420 and performs a predetermined process according to the result, checking a record identifier (S160) and a file. The procedure (S170, S180, S190) may be performed between steps (S200) of checking whether the end of the test is met.
중복된 레코드를 처리하는 방안은 크게 세가지로 나눌 수 있다. 첫째는 중복레코드는 마스터테이블에 임포트시키지 않는 방안(스킵 모드), 둘째는 중복레코드를 마스터테이블에 임포트시키되 어레이(410)에 저장된 필드데이타들중 마스터테이블(420)의 어느 필드가 널(null)인 경우에만 그 필드에 대응하는 어레이의 필드데이타를 마스터테이블(420)로 통합(merge)시키는 방안(통합 모드), 셋째는 마스터테이블(420)과 어레이(410) 간에 널(null)이 아닌 중복필드가 존재할 경우 마스터테이블(420)의 중복필드의 데이터를 어레이(410)의 중복필드 데이터로 대체(replace)시키는 방안(대체 모드)이 있을 수 있다.There are three ways to handle duplicate records. Firstly, duplicate records are not imported into the master table (skip mode). Secondly, duplicate records are imported into the master table. Is a method of merging the field data of the array corresponding to the field to the master table 420 only (integrated mode), and the third is a non-null overlap between the master table 420 and the array 410. If the field exists, there may be a method (replacement mode) in which the duplicate field data of the master table 420 is replaced with the duplicate field data of the array 410.
이들 방안을 구현하기 위해, 도 7에 도시된 메인메뉴의 하단부에는 "통합(merge)" 버튼(750)과 "대체(replace)" 버튼(760)을 마련한다. 사용자는 "통합(merge)" 버튼(750) 및 "대체(replace)" 버튼(760) 중 어느 하나를 택일할 수 있고, 그 선택된 방안대로 중복레코드의 처리가 이루어진다. 아무 버튼도 선택하지 않을 경우에는 위 첫째 방안으로 처리하도록 한다. 텍스트파일와 마스터테이블간, 결국 어레이에 저장된 레코드와 마스터테이블간에 레코드 중복이 검출될 경우, "통합" 버튼(750)은 텍스트파일내의 중복된 레코드의 필드데이타들중 마스터테이블에는 널(null)인 필드에 대응하는 필드데이타들만을 마스터테이블에 통합(merge)할 것을 지정한다. "대체" 버튼(760)이 선택되면 텍스트파일내의 중복된 레코드의 필드데이타 전부를 상기 마스터테이블의 해당 필드에 임포트하여 마스터테이블의 기존 데이타를 대체할 것을 지정하게 된다.In order to implement these methods, a "merge" button 750 and a "replace" button 760 are provided at the lower end of the main menu shown in FIG. The user may alternatively select either the "merge" button 750 and the "replace" button 760, and the duplicated record is processed according to the selected scheme. If no button is selected, proceed to the first solution above. If record duplication is detected between the text file and the master table, and eventually between the records stored in the array and the master table, the "integrate" button 750 is a field that is null in the master table of the field data of the duplicate record in the text file. Specifies to merge only the field data corresponding to the master table. When the "replace" button 760 is selected, all field data of the duplicated records in the text file are imported into the corresponding fields of the master table to designate replacement of existing data in the master table.
도 5는 중복레코드가 존재하는 경우 중복레코드의 통합(merge)을 실행하는 개념을 도시한 도면이며, 도 6은 중복레코드가 존재하는 경우 중복레코드의 교체(replace)를 실행하는 개념을 도시한 도면이다. 도 5와 도 6은, 특허 데이터베이스(A)(500)를 통해 다운로드받은 텍스트파일을 이용하여 마스터테이블(520)을 일차적으로 구축한 다음, 다른 특허 데이터베이스(B)(510)를 통해 다운로드받은 동일한 기술주제에 관한 텍스트파일을 이용하여 상기 마스터테이블(520)의 내용을 갱신하고자 하는 경우를 가정한다.5 is a diagram illustrating a concept of performing a merge of duplicate records when a duplicate record exists, and FIG. 6 is a diagram illustrating a concept of performing replacement of a duplicate record when a duplicate record exists. to be. 5 and 6, the master table 520 is first constructed using the text file downloaded through the patent database (A) 500, and then the same downloaded through the other patent database (B) 510. It is assumed that the contents of the master table 520 are to be updated by using a text file relating to the technical topic.
여기서, 사용자가 "통합(merge)" 버튼(750)을 선택해두었으면, 변환모듈은 이를 확인하고(S170), 어레이(410)에 저장된 특허 데이터베이스(B)로부터 기원한 필드데이타들 중 "공고번호"와 "초록" 필드데이타를 마스터테이블(520)의 해당 레코드에 추가시킨다(S190).Here, if the user has selected the "merge" button 750, the conversion module checks this (S170), "notification number of the field data originating from the patent database (B) stored in the array 410 Field data are added to the corresponding record of the master table 520 (S190).
만약, 사용자가 "대체(replace)" 버튼(760)을 선택해둔 경우에는 변환모듈은 역시 이를 확인하고(S170), 마스터테이블(620)에 저장되어 있는 특허 데이터베이스(A)로부터 획득된 필드데이터 중 특허 데이터베이스(B)의 데이터와 중복되는 필드데이타(예: 초록(A))는 특허 데이터베이스(B)의 필드데이타(예: 초록(A'))로 교체시킨다(S190). 따라서, 교체후의 마스터테이블(630)은 "출원번호"와 "청구범위"의 데이터내용은 특허 데이터베이스(A)로부터 취득한 것이며, "초록"의 데이터는 특허 데이터베이스(B)로부터 취득한 것이 된다.If the user has selected the "replace" button 760, the conversion module also checks this (S170), and among the field data obtained from the patent database (A) stored in the master table (620) Field data (for example, abstract (A)) overlapping with data of the patent database (B) is replaced with field data (for example, abstract (A ')) of the patent database (B) (S190). Therefore, after the replacement of the master table 630, the data contents of the "application number" and the "claim" are obtained from the patent database A, and the "green" data is obtained from the patent database B. FIG.
한편, 사용자가 "통합(merge)" 버튼(750) 및 "대체(replace)" 버튼(760) 중 어느 것도 선택하지 않았으면, 어레이를 리셋시켜 임시저장된 데이터를 유실시키고(S180), 파일의 마지막을 만났는 지를 검사하면서(S200) 다음 레코드의 필드데이터를 다시 파싱하여 어레이에 저장하는 절차를 수행한다(S150).On the other hand, if the user has not selected any of the "merge" button 750 and the "replace" button 760, the array is reset to lose the temporarily stored data (S180), the end of the file While checking whether (S200) is met, a procedure of reparsing field data of the next record and storing the data in an array is performed (S150).
한편, 어레이에 데이터를 임시 저장하는 절차를 생략하더라도 위에서 설명한 중복 레코드의 처리는 가능하다. 즉, 텍스트파일에서 라인을 파싱하면서 찾아낸 특정 레코드의 키 필드 데이터와 마스터테이블에 저장된 키필드 데이터를 서로 비교하여 양자의 동일 여부를 검사하므로써 중복여부를 확인할 수 있다. 중복이 확인된 레코드의 처리 즉, 스킵 모드, 통합 모드 및 대체 모드는 상설한 바와 같이 사용자에 의한 설정조건에 따른다.On the other hand, even if the procedure of temporarily storing data in the array is omitted, the above-described duplicate record processing is possible. In other words, by comparing the key field data of a specific record found while parsing a line in a text file and the key field data stored in the master table, the two groups can be checked for equality. The processing of the record in which the duplication is confirmed, that is, the skip mode, the merge mode, and the replace mode, depends on the setting conditions by the user as mentioned above.
이를 상설하면, 통합모드가 선택된 경우, 텍스트파일내의 중복된 레코드의 필드데이타들중 마스터테이블에는 널(null)인 필드에 대응하는 필드데이타들만을 상기 마스터테이블에 통합(merge)한다. 대체 모드의 경우에는 텍스트파일내의 중복된 레코드의 필드데이타 전부를 마스터테이블의 해당 필드에 임포트하여 마스터테이블의 기존 데이타를 대체한다. 상기 통합버튼과 상기 대체버튼중 어느 것도 선택되지 않으면 스킵 모드가 되므로 중복되는 텍스트파일의 레코드는 마스터테이블로 임포트(import)하지 않고 버린다.If this is the case, when the merge mode is selected, only field data corresponding to a null field in the master table among the field records of the duplicated records in the text file are merged into the master table. In the replacement mode, all field data of duplicate records in the text file are imported into the corresponding fields of the master table to replace the existing data of the master table. If none of the merge button and the replace button is selected, a skip mode is entered. Thus, records of duplicate text files are discarded without being imported into the master table.
이와 같은 인에이블된 변환모듈에 의한 자료변환과정(S150에서 S200)은 텍스트파일(400)의 끝을 만날 때까지 레코드단위별로 반복적으로 실행한다. 파싱동작중 텍스트파일(400)의 끝을 만나면, 도 10에 도시된 바와 같이 자료변환의 결과를 모니터에 표시한다(S210). 즉, 변환대상이 된 텍스트파일명, 이 텍스트파일을 다운로드받은 검색시스템명, 변환된 레코드건수 및 중복이 발생한 레코드건수 등에 관한 정보를 보고한다. 도 10은 중복이 하나도 일어나지 않은 경우를 의미한다. 만약, 이미 자료변환과정을 거친 텍스트파일을 한 번 더 자료변환을 실행하면 전체 레코드가 중복이 발생할 것인데, 이 경우를 도 11이 도시하고 있다. 중복된 레코드에 관한 구체적인 정보를 알고 싶을 경우에 대비하여, 도 11의 화면에서 변환파일명을 더블클릭한 경우 중복된 레코드의 출원번호 리스트 등이 화면에 부가표시되는 데, 도 12는 이를 도시하고 있다.The data conversion process (S150 through S200) by the enabled conversion module is repeatedly executed for each record unit until the end of the text file 400 is met. When the end of the text file 400 is encountered during the parsing operation, the result of data conversion is displayed on the monitor as shown in FIG. 10 (S210). That is, information on the name of the text file to be converted, the name of the search system which downloaded the text file, the number of converted records and the number of records in which duplicates have occurred are reported. 10 illustrates a case where no duplication occurs. If data conversion has already been performed on the text file which has already been converted, the entire record will be duplicated. In this case, FIG. In case the user wants to know specific information about the duplicated record, the application number list of the duplicated record and the like are additionally displayed on the screen when the conversion file name is double-clicked on the screen of FIG. 11, which is illustrated in FIG. 12. .
이상과 같은 자료변환방법은 컴퓨터 프로그램으로 구현가능하며, 이를 예컨데, 시디-롬(CD-ROM)과 같은 기록매체에 기록해두면 범용적이고 편리한 사용이 가능할 것이다. 또한, 변환대상 텍스트파일을 한 번에 하나씩 선택하여 위와 같이 자료변환 할 수도 있지만, 텍스트파일을 한 번에 복수개 선택하여 각 텍스트파일을 순차적으로 자료변환 할 수도 있다.The data conversion method as described above can be implemented by a computer program, for example, if it is recorded on a recording medium such as a CD-ROM, it will be possible to use it universally and conveniently. In addition, you can select the text files to be converted one at a time and convert the data as above, but you can also select multiple text files at once and convert each text file sequentially.
이상과 같은 본 발명의 자료변환방법을 이용하면, 다종다양한 특허 또는 기술 자료 검색시스템으로부터 검색결과를 다운로드받아 획득된 텍스트파일을 기술주제별로 동일한 마스터테이블로 구축할 수 있다. 기술주제별로 구축된 마스터테이블은 이후 추가 검색된 자료를 이용하여 갱신하므로써 그 내용을 보다 풍부하게 할 수 있다. 나아가, 마스터테이블이 일정한 데이터구조로 정리되어 있으므로 특허 또는 기술 정보 분석기능의 부가가 용이하여 예컨데, 특허맵(patent map)의 작성이나 각종 통계자료를 추출하는 데 편리하게 활용할 수 있다.By using the data conversion method of the present invention as described above, it is possible to build a text file obtained by downloading the search results from a variety of patent or technical data search system to the same master table for each technology topic. Master tables built by technology topics can be enriched by updating them with additional data. Furthermore, since the master table is arranged in a certain data structure, it is easy to add a patent or technical information analysis function. For example, the master table can be conveniently used for preparing a patent map or extracting various statistical data.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although the above has been described with reference to a preferred embodiment of the present invention, those skilled in the art will be variously modified and changed within the scope of the present invention without departing from the spirit and scope of the invention described in the claims below. I can understand that you can.
Claims (21)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019990006685A KR100323607B1 (en) | 1999-02-27 | 1999-02-27 | Data conversion method for converting text file searched for art data into master table for art information analysis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019990006685A KR100323607B1 (en) | 1999-02-27 | 1999-02-27 | Data conversion method for converting text file searched for art data into master table for art information analysis |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20000056924A true KR20000056924A (en) | 2000-09-15 |
KR100323607B1 KR100323607B1 (en) | 2002-03-02 |
Family
ID=19575293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019990006685A KR100323607B1 (en) | 1999-02-27 | 1999-02-27 | Data conversion method for converting text file searched for art data into master table for art information analysis |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100323607B1 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010037609A (en) * | 1999-10-19 | 2001-05-15 | 전주범 | Method and apparatus for generating patent map |
KR20040039994A (en) * | 2002-11-05 | 2004-05-12 | 사단법인 고등기술연구원 연구조합 | Method of collecting patent information from patent information search sites and recording user keywords for the collected patent information |
WO2006118404A1 (en) * | 2005-05-02 | 2006-11-09 | Wisdomain | An operating methods for patent information sysytem |
KR100743150B1 (en) * | 2004-05-17 | 2007-07-27 | 재단법인서울대학교산학협력재단 | Customized and Automated Technology Roadmapping System |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06231141A (en) * | 1993-01-29 | 1994-08-19 | Hitachi Software Eng Co Ltd | Patent map preparation supporting system |
US6339767B1 (en) * | 1997-06-02 | 2002-01-15 | Aurigin Systems, Inc. | Using hyperbolic trees to visualize data generated by patent-centric and group-oriented data processing |
JPH08221435A (en) * | 1995-02-14 | 1996-08-30 | Hitachi Ltd | Patent map generating method |
KR100235613B1 (en) * | 1997-06-10 | 1999-12-15 | 전주범 | Patent map mapping method |
JPH1139330A (en) * | 1997-07-22 | 1999-02-12 | Hitachi Ltd | Processing support method in information retrieval system and recording medium recording processing supporting program in information retrieval system |
KR100568369B1 (en) * | 1998-05-23 | 2006-04-05 | 엘지전자 주식회사 | Method for classifying and searching data |
-
1999
- 1999-02-27 KR KR1019990006685A patent/KR100323607B1/en not_active IP Right Cessation
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010037609A (en) * | 1999-10-19 | 2001-05-15 | 전주범 | Method and apparatus for generating patent map |
KR20040039994A (en) * | 2002-11-05 | 2004-05-12 | 사단법인 고등기술연구원 연구조합 | Method of collecting patent information from patent information search sites and recording user keywords for the collected patent information |
KR100743150B1 (en) * | 2004-05-17 | 2007-07-27 | 재단법인서울대학교산학협력재단 | Customized and Automated Technology Roadmapping System |
WO2006118404A1 (en) * | 2005-05-02 | 2006-11-09 | Wisdomain | An operating methods for patent information sysytem |
Also Published As
Publication number | Publication date |
---|---|
KR100323607B1 (en) | 2002-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100541493C (en) | The apparatus and method that are used for structured document management | |
US6915308B1 (en) | Method and apparatus for information mining and filtering | |
US9519636B2 (en) | Deduction of analytic context based on text and semantic layer | |
EP0883848B1 (en) | Automatic transmission of legacy system data | |
US9977803B2 (en) | Column-based table manipulation of event data | |
US20070100823A1 (en) | Techniques for manipulating unstructured data using synonyms and alternate spellings prior to recasting as structured data | |
US8756495B2 (en) | Computer-implemented system and method for tagged and rectangular data processing | |
US8930303B2 (en) | Discovering pivot type relationships between database objects | |
JPH0950372A (en) | Method and system for automatic conversion of specificationsof declarative language | |
JP3023943B2 (en) | Document search device | |
US20090228794A1 (en) | Business specification comprehension assistance system and method | |
JP2005190163A (en) | Method, apparatus and program for retrieving structured data | |
KR100323607B1 (en) | Data conversion method for converting text file searched for art data into master table for art information analysis | |
JP4879193B2 (en) | System log management support apparatus and system log management support method | |
CN115952203B (en) | Data query method, device, system and storage medium | |
CN117453690A (en) | Data processing method, device and computer medium for power grid data warehouse | |
US6963865B2 (en) | Method system and program product for data searching | |
CN110222169A (en) | A kind of visualized data processing resolution system and its processing method | |
JP2000090093A (en) | Method and system for full-text retrieval and record medium recording full-text retrieval program | |
CN116126918A (en) | Data generation method, information screening method, device and medium | |
JPH11161656A (en) | Data base retrieval and extraction system and recording medium in which control program for data base retrieval and extraction is recorded | |
JPH05334363A (en) | Data base retrieval system | |
KR100532823B1 (en) | Apparatus and method for managing data integrity, and computer-readable recording medium having data integrity management program recorded thereon | |
JPH10326285A (en) | Document management system | |
CN108595541A (en) | A kind of test method and system of data pick-up quality |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20061228 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |