KR102578899B1 - Method of expanding queries for searching medical content - Google Patents
Method of expanding queries for searching medical content Download PDFInfo
- Publication number
- KR102578899B1 KR102578899B1 KR1020200170433A KR20200170433A KR102578899B1 KR 102578899 B1 KR102578899 B1 KR 102578899B1 KR 1020200170433 A KR1020200170433 A KR 1020200170433A KR 20200170433 A KR20200170433 A KR 20200170433A KR 102578899 B1 KR102578899 B1 KR 102578899B1
- Authority
- KR
- South Korea
- Prior art keywords
- query
- search
- medical content
- medical
- primary
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
의료 컨텐츠 검색을 위한 쿼리 확장 방법은, (a) 이미 선정된 1차 쿼리를 이용한 검색 결과로서의 1차 검색수가 반영된 검색총량을 소정의 통과 기준과 비교하는 단계, (b) 검색총량이 통과 기준을 만족하지 않으면, 1차 쿼리로부터 파생된 2차 쿼리를 포함하는 2차 쿼리 필드를 선정하는 단계, (c) 2차 쿼리 필드에 의한 2차 검색수가 반영된 새로운 검색총량을 산출하는 단계, 및 (d) 상기 (c) 단계에서의 검색총량을 통과 기준과 비교하는 단계를 포함할 수 있다.The query expansion method for retrieving medical content includes the following steps: (a) comparing the total search volume reflecting the number of primary searches as a search result using an already selected primary query with a predetermined passing standard; (b) comparing the total search volume to a predetermined passing standard; If not satisfied, (c) selecting a secondary query field containing a secondary query derived from the primary query, (c) calculating a new total search volume reflecting the number of secondary searches by the secondary query field, and (d) ) It may include comparing the total search amount in step (c) above with the passing criteria.
Description
본 발명은 의료 관련 컨텐츠를 검색하는 과정에서, 검색의 퀄리티를 높일 수 있는 쿼리 확장 방법에 관한 것이다.The present invention relates to a query expansion method that can improve search quality in the process of searching medical-related content.
인터넷의 보급에 따라 사람들은 유용한 정보를 인터넷 검색을 통해서 찾을 수 있다. 일 예로, 유명한 식당, 편안한 호텔, 최신 가전제품 등에 관한 정보를 위해 사람들은 포털 사이트에 접속하여 검색하고 있으며, 블로그나 사용후기 등을 검색하고, '좋아요' 등의 개수를 참조해서 유용하다고 생각되는 정보를 얻는다.With the spread of the Internet, people can find useful information through Internet searches. For example, people access portal sites to search for information about famous restaurants, comfortable hotels, the latest home appliances, etc., search blogs and user reviews, and refer to the number of 'likes' to find items they think are useful. Get information.
하지만, 어떤 전문적인 분야의 정보는 사용후기나 '좋아요' 등의 정보로는 평가될 수 없는 요소들을 포함하고 있으며, 그렇게 평가되면 오히려 소비자에게 불리하거나 위험한 것들이 있다. 그런 예들 중 하나가 의사 또는 병원에 대한 정보이다. 왜냐하면, 질병의 진단, 처치, 시술 또는 수술 등에 대한 평가는 일반인이 조언할 수 없는 전문적인 영역에 있으며, 가끔은 이러한 평가는 실질적인 의사 또는 병원의 실력 또는 역량과 관련된 요소가 아닌, 전혀 무관한 요소, 예를 들어 의사의 친절함, 의료 처치 후의 일시적 느낌, 의사의 성별, 간호사의 태도, 병원 예약 시간, 병원의 청결도 등의 영향을 받기도 한다.However, information in certain professional fields contains elements that cannot be evaluated through information such as user reviews or 'likes', and when evaluated in that way, there are things that are disadvantageous or dangerous to consumers. One such example is information about doctors or hospitals. This is because evaluation of disease diagnosis, treatment, procedure, or surgery is in a specialized area where the general public cannot provide advice, and sometimes such evaluation is not related to the actual skills or capabilities of the doctor or hospital, but is based on completely unrelated factors. For example, it can be influenced by the friendliness of the doctor, the temporary feeling after medical treatment, the gender of the doctor, the attitude of the nurse, the time of the hospital appointment, and the cleanliness of the hospital.
해외의 어떤 조사에 따르면, 외과 수술의를 선택하는 기준에서 보험의 보장범위, 병원의 위치 등이 수술의의 수술회수, 의료진의 신뢰도보다 더 중요하게 평가되고 있다는 보고도 있었다(jamasurgery.com, 2014년 2월).According to an overseas survey, it was reported that insurance coverage, hospital location, etc. are considered more important than the number of surgeries performed by the surgeon and the reliability of the medical staff when selecting a surgeon (jamasurgery.com, 2014, 2) month).
최근에는 의사나 수술의를 평가할 수 있는 웹사이트들(Physician Rating Websites: PRWs)나 단체들이 있으며, 그러한 예들로 Yelp.com, Healthgrade.com, Insurance plan, Angie's List 등이 있다. 하지만, 이러한 웹사이트들이나 단체들 역시 의사나 그 능력을 평가함에 있어서, 경험자들의 리뷰나 평가점수, 지역적인 거리만 고려한다는 점에서 한계가 있을 수 있다. Recently, there are websites (Physician Rating Websites: PRWs) or organizations that allow you to rate doctors and surgeons, examples of which include Yelp.com, Healthgrade.com, Insurance Plan, and Angie's List. However, these websites or organizations may also have limitations in that they only consider reviews, evaluation scores from experienced people, and regional distance when evaluating doctors and their abilities.
중국공개특허 CN 104680458 A를 보면, 병원 또는 의사를 추천하는 방법이 개시되어 있다. 상기 중국공개특허는 의사별로 모든 처방을 수집하고, 일정 기간 후에 전화연락, 네트워크, 방문 등 다양한 방법을 통해서 치료 효과를 획득하고, 이를 데이터베이스로 통합하여 공중에게 의료대상을 추천할 수 있다. 하지만, 이와 같은 방법은, 많은 시간과 통제력이 필요하며, 모든 처방을 수집한다는 것이 불가능하고, 개인정보 유출의 가능성도 높이 실현이 불가능하다고 할 수 있다.Looking at Chinese Published Patent CN 104680458 A, a method for recommending a hospital or doctor is disclosed. The Chinese published patent collects all prescriptions for each doctor, obtains treatment effects through various methods such as phone contact, networks, and visits after a certain period of time, and integrates them into a database to recommend medical subjects to the public. However, this method requires a lot of time and control, it is impossible to collect all prescriptions, and the possibility of personal information leakage is high, making it impossible to implement.
한국등록특허 제10-1928533호는 "학문적 성과를 이용한 정량적 의사 평가에 기초한 의료대상 추천 방법"에 관한 것으로서, 논문 데이터를 검색한다는 내용이 있고, 논문 데이터로 논문의 개수, 각 논문별 발행시점 데이터, 제1 저자 정보, 교신 또는 책임 저자 정보, 공동 저자 정보, 수록된 학술지 정보, 학술지의 임팩트 팩터 및 의사의 h-index 등의 정보를 이용한다는 내용을 포함하고 있다.Korean Patent No. 10-1928533 relates to “a method of recommending medical subjects based on quantitative physician evaluation using academic achievements,” and includes information about searching paper data, including the number of papers and publication time data for each paper. , it includes the use of information such as first author information, corresponding or responsible author information, co-author information, included journal information, journal impact factor, and physician h-index.
하지만, 검색된 논문의 수가 상대적으로 적은 경우에는, 적은 수의 논문만으로 의료대상을 평가 및 선정한다는 것이 부정확할 수 있으며, 의료 분야와 같이 관련 분야가 세분화된 경우에는 그 검색 결과가 최소한의 기대치에도 미치지 못하는 경우가 있어 이러한 문제점이 수시로 발생할 수 있다.However, when the number of retrieved papers is relatively small, evaluating and selecting medical subjects with only a small number of papers may be inaccurate, and when related fields are segmented, such as the medical field, the search results do not meet minimum expectations. In some cases, this problem may occur from time to time.
본 발명은 쿼리에 따른 검색 결과를 활용하는 과정에서, 검색된 의료 컨텐츠(medical contents)를 양적으로 일정량 또는 일정 기준 이상으로 획득하기 위한 쿼리 확장 방법을 제공한다.The present invention provides a query expansion method for quantitatively obtaining searched medical contents in a certain amount or above a certain standard in the process of utilizing search results according to a query.
본 발명은 쿼리를 확장함에 있어서, 단순 확장보다는 합리적인 기준에 따라 쿼리를 확장하는 방법을 제공한다.The present invention provides a method of expanding a query according to reasonable criteria rather than simple expansion.
상술한 본 발명의 목적들을 달성하기 위한 본 발명의 예시적인 일 실시예에 따르면, 의료 컨텐츠 검색을 위한 쿼리 확장 방법은, (a) 이미 선정된 1차 쿼리를 이용한 검색 결과로서의 1차 검색수가 반영된 검색총량을 소정의 통과 기준과 비교하는 단계, (b) 검색총량이 통과 기준을 만족하지 않으면, 1차 쿼리로부터 파생된 2차 쿼리를 포함하는 2차 쿼리 필드를 선정하는 단계, (c) 2차 쿼리 필드에 의한 2차 검색수가 반영된 새로운 검색총량을 산출하는 단계, 및 (d) 상기 (c) 단계에서의 검색총량을 통과 기준과 비교하는 단계를 포함할 수 있다. According to an exemplary embodiment of the present invention for achieving the purposes of the present invention described above, the query expansion method for retrieving medical content includes (a) reflecting the number of primary searches as a search result using an already selected primary query; Comparing the search total amount with a predetermined passing standard, (b) If the search total amount does not meet the passing standard, selecting a secondary query field containing the secondary query derived from the primary query, (c) 2 It may include the step of calculating a new total search amount reflecting the number of secondary searches by the secondary query field, and (d) comparing the total search amount in step (c) with the passing criteria.
참고로, 본 명세서에서 '검색어'는 서버에 접속한 사용자 또는 다른 서버가 결과를 얻기 위해 직접 제공한 단어 또는 단어들의 조합, 문자일 수 있으며, '쿼리'는 수신 또는 입력된 검색어를 이용하여 서버 또는 데이터베이스가 의료 및 의학 데이터베이스가 인식할 수 있는 의학용어로 선정한 단어, 용어, 이들의 조합일 수 있다. 서버에 따라서는 검색어를 바로 쿼리로 이용할 수 있지만, 다르게는 데이터베이스를 이용하기 위한 다른 쿼리를 추가, 변경, 선정할 수 있다.For reference, in this specification, a 'search word' may be a word or a combination of words or characters provided directly by a user connected to the server or another server to obtain results, and a 'query' may be a word or a combination of words provided by a user accessing the server or another server to obtain results, and a 'query' may be a word or a combination of words provided by a user connected to the server or another server to obtain results. Alternatively, the database may be words, terms, or combinations of words selected as medical terms that the database can recognize. Depending on the server, search terms can be used directly as queries, but in others, other queries can be added, changed, or selected to use the database.
본 명세서에서는 검색어로부터 서버가 1차 쿼리를 선정할 수 있으며, 1차 쿼리에 의한 검색을 반영한 검색총량이 부족하다고 판단되면, 1차 쿼리로부터 파생된 2차 쿼리를 추가로 선정할 수 있다.In this specification, the server can select a primary query from the search word, and if it is determined that the total search volume reflecting the search by the primary query is insufficient, it can additionally select a secondary query derived from the primary query.
본 발명에서 서버는 자체 데이터베이스 또는 외부에 있는 데이터베이스를 이용할 수 있으며, 서버의 외부에 있는 데이터베이스는 네트워크를 통해 연결될 수 있는 Pubmed, 구글 스콜라(Google scholar), 스코푸스(SCOPUS), 네이버 전문검색, NDSL, KCI, RISS, 알트메트릭(Altmetric), 멘델레이(Medeley), PlumX metrics 및 기타 메타데이터 서비스 중 적어도 하나를 포함할 수 있으며, 이 외에도 유사한 목적과 기능의 외부 데이터베이스를 이용할 수 있다.In the present invention, the server can use its own database or an external database, and the database external to the server is Pubmed, Google scholar, SCOPUS, Naver full-text search, and NDSL, which can be connected through a network. , KCI, RISS, Altmetric, Mendeley, PlumX metrics and other metadata services, and may also use external databases with similar purposes and functions.
상기 (d) 단계에서의 검색총량이 통과 기준을 만족하면, 의료 컨텐츠 검색에 대한 쿼리 선정을 완료할 수 있다. If the total search volume in step (d) above satisfies the passing criteria, query selection for medical content search can be completed.
하지만, 경우에 따라서는 (c) 단계에서의 검색총량이 충분하지 않을 수 있는데, 상기 (d) 단계에서의 검색총량이 통과 기준을 만족하지 않으면, 2차 쿼리를 새로운 1차 쿼리로 정의하여 (a) 내지 (d) 단계를 반복할 수 있다.However, in some cases, the total search volume in step (c) may not be sufficient. If the total search volume in step (d) does not meet the passing criteria, the secondary query is defined as a new primary query ( Steps a) to (d) can be repeated.
2차 쿼리는 다양한 기준에 의해서 확장 또는 파생될 수 있다. Secondary queries can be extended or derived based on various criteria.
일 예로, 2차 쿼리는 1차 쿼리를 어근에 따라 분류하고 분류된 어근들의 조합으로 이루어진 범위 내에서 선정될 수 있다. 일 예로, 1차 쿼리로서 "관절경적 반월상연골 복원술"을 검색한 1차 검색수를 반영한 검색총량이 소정의 통과 기준에 미치지 못하면, 1차 쿼리의 어근을 관절경적, 반월상연골, 복원술 등과 같이 분류할 수 있고, 분류된 어근들에 따라 2차 쿼리로서 관절경적 반월상연골, 관절경적 복원술, 반월상연골 복원술, 관절경, 반월상연골, 복원술 등과 같은 2차 쿼리 필드를 선정할 수 있다.As an example, the secondary query may be selected within a range where the primary query is classified according to its root and is a combination of the classified roots. For example, if the total number of searches reflecting the number of primary searches for “arthroscopic meniscus restoration” as the primary query does not meet the predetermined passing criteria, the root of the primary query is changed to arthroscopic, meniscus, restoration, etc. They can be classified together, and secondary query fields such as arthroscopic meniscus, arthroscopic reconstruction, meniscus restoration, arthroscopy, meniscus, reconstruction, etc. can be selected as secondary queries according to the classified roots. .
다른 예로, 2차 쿼리는 1차 쿼리를 증상, 진단, 치료 및 부위 중 적어도 하나를 포함하도록 분류하고, 분류된 증상, 진단, 치료 또는 부위의 유사어나 상위 개념들의 조합으로 이루어진 범위 내에서 선정될 수 있다. 일 예로, 1차 쿼리로서 "손가락 염좌"를 검색한 1차 검색수를 반영한 검색총량이 소정의 통과 기준에 미치지 못하면, 1차 쿼리를 증상, 진단, 치료 또는 부위에 따라 분류할 수 있는데, '손가락'을 부위로 판단하고 부위의 유사어나 상위 개념으로서 '수지', '검지', '엄지', '손' 등을 분류하고, '염좌'를 증상으로 판단하고 증상의 유사어나 상위 개념으로서 '손상' 등을 분류한 후, 2차 쿼리로서 이들의 조합인 수지 염좌, 손 염좌, 손가락 손상, 손 손상 등과 같은 2차 쿼리 필드를 선정할 수 있다.As another example, the secondary query classifies the primary query to include at least one of symptoms, diagnosis, treatment, and area, and is selected within the range consisting of a combination of similar words or superordinate concepts of the classified symptom, diagnosis, treatment, or area. You can. For example, if the total number of searches reflecting the number of primary searches for "finger sprain" as the primary query does not meet the predetermined passing criteria, the primary query can be classified according to symptoms, diagnosis, treatment, or area, ' 'Finger' is judged as a part, and 'finger', 'index finger', 'thumb', 'hand', etc. are classified as analogs or superordinate concepts of the part, and 'sprain' is judged as a symptom and 'sprain' is classified as a synonym or superordinate concept of the symptom. After classifying 'damage', etc., secondary query fields such as finger sprain, hand sprain, finger damage, hand damage, etc., which are combinations of these, can be selected as secondary queries.
증상, 진단, 치료의 상위 개념 등은 알려진 분류 체계 (예, 국제질병분류 International Classification of Diseases, ICD-11; Diagnostic and Statistical Manual of Mental Disorders. DSM-5; International Classification of Primary Care (ICPC); International Classification of Procedures in Medicine (ICPM); International Classification of Health Interventions (ICHI); SNOMED International, SNOMED Clinical Terms 등)을 이용하거나, 독자적으로 개발한 체계 등을 이용할 수 있으며, 부위의 상위 개념은 해부학적 체계 등을 이용할 수 있다. High-level concepts of symptoms, diagnosis, and treatment are included in known classification systems (e.g., International Classification of Diseases, ICD-11; Diagnostic and Statistical Manual of Mental Disorders. DSM-5; International Classification of Primary Care (ICPC); International Classification of Procedures in Medicine (ICPM); International Classification of Health Interventions (ICHI); SNOMED International, SNOMED Clinical Terms, etc.) or independently developed systems can be used, and the higher-level concept of the region is anatomical system, etc. can be used.
소정의 통과 기준이라 함은, 검색 결과로서 합리적이면서 객관적인 결과를 제공할 수 있는 검색수라 할 것이며, 모든 쿼리에 대해서 같은 기준을 가질 수도 있지만, 쿼리에 따라서는 다른 기준을 가질 수도 있다. The predetermined passing standard is the number of searches that can provide reasonable and objective results as search results. The same standard may be applied to all queries, but may have different standards depending on the query.
일 예로, 간단한 통과 기준으로서 검색총량이 특정 상수(ex. 500, 1000) 이상 또는 주변인지를 판단하도록 할 수 있다.For example, as a simple passing criterion, it can be determined whether the search total amount is above or around a certain constant (ex. 500, 1000).
다른 예로, 통과 기준은 검색총량의 추세를 반영하여 결정될 수도 있는데, 검색총량의 변화를 기준으로 통과 기준에 도달 여부를 판단할 수 있다. 가능한 방법으로는 검색총량의 추세 직선이 유의하게 증가하는 경우, 추세가 직선에서 곡선으로 변하거나(J 곡선 등), 추세 곡선이 다시 직선으로 변하거나 가파른 직선이나 곡선이 완만하게 변화하는 경우라 할 수 있다.As another example, the passing standard may be determined by reflecting the trend of the total search volume, and whether or not the passing standard has been reached can be determined based on changes in the total search volume. Possible methods include when the trend straight line of total search volume increases significantly, when the trend changes from a straight line to a curve (J curve, etc.), when the trend curve changes back to a straight line, or when a steep straight line or curve changes to a gentle one. You can.
예를 들어, 검색된 컨텐츠의 변화가 시간 경과에 따르거나, 확장된 검색 범위에 따르거나, 확장된 쿼리의 증상, 질병, 치료 및 부위의 단계 변화에 따라서 검색총량이 특정수 (ex. 500개, 1000개 이상) 또는 확장 전과 비교하여 특정 비율 (eg. 50%) 이상 변화하는 경우를 통과 기준으로 정할 수 있다.For example, depending on changes in searched content over time, expanded search scope, or changes in symptoms, diseases, treatments, and stages of expanded queries, the total number of searches may increase to a certain number (e.g. 500, 1000 or more) or a change of more than a certain percentage (eg. 50%) compared to before expansion can be set as a passing criterion.
2차 쿼리에 의해서 검색총량을 확장한 경우라도, 이를 동일하게 판단하지 않는 것이 바람직할 수 있다. 따라서, 본 발명에 의해 쿼리를 확장한 경우, 확장된 2차 쿼리에 의해 검색된 의료 컨텐츠에 대해서는 2차 검색수 또는 2차 쿼리 필드의 특성을 고려하여 의료 컨텐츠의 스코어를 1차 쿼리에 의한 의료 컨텐츠와 차별적으로 산출하는 것이 필요할 수 있다. Even if the total search volume is expanded by secondary queries, it may be desirable not to judge it equally. Therefore, when the query is expanded according to the present invention, for the medical content retrieved by the expanded secondary query, the score of the medical content is calculated by considering the number of secondary searches or the characteristics of the secondary query field and the score of the medical content by the primary query. It may be necessary to calculate it differently.
예를 들어, 2차 쿼리에 의해 검색된 의료 컨텐츠의 스코어는 2차 검색수를 반영한 검색범위 보정 가중치(r), 2차 쿼리 필드의 특성을 반영한 쿼리필드 특성 가중치(f) 및 이들의 조합을 이용하여 산출될 수 있다.For example, the score of medical content retrieved by secondary query uses a search range correction weight (r) that reflects the number of secondary searches, a query field characteristic weight (f) that reflects the characteristics of the secondary query field, and a combination thereof. It can be calculated as follows.
2차 쿼리에 의해 검색된 의료 컨텐츠의 스코어는 아래의 2차 쿼리 보정 계수(QFi)를 이용하여 산출될 수 있으며, 여기서, QFi는 2차 쿼리 필드 중 i번째 2차 쿼리의 보정 계수, ri는 i번째 2차 쿼리의 검색범위 보정 가중치, fi는 i번째 2차 쿼리의 쿼리필드 보정 가중치, αi는 기타 가중치일 수 있다.The score of the medical content retrieved by the secondary query can be calculated using the secondary query correction coefficient (QF i ) below, where QF i is the correction coefficient of the ith secondary query among the secondary query fields, r i may be the search range correction weight of the ith secondary query, f i may be the query field correction weight of the ith secondary query, and α i may be other weights.
일 예로, , QFi는 ri x fi xαi 로 곱하기로 산출될 수 있다.As an example, QF i can be calculated by multiplying by r i xf i xα i .
2차 쿼리에 의해 검색된 의료 컨텐츠의 스코어는 아래와 같이 산출될 수 있으며, 여기서, Pi는 i번째 2차 쿼리에 의해서 검색된 의료 컨텐츠의 보정 전 스코어이고, X QFi는 i번째 2차 쿼리에 의해서 검색된 의료 컨텐츠의 보정 후 스코어일 수 있다.The score of the medical content retrieved by the secondary query can be calculated as follows, where P i is the score before correction of the medical content retrieved by the ith secondary query, and It may be a score after correction of medical content.
일 예로, XQFi는 QFi x Pi xαi 로 곱하기로 산출될 수 있다.As an example, X QFi can be calculated by multiplying by QF i x P i xα i .
기타 가중치(αi)는 어근의 완성도, 의료 컨텐츠의 종류, 사용자의 특성, 사용된 쿼리의 MeSH 용어로 확장여부 중 적어도 하나를 반영할 수 있다. Other weights (α i ) may reflect at least one of the completeness of the root, the type of medical content, the user's characteristics, and whether the query used is expanded into MeSH terms.
어근의 완성도라 함은 쿼리(Q)에 대한 검색의 온전성에 대응될 수 있다. 일 예로, 검색 주체에 의해서 "어깨힘줄 파열"이 검색어로 입력되었을 때, 서버 등은 의학용어로서 선정 가능한 쿼리 중 "회전근개 파열"을 1차 또는 2차 쿼리(Q)로 선정할 수 있으며, 상기 쿼리(Q)에 의해 검색된 의료 컨텐츠에서 '회전근개'와 '파열'이란 어근이 각각 분리되어 존재하는 경우와, '회전근개 파열'이라는 어근의 조합으로서 온전히 있는 경우를 달리 평가될 수 있어야 한다. 이러한 경우 온전성 또는 어근 완성도에 따라 가중치(αi)를 부여할 때, '회전근개' 및 '파열'이 각각 검색된 경우(ex. αi=1)보다 '회전근개 파열'로 온전하게 검색된 경우((ex. αi=10)를 더 높게 부여할 수 있다. The completeness of the root can correspond to the completeness of the search for the query (Q). For example, when "shoulder tendon rupture" is entered as a search term by the search subject, the server, etc. may select "rotator cuff rupture" as the first or second query (Q) among the queries that can be selected as medical terms, In the medical content retrieved by the above query (Q), the case where the roots 'rotator cuff' and 'rupture' exist separately, and the case where they exist as a combination of the roots 'rotator cuff tear' should be evaluated differently. . In this case, when weighting (α i ) is given according to the integrity or root completeness, the case where 'rotator cuff tear' is searched more completely than when 'rotator cuff' and 'rupture' are searched separately (ex. α i = 1) ((ex. α i =10) can be given higher.
예를 들어, 의료 컨텐츠의 종류 가중치는 의료 컨텐츠가 논문, 특허, 초록, 발표자료, 의견서, 연구계획서, 사설 또는 기고 여부에 따라 동일 또는 다르게 정의될 수 있다.For example, the type weight of medical content may be defined the same or differently depending on whether the medical content is a paper, patent, abstract, presentation, opinion paper, research plan, editorial, or contribution.
의료 컨텐츠가 논문인 경우, 의료 컨텐츠를 구성하는 섹션 정보, 즉 제목, 키워드, MeSH term, 초록, 데이터, 본문의 결과, 토론, 방법 및 서론 중 1, 2차 쿼리가 어디에서 검색되었는지를 다르게 판단하여 반영될 수 있다.If the medical content is a paper, it is judged differently where the first and second queries were searched among the section information that constitutes the medical content, that is, title, keywords, MeSH terms, abstract, data, results of the main text, discussion, methods, and introduction. This can be reflected.
본 발명의 쿼리 확장 방법에 따르면, 충분한 양의 의료 컨텐츠(medical contents)를 확보함으로써 그에 따른 평가 스코어의 객관성을 향상시킬 수 있다.According to the query expansion method of the present invention, the objectivity of the evaluation score can be improved by securing a sufficient amount of medical contents.
다만, 의료 분야 및 의학 용어가 일반 사용자에 생소하다는 점을 고려하여, 검색어를 그대로 사용하지 않고, 1차 쿼리를 선정하는 과정을 거칠 수 있으며, 이러한 과정에서 의학용어나 질병 카테고리 등을 이용할 수 있다.However, considering that the medical field and medical terminology are unfamiliar to general users, you may go through a process of selecting the primary query rather than using the search term as is, and in this process, you may use medical terminology or disease categories. .
본 발명의 쿼리 확장 방법에 따르면, 쿼리를 단순 확장하는 것 외에도 증상, 치료, 진단, 부위 등 의학 분야에 따라 합리적인 기준으로 쿼리를 확장할 수 있다. According to the query expansion method of the present invention, in addition to simply expanding the query, the query can be expanded by reasonable standards according to medical fields such as symptoms, treatment, diagnosis, and site.
본 발명의 쿼리 확장 방법은 의료 컨텐츠를 선별하는 기준으로서, 의료 컨텐츠의 평가 스코어에도 쿼리 확장시 기준을 반영하여 실질적으로 쿼리와 관련된 의료 컨텐츠의 결과가 더 반영되도록 할 수 있다.The query expansion method of the present invention is a standard for selecting medical content, and the evaluation score of the medical content can also reflect the standard when expanding the query so that the results of the medical content related to the query are more substantially reflected.
이러한 쿼리 확장 방법에 따라 의료대상 정보를 정확하게 제공할 수 있으며, 실질적으로 연관성이 높은 성과물에 가중치를 부여하거나 확장에 따른 검색 결과에는 상대적으로 낮은 가중치를 부여함으로써 의료 컨텐츠 평가에 대한 신뢰성을 높일 수 있다.According to this query expansion method, medical target information can be provided accurately, and the reliability of medical content evaluation can be increased by assigning weight to highly relevant results or relatively low weight to search results resulting from expansion. .
도 1은 본 발명의 일 실시예에 따른 쿼리 확장 방법 및 그를 이용한 의료대상 정보 제공방법을 수행하기 위한 서버 및 네트워크 관계를 설명하기 위한 도면이다.
도 2는 본 발명의 일 실시예에 따른 쿼리 확장 방법 및 그를 이용한 의료대상 정보 제공방법의 과정을 설명하기 위한 도면이다.
도 3의 본 발명의 일 실시예에 따른 쿼리 확장 방법 및 그를 이용한 의료 컨텐츠의 평가 과정을 설명하기 위한 도면이다.Figure 1 is a diagram illustrating a server and network relationship for performing a query expansion method and a method of providing medical subject information using the same according to an embodiment of the present invention.
Figure 2 is a diagram for explaining the process of a query expansion method and a method of providing medical subject information using the same according to an embodiment of the present invention.
Figure 3 is a diagram for explaining a query expansion method and a medical content evaluation process using the same according to an embodiment of the present invention.
이하 첨부된 도면들을 참조하여 본 발명의 바람직한 실시예를 상세하게 설명하지만, 본 발명이 실시예에 의해 제한되거나 한정되는 것은 아니다. 참고로, 본 설명에서 동일한 번호는 실질적으로 동일한 요소를 지칭하며, 상기 규칙 하에서 다른 도면에 기재된 내용은 인용하여 설명할 수 있고, 당업자에게 자명하다고 판단되거나 반복되는 내용은 생략될 수 있다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings, but the present invention is not limited or limited by the embodiments. For reference, in this description, the same numbers refer to substantially the same elements, and under the above rules, content written in other drawings may be cited and explained, and content deemed obvious to those skilled in the art or repeated may be omitted.
도 1은 본 발명의 일 실시예에 따른 쿼리 확장 방법 및 그를 이용한 의료대상 정보 제공방법을 수행하기 위한 서버 및 네트워크 관계를 설명하기 위한 도면이고, 도 2는 본 발명의 일 실시예에 따른 쿼리 확장 방법 및 그를 이용한 의료대상 정보 제공방법의 과정을 설명하기 위한 도면이고, 도 3의 본 발명의 일 실시예에 따른 쿼리 확장 방법 및 그를 이용한 의료 컨텐츠의 평가 과정을 설명하기 위한 도면이다.Figure 1 is a diagram illustrating a server and network relationship for performing a query expansion method and a method of providing medical subject information using the same according to an embodiment of the present invention, and Figure 2 is a query expansion according to an embodiment of the present invention. This is a diagram for explaining the method and the process of providing medical subject information using the same, and the query expansion method according to an embodiment of the present invention in Figure 3 is a diagram for explaining the process of evaluating medical content using the method.
참고로, 본 발명에 따른 쿼리 확장 방법을 설명함에 있어 의료대상 정보 제공의 과정을 이용하지만, 본 발명의 쿼리 확장 방법은 의료대상 정보 제공에만 한정되지 아니하며, 유의미한 의료 컨텐츠를 검색하는 다른 과정이나 시스템에도 적용될 수 있다. For reference, in explaining the query expansion method according to the present invention, the process of providing medical information is used, but the query expansion method of the present invention is not limited to providing medical information, and is not limited to other processes or systems that search for meaningful medical content. It can also be applied.
도 1 내지 도 3을 참조하면, 사용자 또는 접속자는 스마트 폰(10)이나 PC 컴퓨터(20) 등을 통해서 서버(110)에 로그인 또는 비로그인 등을 통해 접속할 수 있으며(S120), 접속자는 서버(110)와 네트워크로 연결된 상태에서 검색어를 입력할 수 있으며, 서버(110)는 사용자로부터 검색어를 수신할 수 있다(S130). Referring to FIGS. 1 to 3, the user or accessor can access the server 110 through a smartphone 10 or a PC computer 20 by logging in or not logging in (S120), and the accessor can access the server 110 (S120). 110), a search term can be entered while connected to the network, and the server 110 can receive a search term from the user (S130).
서버(110)는 사용자로부터 수신된 검색어를 데이터베이스(114) 등에 저장할 수 있으며, 서버의 검색부(113)는 검색어를 그대로 이용할 수 있지만, 검색어로부터 전문적인 정보 수집을 위해 1차 쿼리를 선정할 수 있다.The server 110 may store the search term received from the user in the database 114, etc., and the search unit 113 of the server may use the search term as is, but may select a primary query to collect specialized information from the search term. there is.
참고로, 본 명세서에서 '검색어'는 서버에 접속한 사용자 또는 다른 서버가 결과를 얻기 위해 직접 제공한 단어 또는 단어들의 조합, 문자일 수 있으며, '쿼리'는 수신 또는 입력된 검색어를 이용하여 서버 또는 데이터베이스가 의료 및 의학 데이터베이스가 인식할 수 있는 의학용어로 선정한 단어, 용어, 이들의 조합일 수 있다. 서버에 따라서는 검색어를 바로 쿼리로 이용할 수 있지만, 다르게는 데이터베이스를 이용하기 위한 다른 쿼리를 추가, 변경, 선정할 수 있다.For reference, in this specification, a 'search word' may be a word or a combination of words or characters provided directly by a user connected to the server or another server to obtain results, and a 'query' may be a word or a combination of words provided by a user accessing the server or another server to obtain results, and a 'query' may be a word or a combination of words provided by a user connected to the server or another server to obtain results. Alternatively, the database may be words, terms, or combinations of words selected as medical terms that the database can recognize. Depending on the server, search terms can be used directly as queries, but in others, other queries can be added, changed, or selected to use the database.
사용자의 검색어를 1차 쿼리로 변환하는 과정에서 네이버, 카카오, 구글 등의 검색 엔진에서 의학 관련 다빈도 검색어를 추출 및 확보할 수 있으며, 학술적 성과를 이용한 의료대상 특허를 이용한 의료대상 검색 서비스에서 다빈도 검색어를 확보할 수 있으며, 확보된 검색어를 충분한 개수만큼 1차 쿼리로서 가능한 쿼리들을 변환할 수 있으며, 지속적으로 축적되는 다빈도 검색어에 대해서는 확보된 검색어와 쿼리와의 관계를 활용하여 서버 등이 딥 러닝(deep learning)을 포함한 방법으로 수동, 반자동, 및 자동화 변환할 수 있다. In the process of converting the user's search term into a primary query, medical-related high-frequency search terms can be extracted and secured from search engines such as Naver, Kakao, and Google, and Dabin can be used in the medical object search service using medical object patents using academic achievements. Search terms can also be secured, and a sufficient number of secured search words can be converted into possible queries as primary queries. For high-frequency search words that are continuously accumulated, servers, etc. can use the relationship between secured search words and queries. It can be converted manually, semi-automatically, and automatically using methods including deep learning.
예를 들어, 사용자가 "어깨 힘줄 파열", "어깨 회전근개 파열 수술"이나 "어깨손상 수술"과 같은 검색어를 입력하였을 때, 이런 용어들은 의학 용어에서는 사용되지 않는 자연스러운 용어나 표현이 포함될 수 있다.For example, when a user enters a search term such as “shoulder tendon rupture,” “shoulder rotator cuff tear surgery,” or “shoulder injury surgery,” these terms may include natural terms or expressions that are not used in medical terminology. .
서버 등은 검색어로부터 회전근개 파열 등 의학용어 및 어근 등에 따른 다양한 1차 쿼리의 조합을 선정할 수 있다. Servers can select various combinations of primary queries based on medical terms and roots, such as rotator cuff tear, from search terms.
이렇게 선정된 1차 쿼리를 기초로 외부 데이터베이스를 통해 환자 정보를 조회하거나 논문 데이터 등을 검색 및 추출할 수 있다. 서버의 연산부(112)는 환자 정보를 이용하여 후술하는 가중치에 반영하거나 논문 데이터를 참작하여 학술 스코어 등을 미리 계산할 수가 있다. 그리고 데이터베이스(114)에 저장된 학술 스코어, 대상 스코어, 리뷰 스코어 및 이들의 가중치 등을 고려하여 평가 스코어를 계산하고, 최종 또는 임시로 평가 스코어에 따라 적어도 하나의 의료대상을 접속자에게 추천하거나 의료대상에 대한 평가 정보를 제공할 수 있다. Based on this selected primary query, patient information can be searched or paper data can be searched and extracted through an external database. The calculation unit 112 of the server can use patient information to reflect the weights described later or calculate academic scores in advance by taking paper data into consideration. Then, an evaluation score is calculated in consideration of the academic score, target score, review score, and their weights stored in the database 114, and at least one medical target is recommended to the accessor or a medical target according to the final or temporary evaluation score. Evaluation information can be provided.
이를 위해서 서버(110)는 연산부(112), 검색부(113) 및 데이터베이스(114)를 포함할 수 있다. 서버(110)는 외부와 데이터를 송수신하기 위한 통신부(115)를 더 포함할 수 있으며, 통신부(115)는 접속자로부터 검색어를 수신하거나 선정된 1차 쿼리를 송신한 후 외부 데이터베이스(30)로부터 검색 결과를 수신할 수 있다. 또한, 통신부(115)는 외부 데이터베이스(30)로 1차 쿼리에 따른 검색 키워드를 송신할 수 있으며, 평가 스코어에 따른 의료대상 추천 결과를 접속자에게 실시간으로 제공할 수가 있다. For this purpose, the server 110 may include a calculation unit 112, a search unit 113, and a database 114. The server 110 may further include a communication unit 115 for transmitting and receiving data to and from the outside, and the communication unit 115 receives a search term from a connecter or transmits a selected primary query and then performs a search from the external database 30. You can receive the results. Additionally, the communication unit 115 can transmit search keywords according to the primary query to the external database 30, and provide medical target recommendation results according to evaluation scores to the connected person in real time.
참고로, 본 실시예에서는 사용자가 서버(110)에 접속하고, 검색어를 입력하는 내용을 설명하고 있지만, 다른 실시예에서는 API와 같이 다른 서버나 프로그램 인터페이스가 해당 서버로 검색어를 전달하여 의료대상에 대한 스코어 또는 스코어에 따른 의료대상의 리스트를 요청하고, 이에 요청된 결과를 제공하는 과정에서도 의료 컨텐츠를 이용한 의료대상 정보 제공방법에 사용될 수 있다.For reference, in this embodiment, the user connects to the server 110 and enters a search term, but in other embodiments, another server or program interface, such as an API, transmits the search term to the server to provide medical treatment. It can also be used in a method of providing information on medical subjects using medical content in the process of requesting a score or a list of medical subjects according to the scores and providing the requested results.
외부 데이터베이스(30)로는 공공데이터 서버, 민간데이터 서버 또는 블록체인 등이 될 수 있으며, 환자 정보 등을 열람하기 위해서라면 그 대상이 국가의료보험 관리공단, 건강보험심사평가원, 민간 보험회사, 국/공립 병원, 민간 병원, 민간 또는 상업 어플리케이션, 클라우드 등의 데이터베이스, 또는 블록체인 등이 될 수 있으며, 의료 관련 논문을 검색하기 위해서라면, 실시간 접속이 가능한 데이터베이스로서 Pubmed, Scopus, 구글 스콜라(Google scholar), 스코푸스(SCOPUS) 등을 대상으로 할 수 있고, 국내 검색 사이트로서 네이버 전문검색, NDSL, KCI, RISS 등을 이용할 수가 있으며, 알트메트릭(Altmetric), 멘델레이(Medeley) 메타데이터 서비스를 이용할 수도 있다. 또한, 학술 스코어 산출을 위하여 신문, 잡지, 라디오, TV, 인터넷 포털, 소셜 미디어, 소셜네트워크서비스 등에서 인용, 사용, 캡쳐, 언급, 및 소셜 미디어 활용 등의 데이터를 사용할 수 있으며, Altmetric 및 PlumX 메트릭스와 같은 메타데이터 서비스를 이용할 수도 있다. The external database 30 can be a public data server, a private data server, or a blockchain, and if it is to view patient information, etc., the target is the National Health Insurance Service, Health Insurance Review and Assessment Service, private insurance company, national/national/medical insurance company, etc. It can be a public hospital, a private hospital, a private or commercial application, a cloud database, or a blockchain. To search medical-related papers, databases with real-time access include Pubmed, Scopus, and Google Scholar. , SCOPUS, etc., and as domestic search sites, you can use Naver specialized search, NDSL, KCI, RISS, etc., and you can also use Altmetric and Mendeley metadata services. there is. In addition, to calculate academic scores, data such as citations, usage, capture, mentions, and social media usage from newspapers, magazines, radio, TV, Internet portals, social media, and social network services can be used, as well as Altmetric and PlumX metrics. You can also use the same metadata service.
본 명세서에서 의료대상이라 함은 의사(doctor, physician, surgeon), 의료진 또는 병원을 포함하는 개념으로 이해될 수 있으며, 사용자가 원하는 조건에 따라 평가한 스코어 및 그에 따라 가공된 결과를 특정 의사, 의료진 또는 병원명 등으로 제공할 수가 있다.In this specification, a medical subject can be understood as including a doctor, physician, surgeon, medical staff, or hospital, and the score evaluated according to the conditions desired by the user and the results processed accordingly can be used to refer to a specific doctor, medical staff, or hospital. Alternatively, it can be provided by the name of the hospital, etc.
의료대상이 개인인 경우에는 최종적인 평가 스코어는 의사 개인의 학술적 성과를 기준으로 취합될 수 있으며, 의료대상이 의료진인 경우에는 그 의료진에 포함된 의사들의 학술적 성과를 취합할 수 있으며, 의료대상이 병원인 경우에는 그 병원에 속한 의사들의 학술적 성과를 취합할 수가 있다. If the medical subject is an individual, the final evaluation score can be compiled based on the academic performance of the individual doctor. If the medical subject is a medical staff, the academic performance of the doctors included in the medical staff can be collected. In the case of a hospital, the academic achievements of doctors belonging to the hospital can be collected.
도 2를 보면, 본 실시예에 따른 의료대상 정보 제공방법에 따르면, 서버(110)가 의료대상에 대해 학술 스코어(AP), 대상 스코어(PP), 리뷰 스코어(RP)를 구분하는 데이터베이스(114)를 유지할 수 있다(S110). 서버(110)에 사용자가 접속해서(S120) 검색어 입력하면, 서버(110)가 그 검색어를 수신하게 되고(S130), 서버(110)는 검색어를 기초로 의학 용어 등에 적합한 1차 쿼리를 선정할 수 있다(S140). Referring to FIG. 2, according to the method of providing medical subject information according to this embodiment, the server 110 creates a database 114 that distinguishes academic scores (AP), subject scores (PP), and review scores (RP) for medical subjects. ) can be maintained (S110). When a user accesses the server 110 (S120) and enters a search term, the server 110 receives the search term (S130), and the server 110 selects a primary query suitable for medical terms, etc. based on the search term. (S140).
1차 쿼리를 기초로 서버에 포함된 데이터베이스 또는 서버의 외부에 있는 데이터베이스에 저장된 의료 컨텐츠를 검색하게 되고, 1차 검색수를 반영하여 검색총량(1)을 산출할 수 있다(S150). 여기서 1차 검색수를 반영한 검색총량(1)은 1차 검색수를 단순 더할 수도 있지만, 경우에 따라서는 중복 검색된 의료 컨텐츠는 제외하던가 1차 쿼리에 따른 가중치를 반영하여 검색총량(1)에 반영할 수 있다. Based on the primary query, medical content stored in a database included in the server or a database external to the server is searched, and the total number of searches (1) can be calculated by reflecting the number of primary searches (S150). Here, the search total (1) reflecting the number of primary searches can be simply added to the number of primary searches, but in some cases, duplicate searched medical content is excluded or the weight according to the primary query is reflected in the search total (1). can do.
검색총량(1)이 산출되면, 서버(110)는 검색총량(1)이 특정 통과 기준을 만족하는지 확인할 수 있다(S160). 만약 1차 검색수를 반영한 것만으로도 검색총량(1)이 통과 기준을 만족하면, 의료 컨텐츠 검색과 관련하여 2차 쿼리 선정을 생략할 수 있다. When the search total amount (1) is calculated, the server 110 can check whether the search total amount (1) satisfies a specific passing criterion (S160). If the total search volume (1) satisfies the passing criteria just by reflecting the number of primary searches, secondary query selection in relation to medical content search can be omitted.
하지만, 본 실시예에서와 같이, 1차 검색수에 의한 검색총량(1)이 통과 기준을 만족하지 못하면, 2차 쿼리를 포함하는 2차 쿼리 필드를 선정할 수 있으며(S170), 2차 쿼리에 의한 2차 검색수를 반영하여 새로운 검색총량(2)를 산출할 수 있다(S180). 이 새로운 검색총량(2)은 상술한 바와 같이, 2차 검색수를 단순 더하거나 상술한 다른 방법을 통해서 2차 검색수를 반영할 수 있다.However, as in this embodiment, if the total search amount (1) based on the number of primary searches does not meet the passing criteria, a secondary query field including the secondary query can be selected (S170), and the secondary query A new search total (2) can be calculated by reflecting the number of secondary searches (S180). As described above, this new total search amount (2) can reflect the number of secondary searches by simply adding the number of secondary searches or using other methods as described above.
2차 쿼리 필드를 통해 검색총량(2)이 통과 기준을 만족하면, 의료 컨텐츠 검색에 대한 쿼리 선정을 2차 쿼리 선정으로도 완료할 수 있다. If the total search volume (2) satisfies the passing criteria through the secondary query field, query selection for medical content search can be completed through secondary query selection.
하지만, 경우에 따라서는 2차 쿼리를 이용한 검색총량(2)이 충분하지 않을 수 있는데, 이때 3차 쿼리를 추가로 선정해야 할 수도 있다. 3차 쿼리를 선정하는 과정은 1차 쿼리에서 2차 쿼리를 선정하고 검색하는 방법과 유사할 수 있다. 따라서, 논리적으로는 2차 쿼리를 새로운 1차 쿼리로 대입하고, 새로운 1차 쿼리에서 새로운 2차 쿼리를 선정하는 과정(S170)을 반복할 수 있다. 이러한 과정을 통해서 새로운 2차 쿼리 선정, 검색총량의 산출, 다시 산출된 검색총량과 통과 기준의 비교 등을 반복하여 수행할 수 있다. However, in some cases, the total search volume (2) using the secondary query may not be sufficient, and in this case, an additional tertiary query may need to be selected. The process of selecting the third query may be similar to the method of selecting and searching the second query from the first query. Therefore, logically, the process of substituting the secondary query into a new primary query and selecting a new secondary query from the new primary query (S170) can be repeated. Through this process, it is possible to repeatedly select a new secondary query, calculate the total search volume, and compare the calculated total search volume with the passing criteria.
2차 쿼리는 다양한 기준에 의해서 확장 또는 파생될 수 있지만, 본 실시예에서는 어근에 따라 분류하고 분류된 어근들의 조합으로 2차 쿼리 필드를 선정할 수 있다. Secondary queries can be expanded or derived based on various criteria, but in this embodiment, the secondary query fields can be classified according to roots and selected as a combination of classified roots.
도 3을 참조하면, 1차 쿼리로서 "관절경적 반월상연골 복원술"이 이용되고 1차 검색수를 반영한 검색총량이 통과 기준에 미치지 못하였다고 가정할 수 있다. Referring to Figure 3, it can be assumed that "arthroscopic meniscus restoration" was used as the first query and that the total search volume reflecting the number of first searches did not meet the passing criteria.
이 경우, 1차 쿼리의 어근을 관절경적, 반월상연골, 복원술 등과 같이 분류할 수 있고, 부위의 상위 개념으로 무릎을 분류할 수 있다. 분류된 어근들 및 상위 개념에 따라 2차 쿼리로서 반월상연골 복원술, 관절경적 복원술, 반월상연골, 무릎 등과 같은 2차 쿼리 필드를 선정할 수 있다.In this case, the root of the first query can be classified as arthroscopy, meniscus, reconstruction, etc., and knee can be classified as a higher-level concept of the region. Depending on the classified roots and high-level concepts, secondary query fields such as meniscus restoration, arthroscopic restoration, meniscus, knee, etc. can be selected as secondary queries.
2차 쿼리를 반월상연골 복원술, 관절경적 복원술, 반월상연골, 무릎으로 선정한 2차 쿼리 필드를 이용하여, 상술한 외부의 데이터베이스를 통해서 의료 컨텐츠를 다시 검색할 수 있으며, By using the secondary query field where meniscus restoration, arthroscopic restoration, meniscus, and knee are selected as secondary queries, medical content can be searched again through the external database mentioned above.
각 2차 쿼리에 따른 검색 수를 다음과 같이 검색될 수 있다. 1차 쿼리인 '관절경적 반월상연골 복원술'로 검색하였을 때, 약 900건이 검색되었다면, 같은 조건 하에서 2차 쿼리로서 '반월상연골 복원술'로 검색하였을 때 약 2,700건, '관절경적 복원술'로 검색하였을 때 약 6,300건, '반월상연골'로 검색하였을 때 약 15,000건, 단순 부위의 상위 개념이 '무릎'로 검색하였을 때 약 180,000건이 나올 수 있다. The number of searches for each secondary query can be searched as follows. When searching for 'arthroscopic meniscus restoration surgery' as the first query, about 900 results were found, and when searching for 'meniscus restoration surgery' as a second query under the same conditions, about 2,700 results were found for 'arthroscopic restoration surgery'. When you search, you can get about 6,300 results, when you search for 'meniscus', you can get about 15,000 results, and when you search for 'knee', which is the higher level concept of a simple part, you can get about 180,000 results.
2차 쿼리 필드의 결과로 2차 검색수는 20만건이 이상 나올 수 있으며, 이는 소정의 통과 기준을 넘어선 결과로 사용이 가능하다. 하지만, '무릎'으로 검색하였을 때 검색된 약 180,000건의 의료 컨텐츠를 1차 쿼리인 '관절경적 반월상연골 복원술'로 검색하였을 때 검색된 결과와 2차 쿼리 중 '반월상연골 복원술'이나 '관절경적 복원술'로 검색하였을 때 검색된 결과 등과 다른 기준으로 판단할 필요가 있다.As a result of the secondary query field, the number of secondary searches may be more than 200,000, which can be used as a result that exceeds the predetermined passing standard. However, when searching for 'knee', the approximately 180,000 medical contents retrieved were searched with the primary query 'arthroscopic meniscus restoration surgery', and the search results and the secondary query 'meniscus restoration surgery' or 'arthroscopic restoration surgery' ', it is necessary to judge based on different criteria such as the search results.
2차 쿼리에 의해서 검색총량을 확장한 경우라도, 이를 동일하게 판단하지 않는 것이 바람직할 수 있다. 따라서, 본 실시예에서는 2차 쿼리를 확장한 경우, 확장된 2차 쿼리에 의해 검색된 의료 컨텐츠에 대해서는 2차 검색수 또는 2차 쿼리 필드의 특성을 고려하여 의료 컨텐츠의 스코어를 1차 쿼리에 의한 의료 컨텐츠와 차별적으로 산출할 수 있다.Even if the total search volume is expanded by secondary queries, it may be desirable not to judge it equally. Therefore, in this embodiment, when the secondary query is expanded, the score of the medical content is calculated based on the primary query by considering the number of secondary searches or the characteristics of the secondary query field for the medical content retrieved by the expanded secondary query. It can be calculated differently from medical content.
도 3에 부가된 내용을 보면, 2차 쿼리 필드에 의해 검색된 의료 컨텐츠의 스코어에 2차 검색수를 반영한 검색범위 보정 가중치(r), 2차 쿼리 필드의 특성을 반영한 쿼리필드 특성 가중치(f)를 반영할 수 있다.Looking at the content added to FIG. 3, the search range correction weight (r) that reflects the number of secondary searches in the score of the medical content searched by the secondary query field, and the query field characteristic weight (f) that reflects the characteristics of the secondary query field. can be reflected.
일 예로, 2차 쿼리 중 '반월상연골 복원술'을 쿼리로 검색한 결과, 약 2,700 건이 검색되었을 때, 검색범위 보정 가중치(r1)는 1/(3-1)로 약 0.5일 수 있으며, '관절경적 복원술'의 검색범위 보정 가중치(r2)는 약 0.166, '반월상연골'의 검색범위 보정 가중치(r3)는 약 0.063, '무릎'의 검색범위 보정 가중치(r4)는 약 0.005 로 산출될 수 있다.For example, as a result of searching for 'meniscus restoration surgery' as a query among the secondary queries, when about 2,700 cases are searched, the search range correction weight (r 1 ) may be 1/(3-1), which is about 0.5, The search range correction weight (r 2 ) for ‘arthroscopic reconstruction’ is approximately 0.166, the search range correction weight (r 3 ) for ‘meniscus’ is approximately 0.063, and the search range correction weight (r 4 ) for ‘knee’ is approximately 0.063. It can be calculated as 0.005.
또한, 쿼리필드 특성 가중치 역시 각 순서에 따라 특정명(ex. 관절경적 반월상연골)은 상대적으로 높게(ex. 1), 일반명(ex. 복원술)은 상대적으로 낮게(ex. 0.3 이하) 정의하여, 1차 쿼리의 쿼리필드 특성 가중치(f)는 약 2.3으로 산출한 반면, '반월상연골 복원술', '관절경적 복원술', '반월상연골', '무릎'의 각 쿼리필드 특성 가중치(f1~f4)를 1.3, 1.3, 1, 0.1로 산출할 수도 있다.In addition, the query field characteristic weight is also defined as relatively high (ex. 1) for specific names (ex. arthroscopic meniscus) and relatively low (ex. 0.3 or less) for general names (ex. restorative surgery) according to each order. Therefore, the query field characteristic weight (f) of the first query was calculated to be about 2.3, while the query field characteristic weights of 'meniscus restoration', 'arthroscopic restoration', 'meniscus', and 'knee' ( f 1 ~f 4 ) can also be calculated as 1.3, 1.3, 1, or 0.1.
2차 쿼리에 의해 검색된 의료 컨텐츠의 스코어(XQFi)는 아래의 2차 쿼리 보정 계수(QFi)를 이용하여 산출될 수 있다.The score (X QFi ) of the medical content retrieved by the secondary query can be calculated using the secondary query correction coefficient (QF i ) below.
여기서, QFi는 2차 쿼리 필드 중 i번째 2차 쿼리의 보정 계수, ri는 i번째 2차 쿼리의 검색범위 보정 가중치, fi는 i번째 2차 쿼리의 쿼리필드 보정 가중치, αi는 기타 가중치일 수 있으며, QFi는 ri x fi xαi 로 곱하기 함수로도 산출될 수 있다.Here, QF i is the correction coefficient of the ith secondary query among the secondary query fields, r i is the search range correction weight of the ith secondary query, f i is the query field correction weight of the ith secondary query, and α i is It can be other weights, and QF i can also be calculated as a multiplication function as r i xf i xα i .
2차 쿼리에 의해 검색된 의료 컨텐츠의 스코어(XQFi)는 아래와 같이 산출될 수 있다. The score (X QFi ) of the medical content retrieved by the secondary query can be calculated as follows.
여기서, Pi는 i번째 2차 쿼리에 의해서 검색된 의료 컨텐츠의 보정 전 스코어이고, 다른 변수는 상술한 내용을 참조할 수 있다. 여기서도, XQFi는 QFi x Pi xαi 로 곱하기 함수로 산출될 수 있다.Here, P i is the score before correction of the medical content retrieved by the ith secondary query, and other variables can refer to the above-mentioned contents. Here too, X QFi can be calculated as a multiplication function as QF i x P i xα i .
참고로, 기타 가중치(αi)는 어근의 완성도, 의료 컨텐츠의 종류, 사용자의 특성, 사용된 쿼리의 MeSH 용어로 확장여부 중 적어도 하나를 반영할 수 있다. For reference, other weights (α i ) may reflect at least one of the completeness of the root, the type of medical content, the user's characteristics, and whether the query used is expanded to a MeSH term.
어근의 완성도라 함은 쿼리(Q)에 대한 검색의 온전성에 대응될 수 있다. 본 실시예에서, 검색 주체에 의해서 "무릎 연골 복원"이 검색어로 입력되었을 때, 서버 등은 의학용어로서 선정 가능한 쿼리 중 "관절경적 반월상연골 복원술"을 1차 쿼리로 선정할 수 있다. The completeness of the root can correspond to the completeness of the search for the query (Q). In this embodiment, when “knee cartilage restoration” is entered as a search term by the search subject, the server, etc. may select “arthroscopic meniscus restoration surgery” as the primary query among queries that can be selected as medical terms.
"관절경적 반월상연골 복원술"을 1, 2차 쿼리로 선정한 경우라 하더라도, 검색된 의료 컨텐츠에서 '관절경적', '반월상연골', '복원술'이란 어근이 각각 분리되어 존재하는 경우와, '관절경적 반월상연골 복원술'이라는 어근의 조합으로서 온전히 있는 경우를 달리 평가될 수 있어야 한다. 이러한 경우 온전성 또는 어근 완성도에 따라 가중치(αi)를 부여할 때, '관절경적', '반월상연골', '복원술'이 분리되어 검색된 경우(ex. αi=1)보다, '관절경적 반월상연골 복원술'로 온전하게 검색된 경우((ex. αi=10)에 기타 가중치를 더 높게 부여할 수 있다. Even if “arthroscopic meniscus restoration” is selected as the first and second query, the roots of ‘arthroscopic’, ‘meniscus’, and ‘restorative surgery’ exist separately in the searched medical content, and ‘ As a combination of the root words ‘arthroscopic meniscus restoration,’ intact cases should be evaluated differently. In this case, when weighting (α i ) is given according to integrity or root completeness, 'joint horn', 'meniscus', and 'restorative surgery' are searched separately (ex. α i = 1). If the search term ‘horn meniscus restoration surgery’ is completely searched (ex. α i = 10), other weights may be assigned higher.
본 실시예에서 통과 기준은 검색총량이 특정 상수(ex. 10,000)로 절대값으로 정의될 수 있다. 하지만, 이외에도 합리적이면서 객관적인 결과를 제공할 수 있는 검색수로서 다양하게 선정될 수 있으며, 모든 쿼리에 대해서 같은 기준을 가질 수도 있지만, 쿼리에 따라서 다른 기준을 정의할 수도 있다.In this embodiment, the passing criterion may be defined as an absolute value where the search total amount is a specific constant (ex. 10,000). However, in addition to this, the number of searches that can provide reasonable and objective results can be selected in various ways, and the same criteria may be used for all queries, but different criteria may be defined depending on the query.
상술한 바와 같이, 본 발명의 바람직한 실시예를 참조하여 설명하였지만 해당 기술분야의 숙련된 당업자라면 하기의 청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.As described above, although the present invention has been described with reference to preferred embodiments, those skilled in the art may make various modifications and changes to the present invention without departing from the spirit and scope of the present invention as set forth in the claims below. You will understand that you can do it.
10 : 스마트폰 20 : PC
30 : 외부 데이터베이스 110 : 서버
112 : 연산부 113 : 검색부
113 : 데이터베이스10: Smartphone 20: PC
30: external database 110: server
112: calculation unit 113: search unit
113: database
Claims (11)
(a) 상기 1차 쿼리를 이용한 검색 결과로서의 1차 검색수가 반영된 검색총량을 소정의 통과 기준과 비교하는 단계;
(b) 상기 검색총량이 상기 통과 기준을 만족하지 않으면, 상기 1차 쿼리로부터 파생된 2차 쿼리를 포함하는 2차 쿼리 필드를 선정하는 단계; 및
(c) 상기 2차 쿼리 필드에 의한 2차 검색수가 반영된 새로운 검색총량을 산출하는 단계; 및
(d) 상기 (c) 단계에서의 상기 검색총량을 상기 통과 기준과 비교하는 단계;를 포함하며,
상기 2차 쿼리에 의해 검색된 의료 컨텐츠에 대해서는 상기 2차 검색수 또는 상기 2차 쿼리 필드의 특성을 고려하여 상기 의료 컨텐츠의 스코어를 산출하고,
상기 2차 쿼리에 의해 검색된 상기 의료 컨텐츠의 상기 스코어는 상기 2차 검색수를 반영한 검색범위 보정 가중치(r), 상기 2차 쿼리 필드의 특성을 반영한 쿼리필드 특성 가중치(f) 및 이들의 조합을 이용하여 산출되는 것을 특징으로 하는 의료 컨텐츠 검색을 위한 쿼리 확장 방법.In a method of expanding a query for retrieving medical content in response to a selected primary query related to medical care,
(a) comparing the total search volume reflecting the number of primary searches as a search result using the primary query with a predetermined passing standard;
(b) if the search total does not meet the passing criteria, selecting a secondary query field including a secondary query derived from the primary query; and
(c) calculating a new search total amount reflecting the number of secondary searches by the secondary query field; and
(d) comparing the total search amount in step (c) with the passing criteria,
For the medical content searched by the secondary query, a score of the medical content is calculated in consideration of the number of secondary searches or characteristics of the secondary query field,
The score of the medical content searched by the secondary query includes a search range correction weight (r) reflecting the number of secondary searches, a query field characteristic weight (f) reflecting the characteristics of the secondary query field, and a combination thereof. A query expansion method for retrieving medical content, characterized in that it is calculated using:
상기 (d) 단계에서의 상기 검색총량이 상기 통과 기준을 만족하면, 의료 컨텐츠 검색에 대한 쿼리 선정을 완료하는 것을 특징으로 하는 의료 컨텐츠 검색을 위한 쿼리 확장 방법.According to paragraph 1,
A query expansion method for medical content search, characterized in that if the total search amount in step (d) satisfies the pass criterion, query selection for medical content search is completed.
상기 (d) 단계에서의 상기 검색총량이 상기 통과 기준을 만족하지 않으면, 상기 2차 쿼리를 새로운 1차 쿼리로 정의하여 상기 (a) 내지 상기 (d) 단계를 반복하는 것을 특징으로 하는 의료 컨텐츠 검색을 위한 쿼리 확장 방법.According to paragraph 1,
Medical content, characterized in that, if the search total in step (d) does not meet the passing criteria, the secondary query is defined as a new primary query and the steps (a) to (d) are repeated. How to expand queries for search.
상기 2차 쿼리는 상기 1차 쿼리를 어근에 따라 분류하고 분류된 상기 어근들의 조합으로 이루어진 범위 내에서 선정되는 것을 특징으로 하는 의료 컨텐츠 검색을 위한 쿼리 확장 방법.According to paragraph 1,
A query expansion method for retrieving medical content, characterized in that the secondary query is selected within a range of classifying the primary query according to its roots and combining the classified roots.
상기 2차 쿼리는 상기 1차 쿼리를 증상, 진단, 치료 및 부위 중 적어도 하나를 포함하는 분류하고, 분류된 증상, 진단, 치료 또는 부위의 유사어나 상위 개념들의 조합으로 이루어진 범위 내에서 선정되는 것을 특징으로 하는 의료 컨텐츠 검색을 위한 쿼리 확장 방법.According to paragraph 1,
The secondary query classifies the primary query as including at least one of symptoms, diagnosis, treatment, and area, and is selected within a range consisting of a combination of similar words or superordinate concepts of the classified symptom, diagnosis, treatment, or area. Featured query expansion method for medical content retrieval.
상기 2차 쿼리에 의해 검색된 상기 의료 컨텐츠의 상기 스코어는 아래의 2차 쿼리 보정 계수(QFi)를 이용하여 산출되며,
여기서, QFi는 상기 2차 쿼리 필드 중 i번째 2차 쿼리의 보정 계수, ri는 i번째 2차 쿼리의 검색범위 보정 가중치, fi는 i번째 2차 쿼리의 쿼리필드 보정 가중치, αi는 기타 가중치인 것을 특징으로 하는 의료 컨텐츠 검색을 위한 쿼리 확장 방법.According to paragraph 1,
The score of the medical content retrieved by the secondary query is calculated using the secondary query correction coefficient (QF i ) below,
Here, QF i is the correction coefficient of the ith secondary query among the secondary query fields, r i is the search range correction weight of the ith secondary query, f i is the query field correction weight of the ith secondary query, α i is a query expansion method for medical content retrieval, characterized in that other weights.
상기 2차 쿼리에 의해 검색된 상기 의료 컨텐츠의 상기 스코어는 아래와 같이 산출되며,
여기서, Pi는 i번째 2차 쿼리에 의해서 검색된 의료 컨텐츠의 보정 전 스코어이고, X QFi는 i번째 2차 쿼리에 의해서 검색된 의료 컨텐츠의 보정 후 스코어인 것을 특징으로 하는 의료 컨텐츠 검색을 위한 쿼리 확장 방법.According to clause 8,
The score of the medical content retrieved by the secondary query is calculated as follows,
Here, P i is the score before correction of the medical content retrieved by the ith secondary query, and method.
상기 통과 기준은 상수로 제공되는 것을 특징으로 하는 의료 컨텐츠 검색을 위한 쿼리 확장 방법.According to paragraph 1,
A query expansion method for retrieving medical content, wherein the passing criterion is provided as a constant.
상기 통과 기준은 상기 검색총량의 추세를 반영하여 결정되는 것을 특징으로 하는 의료 컨텐츠 검색을 위한 쿼리 확장 방법.According to paragraph 1,
A query expansion method for retrieving medical content, characterized in that the passing criterion is determined by reflecting the trend of the total search volume.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200170433A KR102578899B1 (en) | 2020-12-08 | 2020-12-08 | Method of expanding queries for searching medical content |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200170433A KR102578899B1 (en) | 2020-12-08 | 2020-12-08 | Method of expanding queries for searching medical content |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220081023A KR20220081023A (en) | 2022-06-15 |
KR102578899B1 true KR102578899B1 (en) | 2023-09-13 |
Family
ID=81987775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200170433A KR102578899B1 (en) | 2020-12-08 | 2020-12-08 | Method of expanding queries for searching medical content |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102578899B1 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101928533B1 (en) * | 2017-10-20 | 2018-12-12 | 조현철 | Method of recommending medical team based quantative doctor evaluation using academic performance |
KR101968200B1 (en) * | 2018-10-20 | 2019-04-12 | 최정민 | Medical information recommendation system based on diagnosis name, operation name and treatment name |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130080530A (en) * | 2012-01-05 | 2013-07-15 | 한국전자통신연구원 | Apparatus and method for searching program using related keyword |
-
2020
- 2020-12-08 KR KR1020200170433A patent/KR102578899B1/en active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101928533B1 (en) * | 2017-10-20 | 2018-12-12 | 조현철 | Method of recommending medical team based quantative doctor evaluation using academic performance |
KR101968200B1 (en) * | 2018-10-20 | 2019-04-12 | 최정민 | Medical information recommendation system based on diagnosis name, operation name and treatment name |
Also Published As
Publication number | Publication date |
---|---|
KR20220081023A (en) | 2022-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230026624A1 (en) | Structured support of clinical healthcare professionals | |
Kitchens et al. | Quality of health-related online search results | |
Zeng et al. | Characteristics of consumer terminology for health information retrieval | |
Cook et al. | Project IMPACT: results from a pilot validity study of a new observational database | |
US20120290328A1 (en) | Searching an electronic medical record | |
KR101928533B1 (en) | Method of recommending medical team based quantative doctor evaluation using academic performance | |
Richardson et al. | Does pornography-blocking software block access to health information on the Internet? | |
US10636515B2 (en) | Medical or health information search support apparatus and medical or health information search support system | |
JP5937080B2 (en) | Medical query refinement system | |
Zuccon et al. | The IR Task at the CLEF eHealth evaluation lab 2016: user-centred health information retrieval | |
KR102395921B1 (en) | Method of recommending medical team based on quantative doctor evaluation using user data and query analyzation | |
WO2009052384A2 (en) | Identification of medical practitioners who emphasize specific medical conditions or medical procedures in their practice | |
US20080306914A1 (en) | Method and system for performing a search | |
Kalagara et al. | Predictive factors of positive online patient ratings of spine surgeons | |
KR20210059954A (en) | Classification system for subject of medical specialty materials and method thereof | |
Petron et al. | Use of knee magnetic resonance imaging by primary care physicians in patients aged 40 years and older | |
Pollard et al. | Theoretical framework and methodological development of common subjective health outcome measures in osteoarthritis: a critical review | |
Ting et al. | Web information retrieval for health professionals | |
Bouamrane et al. | Development of an ontology for a preoperative risk assessment clinical decision support system | |
KR102578899B1 (en) | Method of expanding queries for searching medical content | |
Nichols et al. | Bibliometric analysis of ophthalmic journals | |
KR20090002213A (en) | System and method for consulting health care via network | |
KR102615254B1 (en) | Method of evaluating association between query and medical content | |
US20110119277A1 (en) | Method and System for Identifying Expertise | |
KR20220164451A (en) | Method of evaluating speciality of medical team |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |