JPS63187334A - Character-string pattern matching device - Google Patents
Character-string pattern matching deviceInfo
- Publication number
- JPS63187334A JPS63187334A JP62018629A JP1862987A JPS63187334A JP S63187334 A JPS63187334 A JP S63187334A JP 62018629 A JP62018629 A JP 62018629A JP 1862987 A JP1862987 A JP 1862987A JP S63187334 A JPS63187334 A JP S63187334A
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- characters
- memory
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 5
- RRLHMJHRFMHVNM-BQVXCWBNSA-N [(2s,3r,6r)-6-[5-[5-hydroxy-3-(4-hydroxyphenyl)-4-oxochromen-7-yl]oxypentoxy]-2-methyl-3,6-dihydro-2h-pyran-3-yl] acetate Chemical compound C1=C[C@@H](OC(C)=O)[C@H](C)O[C@H]1OCCCCCOC1=CC(O)=C2C(=O)C(C=3C=CC(O)=CC=3)=COC2=C1 RRLHMJHRFMHVNM-BQVXCWBNSA-N 0.000 abstract description 19
- 230000007704 transition Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 20
- 101000941450 Lasioglossum laticeps Lasioglossin-1 Proteins 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【発明の詳細な説明】
(発明の属する技術分野)
本発明は、各文字が固定長のコードで表現されており、
テキストと呼ばれる比較的長い文字列中に、別途与えら
れたパターンと呼ばれる比較的短い文字列が部分列とし
て存在するか否かを判定する″文字列パターンマツチン
グ処理″に関するものである。[Detailed description of the invention] (Technical field to which the invention pertains) The present invention is characterized in that each character is represented by a fixed length code,
This relates to a ``character string pattern matching process'' that determines whether a relatively short character string, called a separately given pattern, exists as a partial string in a relatively long character string called text.
(従来の技術)
データ処理システムの分野では、文章等の文字列データ
(テキストと呼ばれる)の集まりの中からパターンと呼
ばれる特定の部分文字列を含むもののみを検索したり、
テキストの中に含まれている全てのパターンを抽出する
ことがしばしば必要となる。(Prior Art) In the field of data processing systems, searches are made to search for only those containing a specific substring called a pattern from a collection of character string data (called text) such as sentences.
It is often necessary to extract all patterns contained within text.
通常、1つの文字はnビット(固定長)のコードで表現
されるため、テキストおよびパターンはnビット単位の
コードの系列となる。Usually, one character is expressed by an n-bit (fixed length) code, so text and patterns are a series of n-bit codes.
この様な文字列パターンマツチング処理を指定するコマ
ンドとして、SQLのLIKE述語が知られている。(
I B M Program Product S Q
L /DS 適用業務プログラミング解説書)LIK
E述語では、パターンの文字として、通常の文字以外に
任意の1文字と一致する固定長不確定文字(Fixed
−1ength don’t care文字(FDC)
;H31で表す)、および任意桁の任意の文字列と一致
する可変長不確定文字(Variable−1engt
h don’tcare文字(VDC);”%″″で表
す)を使用することができる。The LIKE predicate of SQL is known as a command that specifies such character string pattern matching processing. (
IBM Program Product SQ
L/DS Application Business Programming Manual) LIK
In the E predicate, the characters in the pattern are fixed-length characters that match any single character other than regular characters.
-1ength don't care character (FDC)
;H31), and a variable-length indeterminate character (Variable-1engt) that matches any character string of any digit.
h don'tcare character (VDC; represented by "%"") can be used.
第6図は、この様な従来の文字列パターンマツチング機
構の説明図である。FIG. 6 is an explanatory diagram of such a conventional character string pattern matching mechanism.
第6図において、1はテキストが格納された記憶装置、
2は文字列パターンマツチング装置、3はデータ転送路
、4は検索結果を出力する信号線である。In FIG. 6, 1 is a storage device in which text is stored;
2 is a character string pattern matching device, 3 is a data transfer path, and 4 is a signal line for outputting search results.
文字列パターンマツチング装置2において、文字列パタ
ーンマツチングを行う方法として、従来より有限オート
マトンを用いる方法が知られている。(L、A、)lo
llaar、 ”Hardware Systems
for TextInformation Retri
eval、”ACM 5IGIR6th Confer
ence 1983)第7図は、有限オートマトンの状
態遷移を表した説明図であり、50は有限オートマトン
の状態、60は状態遷移の方向を表し、テキストの中の
“BIC”という3文字のパターンを検出することがで
きる。In the character string pattern matching device 2, a method using a finite automaton is conventionally known as a method for performing character string pattern matching. (L,A,)lo
llaar, “Hardware Systems
for TextInformation Retri
eval,”ACM 5IGIR6th Conference
ence 1983) Figure 7 is an explanatory diagram showing the state transition of a finite automaton, where 50 represents the state of the finite automaton, 60 represents the direction of the state transition, and the three-letter pattern "BIC" in the text is can be detected.
以下、この動作を説明する。This operation will be explained below.
有限オートマトンの初期状態は状態(0)であり、入力
文字がII B IIであると状態(1)へ遷移する。The initial state of the finite automaton is state (0), and if the input character is II B II, it transitions to state (1).
同図のIt # IIはその他の文字を表し、状態(0
)における入力文字がII B Tl以外ならば引き続
き状態(0)に留まる。It #II in the same figure represents other characters, and the state (0
) continues to remain in state (0) if the input character is other than II B Tl.
状態(1)においても同様であり、入力文字が1′″で
あると状態(2)へ、B″′であると状態(1)へ、そ
れ以外であると状態(0)へ遷移する。The same applies to state (1); if the input character is 1'', the state transitions to state (2), if the input character is B'', the state transitions to state (1), and otherwise to state (0).
状態(2)において、入力文字が110”であると“B
IC”というパターンを検出したことになる。In state (2), if the input character is "110", "B"
This means that a pattern called "IC" has been detected.
第8図は、テキストの中のIgB%C”というパターン
を検出する有限オートマトンの説明図である。FIG. 8 is an explanatory diagram of a finite automaton that detects the pattern "IgB%C" in text.
第9図は、テキストの中の”B C”というパターン
を検出する有限オートマトンの説明図である。FIG. 9 is an explanatory diagram of a finite automaton that detects the pattern "B C" in text.
これら図中の記号の説明は、第7図における説明と同様
である。Explanations of symbols in these figures are the same as those in FIG. 7.
以上説明した、従来より知られた文字列パターンマツチ
ング装置では、FDC(”−”)、VDC(“%″)を
扱うことはできたが、文字の範囲を限定した不確定文字
を扱うことがきなかったため、以下のような欠点があっ
た。The previously known character string pattern matching device described above can handle FDC ("-") and VDC ("%"), but it cannot handle uncertain characters with a limited range of characters. As a result of this failure, there were the following drawbacks.
例えば、パターンとして“BIC”、“82G”、“8
3C”、”84C”、”85C″、”B2O”、”87
G”、”88C”、”B9O”を扱いたい場合に、11
8C”とすると、”BAC”等も誤検出されるため、パ
ターンとして、陽に”BIC”〜”B9O”を記述せね
ばならない。この場合の有限オートマドンは第10図の
ごとくなり、状態数が多くなり、それを表現するテーブ
ルを格納するメモリの容量は大きくなり、テーブルの作
用時間も長くなる。For example, the patterns are “BIC”, “82G”, “8
3C", "84C", "85C", "B2O", "87"
If you want to handle “G”, “88C”, “B9O”, 11
8C", "BAC" etc. will also be erroneously detected, so "BIC" to "B9O" must be explicitly written as a pattern. In this case, the finite automaton will be as shown in Figure 10, and the number of states will be As the number of tables increases, the memory capacity for storing the tables representing them increases, and the table operation time also increases.
(発明の目的)
本発明の目的は、パターンの一部として、文字の範囲を
限定した、固定長または可変長の不確定文字を含むこと
を可能とする文字列パターンマツチング装置を提供する
ことにある。(Object of the Invention) An object of the present invention is to provide a character string pattern matching device that can include fixed-length or variable-length uncertain characters with a limited range of characters as part of a pattern. It is in.
(発明の構成)
(発明の特徴と従来の技術の差異)
本発明は、パターンの一部として、文字の範囲を限定さ
れた不確定文字をマツチングする状態において、限定さ
れた範囲の文字が入力されたときのみパターン検出の条
件を維持することを特徴としている。(Structure of the Invention) (Characteristics of the Invention and Differences between the Prior Art) The present invention provides a method for matching uncertain characters with a limited range of characters as part of a pattern. The feature is that the pattern detection conditions are maintained only when the pattern is detected.
従来の無限定の不確定文字のみを対象とする文字列パタ
ーンマツチング装置では、その文字をマツチングする状
態においては、無条件にパターン検出の条件を維持して
いた点が異なる。A conventional character string pattern matching device that targets only indefinite characters differs in that the pattern detection conditions are unconditionally maintained while matching the characters.
(実施例)
第1図は、本発明の一実施例を示したブロック図であり
、5は有限オートマトンの状態遷移情報(次の状態番号
)を格納するランダムアクセスメモリ(RAM)、6は
検出パターン情報を格納するRAM、7はRAM5およ
びRAM6から読み出すデータのアドレスを保持するア
ドレスレジスタ、8はRA M 5およびRAM6共通
のアドレスデコーダ、9,10はそれぞれRAM5.R
AM6から読み出したデータが格納されるメモリレジス
タ、11は検索結果を出力する判別回路である。(Embodiment) FIG. 1 is a block diagram showing an embodiment of the present invention, in which 5 is a random access memory (RAM) that stores state transition information (next state number) of a finite automaton, and 6 is a detection 7 is an address register that holds the address of data to be read from RAM 5 and RAM 6; 8 is an address decoder common to RAM 5 and RAM 6; 9 and 10 are RAM 5. R
A memory register 11 stores data read from AM6, and a determination circuit 11 outputs a search result.
ここで、限定された範囲の任意の1文字と一致する固定
長不確定文字(RFDC)をILE]TTで、また任意
桁の限定された範囲の任意の文字と一致する可変長不確
定文字(RVDC)を%[コバで表すことにする。[コ
内が限定された範囲の文字を示す。Here, we define a fixed-length indeterminate character (RFDC) that matches any single character in a limited range with ILE]TT, and a variable-length indeterminate character (RFDC) that matches any character in a limited range of any digit with ILE]TT. RVDC) will be expressed in %[coba. [The characters in square brackets indicate a limited range of characters.
次に、第1図の動作について説明する。Next, the operation shown in FIG. 1 will be explained.
入力文字はデータ転送路3よりアドレスレジスタ7の下
位8ビツトにセットされる。The input character is set in the lower 8 bits of the address register 7 via the data transfer path 3.
アドレスレジスタ7の上位8ビツトには初期値としてx
’oo’がセットされており、アドレスレジスタ7の示
すアドレスに格納されている8ビツトのデータがRAM
5、RAM6からそれぞれ、メモリレジスタ9、メモリ
レジスタ10に読み出される。The upper 8 bits of address register 7 have x as the initial value.
'oo' is set, and the 8-bit data stored at the address indicated by address register 7 is stored in the RAM.
5. Read out from RAM 6 to memory register 9 and memory register 10, respectively.
メモリレジスタ9の内容は、次のサイクルでアドレスレ
ジスタ7の上位8ビツトにセットされる。The contents of memory register 9 are set to the upper 8 bits of address register 7 in the next cycle.
またメモリレジスタ10の内容は、判別回路11で検出
パターンが判定され信号線4に出力される。Further, the contents of the memory register 10 are outputted to the signal line 4 after a detection pattern is determined by the determination circuit 11 .
以」二の動作は、テキスト中の文字列が1文字入力され
る毎に繰返される。The following operations are repeated every time one character in the text is input.
第2図は、1文字を8ビツトのコードで表現し、最大2
56状態の有限オートマトンを実現するシステムにおい
て、与えられたパターンが
11B%[1〜91C”である場合に、検索の準備動作
としてRAM5、RAM6にそれぞれ格納するデータの
一例を表したものである。Figure 2 shows that one character is expressed as an 8-bit code, and a maximum of 2
In a system realizing a 56-state finite automaton, when a given pattern is 11B% [1 to 91C'', an example of data stored in RAM5 and RAM6 as a search preparation operation is shown.
第2図において、12.13はそわぞれ、RAM5、R
AM6の1つワードに格納された8ビツトのデータ、1
4はRAMのアドレスの上位8ビツト、15はRAMの
アドレスの下位8ビツトである。In Figure 2, 12.13 are RAM5, R
8-bit data stored in one word of AM6, 1
4 is the upper 8 bits of the RAM address, and 15 is the lower 8 bits of the RAM address.
なお、論理的にはRAMアドレスの上位8ビツト14は
有限オートマトンの状態番号、RAMアドレスの下位8
ビツト15はテキストから入力された文字のコードに対
応する。また、16は各文字コードに対応する文字であ
る。Note that logically, the upper 8 bits 14 of the RAM address are the state number of the finite automaton, and the lower 8 bits of the RAM address are
Bit 15 corresponds to the code of the character input from the text. Further, 16 is a character corresponding to each character code.
第2図のデータ12.13において、値が明示されてい
ない所はx’oo’が格納されているものとする。デー
タ12は次に遷移すべき状態番号である。In the data 12.13 of FIG. 2, it is assumed that x'oo' is stored where the value is not specified. Data 12 is the state number to which the next transition should be made.
データ13はパターンが検出されたか否かを示すビット
マツプであり、例えば最下位ビットが1であれば1番目
のパターンが検出されたことを示す。Data 13 is a bitmap indicating whether or not a pattern has been detected; for example, if the least significant bit is 1, it indicates that the first pattern has been detected.
第3図は、第2図と同様な条件の基で与えられたパター
ンが、”B−[l〜91C”である場合に、検索の準備
動作としてRAM5、RAM6にそれぞれ格納するデー
タの一例を表したものである。FIG. 3 shows an example of data stored in RAM5 and RAM6 as a search preparation operation when the pattern given under the same conditions as in FIG. 2 is "B-[l~91C". It is expressed.
第4図は、第2図におけるRAM5、RAM6に格納さ
れた有限オートマトンの状態遷移情報、検出パターン情
報を状態遷移図で表したものである。状態遷移図の見方
は第7図と同様である。FIG. 4 is a state transition diagram representing the state transition information and detection pattern information of the finite automaton stored in the RAM 5 and RAM 6 in FIG. 2. The state transition diagram can be viewed in the same way as in FIG.
=8−
第4図において、状態(1)は不確定文字をマツチング
する状態であり、限定された範囲の文字LL I II
〜II 9 TTが入力されている限り、パターン検出
の条件を維持しており、次に最後の文字11 C++が
入力されたとき、与えられたパターン
“B%[1〜9]C”を検出したことになる。=8- In Fig. 4, state (1) is a state in which uncertain characters are matched, and characters in a limited range LL I II
~II As long as 9 TT is input, the pattern detection conditions are maintained, and then when the last character 11 C++ is input, the given pattern “B%[1~9]C” is detected. That means you did it.
RAM5、RAM6に第2図の内容が格納されていると
、第4図に示した状態遷移図に従った有限オートマトン
の動作をすることになる。If the contents shown in FIG. 2 are stored in the RAM 5 and RAM 6, the finite automaton will operate according to the state transition diagram shown in FIG.
第5図は、第3図におけるRAM5、RAM6に格納さ
れた有限オートマトンの状態遷移情報、検出パターン情
報を状態遷移図で表したものである。第5図において、
状態(1)、(2)は不確定文字をマツチングする状態
であり、限定された範囲の文字″1”〜LL 9 ++
が入力されたときのみ、パターン検出の条件を維持して
状態(3)に遷移し、次に最後の文字# CITが入力
されたとき、与えられたパターン“B−[1〜9コCI
Iを検出したことになる。FIG. 5 is a state transition diagram representing the state transition information and detected pattern information of the finite automaton stored in RAM5 and RAM6 in FIG. In Figure 5,
States (1) and (2) are states in which uncertain characters are matched, and characters in a limited range "1" to LL 9 ++ are matched.
Only when the pattern detection condition is maintained and state (3) is entered, then when the last character # CIT is input, the given pattern "B-[1 to 9 CI
This means that I has been detected.
同様に、第1図のRAM5、RAM6に第3図の内容が
格納されていると、第5図に示した状態遷移図に従った
有限オートマトンの動作をすることになる。Similarly, if the contents of FIG. 3 are stored in the RAM 5 and RAM 6 of FIG. 1, the finite automaton will operate according to the state transition diagram shown in FIG.
(発明の効果)
第2図と同様な条件の基で、第10図の有限オートマト
ンの制御情報をRAM5、RAM6に展開すると、第1
1図のごとくなる。(Effect of the invention) When the control information of the finite automaton shown in FIG. 10 is developed into RAM5 and RAM6 under the same conditions as shown in FIG.
It will look like Figure 1.
この場合に必要なメモリ容量は11ワードである。The memory capacity required in this case is 11 words.
一方、第3図の場合の必要メモリ容量は4ワードである
。On the other hand, the required memory capacity in the case of FIG. 3 is 4 words.
この様に、従来の文字列パターンマツチング装置では、
パターンとして文字の範囲を限定した不確定文字を含む
ことができなかったため、不確定文字の範囲を限定した
処理をやりたい場合に、多量のメモリを使用し、オート
マトンの作成効率も悪い。In this way, conventional string pattern matching devices
Since it was not possible to include indeterminate characters with a limited range of characters as a pattern, a large amount of memory is used and the efficiency of creating an automaton is poor when you want to perform processing with a limited range of indeterminate characters.
一方、本発明の文字列パターンマツチング装置では、パ
ターンの一部として文字の範囲を限定した不確定文字を
処理する場合に、ホ量のメモリで有限オートマトンを効
率よく作成できる。On the other hand, in the character string pattern matching device of the present invention, when processing indeterminate characters with a limited range of characters as part of a pattern, a finite automaton can be efficiently created using a small amount of memory.
第1図は本発明の一実施例を示したブロック図、第2図
は1文字を8ビツトのコードで表現し、最大256状態
の有限オートマトンを表現するシステムにおいて、与え
られたパターンが
“8%[1〜91G”である場合のRAM5、RAM6
にそれぞれ格納されたデータの一例の説明図、第3図は
1文字を8ビツトのコードで表現し、最大256状態の
オートマトンを実現するシステムにおいて与えられたパ
ターンが”B [1〜91C”である場合のRAM5
、RAM6にそれぞれ格納されたデータの一例の説明図
、
第4図は第2図におけるRAM5、RAM6に格納され
た有限オートマトンの状態遷移情報、検出パターン情報
を表現した状態遷移図、第5図は第3図におけるRAM
5、RAM6に格納された有限オートマトンの状態遷移
情報、検出パターン情報を表現した状態遷移図、第6図
は従来の文字列パターンマツチング機構の説明図、
第7図は従来の有限オートマトンの状態遷移を=11−
表した説明図、
第8図はテキストの中のttB%CItというパターン
を検出する有限オートマトンの説明図、第9図はテキス
トの中のIt B C11というパターンを検出する
有限オートマトンの説明図、第10図は、テキストの中
(i’l”B I C”、 ”82 G”。
・・・・・・、”89C”のいずれかのパターンを検出
する有限オートマトンの説明図、
第11図は従来の文字列パターンマツチング装置におい
て、与えられたパターンが”BIC”。
“B2O”、・・・・・・、”B10”である場合のR
AM5、RAM6にそれぞれ格納されたデータの一例の
説明図である。
1 ・・・テキストが格納された記憶装置、2・・・文
字列パターンマツチング装置、3 ・・・データ転送路
、
4 ・・・検索結果を出力する信号線、5・・・有限オ
ートマトンの状態遷移情報を格納するRAM、
6 ・・・検出パターン情報を格納するRAM、=12
−
7・・・RAM5およびRAM6のアドレスレジスタ、
8・・・RAM5およびRAM6共通のアドレスデコー
ダ、
9.10・・・RAM5.RAM6のメモリレジスタ、
11・・・検索結果を出力する判別回路、12、13・
・・RAM5.RAM6の1つワードに格納された8ビ
ツトのデータ、
14・・・RAMのアドレスの上位8ビツト、15・・
・RAMのアドレスの下位8ビツト、16・・・文字コ
ードに対応する文字。
50・・・有限オートマトンの状態、
60・・・状態遷移の方向。
特許出願人 日本電信電話株式会社
第2
’l’ #2”3’ ”4’ 写 ’6’ ”7
’ ”8’ ”グ ”B”C’ ン禮 6第3
”l’ ”2”3’ ”4’ ”5’ ”6’
7° ”8” ”9” ”B”σン備 6第10図
第8図
第9図
第11Figure 1 is a block diagram showing an embodiment of the present invention, and Figure 2 is a system that expresses one character with an 8-bit code and represents a finite automaton with a maximum of 256 states. %[1~91G” RAM5, RAM6
Figure 3 is an explanatory diagram of an example of the data stored in each of the ``B[1~91C''] patterns in a system that expresses one character with an 8-bit code and realizes an automaton with a maximum of 256 states. RAM5 in certain cases
, an explanatory diagram of an example of data stored in RAM 6, respectively, FIG. 4 is a state transition diagram expressing the state transition information and detected pattern information of the finite automaton stored in RAM 5 and RAM 6 in FIG. 2, and FIG. RAM in Figure 3
5. A state transition diagram expressing the state transition information and detected pattern information of the finite automaton stored in the RAM 6. Figure 6 is an explanatory diagram of the conventional string pattern matching mechanism. Figure 7 is the state of the conventional finite automaton. An explanatory diagram showing the transition =11−. Figure 8 is an explanatory diagram of a finite automaton that detects the pattern ttB%CIt in text. Figure 9 is an explanatory diagram of a finite automaton that detects the pattern It B C11 in text. Figure 10 is an explanatory diagram of a finite automaton that detects any of the patterns (i'l"B I C", "82 G", ..., "89C") in the text. , Fig. 11 shows R when the given pattern is "BIC", "B2O", ..., "B10" in a conventional character string pattern matching device.
It is an explanatory view of an example of data stored in AM5 and RAM6, respectively. 1...Storage device storing text, 2...Character string pattern matching device, 3...Data transfer path, 4...Signal line for outputting search results, 5...Finite automaton RAM for storing state transition information, 6...RAM for storing detected pattern information, = 12
- 7...Address register of RAM5 and RAM6, 8...Address decoder common to RAM5 and RAM6, 9.10...RAM5. Memory register of RAM6, 11... Discrimination circuit that outputs search results, 12, 13.
・RAM5. 8-bit data stored in one word of RAM6, 14... Upper 8 bits of RAM address, 15...
・Lower 8 bits of the RAM address, 16...Character corresponding to the character code. 50...state of finite automaton, 60...direction of state transition. Patent applicant: Nippon Telegraph and Telephone Corporation No. 2 'l'#2"3""4" Photo '6'"7
'``8'' ``Gu ``B''C' Nrei 6th 3rd ``l''``2''3'``4''``5''``6''
7° ``8''``9''``B'' σn 6 Figure 10 Figure 8 Figure 9 Figure 11
Claims (2)
ストと呼ばれる比較的長い文字列中に、別途与えられた
パターンと呼ばれる比較的短い文字列が部分列として存
在するか否かを判定する文字列パターンマッチング処理
において、パターンの一部として文字の範囲を限定した
、固定長または可変長の不確定文字を含むことを特徴と
する文字列パターンマッチング装置。(1) Each character is expressed as a fixed-length code, and it is determined whether a relatively short character string called a separately given pattern exists as a substring in a relatively long character string called text. 1. A character string pattern matching device that performs character string pattern matching processing that includes fixed-length or variable-length indeterminate characters with a limited character range as part of the pattern.
番号および検出パターン番号を格納するためのメモリと
、そのメモリへのデータ書き込みおよび読み出し機構と
を備え、与えられたパターンに応じて予めそのメモリへ
次の状態番号および検出パターン番号を格納しておき、
テキストが入力された後は、テキストの各文字毎にその
メモリを索引することにより実行する文字列パターンマ
ッチング処理において、文字の範囲を限定した不確定文
字をマッチングする状態で、入力された文字が限定され
た範囲の対象文字であるときのみその状態に留まること
を特徴とする特許請求の範囲第(1)項記載の文字列パ
ターンマッチング装置。(2) Equipped with a memory for storing the next state number and detection pattern number corresponding to the set of state number and code number, and a mechanism for writing and reading data into the memory, and Store the next state number and detection pattern number in the memory in advance,
After text is entered, the string pattern matching process is performed by indexing the memory for each character of the text, and the entered characters are matched by matching uncertain characters within a limited range of characters. The character string pattern matching device according to claim 1, wherein the character string pattern matching device remains in that state only when the target character is in a limited range.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62018629A JPH07120356B2 (en) | 1987-01-30 | 1987-01-30 | Character string pattern matching device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62018629A JPH07120356B2 (en) | 1987-01-30 | 1987-01-30 | Character string pattern matching device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63187334A true JPS63187334A (en) | 1988-08-02 |
JPH07120356B2 JPH07120356B2 (en) | 1995-12-20 |
Family
ID=11976909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62018629A Expired - Fee Related JPH07120356B2 (en) | 1987-01-30 | 1987-01-30 | Character string pattern matching device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07120356B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04348469A (en) * | 1990-07-23 | 1992-12-03 | Hitachi Ltd | Character string retrieving device and its method |
WO1998011509A1 (en) * | 1996-09-13 | 1998-03-19 | Hitachi, Ltd. | Library information processing method |
CN112395853A (en) * | 2020-11-04 | 2021-02-23 | 苏宁云计算有限公司 | Text content detection mode determining method, device, equipment and storage medium |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58200343A (en) * | 1982-05-18 | 1983-11-21 | Nec Corp | Matching device for character string pattern |
-
1987
- 1987-01-30 JP JP62018629A patent/JPH07120356B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58200343A (en) * | 1982-05-18 | 1983-11-21 | Nec Corp | Matching device for character string pattern |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04348469A (en) * | 1990-07-23 | 1992-12-03 | Hitachi Ltd | Character string retrieving device and its method |
WO1998011509A1 (en) * | 1996-09-13 | 1998-03-19 | Hitachi, Ltd. | Library information processing method |
CN112395853A (en) * | 2020-11-04 | 2021-02-23 | 苏宁云计算有限公司 | Text content detection mode determining method, device, equipment and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JPH07120356B2 (en) | 1995-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4053871A (en) | Method and system for the iterative and simultaneous comparison of data with a group of reference data items | |
US4092729A (en) | Apparatus for automatically forming hyphenated words | |
US5138669A (en) | Range-conditional character string retrieving method and system | |
US4254476A (en) | Associative processor | |
JPH024026B2 (en) | ||
US4327407A (en) | Data driven processor | |
JPS63187334A (en) | Character-string pattern matching device | |
JPS60105040A (en) | Sentence retrieving system | |
JP3141428B2 (en) | Numerical value search apparatus and method | |
JPS62179083A (en) | Reference system for character string | |
US3316538A (en) | Circuit arrangement for processing parts of words in electronic computers | |
EP0227348A2 (en) | Content addressable memory circuit and method | |
JPH03131969A (en) | Method and device for retrieving code string | |
EP0468402A2 (en) | Character string retrieving system and method | |
JP2931934B2 (en) | Numeric search device | |
JPH0664586B2 (en) | String matching method | |
JPH06139278A (en) | Character string retrieving device quipped with character code converting function | |
JP2772124B2 (en) | Dictionary search method | |
SU926717A1 (en) | Associative storage | |
JP2679619B2 (en) | Nested message search device | |
JPS6361345A (en) | Control device for external storage device | |
JPH04223566A (en) | Numeric value retrieval apparatus | |
JPH03147036A (en) | Variable length data processor | |
JPH0193820A (en) | Retrieving device | |
JPS6373422A (en) | Information retrieving device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |