JP6750137B1 - 並列処理を使用したハッシュ結合の実行 - Google Patents
並列処理を使用したハッシュ結合の実行 Download PDFInfo
- Publication number
- JP6750137B1 JP6750137B1 JP2020501787A JP2020501787A JP6750137B1 JP 6750137 B1 JP6750137 B1 JP 6750137B1 JP 2020501787 A JP2020501787 A JP 2020501787A JP 2020501787 A JP2020501787 A JP 2020501787A JP 6750137 B1 JP6750137 B1 JP 6750137B1
- Authority
- JP
- Japan
- Prior art keywords
- grouping
- data
- data records
- records
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title description 102
- 238000000034 method Methods 0.000 claims description 97
- 230000015654 memory Effects 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 17
- 230000004044 response Effects 0.000 claims 6
- 238000012517 data analytics Methods 0.000 description 104
- 230000006870 function Effects 0.000 description 21
- 238000003860 storage Methods 0.000 description 20
- 230000002776 aggregation Effects 0.000 description 14
- 238000004220 aggregation Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 13
- 230000008901 benefit Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000000638 solvent extraction Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000013515 script Methods 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000004931 aggregating effect Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241001522296 Erithacus rubecula Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
- G06F16/137—Hash-based
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2255—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24532—Query optimisation of parallel queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24558—Binary matching operations
- G06F16/2456—Join operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5066—Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
Claims (17)
- コンピュータを使用してデータレコードを結合する方法であって、
第1の複数のデータレコードおよび第2の複数のデータレコードを識別することと、
前記第1の複数のデータレコードおよび前記第2の複数のデータレコード内の各データレコードに対するハッシュを算出することと、
前記算出されたハッシュに基づいて、前記第1の複数のデータレコードのデータレコードを複数の第1のグループ分けに割り当てることであって、各第1のグループ分けは、前記第1のグループ分けの前記データレコードの前記算出されたハッシュに含まれるビットのセットに関連付けられる、ことと、
前記算出されたハッシュに基づいて、前記第2の複数のデータレコードのデータレコードを複数の第2のグループ分けに割り当てることであって、各第2のグループ分けは、前記第2のグループ分けの前記データレコードの前記算出されたハッシュに含まれるビットのセットに関連付けられる、ことと、
それぞれの第1のグループ分けおよびそれぞれの第2のグループ分けをそれぞれのワーカースレッドに割り当てることであって、前記それぞれの第1のグループ分けは、前記それぞれの第2のグループ分けと同じビットのセットに関連付けられる、ことと、
前記それぞれのワーカースレッドに割り当てられた前記第1のグループ分けおよび前記第2のグループ分けの前記データレコードの前記算出されたハッシュに基づいて、前記それぞれのワーカースレッドによって、前記第1のグループ分けのデータレコードを前記第2のグループ分けのデータレコードに結合するべきかどうかを決定することと、
前記第1のグループ分けの1つまたは複数のデータレコードを前記第2のグループ分けの1つまたは複数のデータレコードに結合することを決定したことに応答して、前記それぞれのワーカースレッドによって、前記データレコードを結合することと、
前記それぞれのワーカースレッドによって、前記第1のグループ分けおよび前記第2のグループ分けの前記結合されたデータレコードを出力することと
を含む方法。 - 前記データレコードは、値を有する複数のフィールドを含み、前記第1の複数のデータレコードおよび前記第2の複数のデータレコード内の各データレコードに対するハッシュを算出することは、
前記第1の複数のデータレコードおよび前記第2の複数のデータレコード内のデータレコードに共通する前記データレコードの前記複数のフィールドのサブセットを識別することと、
前記第1の複数のデータレコードおよび前記第2の複数のデータレコード内のデータレコードに共通する前記複数のフィールドの前記サブセットの値のハッシュを算出することと
を含む、請求項1の方法。 - 前記それぞれのワーカースレッドに割り当てられた前記第1のグループ分けおよび前記第2のグループ分けの前記データレコードの前記算出されたハッシュに基づいて、前記それぞれのワーカースレッドによって、前記第1のグループ分けのデータレコードを前記第2のグループ分けのデータレコードに結合するべきかどうかを決定することは、
第1のデータレコードと第2のデータレコードが一致するハッシュを有することに応答して、前記第1のグループ分けの前記第1のデータレコードを前記第2のグループ分けの前記第2のデータレコードに結合することを決定すること
を含む、請求項1の方法。 - 前記第1のグループ分けのデータレコードを前記第2のグループ分けのデータレコードに結合するべきかどうかを決定することは、
前記データレコードに対する前記ハッシュに基づいて、前記第1のグループ分けの前記データレコードおよび前記第2のグループ分けの前記データレコードをソートすること
を含む、請求項1の方法。 - 前記コンピュータは、いくつかのプロセッサコアを有し、前記第1のグループ分けの数および前記第2のグループ分けの数は、前記プロセッサコアの数に応答して決定される、請求項1の方法。
- 異なるワーカースレッドは、対応する前記第1のグループ分けおよび前記第2のグループ分けを並列に処理する、請求項1の方法。
- データレコード結合するためのコンピュータであって、
少なくとも1つのコンピュータプロセッサと、
動作を実行するための前記コンピュータプロセッサによって実行可能なコンピュータプログラム命令を記憶する非一時的なコンピュータ可読メモリと
を備え、前記動作は、
第1の複数のデータレコードおよび第2の複数のデータレコードを識別することと、
前記第1の複数のデータレコードおよび前記第2の複数のデータレコード内の各データレコードに対するハッシュを算出することと、
前記算出されたハッシュに基づいて、前記第1の複数のデータレコードのデータレコードを複数の第1のグループ分けに割り当てることであって、各第1のグループ分けは、前記第1のグループ分けの前記データレコードの前記算出されたハッシュに含まれるビットのセットに関連付けられる、ことと、
前記算出されたハッシュに基づいて、前記第2の複数のデータレコードのデータレコードを複数の第2のグループ分けに割り当てることであって、各第2のグループ分けは、前記第2のグループ分けの前記データレコードの前記算出されたハッシュに含まれるビットのセットに関連付けられる、ことと、
それぞれの第1のグループ分けおよびそれぞれの第2のグループ分けをそれぞれのワーカースレッドに割り当てることであって、前記それぞれの第1のグループ分けは、前記それぞれの第2のグループ分けと同じビットのセットに関連付けられる、ことと、
前記それぞれのワーカースレッドに割り当てられた前記第1のグループ分けおよび前記第2のグループ分けの前記データレコードの前記算出されたハッシュに基づいて、前記それぞれのワーカースレッドによって、前記第1のグループ分けのデータレコードを前記第2のグループ分けのデータレコードに結合するべきかどうかを決定することと、
前記第1のグループ分けの1つまたは複数のデータレコードを前記第2のグループ分けの1つまたは複数のデータレコードに結合することを決定したことに応答して、前記それぞれのワーカースレッドによって、前記データレコードを結合することと、
前記それぞれのワーカースレッドによって、前記第1のグループ分けおよび前記第2のグループ分けの前記結合されたデータレコードを出力することと
を含む、コンピュータ。 - 前記データレコードは、値を有する複数のフィールドを含み、前記第1の複数のデータレコードおよび前記第2の複数のデータレコード内の各データレコードに対するハッシュを算出することは、
前記第1の複数のデータレコードおよび前記第2の複数のデータレコード内のデータレコードに共通する前記データレコードの前記複数のフィールドのサブセットを識別することと、
前記第1の複数のデータレコードおよび前記第2の複数のデータレコード内のデータレコードに共通する前記複数のフィールドの前記サブセットの値のハッシュを算出することと
を含む、請求項7のコンピュータ。 - 前記それぞれのワーカースレッドに割り当てられた前記第1のグループ分けおよび前記第2のグループ分けの前記データレコードの前記算出されたハッシュに基づいて、前記それぞれのワーカースレッドによって、前記第1のグループ分けのデータレコードを前記第2のグループ分けのデータレコードに結合するべきかどうかを決定することは、
第1のデータレコードと第2のデータレコードが一致するハッシュを有することに応答して、前記第1のグループ分けの前記第1のデータレコードを前記第2のグループ分けの前記第2のデータレコードに結合することを決定すること
を含む、請求項7のコンピュータ。 - 前記第1のグループ分けのデータレコードを前記第2のグループ分けのデータレコードに結合するべきかどうかを決定することは、
前記データレコードに対する前記ハッシュに基づいて、前記第1のグループ分けの前記データレコードおよび前記第2のグループ分けの前記データレコードをソートすること
を含む、請求項7のコンピュータ。 - 前記コンピュータプロセッサは、いくつかのプロセッサコアを有し、前記第1のグループ分けの数および前記第2のグループ分けの数は、前記プロセッサコアの数に応答して決定される、請求項7のコンピュータ。
- 異なるワーカースレッドは、対応する前記第1のグループ分けおよび前記第2のグループ分けを並列に処理する、請求項7のコンピュータ。
- データレコードを結合するための動作を実行するためにコンピュータプロセッサによって実行可能なコンピュータプログラム命令を記憶する非一時的なコンピュータ可読メモリであって、前記動作は、
第1の複数のデータレコードおよび第2の複数のデータレコードを識別することと、
前記第1の複数のデータレコードおよび前記第2の複数のデータレコード内の各データレコードに対するハッシュを算出することと、
前記算出されたハッシュに基づいて、前記第1の複数のデータレコードのデータレコードを複数の第1のグループ分けに割り当てることであって、各第1のグループ分けは、前記第1のグループ分けの前記データレコードの前記算出されたハッシュに含まれるビットのセットに関連付けられる、ことと、
前記算出されたハッシュに基づいて、前記第2の複数のデータレコードのデータレコードを複数の第2のグループ分けに割り当てることであって、各第2のグループ分けは、前記第2のグループ分けの前記データレコードの前記算出されたハッシュに含まれるビットのセットに関連付けられる、ことと、
それぞれの第1のグループ分けおよびそれぞれの第2のグループ分けをそれぞれのワーカースレッドに割り当てることであって、前記それぞれの第1のグループ分けは、前記それぞれの第2のグループ分けと同じビットのセットに関連付けられる、ことと、
前記それぞれのワーカースレッドに割り当てられた前記第1のグループ分けおよび前記第2のグループ分けの前記データレコードの前記算出されたハッシュに基づいて、前記それぞれのワーカースレッドによって、前記第1のグループ分けのデータレコードを前記第2のグループ分けのデータレコードに結合するべきかどうかを決定することと、
前記第1のグループ分けの1つまたは複数のデータレコードを前記第2のグループ分けの1つまたは複数のデータレコードに結合することを決定したことに応答して、前記それぞれのワーカースレッドによって、前記データレコードを結合することと、
前記それぞれのワーカースレッドによって、前記第1のグループ分けおよび前記第2のグループ分けの前記結合されたデータレコードを出力することと
を含む非一時的なコンピュータ可読メモリ。 - 前記データレコードは、値を有する複数のフィールドを含み、前記第1の複数のデータレコードおよび前記第2の複数のデータレコード内の各データレコードに対するハッシュを算出することは、
前記第1の複数のデータレコードおよび前記第2の複数のデータレコード内のデータレコードに共通する前記データレコードの前記複数のフィールドのサブセットを識別することと、
前記第1の複数のデータレコードおよび前記第2の複数のデータレコード内のデータレコードに共通する前記複数のフィールドの前記サブセットの値のハッシュを算出することと
を含む、請求項13の非一時的なコンピュータ可読メモリ。 - 前記それぞれのワーカースレッドに割り当てられた前記第1のグループ分けおよび前記第2のグループ分けの前記データレコードの前記算出されたハッシュに基づいて、前記それぞれのワーカースレッドによって、前記第1のグループ分けのデータレコードを前記第2のグループ分けのデータレコードに結合するべきかどうかを決定することは、
第1のデータレコードと第2のデータレコードが一致するハッシュを有することに応答して、前記第1のグループ分けの前記第1のデータレコードを前記第2のグループ分けの前記第2のデータレコードに結合することを決定すること
を含む、請求項13の非一時的なコンピュータ可読メモリ。 - 前記コンピュータプロセッサは、いくつかのプロセッサコアを有し、前記第1のグループ分けの数および前記第2のグループ分けの数は、前記プロセッサコアの数に応答して決定される、請求項13の非一時的なコンピュータ可読メモリ。
- 異なるワーカースレッドは、対応する前記第1のグループ分けおよび前記第2のグループ分けを並列に処理する、請求項13の非一時的なコンピュータ可読メモリ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/652,131 US10489348B2 (en) | 2017-07-17 | 2017-07-17 | Performing hash joins using parallel processing |
US15/652,131 | 2017-07-17 | ||
PCT/US2018/042257 WO2019018271A1 (en) | 2017-07-17 | 2018-07-16 | MAKING HASH JOINTS USING PARALLEL PROCESSING |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6750137B1 true JP6750137B1 (ja) | 2020-09-02 |
JP2020528606A JP2020528606A (ja) | 2020-09-24 |
Family
ID=64998959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020501787A Active JP6750137B1 (ja) | 2017-07-17 | 2018-07-16 | 並列処理を使用したハッシュ結合の実行 |
Country Status (8)
Country | Link |
---|---|
US (2) | US10489348B2 (ja) |
EP (1) | EP3635573B1 (ja) |
JP (1) | JP6750137B1 (ja) |
KR (1) | KR102152560B1 (ja) |
CN (1) | CN111095193B (ja) |
AU (1) | AU2018303579B2 (ja) |
CA (1) | CA3069534C (ja) |
WO (1) | WO2019018271A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10320897B2 (en) * | 2015-12-15 | 2019-06-11 | Microsoft Technology Licensing, Llc | Automatic system response to external field-replaceable unit (FRU) process |
US10715459B2 (en) * | 2017-10-27 | 2020-07-14 | Salesforce.Com, Inc. | Orchestration in a multi-layer network |
US11625398B1 (en) | 2018-12-12 | 2023-04-11 | Teradata Us, Inc. | Join cardinality estimation using machine learning and graph kernels |
US11678191B2 (en) * | 2018-12-27 | 2023-06-13 | Apple Inc. | Integrity protection for frequent small data transmission |
EP3686756A1 (en) * | 2019-01-25 | 2020-07-29 | Sage (UK) Limited | Method and apparatus for grouping data records |
US11360983B2 (en) * | 2019-03-01 | 2022-06-14 | Hitachi Vantara Llc | Techniques for processing of data in motion |
CN111125261B (zh) * | 2020-03-31 | 2020-09-29 | 四川新网银行股份有限公司 | 基于分布式缓存的数据传输方法 |
RU2755568C1 (ru) * | 2020-07-26 | 2021-09-17 | Смоленская общественная организация содействия науке и образованию «Региональный союз ученых» | Способ параллельного выполнения операции JOIN при обработке больших структурированных высокоактивных данных |
CN116702225B (zh) * | 2023-06-08 | 2024-07-02 | 重庆亲笔签数字科技有限公司 | 基于哈希并行计算快速验证电子档案文件的方法、系统、设备及介质 |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5832310A (en) | 1993-12-30 | 1998-11-03 | Unisys Corporation | Serial I/O channel having dependent and synchronous sources of control data and user defined data |
US5875454A (en) | 1996-07-24 | 1999-02-23 | International Business Machiness Corporation | Compressed data cache storage system |
JP3056704B2 (ja) * | 1997-08-25 | 2000-06-26 | 三菱電機株式会社 | データ管理装置 |
US6625671B1 (en) | 1999-05-03 | 2003-09-23 | Computer Network Technology Corporation | Compression of buffered data |
JP3318834B2 (ja) * | 1999-07-30 | 2002-08-26 | 三菱電機株式会社 | データファイルシステム及びデータ検索方法 |
US6606704B1 (en) | 1999-08-31 | 2003-08-12 | Intel Corporation | Parallel multithreaded processor with plural microengines executing multiple threads each microengine having loadable microcode |
US6564274B1 (en) | 1999-12-17 | 2003-05-13 | Omnicluster Technologies, Inc. | Modular architecture for small computer networks |
JP3515050B2 (ja) * | 2000-07-07 | 2004-04-05 | 三菱電機株式会社 | データベース演算処理装置 |
US20040236785A1 (en) | 2003-05-22 | 2004-11-25 | Greiner Dylan E. | Method and system for transmitting a digital image over a communication network |
US7003597B2 (en) | 2003-07-09 | 2006-02-21 | International Business Machines Corporation | Dynamic reallocation of data stored in buffers based on packet size |
US7188227B2 (en) | 2003-09-30 | 2007-03-06 | International Business Machines Corporation | Adaptive memory compression |
US7590620B1 (en) * | 2004-06-18 | 2009-09-15 | Google Inc. | System and method for analyzing data records |
US7711876B2 (en) | 2005-03-23 | 2010-05-04 | International Business Machines Corporation | Dynamic category compression in a data storage library |
US7523123B2 (en) * | 2006-11-16 | 2009-04-21 | Yahoo! Inc. | Map-reduce with merge to process multiple relational datasets |
US7899840B2 (en) * | 2007-03-29 | 2011-03-01 | Microsoft Corporation | Group joins to navigate data relationships |
US9331919B2 (en) | 2007-11-30 | 2016-05-03 | Solarwinds Worldwide, Llc | Method for summarizing flow information of network devices |
WO2010033834A1 (en) | 2008-09-19 | 2010-03-25 | Oracle International Corporation | Hash join using collaborative parallel filtering in intelligent storage with offloaded bloom filters |
US20100115182A1 (en) | 2008-11-06 | 2010-05-06 | Sony Corporation | Flash memory operation |
US9552299B2 (en) | 2010-06-11 | 2017-01-24 | California Institute Of Technology | Systems and methods for rapid processing and storage of data |
US8370316B2 (en) | 2010-07-12 | 2013-02-05 | Sap Ag | Hash-join in parallel computation environments |
US8515945B2 (en) * | 2010-11-16 | 2013-08-20 | Sybase, Inc. | Parallel partitioning index scan |
US9436558B1 (en) | 2010-12-21 | 2016-09-06 | Acronis International Gmbh | System and method for fast backup and restoring using sorted hashes |
US10055480B2 (en) * | 2015-05-29 | 2018-08-21 | Sap Se | Aggregating database entries by hashing |
JP5712609B2 (ja) | 2010-12-24 | 2015-05-07 | 富士通株式会社 | データ処理装置及びデータ記録方法 |
WO2013009503A2 (en) * | 2011-07-08 | 2013-01-17 | Yale University | Query execution systems and methods |
US8880481B1 (en) | 2012-03-29 | 2014-11-04 | Pivotal Software, Inc. | Inverse distribution function operations in a parallel relational database |
EP2857975A4 (en) | 2012-05-31 | 2016-03-02 | Univ Tokyo | PARALLEL DATA PROCESSING SYSTEM, COMPUTER, AND METHOD FOR PARALLEL DATA PROCESSING |
US20130339473A1 (en) | 2012-06-15 | 2013-12-19 | Zynga Inc. | Real time analytics via stream processing |
US9183200B1 (en) | 2012-08-02 | 2015-11-10 | Symantec Corporation | Scale up deduplication engine via efficient partitioning |
WO2014145092A2 (en) | 2013-03-15 | 2014-09-18 | Akuda Labs Llc | Hierarchical, parallel models for extracting in real time high-value information from data streams and system and method for creation of same |
US9817612B2 (en) | 2014-11-20 | 2017-11-14 | International Business Machines Corporation | High-performance hash joins using memory with extensive internal parallelism |
US9922064B2 (en) * | 2015-03-20 | 2018-03-20 | International Business Machines Corporation | Parallel build of non-partitioned join hash tables and non-enforced N:1 join hash tables |
US10394760B1 (en) * | 2015-04-16 | 2019-08-27 | Western Digital Technologies, Inc. | Browsable data backup |
US20160378824A1 (en) * | 2015-06-24 | 2016-12-29 | Futurewei Technologies, Inc. | Systems and Methods for Parallelizing Hash-based Operators in SMP Databases |
US10013443B2 (en) | 2015-06-25 | 2018-07-03 | Bank Of America Corporation | Comparing data stores using hash sums on disparate parallel systems |
US10489350B2 (en) | 2017-02-24 | 2019-11-26 | Advanced Micro Devices, Inc. | Data compression with inline compression metadata |
US20180285167A1 (en) * | 2017-04-03 | 2018-10-04 | Ocient, Inc | Database management system providing local balancing within individual cluster node |
-
2017
- 2017-07-17 US US15/652,131 patent/US10489348B2/en active Active
-
2018
- 2018-07-16 JP JP2020501787A patent/JP6750137B1/ja active Active
- 2018-07-16 AU AU2018303579A patent/AU2018303579B2/en active Active
- 2018-07-16 EP EP18834729.8A patent/EP3635573B1/en active Active
- 2018-07-16 KR KR1020197038516A patent/KR102152560B1/ko active IP Right Grant
- 2018-07-16 CN CN201880047106.3A patent/CN111095193B/zh active Active
- 2018-07-16 WO PCT/US2018/042257 patent/WO2019018271A1/en unknown
- 2018-07-16 CA CA3069534A patent/CA3069534C/en active Active
-
2019
- 2019-10-18 US US16/657,665 patent/US11334524B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
KR20200021946A (ko) | 2020-03-02 |
WO2019018271A1 (en) | 2019-01-24 |
US20190018855A1 (en) | 2019-01-17 |
KR102152560B1 (ko) | 2020-09-04 |
CN111095193A (zh) | 2020-05-01 |
CN111095193B (zh) | 2022-03-25 |
US10489348B2 (en) | 2019-11-26 |
EP3635573B1 (en) | 2022-11-09 |
CA3069534A1 (en) | 2019-01-24 |
AU2018303579B2 (en) | 2020-01-23 |
CA3069534C (en) | 2020-06-16 |
AU2018303579A1 (en) | 2019-12-05 |
JP2020528606A (ja) | 2020-09-24 |
US11334524B2 (en) | 2022-05-17 |
EP3635573A4 (en) | 2020-12-09 |
EP3635573A1 (en) | 2020-04-15 |
US20200050585A1 (en) | 2020-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6750137B1 (ja) | 並列処理を使用したハッシュ結合の実行 | |
JP7038740B2 (ja) | キャッシュ最適化及び効率的な処理のためのデータ集約の方法 | |
US9953071B2 (en) | Distributed storage of data | |
US20180248934A1 (en) | Method and System for a Scheduled Map Executor | |
US9910821B2 (en) | Data processing method, distributed processing system, and program | |
US10326824B2 (en) | Method and system for iterative pipeline | |
US11042530B2 (en) | Data processing with nullable schema information | |
De Luca et al. | Distributed genomic compression in MapReduce paradigm | |
US10049159B2 (en) | Techniques for data retrieval in a distributed computing environment | |
Win et al. | An efficient big data analytics platform for mobile devices | |
Dhabhai et al. | A study of big data in cloud environment with their related challenges | |
Mathew | Cluster performance by dynamic load and resource-aware speculative execution | |
Singh et al. | MCC and Big Data Integration for Various Technological Frameworks | |
Pippal et al. | Implementation of distributed searching and sorting using hadoop mapreduce | |
Tang et al. | Network-based inference algorithm on hadoop | |
MARZUNI et al. | Optimizing Geo-Distributed Data Processing with Resource Heterogeneity over the Internet | |
Hamza | Enhancing Hadoop Performance in Homogenous and Heterogeneous Big Data Environments by Dynamic Slot Configuration | |
Vipulkumar et al. | A survey on data placement in heterogeneous cloud environment for big data | |
Zhu et al. | Study and Implementation of Elastic Stream Computing In The Cloud |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200115 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200115 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200115 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200611 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200714 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200812 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6750137 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |