Presto でどのような SQL を書いたらこれを高速に求められるかというお話です。 データは S3 に置くことにするので、試したい方は Athena や Amazon Elastic MapReduce (EMR) を使うとサクッと確認できます。 サンプルデータ 次のような Ruby スクリプトで S3 にデータをアップロードします。例えば、環境変数 S3_LOCATION に s3://example.com/test を指定すると、s3://example.com/test/access_logs 以下と s3://example.com/test/time_ranges 以下にデータがアップロードされます。 require 'date' require 'uri' require 'aws-sdk-s3' BASE_DATE = Date.parse('2018-12-01')