MyNA・JPUG合同DB勉強会 in 東京 発表量 『JSONBはPostgreSQL9.5でいかに改善されたのか』Read less
Over the last few months I've really started using Python as much as possible for data engineering and analysis work. A lot of smaller or one-off kinds of tasks I do involve extracting data from some API or reading it from a text file, and running some kind of processing or analytics task on it, or graphing the data. Python is just perfect for these kinds of 'glueing things together' scripts, and
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "エンタープライズ・サービス・バス" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2022年12月) ESBエンタープライズ・サービス・バス(英: Enterprise service bus, ESB)は、一般に標準に基づくミドルウェアインフラストラクチャー製品で実装されるソフトウェアアーキテクチャの構成要素であり、上位のより複雑なアーキテクチャの基盤となるサービスを提供するイベント駆動型で標準ベースのメッセージングエンジン(バス)である。 ESB は一般に Enterprise Messaging System の実装の上の抽象化
職場選びのサービスは、従来のリスティング型のものからストーリーテリングを重視したもの、ライフイベントが多い女性に特化した「LiB」のようなサービスまで様々な形に増えています。そんな中、「エンジニアがハッピーになる世界をつくる」という大きなミッションのもとβオープンしたのが、「Tech Stars」です。エンジニアに特化したダイレクトマッチングサービスを提供します。 希望条件以上の「会いたい」オファーが届く TechStarsの3つのポイント 企業とエンジニアをダイレクトにマッチングすることが特徴のTech Stars。エンジニアは、自分の経歴やスキル、年収などの希望条件などを記入。それを見た希望条件以上の企業から、「会いたい」オファーが届きます。企業とのマッチングが成立した後は、早ければ計3回ほどのやり取りで面談が実現すると言います。 10月末の提供を予定する企業側からオファーを送る機能。
ページ置換アルゴリズム(ページちかんアルゴリズム)とは、仮想記憶管理としてページング方式を使用するコンピュータのオペレーティングシステムにおいて、空き物理ページが少ない状態で新たなページを割り当てなければならないときにどのページを「ページアウト(スワップアウト)」するかを決定する方法を意味する。これはページフォールトが発生したときに使用可能なフリーなページが存在しないときに発生する。厳密には発生条件はシステムの種類や設定によって異なるが、フリーなページが全く無い場合か、あらかじめ設定したしきい値よりもフリーなページ数が少ないときに発生する。 以前にページアウトすべきページとして選択され置換されたページに再度アクセスが発生したら、そのページをページインする必要がある。そして、これにはI/Oの完了を待たなければならない。この、ページインを待つ時間の累計が小さいほどページ置換アルゴリズムが優秀で
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "キャッシュアルゴリズム" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2023年8月) キャッシュアルゴリズム(英: cache algorithm)は、コンピュータ上で情報を格納するキャッシュを管理するプログラムまたはハードウェア構造を最適化するアルゴリズム群。キャッシュが一杯になったとき、このアルゴリズムで新たな情報を格納するための場所を選択し確保する。置換アルゴリズムあるいは置換ポリシーとも。 キャッシュのヒット率(hit rate)とは、探しているデータがキャッシュ上で見つかる率(頻度)である。キャッシュサイズを増やさずにヒ
Free software, open standards, and web services for interactive computing across all programming languages JupyterLab: A Next-Generation Notebook Interface JupyterLab is the latest web-based interactive development environment for notebooks, code, and data. Its flexible interface allows users to configure and arrange workflows in data science, scientific computing, computational journalism, and ma
doda X(旧:iX転職)は、パーソルキャリアが運営するハイクラス転職サービス。今すぐ転職しない方にも登録いただいています。 今の自分の市場価値を確かめてみましょう。 多くの企業がいま新規事業の開発に力を入れています。読者の中には、当事者として事業の創出に取り組んでいる方もいるでしょう。そんな方々の中には、 自社のリソースを活用すれば、本来はベンチャーのように事業をスピーディーに立ち上げ、成功に導くことができるはず。しかし、組織特有の力学などさまざまな理由から事業がなかなか思うように進まない。 そうジレンマを感じている方もいるのではないでしょうか。ではいったいどうすれば・・・。 日本最大の料理レシピサイトを運営するクックパッド株式会社は、新規事業の開発に積極的に取り組んでいることでも知られています。そんな同社は、休日のおでかけプランを投稿・共有できる新サービス「Holiday」を2014
Redisの作者antirez氏自らによる、memcachedとRedisの長所短所の比較。特に、Redisを単なるキャッシュ用アプリケーションとしてmemcachedと比較することの間違いと、それぞれの向いている使用方法についての私見。 あなたが私と面識があるなら、私が競合製品があることが悪いと考える人間でないことはご存知でしょう。ユーザーに選択肢があることは本当にいいことだと思っていますし、だからこそ他の技術とRedisを比較するようなことはほとんどしませんでした。 しかし、最適なソリューションを選ぶためには、ユーザーは正しく情報を持たねばならないのも確かです。 この記事を書くのは、有名なライブラリであるSidekiqの作者として知られるMike Perhamが、Redisのバックエンドストレージとしての使い方を書いた記事を読んだのがきっかけです。従って、私はMikeがRedisに「反
プログラミングにはレベルの低い・高いがある。ここでいうレベルとはCPUとかストレージデバイスといった生のハードウェアに近いかという意味である。レベルが低いほど生のハードウェアを意識しなければならない。カーネルは低レベルなソフトウェアの代表である。高尚かどうかと混同されることを嫌ってか、低レイヤ・高レイヤという言い方も良くする。私はあえて混同させたくてレベルという単語を使用している。 私は元々低レベルのプログラミングの方が計算機を操ってる感があって好きだった。しかし、しばらく離れてJavaとかPythonとか高レベルなことをやっていたが、ふと低レベルのところを再び触りたくなったので、 ハッカーのたのしみ Binary Hacks Cプログラミング高速化研究班 等を読み返しながら勉強している。低レベルはちょこちょこっとチューニングするだけで演算が高速化していき、ハッカー感が得られるので楽しい。
This document discusses data-driven development and the technologies used in the data analytics process. It covers topics like data collection, storage, processing, and visualization. The document advocates using managed cloud services for data and analytics to focus on data instead of managing infrastructure. Choosing technologies should be based on the type of data and problems to solve, not the
6. ネット広告売買の世界:Real Time Bidding(RTB) • SSP(Supply-Side Platform)がimpressionのオークションを仕切って、 それに複数のDSP(Demand-Side Platform )がセリに参加するイメー ジ。 DSP1 DSP2 DSP3 SSP いくらで 配信す るの? ¥10 ¥30 ¥20 DSP2を配信 ユーザID, 広告サイズ等 を開示 6 7. DSP (Demand-Side Platform)とは 7 これまで 現在 広告枠 広告主 広告枠 メディア ユーザ 広告枠 ? 広告主のロジックでの買い付けが可能に ネット広告のパラダイムシフト 取引対象が、「広告枠」から「人」へ変化 手売りでの 広告販売 RTBによる 自動買い付け 広告枠
8. 8 推定方法 ● Demographic Prediction Based on User’s Browsing Behavior を少し参考に (http://www2007.org/papers/paper686.pdf) ● Microsoftが出した論文で、ユーザの行動履歴から性 別は約80%、年代は約60%推定できたらしい 9. 9 利用データ ● 閲覧サイト(ドメイン) : 約14万件 (一部ドメインは下位階層まで取得) ● 閲覧サイトのカテゴリ : 146件 (カテゴリ分類器で自動分類したもの+出現上位のみ人力) ● 閲覧広告サイト : 可変(3000〜6000件) (クリック・コンバージョンに限らず広告サイトへのリーチ) 15万次元 × 300万のsparseな行列 hiveならこれくらいは軽い 15万次元 × 300万のsparseな行列 hiveならこれくらいは軽
大盛況の内に閉幕した第一回Hivemall Meetupを受けて,第二回を開催することになりました。まだ参加枠が残っておりますので,お時間のある方は是非ともご参加下さい。 イベント会場であるdots.は渋谷駅すぐそばにあります。 開催内容 イベント: 第二回 Hivemall Meetup 開催日時: 2015/10/20(火) 19:00 〜 22:30 開催場所: イベント&コミュニティスペース dots. 住 所: 東京都渋谷区宇田川町20-17 NOF渋谷公園通りビル 8F 定 員: 定員数 : 200人 申込数 : 122人 残席数 : 78人 参 加 費: 無料 タイムスケジュール 時間講演内容 18:30 - 受付 19:00 - 19:05 イントロダクション Treasure Data Inc. 油井氏 - @myui 19:05 - 19:45 Hivemall
トレジャーデータはクラウドでデータマネージメントサービスを提供しています。 ↑ 理論編は少し難解ですが,知っておいて損はありません。 さて,本シリーズの最後として他のテスト(統計的仮説検定)の事例を紹介します。 全ての問題で共通においている前提 ※ 検定方向ついて 以下で紹介するテストは全て両側検定としている。両側検定についてはこちらを参照して下さい。両側検定にする理由は,(1) 片側より棄却されにくいこと,(2) 信頼区間を同時に求める際に,棄却域と信頼区間が交わるような矛盾を極力避けるため。(ただし信頼区間についてはここでは取り上げません。) ※ 有意水準について 有意水準は全て 0.05 としています。 ※ サンプルサイズについて 計算する統計量とそれの従う分布(特に標準正規分布か t 分布かで)はサンプルサイズによって異なってきます。ここでは「大標本」を n > 100 または
Gitは速く柔軟性がありますが、理解に時間のかかる分散型バージョン管理システムです。Gitを始める前に次を理解しておきましょう。 通常のバージョン管理 分散型バージョン管理 本 や 学習書 、 指南書 はGitを理解するのに役に立ちました。しかし、その他にもGitの理解に至ったきっかけがありますのでご紹介します。 ステージング・エリアがある Gitにはステージング・エリアがあります。繰り返しますが、 ステージング・エリアがあるのです 。 これには混乱しました。リポジトリ(「オブジェクトデータベース」)とステージング・エリア(「インデックス」と呼ばれる)の両方がGitにはあります。チェックインには2段階あります。 git add foo.txt インデックスにfoo.txtを追加します。これだけでは、チェックインは完了していません。 git commit -m "message" リポジトリ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く