[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

idに関するamari3のブックマーク (4)

  • Snowflake的なID生成方法

    作っているプログラムでランダムなIDが必要となったため、ちょっとリサーチしました。久しぶりにJavaでコードを書いています。 UUID 完全に分散した環境で使用するのには、UUID(Universally Unique Identifier)が最適です。1IDあたり16バイトの容量が必要となる点をのぞけば、理想的なIDと言えると思います。ただIDは大量に使用されるので、16バイトというサイズはちょっと気になります。 Snowflake SnowflakeはTwitterが使用しており、Apache Licenseで公開しているID生成方法です。ある程度分散した環境でも、1IDあたり8バイトの容量で利用できます。また非常に重要な特徴としてIDの先頭部分にタイムスタンプ利用しており、生成されたIDはある程度時系列に並びます。8バイト、つまり64bitを下記のように振り分けて使用します。 先頭4

    Snowflake的なID生成方法
  • 重複のない10桁の数字をIDとして採番するアルゴリズムを教えて下さい。…

    重複のない10桁の数字をIDとして採番するアルゴリズムを教えて下さい。 但し、下記の条件があります。 - 最低でも1億以上、採番可能なもの - 時系列や連番など推測されやすいものはNG - 基的にデータベースを使用せずアルゴリズム内だけて採番(但しカウントアップ用で使うならOK) - 数字が一意であると保証されていること 以上になります。 PHPのコードで書かれてると、なお有り難いです、 宜しくお願いします。

    amari3
    amari3 2016/05/10
  • 軽量なTime-based ID生成器”shakeflake(仮称)”について - SmartNews Engineering Blog

    大平です。今回はさだまさしネタは特に無しです。 先日、サービスのクローラーで使用しているID生成器について置き換えを行いました。非常に地味な話になりますが、記事ではその辺の内幕の話をしたいと思います。 ID生成にまつわる苦悩 弊社ゴクロの提供しているSmartNewsは表向きはニュースアプリですが、裏側の仕組みは検索エンジンに近似しています。ユーザーの方々の興味関心や、アクセス傾向をクエリーとし、その内容に応じた話題のニュースを検索結果として返却する、という風に捉えていただくと、なんとなく私が言わんとしている事を想像していただけるかと思います。 SmartNewsはTwitterのつぶやき情報を用いたトレンド分析をベースとしており、話題になっているニュースを選定するためには、大量のTwitter上のtweet、ならびにその中に含まれているURLに対してクロールを行う必要があります。日々配

    軽量なTime-based ID生成器”shakeflake(仮称)”について - SmartNews Engineering Blog
    amari3
    amari3 2016/05/02
  • Twitterのsnowflakeについて

    2. DSIRNLP #4 / Twitterのsnowflakeについて 今日話す内容 •snowflake •Twitter社がOSSとして提供しているID生成器 •なぜこのようなツールが必要なのか •仕組みについて •etc,etc... 2 3. DSIRNLP #4 / Twitterのsnowflakeについて ID生成は結構大事(小並感) •たいていの処理の際にIDの生成は必要になる •例1:クローリングした各Webサイト群それぞ れにIDを割り振る •例2:n-gramで分かち書きをした各ワード群 それぞれにIDを割り振る •etc, etc... 3 4. DSIRNLP #4 / Twitterのsnowflakeについて ID生成の性能も結構大事 •例:1つのID生成に1msかかるとした場合、ID生 成処理にどれくらい時間がかかる? •Webサイト10億ページ the num

    Twitterのsnowflakeについて
  • 1