最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めの本です。 ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。 さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン
晴天の価値 2月中旬に出張で千葉へ行った。5日間の滞在中はずっと快晴で、気温は20℃に迫る春のような暖かさだった。仕事は朝から晩まで現場を走り回る過酷なもので、身体的にも精神的にも追い込まれた。毎朝、京葉線から見える美しい景色を眺めて正気を保っていた。太平洋へ燦々と…
米国や英国の新聞社サイトがデジタルアーカイブを充実させている。英Times(Times of London)も200年以上前の記事も対象にしたデジタルアーカイブを構築中だ。正式サービス前の約2ヶ月間,無料で利用できるようにするという(Journalism.co.ukより)。 The Times ,The Sunday Times ,Times Onlineの記事が含まれる。なんと,1785年の記事から 対象となる。ということは,歴史書や教科書でしか知らなかった次のような産業革命時代の出来事も,ニュース記事として読めるようになるはず。 1785年:カートライトが力織機を発明 1811年:ラッダイト(機械打ち壊し)運動 1814年:ジョージ・スチーブンソン が蒸気機関車を実用化 1834年:チャーチスト運動 1848年:マルクスとエンゲルスの共産党宣言 などの出来事を,当時のジャーナリストがど
このところ、演奏会に行くことのできるチャンスが増えてきた。オーケストラ、ピアノ、室内楽…さまざまな形態に触れてみようと思っているので嬉しい。今回行ったコンサートはチェロとピアノのデュオ。前回、舘野泉さんのコンサートでピアノだけのコンサートを初めて体験したが、今回の室内楽も初めて。オーケストラは沢山の楽器に、一度に触れられる。その音の重なりや規模の大きさを体感できる。ピアノだけの場合は、ピアノだけに集中できる。室内楽は楽器は少ないけど、それぞれの響きをじっくり味わえるし、少ない楽器だからこそ出来るかけ合いも聴ける。 そのコンサートを聴いていて、思ったことを。まず、音楽って立体的なものなんだ、と。楽譜は平面、2次元に書かれている(現代音楽を除く)。それを演奏する時、その2次元のまま演奏しても、平坦な演奏になってしまう。楽譜に書かれてあることに、表現や解釈、響きや音の質感をプラスして、3次元にす
人は見た目が十割で、ブサイクは生きる資格すらないという強迫観念が、整形中毒者の不安を煽り、果てなき「美」への欲望が150億ドルの美容整形市場を生み出している――って、おまえらの「美」は医者が決めるんかい! 「美」と「若さ」を求めて暴走する整形ジャンキーたちの最前線をレポートしている。 脂肪吸引、豊胸、フェイスリフト、ボトックス注射の事例が実況中継さながらに紹介される。ピンと張った陶器のような顔、大きな頬骨と形の良い鼻、大きな胸とくびれた腰、まわり、すらりとしたツルツルの足… それぞれ、パーツを取り替えるかのように買い求める「ビューティー・ジャンキー」たちは、ドラッグ中毒患者と重なる。 そして、ジャンキーたちは海を越える。バッグに現金を詰め込んで貧しい国へ飛び、手術台の安さにつけこんで「きれい」を目指す。アフリカへボトックス手術を受けにきたアメリカ女に、「そんな行為は典型的な『醜いアメリカ人
インターネット上の誹謗中傷にどう対処するか、政府やメディア、ブログなどで論議が高まっている。発言はどこまで許されるのか、匿名だから誹謗中傷が氾濫するのか。こうした疑問について、ITジャーナリストや弁護士らの論客に話を聞いた。3回にわたって特集する。 ネットの問題は、プライベートとパブリックのあいまい ――評論家の池内ひろ美さん「殺害予告」事件で、被告の会社員男性(45)に厳しい有罪判決が下されました。2ちゃんねるへの書き込みは、被告が主張した「ネット掲示板の常識」に当たらないと断じた裁判官の裁定をどう思いますか。 佐々木 あの事件は、(被告が)捕まってしかるべきでしょう、と言うしかありません。書き込みは、法律の範囲内で許されるという線引きが、メディアと異なることがないということです。ネットでの問題は、プライベートとパブリックの境界があいまいになることにあります。例えば、居酒屋で同僚に「あい
GWコラムですこんばんは(えー)。私はときどき、 「どうでも良いことをひたすら続けると、 何かいいことあるんじゃないか」 ということを考えて実験的な行動していることがあるのですが、 その中でも凄く長く続いているのが 「投げ銭」 です。 実はこの 2008/05/05で、はてなポイント による投げ銭を始めてから まるまる 1,000日目 になりました。開始日は2005/08/10、 はてなブックマークで投げ銭システムが始まった日ですね。 始めた当初は、 出て行くお金は必ず回りまわって自分に返ってくる(?)から せめて最初はこちらから景気良く投げ始めてみよう! というくらいの気分でした。結果的には ぜんぜん返ってこない (?) のですが、それでもこの試みは今でもなかなか面白いと思っています。 で、過去に実際にどのくらいの投げ銭をしてきたのか、 せっかくの記念日(?)なので調べてみました。 この
こないだ通勤電車で、赤ちゃんを抱いたお母さんの隣に座ったのね。二日酔いで頭痛くて喉乾いたなーとか思いながら、ふと右を見ると赤ちゃんがこっちガン見してるのよ。お母さんの膝の上に向かい合わせに座ってるから、ちょうど視界に入った。そういや赤ちゃん見るの久しぶりだけど、あいつらの目ってホントきれいな。新品のビー玉みたい。そういうきれいな目で見られるのは悪くない。悪くないんだけれども、どこか居心地が悪い。だってアタシそんなにきれいじゃないもの。オッサン手前の男なわけで。頭の中には「誰かにナメられたくない」とか「女にもてたい」とか「いっぱい稼いでスマートに暮らしたい」とか「アイツが気にくわない」とか、褒められたもんじゃないややこしい感情も人並みに持ち合わせているわけですよ。そんな俺にね、やっこさん微笑みかけてきたのよ、一瞬。ニコーっとなって、すぐ真顔に戻った。ちょっと不安そうな顔。おい、あれか?俺が愛
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く