Powered by a free Atlassian Confluence Open Source Project License granted to Apache Software Foundation. Evaluate Confluence today. Čeština Dansk Deutsch Eesti English (UK) English (US) Español Français Íslenska Italiano Magyar Nederlands Norsk Polski Português Română Slovenčina Suomi Svenska Русский 中文 日本語 한국어 Powered by Atlassian Confluence 7.19.30 Printed by Atlassian Confluence 7.19.30 Report
はじめまして。 プロダクト&サービス事業部 リーダーの久保です。 今日は、当社で利用しているOSSの全文検索アプリケーションであるApache Solrについてご紹介したいと思います。 GoogleでSolrを検索しても、日本語圏のコンテンツはまだまだ少ないようです。 当社がSolrを使い始めた昨年は現在よりもさらに少なく、結構苦労しました。 今回はやや雑多な内容となりますが、新しくSolrを使う際に必要と考えられる情報をまとめてみました。 本エントリーでは、Solr1.3を対象としています。 Solr1.3が現在の安定版で、Solr1.4-devが開発版となります。 目次 Solrとは 機能一覧 実績/事例 Solrを使ったシステムの開発方法 おすすめする方 データ量/性能とハードウェア マルチコア構成 様々な検索 スケールアウト 検索と更新 Solrを始めるための情報リスト 全
本連載ではJBoss Enterprise Middlewareを使った「エンタープライズレベルの検索サービス」を提供するWebアプリケーションの作成を行う。検索エンジンとしてオープンソースソフトウェア(以下、OSS)のApache Lucene(以下、Lucene:ルシーン)を使用する。 前回「第1回:OSS検索エンジンLuceneとは」では、検索エンジンLuceneについて詳しく解説した。今回はいよいよ実際の検索プログラムを作成していく。 ここでは簡単なサンプルプログラムとするため、JBoss Enterprise Application Platform(以下、JBoss EAP)のJBoss Application Server上で動作するJSPプログラムを作成する。JBoss EAPのインストールについては以下記事を参照していただきたい。
こんにちは 。 検索 関連 を 担当 して いる やましー です 。 今回は livedoor で提供しているサービスの中の「検索関連」について書きます。 このブログでも過去に何度か取り上げられていますが、livedoor では検索エンジンとして HyperEstraier、lucene、mysql + senna、Namazu、SUFARY などを利用しています。 その中で lucene の利用方法や機能拡張について説明します。 lucene とは Apache Lucene は、Java で書かれた高性能で高機能な検索エンジンライブラリです。全文検索を(特にクロスプラットフォームで)必要とするほとんどのアプリケーションに適している技術です。※ 公式サイトから抜粋 インデックスの作成 lucene は転置インデックス型の検索エンジンなので、ドキュメントを検索するには、まずインデックスの作
テクニカルSEOとは、オンページSEOの一部であり、検索結果での順位を向上させるためにウェブサイトの技術的な側面を改善することを指します。検索エンジンにとって、クロールしやすく理解しやすくすることがテクニカルSEOの中心です。具体的には、サイト内のリンク構造を最適化したり、ページ内の論理的な構造を最適化したり、ページの読み込みを高速化することなどの技術的な最適化が含まれます。 テクニカルSEOとは、検索エンジンがウェブサイトの内容を確実かつ効率的に取得できるように、また内容を理解しやすくなるように、ウェブサイトの技術的な側面を最適化することをいいます。ウェブサイトの構造やコンテンツを理解しやすくし、正しくクロールやインデックスすることを助けます。
2008年04月06日 SolrのTomcatへのインストールでハマる 早速SolrをTomcat6.0の環境にインストールしてみる。 最初は、IBMの記事を参考にしたのだが、「以下のいずれかの方法で、Solr のホーム・ロケーションを設定します」のあたりで具体的に何をすべきかのかがわからなくなってしまった。 とりあえず、apache-solr-1.2.0.war ファイルはダウンロードしてあったので、これを $TOMCAT_HOME/webapps の下に置いてみたり、TomcatのWebアプリケーションマネージャ(http://localhost:8080/manager/html/)から配備してみたりしたが、いずれも失敗。画面が出るはずのURL(http://localhost:8080/solr/admin/)にアクセスしても、404エラーになってしまう。 Webアプリケーションマ
{{{#!wiki red/solid Beginning with Solr 5.0, Solr is no longer distributed as a "war" (Web Application Archive) suitable for deployment in any Servlet Container. Solr is now distributed as a stand alone java server application, including start and stop scripts for use on Unix and MS-Windows platforms, as well as an installation script for setting up a "production" installation of Solr on *nix plat
Google モバイル検索エンジンは Google モバイル検索、NTT ドコモおよび KDDI のモバイルポータルトップページの検索をはじめとする、様々なモバイル検索サービスに利用されています。 このたび、モバイル向けウェブサイトを管理されている皆様を対象として、Google モバイルウェブクローラーについての情報を公開いたします。なお、以下の情報に基づいてウェブサイトの設定を行ったとしても、そのサイトが Google モバイル検索の検索結果上位に掲載されるとは限らないことをあらかじめご了承ください。また、本情報は EZweb 公式サイトのクローラーとは無関係です。EZweb 公式サイトのクローラーの情報については、KDDI より公式コンテンツプロバイダ向けに配布されている資料をご覧ください。 Google モバイルウェブクローラーのIP アドレス帯域 日本向け Google モバイルウ
<OpenSearchDescription xmlns="http://a9.com/-/spec/opensearch/1.1/" xmlns:moz="http://www.mozilla.org/2006/browser/search/"> <ShortName>[SNK]</ShortName> <Description>[Search engine full name and summary]</Description> <InputEncoding>[UTF-8]</InputEncoding> <Image width="16" height="16" type="image/x-icon">[https://example.com/favicon.ico]</Image> <Url type="text/html" template="[searchURL]"/> <Ur
米ヤフーは、近く同社のSearchプラットフォームのAPIを提供して、外部の開発者が構造化データを使って検索結果をカスタマイズし、ユーザーの利便性を向上させられるようにすると明らかにした。 このプログラムでは、外部プログラマがAPIに独自のアルゴリズムを加えて、ヤフーの検索インデックスをどう利用するかを決めることができる。 また、Yahoo! Searchプラットフォーム上でのプログラミングを向上させるために、ヤフーはRDF(Resource Description Framework)やマイクロフォーマットなどのセマンティックWeb標準をいくつかサポートすると、Yahoo! Search製品管理ディレクター、アミット・クマー氏は3月13日付のブログで述べている。 ワールドワイドウェブの生みの親ティム・バーナーズ-リー氏が広めたセマンティックWebとは、Webコンテンツを使いたいというユー
エンタープライズサーチの導入を検討する段階でいくつかの課題(陥りやすい罠)が出てきます。これらの課題を解決しなければ、エンタープライズサーチを導入しても、効果的な情報検索の実現という最終目標は達成できないと考えていいでしょう。 最近のテレビCM いまやテレビで「詳しくは○○○で検索!」といった検索窓を表示する手法を使ったCMを見ない日はありません。これは、一般家庭で携帯電話やパソコンを使った検索が日常的に行われていることを表しています。 このように、「欲しい情報を検索という手段ですぐ得られる」というのは便利この上ありません。CMで流れた○○○というキーワードを検索ボックスに入れて検索ボタンを押せば、インターネット上に数多く存在するWebサイトの中から見たい商品や知りたい場所の情報がすぐに得られます。同じようにすれば企業の中でも欲しい情報(および情報源)が検索して得られて便利だ、と考えてもお
「インターネットの検索において、Webページ検索というのは、そろそろピークを過ぎるのではないか。人物や商品などドメインを区切ったバーチカルサーチや、Webページではなく知識そのものを検索できるようなナレッジサーチなどが今後の研究テーマになってくる」。2007年11月27日から2日間の予定で開催されている「データベースとWeb情報システムに関するシンポジウム」(DBWeb 2007)において「情報爆発に対処できる次世代サーチ技術」と題した講演を行った京都大学大学院情報学研究科の田中克己教授は、今後のネット検索技術の動向をそう総括する。 既存の検索サービスを使ってできることはまだまだある 田中氏は、2005年から5年間の予定で文部科学省が研究補助金を出すプロジェクト「情報爆発時代に向けた新しいIT基盤技術の研究」において「情報爆発に対応するコンテンツ融合と操作環境融合に関する研究」という研究テ
このページでは、PostgreSQLの全文検索モジュール“Tsearch2”と、形態素解析による分かち書きを行う関数“pgkakasiw()”を使って、日本語全文検索システムを構築する方法についてご紹介します。 新着情報 2005/01/19 PostgreSQL8.0.0での動作を確認しました。 2005/01/19 pgkakasiw Verison 1.1 を公開しました。本体に変更はありませんが、1.0に添付したMakefileではmakeできないプラットフォームがある問題を修正しました。 2004/10/19 pgkakasiw Verison 1.0 を公開しました。 2004/10/19 環境構築手順書を公開しました。 Tsearch2とは Tsearch2は、PostgreSQLに添付される拡張機能(contribモジュール)の一つで、ヨーロッパ言語向け全文検索用のモジュー
07 June 2007 - Apache Solr 1.2 released Apache Solr 1.2 is the first release since graduating from the Apache Incubator. Solr is a high performance full-text search server based on Apache Lucene, written in Java5, and easily extensible through plugins written in Java. Documents are added to a search collection via XML over HTTP. The collection is queried via HTTP to receive an XML response (or alt
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く