2007年03月20日
有限会社Preferred Infrastructure(本社:東京都練馬区、代表:西川徹)は
、ビットレイティングス株式会社(本社:東京都千代田区、代表:佐藤崇)の
携帯向け検索サイト「F★ROUTE」に、数百万以上のURLを高速処理可能な検索
エンジン(Sedue)を提供した。
Preferred Infrastructureでは、最先端の検索技術である「圧縮接尾辞配列
」を利用した、大容量規模のインデックスでも高速に全文検索を実現すること
のできる検索エンジン「Sedue」を開発している。
今回導入した全文検索エンジンである「Sedue」の用いている検索手法であ
る「圧縮接尾辞配列」は、従来の「転置インデックス方式」や「Nグラム方式
」と比較して、大容量の文章に対しても精度の高い検索を高速に実現すること
ができる。それにより、日々増えつつあるアクセス数に対して安定した全文検
索機能を提供することが可能である。
IT/コンピュータ,有限会社Preferred Infrastructure
|2007年03月20日 10:23
| トラックバック(0)
トラックバック
このエントリーのトラックバックURL:
http://www.prblog.biz/mt-tb.cgi/4536
2007年03月05日
有限会社Preferred Infrastructure(本社:東京都練馬区、代表取締役:西川
徹)は、最先端の文字列検索アルゴリズムを利用し、曖昧検索処理を高速に実
現する検索エンジン『Sedue Flex』を発表いたします。
■概要
今回発表する『Sedue Flex』は、ゲノムや音声データなどの検索に必要とされ
る「曖昧全文検索」を、最新のアルゴリズムを利用することにより高速に処理
可能な検索エンジンです。本検索エンジンを利用することにより、従来であれ
ばスーパーコンピュータ級の処理能力を必要としていたゲノム解析などを1台
~数台のPC上で高速に処理することが可能です。
■特徴
『Sedue Flex』は、弊社が開発した全文検索技術『Sedue』をベースにし、文
字列の欠落やミスマッチありの場合でも高速検索を可能にした全文検索エンジ
ンです。本エンジンでは、10%~20%の誤りを許した全文検索を、ギガバイト級
のデータに対しても数ミリ秒~数秒のオーダーで検索することが可能です。
今回開発したエンジンは、どのような長さの文字列に対しても曖昧検索を可能
にしているため、従来手法では実現できなかった高度なゲノム解析処理やノイ
ズを含んだデータに対する検索を実現可能にしています。特に、ゲノム解析に
おいては従来手法では困難であった、50塩基程度の短い長さの塩基配列に対
するミスマッチあり(一部の文字が異なる)・ギャップあり(一部の文字が欠
落・追加している)の検索も可能です。
本エンジンに利用している「圧縮全文索引」方式は、従来の検索方式では扱う
ことが難しい任意長の長さの文字列に対しても、非常に高速に検索を行うこと
が可能です。その技術と今回新たに開発した曖昧検索アルゴリズムを融合する
ことにより、従来ではスーパーコンピュータ級の性能が必要であった検索処理
を、1台のPCで実現することが可能になっています。
■用途・動作環境
本エンジンは、
・ゲノム解析
・ノイズの含まれたデータに対する検索
などの高速・高度な曖昧検索機能を必要とするユーザーを対象にしています。
Sedue Toolsが動作する環境は、Linux(Fedora Core 4/5/6及びCentOS 3/4で動
作確認済み)となります。
<本件に関するお問い合わせ先>
Mail:info@preferred.jp
URL:http://preferred.jp/sedue/
IT/コンピュータ,有限会社Preferred Infrastructure
|2007年03月05日 15:56
| トラックバック(0)
トラックバック
このエントリーのトラックバックURL:
http://www.prblog.biz/mt-tb.cgi/4402
2006年10月13日
有限会社Preferred Infrastructure(本社:東京都練馬区、代表取締役:西川
徹)は、簡単に高速なWeb CGIを開発するためのフレームワーク『AzaraC(あざ
らし)』を公開します。
■概要
今回公開する『AzaraC(あざらし)』は、C++を言語としたCGIを作成するための
フレームワークを提供します。テンプレートによるデザインとロジックの分離
、ページ更新時に自動的に再コンパイルする機能を搭載し、CGIの作成コスト
・管理コストを最小限にします。そして、C++言語により高速なCGIの構築を可
能にします。このフレームワークは、オープンソースで提供され、利用者は本
フレームワークを利用して自由にWebアプリケーションを構築できます。
『AzaraC』は、Preferred InfrastructureのWebサービス・オープンソースプ
ロジェクト公開サイト『labs.preferred.jp』にて提供されます。
■機能
・テンプレートエンジン
AzaraCでは、Ruby on RailsやPHPなどと同様に、Webページにプログラムを
埋め込むことを可能にする「テンプレートエンジン」を提供します。テンプレ
ートエンジンを利用することにより、デザインとロジックを分離したWebアプ
リケーションの作成が可能になります。テンプレートエンジンによって作成さ
れたアプリケーションは、実際にはネイティブで動作する実行コードに変換さ
れるので、最高のパフォーマンスを達成することができます。
・CGI作成のためのライブラリ
また、CGIを作成する際に利用可能なCGI作成用ライブラリを提供します。こ
のライブラリを用いることにより、Cookieの操作やユーザーからの要求の処理
を容易に行うことが可能です。
・ページ更新による自動再コンパイル
AzaraCは、ページを実行可能コードにコンパイルすることにより高速なCGI
の動作を達成しています。ページ更新時に、煩わしい再コンパイルを不要にす
るため、ページ更新を自動的に検知して実行可能コードを更新する機能を備え
ています。これにより、Webページの変更時に手動によるコンパイルを必要と
しません。
■labs.preferred.jpについて
labs.preferred.jpでは、弊社が提供するWebサービスやオープンソースプロジ
ェクトを公開しています。弊社が開発したソフトウェアをベースにしたサービ
スを公開しており、実際に製品の動作をサービスを通じて体験することができ
ます。また、オープンソースプロジェクトでは、Webアプリケーション作成や
効率的なソフトウェア開発支援ツール、エンターティメントソフトウェアなど
多岐に渡るソフトウェアを公開予定です。
<本件に関するお問い合わせ先>
Mail:info@preferred.jp
URL:http://labs.preferred.jp/azarac/
IT/コンピュータ,有限会社Preferred Infrastructure
|2006年10月13日 11:55
| トラックバック(0)
トラックバック
このエントリーのトラックバックURL:
http://www.prblog.biz/mt-tb.cgi/3295
2006年09月20日
有限会社Preferred Infrastructure(本社:東京都練馬区、代表取締役:西川
徹)は、圧縮全文索引を用いた大規模・分散検索向けエンタープライズ全文検
索エンジン『Sedue』を発表します。
関係者各位
プレスリリース 2006年9月20日
有限会社 Preferred Infrastructure
==================================
Preferred Infrastructure、エンタープライズ向け全文検索エンジンを発表
-オンメモリ・複数サーバーでの高速な検索を低コストで実現-
==================================
有限会社Preferred Infrastructure(本社:東京都練馬区、代表取締役:西川
徹)は、圧縮全文索引を用いた大規模・分散検索向けエンタープライズ全文検
索エンジン『Sedue』を発表します。
■概要
今回発表するSedue全文検索エンジンでは、最新技術である「CSA (compressed
suffix arrays)方式」をコアテクノロジーとして採用しています。これにより
一台あたり数ギガバイト・数百万文章のテキストに対する検索操作をメモリ上
で処理し、高速・安定した全文検索の運用を実現することが可能になりました。
また、複数台のマシンを利用した場合のスケーラビリティも備え、数10ギガ
バイトのテキストを対象とした検索にも対応します。全文検索機能に加え、ア
クセス制御、リソースの自動管理、分散クエリ処理などの機能を搭載します。
■コアテクノロジー
今回採用したCSA方式では、最新の圧縮技術やデータ構造を組み合わせること
により、高速な検索を実現しつつIndex情報を高密度に保持することが可能と
なりました。これにより、漏れの無い検索を従来手法(N-gram)と比較し1/2
から1/3のサイズの索引で実現可能となり大規模なテキストの検索をメモリ上
で実現可能となります。また、この技術を基にした、独自スコアリング技術・
分散検索システムを開発しシステムに統合されています。
本技術の基礎部分は独立行政法人情報処理推進機構(IPA)による「未踏ソフト
ウェア創造事業」による支援を受け開発され、現在も高速化・大容量化に向け
改良が続けられています。
■製品情報
本製品の対象となる分野は次の通りです。
・企業内の情報を集約し活用するナレッジポータル
・大規模データを扱うWebサイトの検索バックエンド
・アプリケーションへの検索機能組み込み用
本製品の導入により、オンメモリ・分散処理による大規模検索を組み込んだサ
ービス提供が可能になります。また、サーバーの追加・故障時の管理を自動化
することにより、サービスのメンテナンスコストを最小限に抑えます。
別途提供のライブラリにより、圧縮全文索引機能をクライアントアプリケーシ
ョンに組み込むことが可能です。このライブラリは、全文検索エンジンから1
マシンでの検索に必要な機能を抽出し、軽量・省メモリの全文検索アプリケー
ションの開発を可能にする他、バイオインフォマティクスなど大規模文字列処
理が必要なアプリケーションにも応用可能です。
■販売開始時期
『エンタープライズ向け全文検索エンジン』
販売開始時期は2006年10月中旬を予定。
『圧縮全文索引ソフトウェア開発用ライブラリ』
販売開始時期は2006年10月中旬を予定。
2006年9月より評価版の配布を開始。
<本件に関するお問い合わせ先>
有限会社 Preferred Infrastructure
東京都練馬区小竹町1-4-6
email:info@preferred.jp
URL:http://preferred.jp/sedue/
IT/コンピュータ,有限会社Preferred Infrastructure
|2006年09月20日 13:13
| トラックバック(0)
トラックバック
このエントリーのトラックバックURL:
http://www.prblog.biz/mt-tb.cgi/3095