Aug 14, 2005

[JSR] JSR 73 Data Mining API ダイジェスト

Data Mining API の仕様をざっと眺めたときのメモ。

JSR 73 Data Mining API

オリジナルの入手はこちら → JSR 73

1. Overview

  • JDM は Pure Java のデータマイニング用 API。 データマイニングツールベンダが提供する実装に対する共通の API を定義する。
  • 類似の JSR に JSR-69 JOLAP があるが、JSR-73 は JSR-69 と調整をしながら策定されている。
  • JDM は、API(application programming interface)、DME(data mining engine)、MOR(mining object repository) の 3 つのコンポーネントで構成される。

2. Use cases

3. Concepts

Data mining Functions
データマイニングの主だったサブドメイン。以下の 5 つから構成される。
  • Classification・・・予め決められた分類に従ってデータを分類する。ex) customer segmentation, business modeling, credit analysis
  • Regression・・・時間を考慮したClassification。ex) financial forecasting, biomedical and drug response modeling
  • Attribute Importance・・・モデルの構築の際にどの属性が最も重要であるかを決定する。
  • Clustering・・・データ内のクラスタを見つける。
  • Association・・・データ内に頻発する値の関連を見つける。ex) market basket analysis
Data mining Tasks
  • Building a model
  • Testing a model
  • Applying a model
  • Object import and export
  • Computing statistics on data
  • Verifying task correctness
Principal Objects
  • Connection
  • Task
  • Execution handle and status
  • Physical data set
  • Physical data record
  • Build settings
  • Algorithm
  • Algorithm settings
  • Model
  • Model signature
  • Model detail
  • Logical attribute
  • Logical data
  • Attribute statistics set
  • Apply settings
  • Confusion matrix
  • Lift
  • Cost matrix
  • Prior probabilities
  • Category sets
  • Taxonomy
  • Rules
  • Verification report
Physical data representations
  • Individual record
  • Single record case table
  • Multi-record case table
  • Data preparation
Attribute mapping
  • Direct mapping
  • Pivot mapping
Creating physical data objects
Persistence
Object references
Reflection/introspection

4. Packages

5. Code examples

6. Conformance statement

Posted in JSR | このエントリーをはてなブックマークに追加 | この記事をクリップ! livedoor クリップ |