Aug 14, 2005
[JSR] JSR 73 Data Mining API ダイジェスト
Data Mining API の仕様をざっと眺めたときのメモ。
JSR 73 Data Mining API
オリジナルの入手はこちら → JSR 73
1. Overview
- JDM は Pure Java のデータマイニング用 API。 データマイニングツールベンダが提供する実装に対する共通の API を定義する。
- 類似の JSR に JSR-69 JOLAP があるが、JSR-73 は JSR-69 と調整をしながら策定されている。
- JDM は、API(application programming interface)、DME(data mining engine)、MOR(mining object repository) の 3 つのコンポーネントで構成される。
2. Use cases
3. Concepts
- Data mining Functions
-
データマイニングの主だったサブドメイン。以下の 5 つから構成される。
- Classification・・・予め決められた分類に従ってデータを分類する。ex) customer segmentation, business modeling, credit analysis
- Regression・・・時間を考慮したClassification。ex) financial forecasting, biomedical and drug response modeling
- Attribute Importance・・・モデルの構築の際にどの属性が最も重要であるかを決定する。
- Clustering・・・データ内のクラスタを見つける。
- Association・・・データ内に頻発する値の関連を見つける。ex) market basket analysis
- Data mining Tasks
-
- Building a model
- Testing a model
- Applying a model
- Object import and export
- Computing statistics on data
- Verifying task correctness
- Principal Objects
-
- Connection
- Task
- Execution handle and status
- Physical data set
- Physical data record
- Build settings
- Algorithm
- Algorithm settings
- Model
- Model signature
- Model detail
- Logical attribute
- Logical data
- Attribute statistics set
- Apply settings
- Confusion matrix
- Lift
- Cost matrix
- Prior probabilities
- Category sets
- Taxonomy
- Rules
- Verification report
- Physical data representations
-
- Individual record
- Single record case table
- Multi-record case table
- Data preparation
- Attribute mapping
-
- Direct mapping
- Pivot mapping
- Creating physical data objects
- Persistence
- Object references
- Reflection/introspection
4. Packages
5. Code examples
6. Conformance statement



