データベーススペシャリスト(応用技術)
網走で流氷を見ていたので2日間ほど間があいてしまいました(苦笑)。
流氷の速度計算と着氷予測とかの計算なんかも案外、観光には有効かも
しれないです。さて本題、いよいよ最終章です。
行ってみましょう。
1:レプリケーション
・複数のデータベース間で更新したデータを自動的に反映させる。
・同期レプリケーション(同期更新)
同一トランザクションで2つのサイトを更新する。→負荷が高い。
・非同期レプリケーション(非同期更新)
トランザクション完了後にバックアップサイトを更新→更新が遅い。
2:OLAP(多次元分析)
・OLAP(On-Line Analytical Processing)
データを多角的に見て法則性を分析する。
・MOLAP(Multi-Dimensional On-Line Analytical Processing)
多次元データベースを用いた分析処理
・ROLAP(Rerlational On-Line Analytical Processing)
関係データベースを用いた分析処理
・スライシング
2つの軸を選択して特定の面だけを参照する。
・ダイシング
サイコロを転がすようにデータの軸を変える。
・ドリルダウン
集約されたデータを細かく砕いていく。
・SQL/OLAP
SQLのOLAP拡張
3:データマイニング
大量に蓄積されたデータから隠れた規則性を見つけ出す。
規則信頼度が高くても規則支持度が低ければ意味が無い。
規則支持度が高いと規則信頼度は低い。
・規則信頼度
結論部の数/条件部の数
・規則支持度
結論部の数/全体の数
4:データウエアハウス
・主題指向(Subject-Oriented)
データ中心でデータを格納する。
・統合(integration)
データ体系を統一する。コード体系や意味、名称の統一
・時系列(time-variant)
過去から最新のデータまでを保持する。
・不変性(nonvolatile)
データが不変。更新されない。
5:メタデータ、データ辞書、リポジトリ
・メタデータ
データに関する情報のこと、データベースだと
「表定義、ビュー定義、列定義、権限定義」のような物。
・データ辞書
メタデータを格納した表の集合のこと。
・リポジトリ
ソフトウエア開発のライフサイクルに沿ってデータを一元管理
する仕組みのこと。
6:ストアドプロシージャ
データベースの操作を予め定義しておいてDBMSサーバ内で
動作する。
・手続きをまとめるため、通信のオーバヘッドを削減できる。
・手続きを一元管理できるのでセキュリティを確保できる。
7:その他のデータベース
・オブジェクト指向データベース(OODB)
オブジェクト識別子で一意にオブジェクトを識別する。
考え方としてはオブジェクト指向言語と同様(構造体+関数)
・オブジェクト関係データベース
関係データベースにオブジェクト指向的要素を付加
・XML
DTDでタグを独自定義できる。文書構造を作ることができる。
文書構造を利用してデータを保管するといったもの。
8:その他の用語
・ベンチマーク
TPC-C:オンライントランザクション処理を評価
TPC-B:バッチ処理を評価
TPC-H、TPC-R:オンライン分析処理向
・UniCode
世界中のすべての文字を1つの文字コード体系で表現する。
UCS-2、UTF-16、UCS-4、UTF-8等
はい、ようやくテキスト終了です。午前は用語を覚えるのと
短時間でSQLを解析して処理結果を選ぶのがキモですが、午後は
データモデリングと正規化がキモになりそうです。
後は午後の過去問を分析しながら数をこなすことになるかなと思います。
後は実業務で無理やりSQLを使う機会を増やすですな。
EXCELのピボットでできることもACCESSでのSQLで書くとか(笑)。
残り2ヶ月間、やれることはやってみます。
◆メモ
http://www.atmarkit.co.jp/fdb/rensai/sqls_analysis03/sqls_analysis03_01.html
http://labo.mamezou.com/special/sp_012/sp_012_002.html
http://www5.ocn.ne.jp/~shinya91/
http://www.dm-lab.ws/www/contents/kinka97.pdf
http://www.maebashi-it.org/data/data-mining.pdf
http://www.teradata-j.com/solution/images/TDMK5022_0710_DataminingIntroductory.pdf
http://www5.ocn.ne.jp/~shinya91/csm/42csm_link.html
http://japan.internet.com/busnews/20090706/6.html
http://www.atmarkit.co.jp/fnetwork/rensai/sql20/sql1.html
http://www.shift-the-oracle.com/plsql/user-function-procedure.html
http://thinkit.co.jp/free/article/0703/13/6/
http://northqra.com/stored_1.html
http://www.techscore.com/tech/sql/13_02.html
http://ash.jp/db/ora_nls.htm
http://itpro.nikkeibp.co.jp/article/COLUMN/20070614/274802/
http://park3.wakwak.com/~ozashin/sw_tips/webapp_tips/sjis_charset.html
流氷の速度計算と着氷予測とかの計算なんかも案外、観光には有効かも
しれないです。さて本題、いよいよ最終章です。
行ってみましょう。
1:レプリケーション
・複数のデータベース間で更新したデータを自動的に反映させる。
・同期レプリケーション(同期更新)
同一トランザクションで2つのサイトを更新する。→負荷が高い。
・非同期レプリケーション(非同期更新)
トランザクション完了後にバックアップサイトを更新→更新が遅い。
2:OLAP(多次元分析)
・OLAP(On-Line Analytical Processing)
データを多角的に見て法則性を分析する。
・MOLAP(Multi-Dimensional On-Line Analytical Processing)
多次元データベースを用いた分析処理
・ROLAP(Rerlational On-Line Analytical Processing)
関係データベースを用いた分析処理
・スライシング
2つの軸を選択して特定の面だけを参照する。
・ダイシング
サイコロを転がすようにデータの軸を変える。
・ドリルダウン
集約されたデータを細かく砕いていく。
・SQL/OLAP
SQLのOLAP拡張
3:データマイニング
大量に蓄積されたデータから隠れた規則性を見つけ出す。
規則信頼度が高くても規則支持度が低ければ意味が無い。
規則支持度が高いと規則信頼度は低い。
・規則信頼度
結論部の数/条件部の数
・規則支持度
結論部の数/全体の数
4:データウエアハウス
・主題指向(Subject-Oriented)
データ中心でデータを格納する。
・統合(integration)
データ体系を統一する。コード体系や意味、名称の統一
・時系列(time-variant)
過去から最新のデータまでを保持する。
・不変性(nonvolatile)
データが不変。更新されない。
5:メタデータ、データ辞書、リポジトリ
・メタデータ
データに関する情報のこと、データベースだと
「表定義、ビュー定義、列定義、権限定義」のような物。
・データ辞書
メタデータを格納した表の集合のこと。
・リポジトリ
ソフトウエア開発のライフサイクルに沿ってデータを一元管理
する仕組みのこと。
6:ストアドプロシージャ
データベースの操作を予め定義しておいてDBMSサーバ内で
動作する。
・手続きをまとめるため、通信のオーバヘッドを削減できる。
・手続きを一元管理できるのでセキュリティを確保できる。
7:その他のデータベース
・オブジェクト指向データベース(OODB)
オブジェクト識別子で一意にオブジェクトを識別する。
考え方としてはオブジェクト指向言語と同様(構造体+関数)
・オブジェクト関係データベース
関係データベースにオブジェクト指向的要素を付加
・XML
DTDでタグを独自定義できる。文書構造を作ることができる。
文書構造を利用してデータを保管するといったもの。
8:その他の用語
・ベンチマーク
TPC-C:オンライントランザクション処理を評価
TPC-B:バッチ処理を評価
TPC-H、TPC-R:オンライン分析処理向
・UniCode
世界中のすべての文字を1つの文字コード体系で表現する。
UCS-2、UTF-16、UCS-4、UTF-8等
はい、ようやくテキスト終了です。午前は用語を覚えるのと
短時間でSQLを解析して処理結果を選ぶのがキモですが、午後は
データモデリングと正規化がキモになりそうです。
後は午後の過去問を分析しながら数をこなすことになるかなと思います。
後は実業務で無理やりSQLを使う機会を増やすですな。
EXCELのピボットでできることもACCESSでのSQLで書くとか(笑)。
残り2ヶ月間、やれることはやってみます。
◆メモ
http://www.atmarkit.co.jp/fdb/rensai/sqls_analysis03/sqls_analysis03_01.html
http://labo.mamezou.com/special/sp_012/sp_012_002.html
http://www5.ocn.ne.jp/~shinya91/
http://www.dm-lab.ws/www/contents/kinka97.pdf
http://www.maebashi-it.org/data/data-mining.pdf
http://www.teradata-j.com/solution/images/TDMK5022_0710_DataminingIntroductory.pdf
http://www5.ocn.ne.jp/~shinya91/csm/42csm_link.html
http://japan.internet.com/busnews/20090706/6.html
http://www.atmarkit.co.jp/fnetwork/rensai/sql20/sql1.html
http://www.shift-the-oracle.com/plsql/user-function-procedure.html
http://thinkit.co.jp/free/article/0703/13/6/
http://northqra.com/stored_1.html
http://www.techscore.com/tech/sql/13_02.html
http://ash.jp/db/ora_nls.htm
http://itpro.nikkeibp.co.jp/article/COLUMN/20070614/274802/
http://park3.wakwak.com/~ozashin/sw_tips/webapp_tips/sjis_charset.html
コメント