SQL入門
データベースの正規化とマスタの作成

SQLの初心者向け入門解説、VBAからデータベースを扱うためのSQLを解説
公開日:2019-12-03 最終更新日:2019-12-17

データベースの正規化とマスタの作成


エクセルVBAでデータベースを扱うためのSQL入門です。
前回までは1つのテーブルのみを扱ってきましたが、これからは複数のテーブルを扱っていきます。
複数テーブルの情報を必要に応じて結合して取得できるようになると、よりデータベースおよびSQLの利便性が感じられると思います。


エクセルでは、SUMIF,COUNTIF,VLOOKUP,INDEX,OFFSET等々、これらの関数で他シートの情報を取得できます。
SQLでは、これらの機能を強力かつ柔軟にしたことが行えるます。

前回まで使っていたテーブルは、全てのデータが1つのテーブルに入っていました。
同じcodeで同じnameのデータが多数存在していました。
同じデータが存在することはとても無駄なことです、ディスクの容量の無駄遣いでもあります。
このような無駄を排除してデータベースをあるべき形にすることをデータベースの正規化と言います。

データベース正規化とは

データの整合性を保ちつつ、データの冗長性(重複)を排除してデーベースを設計することです。
情報関係の資格を取るのであれば言葉の定義を正確に覚える必要がありますが、ここではごく簡単な説明にとどめます。
以下の説明は一般的な説明として問題ないはずですが、言葉使いや細部においては資格試験等の説明と相違する可能性がある点はご承知おきください。

第1正規形
繰り返し項目を持たない
導出項目を持たない

データベースのテーブルに入れることが出来れば概ね第1正規形であると言えます。
正規化されていないデータとは、エクセルで考えると分かりやすいと思います。
・セル結合されている
・横(列)に繰り返し現れるグループある
セル結合はいうまでもないでしょう。
繰り返し現れるグループとは、日別のデータが横に並んでいるようなデータです。
これらは、エクセルで関数を使ってデータ取得する時にも、かなり困った状態であることはお分かりいただけると思います

第1正規形とは、これらを排除した状態になります。
前回まで使用したテーブルは、金額が導出項目なので(であるとすれば)、完全には第1正規形とは言えないことになります。

第2正規形
第1正規形である
すべての非キー属性が候補キーに関して完全関数従属している

第1正規形からさらに、複数レコードに該当する値ごとに1つのテーブルを作成します。
レコードが、テーブルの主キー 以外に従属しないようにします。
主キーだけで決まる(関数従属)ものがあれば別テーブルに分離します。

前回まで使用したテーブルは、第2正規形になっていません。
codeで決まるnameが全てのレコードに存在しています。
このような項目が複数ありますので、これを分離して別テーブルにするのが第2正規形になります。

第3正規形
第1正規形である
いかなる非キー属性も候補キーに対して推移的関数従属をしない

推移的関数従属とは
Aが決まればBが決まり、Bが決まればCが決まる、しかし、AからCは決まらない場合です。
A→B、B→C、かつ、A→Cではない
レコードに、キーの一部ではない値が含まれる場合、その値を別のテーブルに分離します。
フィールドの内容が、テーブル内の複数のレコードに適用されるときは、それらのフィールドを別のテーブルに配置します。

「推移的関数従属」であるかどうかは、データの特質を良く見なければ簡単には判断できません。
第3正規形をあまり厳密に適用すると、使いづらいデータベースになってしまう場合もあります。
第3正規形は、頻繁に変更されるデータ以外では、あまり厳密に適用しないほうが良い場合もあります。

マスタデータとトランザクションデータ

マスタデータ:IT用語辞典より
企業内データベースなどで、業務を遂行する際の基礎情報となるデータのこと。
また、それらを集約したファイルやデータベースのテーブルなど。
単に「マスタ」と省略するのが一般的である。

トランザクションデータ:IT用語辞典より
企業の情報システムなどが扱うデータの種類の一つで、業務に伴って発生した出来事の詳細を記録したデータのこと。

各種伝票データはトランザクションデータであり、科目情報や取引先情報はマスタデータになります。

データべースのテーブル命名規則
命名規則は、それぞれの会社・システムにおいて検討されるものですが、良く使われるものとして、
マスタデータは、m_○○、m○○、M_○○、M○○
トランザクションデータは、t_○○、t○○、T_○○、T_○○
このような命名は良く使われます。
○○は英文を使って端的な単語にする場合や、数値で管理したりします。
テーブル数が多くなってくると、英単語ではかえって分かりづらくなってしまう為、数値(さらに記号を追加)を使ったりします。

SQL入門では、
マスタデータは、m_○○
トランザクションデータは、t_○○
このような名称を使っていきます。

正規化したテーブル定義

前回まで使用したテーブルを正規化します。

前回までの非正規化状態
テーブル:t_sales
列名 PRIMARY KEY AUTOINCREMENT NOT NULL
1 id INTEGER
2 code TEXT
3 name TEXT
4 address TEXT
5 sales_date TEXT
6 item_code TEXT
7 item_name TEXT
8 item_price INTEGER
9 item_count INTEGER
10 item_amount INTEGER
11 comment TEXT
※UNIQUやDEFAULTは使っていないので省略しています。

正規化後の状態
テーブル:m_customer
列名 NOT NULL PRIMARY KEY AUTOINCREMENT
1 code TEXT
2 name TEXT
2 address TEXT

CREATE TABLE m_customer (
 "code" TEXT NOT NULL
,"name" TEXT NOT NULL
,"address" TEXT
,PRIMARY KEY (code)
);

テーブル:m_item
列名 NOT NULL PRIMARY KEY AUTOINCREMENT
1 item_code TEXT
2 item_name TEXT

CREATE TABLE m_item (
 "item_code" TEXT NOT NULL
,"item_name" TEXT NOT NULL
,PRIMARY KEY (item_code)
);

このテーブルだけで見た時には、カラム名はcode,nameだけでも良いように見えます。
ここはどちらが良いという事もありませんし、意見がわかれるところだと思います。

テーブル:t_sales
列名 PRIMARY KEY AUTOINCREMENT NOT NULL
1 id INTEGER
2 code TEXT
3 sales_date TEXT
4 item_code TEXT
5 item_price INTEGER
6 item_count INTEGER
7 comment TEXT

CREATE TABLE t_sales (
 "id" INTEGER PRIMARY KEY AUTOINCREMENT NOT NULL
,"code" TEXT NOT NULL
,"sales_date" TEXT
,"item_code" TEXT
,"item_price" INTEGER
,"item_count" INTEGER
,"comment" TEXT
);

※item_priceは、item_codeが同じでも金額が違うので従属関係にありません。
例えば割引方法があり、それによって決まるのであれば、
そもそもその情報が欠落したデータベースだという事になります。
これはデータ蓄積時に良く注意しなければなりません。
後から、このような情報を追加することは極めて困難になります。

SQL入門では、SQLの解説が主になりますので、なるべく簡単なデータ例としています。

SQLの作成は、シートに上記の定義を入れて、
テーブル名変更と列追加(ALTER TABLE)とテーブル自動作成
・テーブル名変更:ALTER TABLE RENAME TO ・カラム(列)追加:ALTER TABLE ADD COLUMN ・SQLの半角空白と改行とセミコロン ・テーブル自動作成 ・テーブル名変更と列追加とテーブル自動作成の最後に
こちらで作成したプロシージャーを使用しています。

非正規化から正規化したテーブルを作成

m_customerとm_itemは、データを全て新規にINSERTするので、そのままCREATEしてからINSERTします。
ただし、同名のテーブルがないかは確認してから行ってください。

t_salesは、カラム削除になりますが、SQLiteではカラム削除ができません。
データをシートに取得後に、DROP TABLE→CREATE TABLE→INSERTの順で行います。

テーブル:m_customerの作成
t_salesをcodeでユニーク化したデータになります。
ワークシートでも簡単にできますが、SQLで作成してみましょう。

SELECT code,name,address
 FROM t_sales
 GROUP BY code
 ORDER BY code

このSQLを、
VBAクラスの全コード:データの取得
SQL入門の「データの取得:条件指定(SELECT,WHERE)」時点のVBAクラスの全コードです。ADOを使ったDB接続のVBAクラスの全コード クラスモジュール:clsSQLite
このVBAで実行すると、シートにcodeのユニークなデータが作成されます。

VBA マクロ SQL 正規化

このシートを使って、
データの挿入:バルクインサート
・テスト用のテーブル作成 ・VBAの改善点の概要 ・バルクインサートのSQL解説 ・バルクインサートのVBAコードと動作検証 ・文字列操作を改善する方法とVBAコード ・標準モジュールでの使い方と、100万行の実行結果 ・バルクインサートの最後に
ここのテーブル自動作成でデータをINSERTします。

INSERT INTO m_customer
 ("code","name","address")
 VALUES
 ('001','販売先001','住所001')
,('002','販売先002','住所002')
,('003','販売先003','住所003')
,・・・

テーブル:m_itemの作成
m_customer同様に、以下のSQLでシートに出力してから、INSERTします。
SELECT item_code,item_name
 FROM t_sales
 GROUP BY item_code
 ORDER BY item_code

VBA マクロ SQL 正規化

INSERT INTO m_item
 ("item_code","item_name")
 VALUES
 ('10001','商品10001')
,('10002','商品10002')
,('10003','商品10003')
,・・・

テーブル:t_salesの作成
m_customer同様に、以下のSQLでシートに出力しします。

SELECT code,sales_date,item_code,item_price,item_count,comment
 FROM t_sales

100万行あると少し時間がかかりますが、それでも10秒程度でしょう。

VBA マクロ SQL 正規化

データはシートに確保したので、テーブルを削除します。

DROP TABLE t_sales

CREATE TABLE t_sales (
 "id" INTEGER PRIMARY KEY AUTOINCREMENT NOT NULL
,"code" TEXT NOT NULL
,"sales_date" TEXT
,"item_code" TEXT
,"item_price" INTEGER
,"item_count" INTEGER
,"comment" TEXT
);

シートからデータをINSERTします。

INSERT INTO t_sales
 ("code","sales_date","item_code","item_price","item_count","comment")
 VALUES
 ('057','2019-11-28','10051',1200,12,'備考001')
,('046','2019-11-29','10099',1500,20,'備考002')
,('027','2019-11-30','10027',1300,5,'備考003')
,・・・

データベース正規化の最後に

ここで作成したテーブルは今後もサンブルSQLとして使用していきます。
以下に、全テーブル定義と、テーブル自動作成のVBAを掲載しておきます。
全テーブル定義とテーブル自動作成VBA
・テーブル:m_customer ・テーブル:m_item ・テーブル:t_sales ・テーブル自動作成

今回は、次回以降のテーブルを結合して取得する前準備を行いました。
データベース正規化については、特に専門的にDBを扱うという事でないなら、単純に重複データを排除するくらいの認識で問題ありません。

ここでは、シートを経由してデータを別のテーブルにINSERTしましたが、
実は、SQLで他のテーブルから直接INSERTすることができます。
これについては、後々に紹介します。

次回は、複数テーブルを結合してデータ取得するSQLの解説になります。



同じテーマ「SQL入門」の記事

データの取得:集約集計、並べ替え(DISTINCT,GROUP,HAVING,ORDER)
SQL関数と演算子
データベースにおけるNULLの扱い方
データベースの正規化とマスタの作成
全テーブル定義とテーブル自動作成VBA
テーブルを結合して取得(INNER JOIN,OUTER JOIN)
複数のSELECT結果を統合(UNION,UNION ALL)
データの更新(UPDATE)
データの削除(DELETE)
他のテーブルのデータで追加/更新/削除
インデックスを作成して高速化(CREATE INDEX)


新着記事NEW ・・・新着記事一覧を見る

TRIMRANGE関数(セル範囲をトリム:端の空白セルを除外)|エクセル入門(2024-08-30)
正規表現関数(REGEXTEST,REGEXREPLACE,REGEXEXTRACT)|エクセル入門(2024-07-02)
エクセルが起動しない、Excelが立ち上がらない|エクセル雑感(2024-04-11)
ブール型(Boolean)のis変数・フラグについて|VBA技術解説(2024-04-05)
テキストの内容によって図形を削除する|VBA技術解説(2024-04-02)
ExcelマクロVBA入門目次|エクセルの神髄(2024-03-20)
VBA10大躓きポイント(初心者が躓きやすいポイント)|VBA技術解説(2024-03-05)
テンキーのスクリーンキーボード作成|ユーザーフォーム入門(2024-02-26)
無効な前方参照か、コンパイルされていない種類への参照です。|エクセル雑感(2024-02-17)
初級脱出10問パック|VBA練習問題(2024-01-24)


アクセスランキング ・・・ ランキング一覧を見る

1.最終行の取得(End,Rows.Count)|VBA入門
2.セルのコピー&値の貼り付け(PasteSpecial)|VBA入門
3.変数宣言のDimとデータ型|VBA入門
4.繰り返し処理(For Next)|VBA入門
5.RangeとCellsの使い方|VBA入門
6.ブックを閉じる・保存(Close,Save,SaveAs)|VBA入門
7.セルのクリア(Clear,ClearContents)|VBA入門
8.メッセージボックス(MsgBox関数)|VBA入門
9.条件分岐(Select Case)|VBA入門
10.ブック・シートの選択(Select,Activate)|VBA入門




このサイトがお役に立ちましたら「シェア」「Bookmark」をお願いいたします。


記述には細心の注意をしたつもりですが、
間違いやご指摘がありましたら、「お問い合わせ」からお知らせいただけると幸いです。
掲載のVBAコードは動作を保証するものではなく、あくまでVBA学習のサンプルとして掲載しています。
掲載のVBAコードは自己責任でご使用ください。万一データ破損等の損害が発生しても責任は負いません。


このサイトがお役に立ちましたら「シェア」「Bookmark」をお願いいたします。
本文下部へ