.NET開発者のためのブログメディア
SQL ServerのDISTINCTを使って重複を除外して取得する方法
データベースからデータを取得する際に、重複したデータを取得してしまうことがあります。何件も同じデータが照会画面などで出力されるのは、ユーザーにとって使いやすいシステムとはいえないでしょう。SQL Serverでは、重複データを除外して取得する方法に「DISTINCT」命令が用意されています。ここではDISTINCTの使い方などをサンプルソースとともに解説していきます。
- SE
- 単体テストを行っているのですが、どうしてもデータが重複して取得されます。これを回避させる方法はありますか?
- PL
- そういった時にはDISTINCT命令を活用してみてください。重複データを除外してデータを取得してくれます。ですがDISTINCTを使う前に、重複データが取得される原因は突き止めましょう。もしかしたらLEFT JOINなどの条件といった原因も考えられます。
実行環境
・Microsoft SQL Server 2017
目次
DISTINCTでできること
まずは以下のデータを作成します。
■[DB_TEST].[dbo].[URI_TABLE]
No | Date | Kingaku | Syain |
---|---|---|---|
1 | 20200822 | 10000 | 大阪太郎 |
2 | 20200823 | 20000 | 東京太郎 |
3 | 20200823 | 30000 | 福岡太郎 |
4 | 20200823 | 40000 | 札幌太郎 |
5 | 20200824 | 50000 | 名古屋太郎 |
※背景色が黄色の箇所が重複しています。
SQL Serverで活用するDISTINCTとは、SELECT処理を実施した場合に生じてしまう重複データをひとつにまとめる(除外する)ための命令です。
以下、DISTINCTの基本構文です。非常に簡単な構造ですので、忘れずに活用しましょう。
1
|
SELECT DISTINCT カラム名 FROM テーブル名
|
上記のテーブルでは、カラム名「Date」が重複していますので、基本構文のカラム名に「Date」項目を設定してください。これにより重複データは除外されます。実際のプログラムは次項で確認していきましょう。
DISTINCTの基本的な使い方
先ほどのデータを用いて、基本的なDISTINCTの処理を実行します。
1
|
SELECT DISTINCT [Date] FROM [DB_TEST].[dbo].[URI_TABLE]
|
実行結果
全体で5件のデータが格納されていますが、No.2~4のDateカラムが重複データでした。よって、今回の実行で取得できるデータ件数は3件となることが確認できました。
複数列の重複を取得する方法
複数の列で重複データがある場合の取得方法も解説していきます。今回は以下のデータを使って操作します。
■[DB_TEST].[dbo].[URI_TABLE]
No | Date | Kingaku | Syain |
---|---|---|---|
1 | 20200822 | 10000 | 大阪太郎 |
2 | 20200823 | 20000 | 東京太郎 |
3 | 20200823 | 20000 | 東京太郎 |
4 | 20200823 | 20000 | 東京太郎 |
5 | 20200823 | 20000 | 東京太郎 |
※背景色が黄色の箇所が重複しています。
複数のカラムで重複を除外する場合でも、コードの基本的な構造は変わりません。KingakuカラムとSyainカラムを追加するようにしましょう。
1
|
SELECT DISTINCT [Date],[Kingaku],[Syain] FROM [DB_TEST].[dbo].[URI_TABLE]
|
実行結果
全体で5件のデータが存在し、DateカラムとKingakuカラムとSyainカラムの組み合わせで、重複データが4件(No.2~5)あります。今回の実行で取得できるデータ件数は2件となることが確認できました。
- SE
- とても簡単に重複データを除外させることができました!DISTINCT命令の使い方をこの機会に覚えて、コーディングを進めていきます。
- PL
- DISTINCT命令を使う場面は案外多いかもしれませんね。また、DISTINCTとCOUNTを組み合わせて、重複データを除外した件数を取得することもあります。他のデータベースでもこのDISTINCT命令は使えますし、自分の技術にして現場で活用していきましょう。
DISTINCT命令を使いこなして重複データを除外する
何万件と登録されている、売り上げテーブルなどのトランザクション系のテーブルでは、検索条件の設定状況次第で、データが重複されて取得してしまうことが多々あります。その際には検索条件が正しいのか、データの不整合がないかといった確認調査は必要でしょう。
今回解説したDISTINCT命令を有効活用すれば、比較的簡単に重複データは除外できます。重複データを取得して処理を行えば、それだけシステムのパフォーマンスにも影響してきますので、DISTINCTを使用して、より良いシステムを開発するように努めていきましょう。
Search キーワード検索
Popular 人気の記事
-
.NET Framework 3.5をWindows10にインストールする方法
2019年10月24日 -
EdgeとChromeはどう違う?それぞれのスペック7つを比較解説!
2020年09月28日 -
【VB.NET入門】DataGridViewの使い方まとめ
2019年12月22日 -
VB.NETをおすすめする3つの理由とは?VBAとの違いや勉強方法を解説
2019年12月21日 -
Windows10のテキストエディタおすすめ20選!選ぶポイント3つ
2020年04月28日
reccomended おすすめ記事
-
C#のusingステートメントでリソースの解放【Disposeとの違いとは】
2020年03月17日 -
【SQL Serverログの操作】トランザクションログの使用量を確認する方法
2020年03月16日 -
【.NETが統合】.NET 5の概要と今後のリリース予定
2020年03月05日