隨筆-102? 文章-0? 評論-83?
# [PostgreSQL刪除重復數據](http://www.cnblogs.com/mchina/archive/2013/04/15/3022086.html)
去重的方法一般是找到重復數據中的一條,以某一唯一條件去掉其他重復值。
Oracle?去重的方法很多,常用的是根據 rowid 進行去重。
PostgreSQL 庫如何去除單表重復數據呢?可以通過 ctid 進行,下面是實驗過程。
**一、創建測試表**
~~~
david=# create table emp (
david(# id int,
david(# name varchar);
CREATE TABLE
david=#
~~~
**二、插入測試數據**
[]( "復制代碼")
~~~
david=# insert into emp values (1, 'david');
INSERT 0 1
david=# insert into emp values (1, 'david');
INSERT 0 1
david=# insert into emp values (1, 'david');
INSERT 0 1
david=# insert into emp values (2, 'sandy');
INSERT 0 1
david=# insert into emp values (2, 'sandy');
INSERT 0 1
david=# insert into emp values (3, 'renee');
INSERT 0 1
david=# insert into emp values (4, 'jack');
INSERT 0 1
david=# insert into emp values (5, 'rose');
INSERT 0 1
david=#
~~~
[]( "復制代碼")
**三、查詢初始化數據**
[]( "復制代碼")
~~~
david=# select ctid, * from emp;
ctid | id | name
-------+----+-------
(0,1) | 1 | david
(0,2) | 1 | david
(0,3) | 1 | david
(0,4) | 2 | sandy
(0,5) | 2 | sandy
(0,6) | 3 | renee
(0,7) | 4 | jack
(0,8) | 5 | rose
(8 rows)
david=#
~~~
[]( "復制代碼")
查詢重復數據數
[]( "復制代碼")
~~~
david=# select distinct id, count(*) from emp group by id having count(*) > 1;
id | count
----+-------
1 | 3
2 | 2
(2 rows)
david=#
~~~
[]( "復制代碼")
查詢出 id 為1的記錄有3條,id 為2的記錄有2條。
**四、查詢要保留的數據**
以 min(ctid) 或 max(ctid) 為準。
[]( "復制代碼")
~~~
david=# select ctid, * from emp where ctid in (select min(ctid) from emp group by id);
ctid | id | name
-------+----+-------
(0,1) | 1 | david
(0,4) | 2 | sandy
(0,6) | 3 | renee
(0,7) | 4 | jack
(0,8) | 5 | rose
(5 rows)
david=#
~~~
[]( "復制代碼")
**五、刪除重復數據**
~~~
david=# delete from emp where ctid not in (select min(ctid) from emp group by id);
DELETE 3
david=#
~~~
**六、查看最后結果**
[]( "復制代碼")
~~~
david=# select ctid, * from emp;
ctid | id | name
-------+----+-------
(0,1) | 1 | david
(0,4) | 2 | sandy
(0,6) | 3 | renee
(0,7) | 4 | jack
(0,8) | 5 | rose
(5 rows)
david=#
~~~
[]( "復制代碼")
說明:如果表中已經有標明唯一的序列主鍵值,可以把該值替換上述的ctid直接刪除。
**七、其他方法**
也可以使用以下SQL刪除重復數據。
[]( "復制代碼")
~~~
david=# delete from emp a
david-# where a.ctid <>
david-# (
david(# select min(b.ctid) from emp b
david(# where a.id = b.id
david(# );
DELETE 3
david=#
~~~
[]( "復制代碼")
說明:在表數據量較大的情況下,這種刪除方法效率很高。
分類: [Postgresql](http://www.cnblogs.com/mchina/category/381458.html)
標簽: [postgresql](http://www.cnblogs.com/mchina/tag/postgresql/), [刪除重復數據](http://www.cnblogs.com/mchina/tag/刪除重復數據/)
綠色通道: [好文要頂]()[關注我]()[收藏該文]()[與我聯系](http://space.cnblogs.com/msg/send/David_Tang)[]( "分享至新浪微博")
[](http://home.cnblogs.com/u/mchina/)
[David_Tang](http://home.cnblogs.com/u/mchina/)
[關注 - 1](http://home.cnblogs.com/u/mchina/followees)
[粉絲 - 116](http://home.cnblogs.com/u/mchina/followers)
[+加關注]()
0
0
(請您對文章做出評價)
[? ](http://www.cnblogs.com/mchina/archive/2013/04/15/3010418.html) 上一篇:[PostgreSQL的時間/日期函數使用](http://www.cnblogs.com/mchina/archive/2013/04/15/3010418.html "發布于2013-04-15 11:56")
[? ](http://www.cnblogs.com/mchina/archive/2013/04/19/3028573.html) 下一篇:[PostgreSQL 查看數據庫,索引,表,表空間大小](http://www.cnblogs.com/mchina/archive/2013/04/19/3028573.html "發布于2013-04-19 09:56")
posted @ 2013-04-15 14:47[David_Tang](http://www.cnblogs.com/mchina/) 閱讀(89) 評論(0) [編輯](http://www.cnblogs.com/mchina/admin/EditPosts.aspx?postid=3022086)[收藏](#)

Copyright ?2013 David_Tang
- 數據表
- 模式Schema
- 表的繼承和分區
- 常用數據類型
- 函數和操作符-一
- 函數和操作符-二
- 函數和操作符-三
- 索引
- 事物隔離
- 性能提升技巧
- 服務器配置
- 角色和權限
- 數據庫管理
- 數據庫維護
- 系統表
- 系統視圖
- SQL語言函數
- PL-pgSQL過程語言
- PostgreSQL 序列(SEQUENCE)
- PostgreSQL的時間-日期函數使用
- PostgreSQL 查看數據庫,索引,表,表空間大小
- 用以查詢某表的詳細 包含表字段的注釋信息
- PostgreSQL 系統表查看系統信息
- postgre存儲過程簡單實用方法
- PostgreSQL實用日常維護SQL
- PostgreSQL的時間函數使用整理
- 命令
- pg_ctl控制服務器
- initdb 初始化數據庫簇
- createdb創建數據庫
- dropdb 刪除數據庫
- createuser創建用戶
- dropuser 刪除用戶
- psql交互式工具
- psql命令手冊
- pg_dump 數據庫轉儲
- pg_restore恢復數據庫
- vacuumdb 清理優化數據庫
- reindexdb 數據庫重創索引
- createlang 安裝過程語言
- droplang 刪除過程語言
- pg_upgrade 升級數據庫簇
- 調試存儲過程
- 客戶端命令-一
- 客戶端命令-二
- 使用技巧
- PostgreSQL刪除重復數據
- postgresql 小技巧
- PostgreSQL的10進制與16進制互轉
- PostgreSQL的漢字轉拼音
- Postgres重復數據的更新一例
- PostgreSQL使用with一例
- PostgreSQL在函數內返回returning
- PostgreSQL中的group_concat使用
- PostgreSQL數據庫切割和組合字段函數
- postgresql重復數據的刪除
- PostgreSQL的遞歸查詢(with recursive)
- PostgreSQL函數如何返回數據集
- PostgreSQL分區表(Table Partitioning)應用 - David_Tang - 博客園
- PostgreSQL: function 返回結果集多列和單列的例子
- 利用pgAgent創建定時任務
- 淺談 PostgreSQL 類型轉換類似Oracle
- postgresql在windows(包括win7)下的安裝配置
- PostgreSQL簡介、安裝、用戶管理、啟動關閉、創建刪除數據庫 (2010-11-08 12-52-51)轉載▼標簽: 雜談分類: PostgreSQL
- PostgreSQL的generate_series函數應用
- PostgreSQL 8.3.1 全文檢索(Full Text Search)
- postgresql record 使用
- 備份恢復
- PostgreSQL基于時間點恢復(PITR)
- Postgresql基于時間點恢復PITR案例(二)
- Postgres邏輯備份腳本
- Postgres invalid command \N數據恢復處理