MySQL에서 중복되는 행을 하나만 남기도 모두 삭제하는 방법
가령 다음과 같은 테이블이 있는 경우:
+----+--------+ | id | name | +----+--------+ | 1 | google | | 2 | yahoo | | 3 | msn | | 4 | google | | 5 | google | | 6 | yahoo | +----+--------+
중복되는 필드 중에서 가장 낮은 ID만 남기고 모두 삭제하고 싶은 경우가 있을 수 있습니다. (혹은 그 반대로 가장 큰 ID만 남겨야 하는 경우도 있을 것입니다.)
이런 상황에서 다음과 같은 쿼리를 사용할 수 있습니다.
DELETE n1 FROM names n1, names n2 WHERE n1.id > n2.id AND n1.name = n2.name 출처: stackoverflow
(여기에서 names는 테이블 이름입니다.)
큰 ID를 남기려는 경우에는:
DELETE n1 FROM names n1, names n2 WHERE n1.id < n2.id AND n1.name = n2.name
참고로 여러 개의 row를 삭제하려는 경우에는 다음과 같이 IN statement를 사용하면 됩니다.
DELETE from tablename WHERE id IN (1,2,3,...,254); 출처: stackoverflow
Between을 사용하여 범위를 지정하는 것도 가능합니다.
DELETE from tablename WHERE id BETWEEN 1 AND 254;
인덱스 걸면 많이 빠를거 같은데..
중복을 찾아서 지워준다는 자체가 감사하네요.
그런거 없는 줄 알았음..
안녕하세요? DB내 항목이 많을 경우에는 시간 초과 오류 등으로 인해 위의 방법이 잘 작동하지 않는다고 하네요. 만약 위의 방법으로 시도한다면 백업을 반드시 한 후에 진행해보시기 바랍니다.
이건 데이터 조금만 많아도 엄청 오래걸리거나 설정에 따라는 뻗어버릴거같은데여
안녕하세요?
찾아보고 더 좋은 해법이 있으면 업데이트하도록 하겠습니다.
위의 제시한 방법은 stackoverflow에 제시된 방법인데요. 좋은 솔루션이 아닐 수도 있을 것 같네요.
즐거운 시간 보내시기 바랍니다 🙂
실제로 3만개 있는 유저데이터에서 실행해봤는데 시간 초과해버리네요
안녕하세요?
댓글을 남겨주셔서 감사합니다.
이보다 더 효과적인 방법이 있는지 확인해보겠습니다.
즐거운 하루 보내시기 바랍니다 🙂
중복 값 하나만 남기고 없애는 쿼리
시간이 너무 걸리지 않을까요?