Skip to main content

Loại bỏ hàng trùng lặp dữ liệu trong Excel

There are No Forests on Earth ??? Really? Full UNBELIEVABLE Documentary -Multi Language (Tháng Tư 2024)

There are No Forests on Earth ??? Really? Full UNBELIEVABLE Documentary -Multi Language (Tháng Tư 2024)
Anonim
01 trên 02

Loại bỏ bản ghi dữ liệu trùng lặp trong Excel

Các chương trình bảng tính như Excel thường được sử dụng làm cơ sở dữ liệu cho những thứ như phần kiểm kê, hồ sơ bán hàng và danh sách gửi thư.

Cơ sở dữ liệu trong Excel bao gồm các bảng dữ liệu thường được tổ chức thành các hàng dữ liệu được gọi là các bản ghi.

Trong một bản ghi, dữ liệu trong mỗi ô hoặc trường trong hàng có liên quan - chẳng hạn như tên, địa chỉ và số điện thoại của công ty.

Một vấn đề thường gặp xảy ra khi cơ sở dữ liệu tăng kích thước là bản ghi trùng lặp hoặc hàng dữ liệu.

Sự trùng lặp này có thể xảy ra nếu:

  • Toàn bộ các bản ghi được nhập vào cơ sở dữ liệu nhiều hơn một lần dẫn đến hai hoặc nhiều bản ghi giống hệt nhau
  • Nhiều bản ghi có một hoặc nhiều trường - chẳng hạn như tên và địa chỉ - chứa cùng một dữ liệu.

Dù bằng cách nào, bản ghi trùng lặp có thể gây ra toàn bộ sự cố - chẳng hạn như gửi nhiều bản sao tài liệu tới cùng một người khi thông tin cơ sở dữ liệu được sử dụng trong quá trình hợp nhất thư - vì vậy, nên quét và loại bỏ các bản ghi trùng lặp thường xuyên nền tảng.

Và trong khi dễ dàng chọn ra các bản ghi trùng lặp trong một mẫu nhỏ như trong hình ở trên, các bảng dữ liệu có thể dễ dàng chứa hàng trăm nếu không phải hàng nghìn hồ sơ gây khó khăn cho việc chọn ra các bản ghi trùng lặp.

Để làm cho việc thực hiện nhiệm vụ này trở nên dễ dàng hơn, Excel có một công cụ dữ liệu tích hợp được gọi, không đáng ngạc nhiên, Loại bỏ các bản sao, có thể được sử dụng để tìm và loại bỏ các bản ghi trùng khớp cũng như khớp một phần.

Tuy nhiên, cách Loại bỏ các bản sao công cụ được thiết kế, các bản ghi trùng khớp và một phần phù hợp phải được xử lý riêng.

Điều này là do Loại bỏ các bản sao hộp thoại hiển thị tên trường cho bảng dữ liệu đã chọn và bạn chọn trường cần bao gồm trong tìm kiếm bản ghi khớp:

  • Đối với các bản ghi giống nhau, hãy tìm kiếm tất cả các trường - để lại dấu kiểm bên cạnh tất cả các tên cột hoặc trường;
  • Đối với các bản ghi khớp một phần - hãy để dấu kiểm bên cạnh chỉ những trường cần khớp.

Tên trường so với chữ cái cột

Như đã đề cập, Loại bỏ các bản sao công cụ bao gồm một hộp thoại nơi bạn chọn các trường phù hợp để tìm kiếm bằng cách kiểm tra các tên trường hoặc cột mong muốn.

Thông tin mà hộp thoại hiển thị - tên trường hoặc chữ cái cột - tùy thuộc vào việc dữ liệu của bạn có chứa một hàng tiêu đề hay không tiêu đề - ở đầu bảng dữ liệu như được thấy trong hình trên.

Nếu có - hãy đảm bảo tùy chọn ở phía bên tay phải của hộp thoại - Dữ liệu của tôi có tiêu đề - được chọn và Excel sẽ hiển thị tên trong hàng này dưới dạng tên trường trong hộp thoại.

Nếu dữ liệu của bạn không có hàng tiêu đề, hộp thoại sẽ hiển thị các chữ cái cột thích hợp trong hộp thoại cho phạm vi dữ liệu đã chọn.

Phạm vi dữ liệu liền kề

Cho Loại bỏ các bản sao công cụ để hoạt động chính xác, bảng dữ liệu phải là một dải dữ liệu liền kề - nghĩa là nó không được có bất kỳ hàng trống, cột nào và nếu có thể, không có ô trống nào nằm trong bảng.

Không có khoảng trống trong bảng dữ liệu là một thực hành tốt khi nói đến quản lý dữ liệu nói chung và không chỉ khi tìm kiếm dữ liệu trùng lặp. Các công cụ dữ liệu khác của Excel - chẳng hạn như sắp xếp và lọc - hoạt động tốt nhất khi bảng dữ liệu là một dải dữ liệu liền kề nhau.

Xóa ví dụ bản ghi dữ liệu trùng lặp

Trong hình trên, bảng dữ liệu chứa hai bản ghi giống nhau cho A. Thompson và hai bản ghi khớp một phần cho R. Holt - nơi tất cả các trường khớp với số học sinh.

Các bước được liệt kê bên dưới nêu chi tiết cách sử dụng Loại bỏ các bản sao công cụ dữ liệu để:

  1. Loại bỏ thứ hai của hai bản ghi giống hệt nhau cho A. Thompson .
  2. Xóa bản ghi đối sánh một phần thứ hai cho R. Holt .

Mở hộp thoại loại bỏ trùng lặp

  1. Nhấp vào bất kỳ ô nào chứa dữ liệu trong cơ sở dữ liệu mẫu.
  2. Nhấn vào Dữ liệu trên ribbon.
  3. Nhấp vào Loại bỏ các bản sao biểu tượng để đánh dấu tất cả dữ liệu trong bảng dữ liệu và mở Loại bỏ các bản sao hộp thoại.
  4. Các Loại bỏ các bản sao hộp thoại hiển thị tất cả các tiêu đề cột hoặc tên trường từ mẫu dữ liệu của chúng tôi
  5. Dấu kiểm bên cạnh tên trường cho biết cột Excel sẽ cố gắng khớp trong khi tìm kiếm bản ghi trùng lặp
  6. Theo mặc định, khi hộp thoại mở tất cả các tên trường được chọn tắt

Tìm bản ghi giống hệt nhau

  1. Vì chúng tôi đang tìm kiếm các bản ghi hoàn toàn giống hệt nhau trong ví dụ này, chúng tôi sẽ để lại tất cả các tiêu đề cột được chọn
  2. Nhấp chuột được

Tại thời điểm này, bạn sẽ thấy các kết quả sau:

  • Hộp thoại sẽ đóng và được thay thế bằng một thông báo cho biết: Tìm thấy và xóa 1 giá trị trùng lặp; 7 giá trị duy nhất vẫn còn.
  • Hàng có chứa bản sao A. Thompson bản ghi sẽ bị xóa khỏi cơ sở dữ liệu
  • Mặc dù có hai bản ghi khớp một phần cho R. Hol t, bởi vì không phải tất cả các trường khớp nhau - số học sinh cho hai bản ghi khác nhau - Excel coi nó là một bản ghi dữ liệu duy nhất
02 trên 02

Tìm và loại bỏ các bản ghi trùng khớp một phần với Xóa các bản sao

Kiểm tra một trường tại một thời điểm

Vì Excel chỉ xóa các bản ghi dữ liệu khớp chính xác cho các trường dữ liệu đã chọn, cách tốt nhất để tìm tất cả các bản ghi dữ liệu khớp một phần là xóa dấu kiểm chỉ cho một trường tại một thời điểm, như được thực hiện trong các bước dưới đây.

Các tìm kiếm tiếp theo cho các bản ghi khớp với tất cả các trường ngoại trừ tên, tuổi hoặc chương trình sẽ xóa tất cả các kết hợp có thể cho các bản ghi khớp một phần.

Tìm bản ghi khớp một phần

  1. Nhấp vào bất kỳ ô nào chứa dữ liệu trong bảng dữ liệu nếu cần
  2. Nhấn vào Dữ liệu trên ribbon.
  3. Nhấp vào Loại bỏ các bản sao biểu tượng để đánh dấu tất cả dữ liệu trong bảng dữ liệu và mở Loại bỏ các bản sao hộp thoại.
  4. Tất cả các tên trường hoặc tiêu đề cột cho bảng dữ liệu được chọn.
  5. Để tìm và xóa các bản ghi không có kết quả phù hợp trong mọi trường, hãy xóa dấu kiểm bên cạnh các tên trường mà Excel sẽ bỏ qua.
  6. Đối với ví dụ này, nhấp vào hộp kiểm bên cạnh thẻ học sinh tiêu đề cột để loại bỏ dấu kiểm.
  7. Excel giờ đây sẽ chỉ tìm kiếm và xóa các bản ghi có dữ liệu phù hợp trong Họ , Ban đầu và Chương trình lĩnh vực.
  8. Nhấp chuột được
  9. Hộp thoại sẽ đóng và được thay thế bằng một thông báo cho biết: Tìm thấy và xóa 1 giá trị trùng lặp; 6 giá trị duy nhất vẫn còn.
  10. Hàng chứa bản ghi thứ hai cho R. Holt với ID sinh viên của ST348-252 sẽ bị xóa khỏi cơ sở dữ liệu.
  11. Nhấp chuột được để đóng hộp tin nhắn

Tại thời điểm này, bảng dữ liệu ví dụ sẽ không có tất cả dữ liệu trùng lặp.