Как в кабинете
Как найти дубли в Excel
Реальная неувязка для огромных MS Excel таблиц — повторяющиеся данные либо дублирующиеся строчки. В обыденных критериях, поиск «дублей» это сизифов труд. Просмотреть вручную даже несколько 10-ов строк — уже непростая задачка, а если счет идет на тыщи?
К счастью, у MS Excel есть достаточно действенный метод борьбы с дубликатами строк — проверка данных. Но, чтоб она заработала, сначала нам придется как надо приготовиться.
Подготовка таблицы MS Excel к поиску дублей
Чтоб находить дублирующиеся записи, нам нужна какая-то точка опоры. По какому принципу будет осуществляться отбор дублей? Потому сперва, необходимо найти «эталонный столбец» — конкретно по нему и будет осуществляться отбор дубликатов. Данные размещенные в нем должны быть неповторимы и исключать возможность ошибки ввода.
Хороший пример образца — email адресок: он уникален для всякого обладателя, не склоняется, пишется постоянно на британском языке, не содержит пробелов.
Нехороший вариант — фамилия: во-1-х в перечне могут быть однофамильцы, во-2-х быть может написана с дефисами и без и т.п.
Как лишь эталонный столбец определен, необходимо его привести к очень чистому виду — другими словами пристально просмотреть и удостоверится, что в нем дубликатов нет в принципе. Дело в том, что инструмент «проверка данных» замечательно совладевает с попытками неверного ввода, но не направит внимания на те данные, которые уже находятся в документе, даже если они не верны.
Настраиваем проверку данных в MS Excel
Продолжаем наводить порядок. Выделяем все данные нашего эталонного столбца (естественно с припасом — мы ведь будем пополнять его!), чтоб убыстрить этот процесс — выделите первую ячейку столбца, зажмите кнопку SHIFT и промотайте лист вниз до конца, а потом опять щелкните мышью, но уже в последнюю ячейку. Столбец выделен.
Перейдите на вкладку «Данные», и в группе «Работа с данными», щелкните на инструмент «Проверка данных».
В открывшемся окне, на вкладке «Характеристики», в выпадающем перечне «Тип данных» изберите «Иной», а в показавшемся ниже поле «Формула», введите:
=СЧЁТЕСЛИ($A:$A;A2)=1
=COUNTIF($A:$A,A2)=1
Естественно, в зависимости от буквы-обозначения вашего эталонного столбца, изменяются и буквенные обозначения в параметрах функции ($A:$A;A2). По русски это звучало бы:
применить функцию СЧЁТЕСЛИ, которая ассоциирует каждую вводимую в столбец А строку с каждой уже там имеющейся ($A:$A), начиная со 2-ой ячейки (А2), при всем этом однообразное значение для каждой композиции может покажется лишь 1 раз (=1).
Перейдите на вкладку «Сообщение о ошибке» и введите текст, который будет выводится в случае несоблюдения описанного чуть повыше условия (поля «Заголовок» и «Сообщение). Поле «Вид» оставьте по-умолчанию, в положении «Останов».
Вот и готово. Давайте проверим?
Непревзойденно — при вводе слова «Ананас» ничего не происходит, но стоит мне ввести дубликат — слово «Груши», как MS Excel немедля выдает ошибку и советы по её исправлению, которые я ввел ранее.
Как же исключения?
Бывают и исключения из правил. Представим, что разыскиваемые груши мне все-же нужно внести в перечень, что именуется «кровь (внутренняя среда организма, образованная жидкой соединительной тканью. Состоит из плазмы и форменных элементов: клеток лейкоцитов и постклеточных структур: эритроцитов и тромбоцитов) из носу». Чтоб сделать такую лазейку, вновь откройте окно «Проверка данных», перейдите на вкладку «Сообщение о ошибке», но заместо категоричного «Останов», изберите наиболее либеральное «Предупреждение». Примените конфигурации и вновь попытайтесь ввести заранее неверное значение.
Как видите, форма вывода ошибки поменялась — она как и ранее предупреждает о ошибке, но нажатие клавиши «Да», дозволит для вас обойти написанное нами правило, и все-же добавить наши груши в перечень повторно.