Madskillz.pngСкачать программу «Магадан» LITE — бесплатную, не ограниченную по времени редакцию парсера ключевых слов!

Отладка фильтра ключевых слов

Материал из "Магадан" - инструкция пользователя
Версия от 01:15, 13 сентября 2017; Root (обсуждение | вклад) (Новая страница: «==Постановка проблемы== Один из наиболее часто задаваемых в рамках тех. поддержки вопросо…»)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Постановка проблемы

Один из наиболее часто задаваемых в рамках тех. поддержки вопросов связан с ложным (ложноположительным?) срабатыванием фильтра ключевых слов, когда из очереди на парсинг, выдачи браузера баз или любого другого списка ключевых слов пропадают фразы, которые на первый взгляд не должны быть подвержены влиянию активированного фильтра. В подавляющем большинстве случаев причина подобных ошибок кроется в слишком коротких стоп-словах, используемых для фильтрации в режиме «поиска подстроки» (см. рисунок 1).

Регулировка режима работы фильтра

Если ситуация позволяет, следует переключить фильтр в режим «поиска точного вхождения» (см. рисунок 2). В этом режиме фильтр будет реагировать только на точные совпадения слов в фразе (например, фильтр по слову «сон» отфильтрует фразу «сон обломова», но не отфильтрует «сонм богов»). Конечно, это не всегда удобно, но позволяет свести количество ложных срабатываний фильтра к нулю.

Отладка действующего фильтра

В случаях, когда задача таки требует работы фильтра в режиме «поиска подстроки», необходимо очистить список стоп-слов от неадекватных задаче фраз, дающих ложные вхождения. Для выявления упомянутых стоп-слов (т.е. для отладки работы фильтра) можно использовать пункт его контекстного меню «Вести список отфильтрованных слов»" (см. рисунок 3). Программа будет сохранять все удаленные из фильтруемого списка фразы и причину их удаления, просмотреть которую можно при помощи пункта «Отобразить список [отфильтрованных слов]», расположенного в том же меню фильтра (см. тот же рисунок 3).

Manual-icon-exlamation.pngВедение списка отфильтрованных слов замедляет производительность работы фильтра на больших выборках и предъявляет дополнительные требования к объему доступной оперативной памяти, поэтому имеет смысл отключать ведение списка после того, как процесс настройки фильтра завершен.
Галерея
Рисунок 1. Пример потенциально «опасной» настройки фильтра ключевых слов  
Рисунок 2. Переключение фильтра ключевых слов в режим «поиска точного вхождения»  
Рисунок 3. Вот так можно выяснить, почему именно были отфильтрованы те или иные ключевые слова  

См. также

  1. Фильтр ключевых слов
  2. FAQ