Madskillz.pngСкачать программу «Магадан» LITE — бесплатную, не ограниченную по времени редакцию парсера ключевых слов!

Автоматическое наполнение очереди ключевых слов на парсинг: различия между версиями

Материал из "Магадан" - инструкция пользователя
Перейти к навигации Перейти к поиску
 
 
(не показано 8 промежуточных версий этого же участника)
Строка 1: Строка 1:
[[Категория:Функциональные возможности|60]]
[[Категория:Функциональные возможности|60]]
'''Автоматическое наполнение очереди ключевых слов на парсинг''' — функционал, позволяющий автоматизировать поступление новых ключевых слов в [[очередь ключевых слов на парсинг|очередь на парсинг]]. Используется в связке с [[фильтр списка ключевых слов|фильтром ключевых слов]] очереди.
'''Автоматическое наполнение очереди ключевых слов на парсинг''' — функционал, позволяющий автоматизировать поступление новых ключевых слов в [[очередь ключевых слов на парсинг|очередь на парсинг]]. Позволяет решать различные задачи, начиная от сбора дерева [[Связанные ключевые слова|связанных ключевых слов]] (т.н «[[сбор слов в глубину]]»), заканчивая цикличным обновлением статистики уже имеющихся в [[База ключевых слов|базе]] ключевых слов с заданной периодичностью. Дополнительную гибкость функции автоматического пополнения очереди придает использование ее в связке с [[фильтр списка ключевых слов|фильтром ключевых слов]] очереди.


==Описание==
==Моментальное пополнение очереди ключевых слов==
Зачастую перед пользователем стоит задача автоматического помещения в [[очередь ключевых слов на парсинг|очередь на парсинг]] тех или иных ключевых слов, содержащихся в [[база|базе]]. Это могут быть как новые слова, найденные в процессе [[парсинг|парсинга]], так и сохраненные ранее слова (например, [[Импорт ключевых слов|импортированные]] из внешних файлов).
[[Файл:Typical-formmain-data-flow-setup.png|мини|300px|Выпадающие пункты меню, используемые при настройке моментального пополнения очереди собранными ключевыми словами. Содержимое столбца «[[Что искали со словом]]» (левый) помещаем в очередь, содержимое столбца «[[Что еще искали люди, искавшие слово]]» (правый) только сохраняем в базу, в очередь не помещаем.]]
Моментальное пополнение очереди ключевых слов [[Связанные слова|найденными в процессе парсинга словами]] настраивается в [[Главное окно|главном окне]] «Магадана» при помощи выпадающего меню кнопок с изображением дискеты, расположенных над столбцами собираемых слов («[[Что искали со словом]]» и «[[Что еще искали люди, искавшие слово]]»). Каждая кнопка отвечает за обработку соответствующего ей столбца. Когда пункт меню «'''Сразу добавлять в очередь на парсинг'''» включен, содержимое столбца будет планомерно помещаться в очередь для последующей обработки (закончили сбор связей для текущего слова в очереди — поместили собранные слова туда же). Когда указанный пункт меню отключен, функция моментального пополнения очереди содержимым данного столбца отключена.


Автоматическое пополнение дает наибольшую эффективность при использовании в связке с [[Фильтр списка ключевых слов|фильтром ключевых слов]], поступающих в очередь: в настройках программы пользователь задает общие правила помещения слов в очередь, а в фильтре очереди указывает возможные стоп-слова и другие условия, точно так же, как это происходит при работе с любым экземпляром элемента интерфейса «[[Список ключевых слов]]».
Типичной задачей, для решения которой используется функция моментального пополнения очереди, является рекурсивный [[сбор ключевых слов в глубину]] (сбор всего содержимого графа связанных ключевых слов).


Автоматическое пополнение выполняется (если активировано в настройках) каждый раз, когда текущий набор ключевых слов в очереди подходит к концу. Если заданным правилам автоматического пополнения не соответствует более ни одно слово в подключенной базе, [[парсинг]] завершается.
По умолчанию, найденные слова помещаются в начало очереди, при этом производится сортировка таким образом, чтобы [[НЧ]] шли в начале, т.е. обрабатывались первыми. Подразумевается, что подобная организация позволяет позволит минимизировать размеры очереди без падения [[КПД парсинга]]. Меньше очередь — меньше времени необходимо на вполнение любых операций над ее содержимым (сортировка, [[Фильтр списка ключевых слов|фильтрация]], сохранение, загрузка и т.д.). Однако, порядок размещения найденных слов в очереди можно настроить во вкладке «[[Диалог настроек#Вкладка «Очередь ключевых слов»|Очередь ключевых слов]]» диалога настроек «[[Магадан|Магадана]]».


==Настройка автоматического пополнения очереди==
Отключение функции моментального помещения найденных слов в очередь на парсинг не влияет на настройку сохранения (записи) найденных слов в подключенный [[файл базы]].
Для решения задачи автоматического пополнения очереди используются настройки, расположенные во вкладке «[[Диалог настроек#Вкладка «Очередь ключевых слов»|Очередь ключевых слов]]» диалога настроек «Магадана».
 
{{Важно|text=Моментальное помещение ключевых слов из правого столбца («[[Что еще искали люди, искавшие слово]]») по умолчанию отключено! Включение опции для правого столбца в подавляющем большинстве случаев приведет к стремящемуся к бесконечности парсингу, т.к. столбец содержит множество слов, семантически не релевантных обрабатываемому в настоящий момент. Подробности см. в статье «[[Как ускорить процесс сбора ключевых слов?]]».}}
 
==Отложенное пополнение очереди ключевых слов==
[[Файл:Magadan-dialog-settings-tab-pool.png|мини|300px|Настройки моментального (сверху) и отложенного (снизу) пополнения очереди ключевых слов (см. вкладку «[[Диалог настроек#Вкладка «Очередь ключевых слов»|Очередь ключевых слов]]» в [[Диалог настроек|диалоге настроек]] «[[Магадан|Магадана]]»).]]
Отложенное пополнение очереди ключевых слов производится каждый раз, когда содержимое очереди подходит к концу. В ходе каждой итерации «Магадан» достает из подключенной базы небольшую порцию ключевых слов, помещает ее в очередь и продолжает [[Сбор ключевых слов|сбор данных]]. Если заданным правилам автоматического пополнения не соответствует более ни одно слово в подключенной базе, Магадан останавливает [[парсинг]] и выдает соответствующее сообщение.
 
Отложенное пополнение можно использовать как способ разгрузить очередь на компьютерах с малой производительностью, как аналог ''моментального пополнения очереди'', но без учета происхождения обрабатываемых слов (не смотрим, из какого столбца слово попало в базу, да и было ли вообще собрано в процессе, или же предварительно импортировано пользователем в базу), а также как возможность зациклить процесс обновления содержимого базы с заданным периодом.
 
Настройка отложенного пополнения очереди производится во вкладке «[[Диалог настроек#Вкладка «Очередь ключевых слов»|Очередь ключевых слов]]» диалога настроек программы.


==См. также==
==См. также==
* [[Диалог настроек#Вкладка «Очередь ключевых слов»|Вкладка настройки автоматического пополнения очереди в диалоге настроек «Магадана»]]
* [[Управление потоками данных во время сбора ключевых слов]]
* [[Сбор ключевых слов «в глубину»]]
* [[Сбор ключевых слов «в глубину»]]
* [[Очередь ключевых слов на парсинг]]
* [[Очередь ключевых слов на парсинг]]
* [[Фильтр списка ключевых слов]]
* [[Фильтр списка ключевых слов]]
* [[Список ключевых слов|Элемент интерфейса «Список ключевых слов»]]
* [[Список ключевых слов|Элемент интерфейса «Список ключевых слов»]]

Текущая версия от 01:12, 28 июля 2016

Автоматическое наполнение очереди ключевых слов на парсинг — функционал, позволяющий автоматизировать поступление новых ключевых слов в очередь на парсинг. Позволяет решать различные задачи, начиная от сбора дерева связанных ключевых слов (т.н «сбор слов в глубину»), заканчивая цикличным обновлением статистики уже имеющихся в базе ключевых слов с заданной периодичностью. Дополнительную гибкость функции автоматического пополнения очереди придает использование ее в связке с фильтром ключевых слов очереди.

Моментальное пополнение очереди ключевых слов

Выпадающие пункты меню, используемые при настройке моментального пополнения очереди собранными ключевыми словами. Содержимое столбца «Что искали со словом» (левый) помещаем в очередь, содержимое столбца «Что еще искали люди, искавшие слово» (правый) только сохраняем в базу, в очередь не помещаем.

Моментальное пополнение очереди ключевых слов найденными в процессе парсинга словами настраивается в главном окне «Магадана» при помощи выпадающего меню кнопок с изображением дискеты, расположенных над столбцами собираемых слов («Что искали со словом» и «Что еще искали люди, искавшие слово»). Каждая кнопка отвечает за обработку соответствующего ей столбца. Когда пункт меню «Сразу добавлять в очередь на парсинг» включен, содержимое столбца будет планомерно помещаться в очередь для последующей обработки (закончили сбор связей для текущего слова в очереди — поместили собранные слова туда же). Когда указанный пункт меню отключен, функция моментального пополнения очереди содержимым данного столбца отключена.

Типичной задачей, для решения которой используется функция моментального пополнения очереди, является рекурсивный сбор ключевых слов в глубину (сбор всего содержимого графа связанных ключевых слов).

По умолчанию, найденные слова помещаются в начало очереди, при этом производится сортировка таким образом, чтобы НЧ шли в начале, т.е. обрабатывались первыми. Подразумевается, что подобная организация позволяет позволит минимизировать размеры очереди без падения КПД парсинга. Меньше очередь — меньше времени необходимо на вполнение любых операций над ее содержимым (сортировка, фильтрация, сохранение, загрузка и т.д.). Однако, порядок размещения найденных слов в очереди можно настроить во вкладке «Очередь ключевых слов» диалога настроек «Магадана».

Отключение функции моментального помещения найденных слов в очередь на парсинг не влияет на настройку сохранения (записи) найденных слов в подключенный файл базы.

Manual-icon-exlamation.pngМоментальное помещение ключевых слов из правого столбца («Что еще искали люди, искавшие слово») по умолчанию отключено! Включение опции для правого столбца в подавляющем большинстве случаев приведет к стремящемуся к бесконечности парсингу, т.к. столбец содержит множество слов, семантически не релевантных обрабатываемому в настоящий момент. Подробности см. в статье «Как ускорить процесс сбора ключевых слов?».

Отложенное пополнение очереди ключевых слов

Настройки моментального (сверху) и отложенного (снизу) пополнения очереди ключевых слов (см. вкладку «Очередь ключевых слов» в диалоге настроек «Магадана»).

Отложенное пополнение очереди ключевых слов производится каждый раз, когда содержимое очереди подходит к концу. В ходе каждой итерации «Магадан» достает из подключенной базы небольшую порцию ключевых слов, помещает ее в очередь и продолжает сбор данных. Если заданным правилам автоматического пополнения не соответствует более ни одно слово в подключенной базе, Магадан останавливает парсинг и выдает соответствующее сообщение.

Отложенное пополнение можно использовать как способ разгрузить очередь на компьютерах с малой производительностью, как аналог моментального пополнения очереди, но без учета происхождения обрабатываемых слов (не смотрим, из какого столбца слово попало в базу, да и было ли вообще собрано в процессе, или же предварительно импортировано пользователем в базу), а также как возможность зациклить процесс обновления содержимого базы с заданным периодом.

Настройка отложенного пополнения очереди производится во вкладке «Очередь ключевых слов» диалога настроек программы.

См. также