Загрузка файлов

Parent Previous Next


В коде найденного значения поля данных парсер может находить ссылки на файлы (в том числе изображения) и загружать их на локальный компьютер.


Загружать файлы. Включает загрузку файлов, ссылки на которые присутствуют в данном поле, на локальный компьютер


Максимум попыток загрузки. Количество повторных попыток загрузки страницы, если загрузка завершилась неудачей.


Конечное расширение. Конечное расширение загружаемых файлов. Если оно не задано, то у сохраненных файлов остается оригинальное расширение.


Папка для сохранения. Путь к папке для сохранения файлов. Если данная настройка не задана, то по умолчанию используется папка Мои рисунки у вас на компьютере.


Виртуальный путь. Виртуальный путь папки, в которой будут храниться изображения у вас на сервере (относительно корневого домена).


Возвращаемое значение. Настройка определяет вид результирующего значения поля, в рамках которого производится поиск ссылок на файлы:


- Возвращать виртуальный путь. Результат - виртуальные пути скачанных файлов, перечисленные через запятую.



- Возвращать локальные пути. Результат - локальные пути скачанных файлов, перечисленные через запятую.



- Возвращать ссылку. Результат - ссылки на файлы, перечисленные через запятую.



- Возвращать полное значение. Результат - все найденное значение поля. При этом в коде пути к закачанным ссылкам заменяются виртуальным путем, указанным в соответствующей настройке. Таким образом, если вы зальете на свой сайт скачанные файлы (и в то же время опубликуете спарсенный контент) - ссылки в контенте будут указывать на файлы на вашем сервере.




Обработка существующих файлов. Если файл уже существует на локальном компьютере, то в зависимости от настроек данного блока Datacol может производить следующие действия:


- Перезаписывать существующие. Заменить существующий файл новым скачанным.


- Оставлять существующие. Проигнорировать скачивание если файл уже существует.


- Добавлять с 1. Создать новый файл, имя которого будет отличаться от существующего за счет добавленного постоянно инкрементируемого числа.


Правила идентификации ссылки (Для продвинутых пользователей!). Список регулярных выражений, которые позволяют Datacol идентифицировать ссылки в спарсенном значение поля (в частности, ссылку идентифицирует первая группа регулярного выражения). Если настройка остается пустой, то по умолчанию используются следующие правила:


Правило, чаще всего подходящее для обычных файлов:

href=["']([^<>'"]*?)["']


Правило, чаще всего подходящее для изображений:

src=["']([^<>'"]*?)["']


Расширения. Список расширений файлов, которые допустимы для загрузки. Если список пуст, то закачиваются файлы с любыми расширениями.


Генерация названия. Данный блок позволяет задать правила, по которым будет генерироваться название файла.


- Не генерировать. У файла остается оригинальное название.


- Случайное название. Для названия файла генерируется случайная строка.


- Формула. Название файла генерируется на базе формулы, которая может содержать значения спарсенных ранее полей данных. Обратите внимание, что поля, используемые в формуле генерации названия, должны находиться в списке полей выше, чем поле, в рамках которого закачиваются файлы (для которых собственно происходит генерация названия).




Генерация подпапок. Данный блок позволяет задать правила, по которым будет генерироваться подпапка (относительно Папки для сохранения) для загружаемого файла. Обратите внимание, что при загрузке файлов по FTP, на FTP сервере подпапки будут сгенерированы автоматически, что обеспечивает максимальное удобство данного механизма. В данном блоке доступны следующие опции


- Не генерировать. Генерации подпапок не происходит. Файлы сохраняются в папку, заданную настройкой Папка для сохранения.


- Формула. Подпапка генерируется на базе формулы, которая может содержать значения спарсенных ранее полей данных. Обратите внимание, что поля, используемые в формуле генерации подпапки, должны находиться в списке полей выше, чем поле, в рамках которого закачиваются файлы (для которых собственно происходит генерация подпапки).


Плагин для загрузки файлов. Настройка позволяет задать плагин, который переопределяет стандартный механизм загрузки файлов на локальный компьютер.


Подробнее о механизме работы плагинов можно почитать в данном разделе.

Created with the Personal Edition of HelpNDoc: Free help authoring tool