• Гигабайты ценной информации. Присоединяйся.
    У нас действительно всё бесплатно, включая ChatGPT/DALLE/VISION)

WebParser - автоматический парсер контента

serafim

Житель Разулы
Команда форума
Разула в сердце
Регистрация
25 Апр 2016
Сообщения
78.844
Реакции
131.054
Ra
242.678
Доброго времени суток!
Как обычно:
Если было на форуме - удалите
Не тот раздел - перенесите
Краткое описание:
Создан для сбора статей, текстов, любого контента со сторонних сайтов, источников.
Встроенный уникализатор текста, повышает индексность поисковыми системами.
Для работы скрипта требуется только адрес(url) cайта, желаемый раздел или разделы и все, остальное делает скрипт, автоматически определяет контент и вытаскивает его, отделяя его от мусора.
Результат работы скрипта - готовые статьи для ваших сайтов, также возможен экспорт полученных статей в форматы: TXT, HTML, PHP
Не тратьте время на ручной сбор контента!
Скачать:
[HIDE-REPLY-THANKS]

Войти или Зарегистрироваться чтобы увидеть скрытый текст.

[/HIDE-REPLY-THANKS]

Продажник:
[HIDE-REPLY-THANKS]

Войти или Зарегистрироваться чтобы увидеть скрытый текст.


[/HIDE-REPLY-THANKS]
Основной принцип:1. Вводите в скрипт url сайта со статьями.
2. Скрипт заходит на все страницы сайта и грузит оттуда статьи.
3. Скрипт сам отбрасывает мусор со страницы, оставляя только статью.

Вы можете: 1. Указать с каких разделов сайта нужно парсить статьи.
2. Указать какие слова текст должен содержать (например, окна).
3. Указать минимальную длину текста.
4. Использовать автоопределение статьи (скрипт сам определит статью на странице), либо можете указать шаблон для парсинга (указываете между какими кусками кода страницы, должна находиться статья).
редактировать полученные статьи, как вручную, так и автоматически.
5. Использовать синонимайзер (база 308 000).
6. Исользовать экспорт полученных статей в txt, html, php.
7. Указывать максимальное количество статей
Настройка:
В конфиг прописывается доступ к базе данных, а доступ в админку по умолчанию такой:
логин - admin
пароль - admin
 

Похожие темы

Сверху