Автор Тема: A-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парс  (Прочитано 1208 раз)

12 Май, 2017, 14:23:19

Оффлайн A-Parser Support

  • Школьник
  • *
  • Сообщений: 9
  • Репутация: 0
  • OS: Windows 7/Server 2008 R2 Windows 7/Server 2008 R2
  • Browser: Chrome 58.0.3029.110 Chrome 58.0.3029.110
    • Просмотр профиля
A-Parser - многопоточный парсер поисковых систем, сервисов оценки сайтов, ключевых слов, контента(текст, ссылки, email, телефоны, произвольные данные) и других различных сервисов(youtube, картинки, переводчик...), всего A-Parser содержит более 70 парсеров

На сегодняшний день A-Parser развился в невероятный SEO комбаин, позволяющий покрыть огромное число задач для SEO-специалистов и вебмастеров любого уровня подготовки:
  • Используйте встроенные парсеры чтобы с легкостью получать и анализировать любые данные
  • Воспользуйтесь нашим каталогом парсеров и пресетов для расширения возможностей A-Parser и решения нестандартных задач
  • Если вы продвинутый пользователь - создавайте свои собственные парсеры на основе регулярных выражений или XPath
  • Владеете JavaScript? Тогда A-Parser предлагает вам беспрецедентную возможность программировать свои собственные парсеры, используя всю мощь возможностей A-Parser!
  • Для автоматизации мы предлагаем API позволяющий легко встроить A-Parser в ваши бизнес процессы, а также для создания сервисов любого уровня сложности на базе нашего парсера


Кроме этого мы предоставляем услуги по составлению заданий и написанию парсеров под ваши задачи, в кратчайшие сроки и по демократичной цене. Хотите спарсить целиком интернет магазин(Ozon, Amazon, AliExpress)? Проверить 100 миллионов сайтов по вашим признакам? Получить данные с любого сайта в структурированном виде(CSV, JSON, XML, SQL)? В решении этих задач поможет наша дополнительная платная поддержка

A-Parser полностью решает рутинные задачи по получению, обработки и систематизации данных, необходимых для работы в следующих областях:
  • SEO-оптимизация сайтов и Web-аналитика
    • Сбор баз ссылок для XRumer, A-Poster, AllSubmitter, ZennoPoster...
    • Оценка сайтов и доменов по множеству параметров
    • Мониторинг позиции любых сайтов в поисковых системах
    • Сбор контента(текст, картинки, ролики) для генерации сайтов(дорвеев)
    • Отслеживание обратных ссылок
    • Сбор произвольной информации с любых сайтов(например телефоны/e-mails, сообщения с форумов, объявления...)
    • Сбор и оценка ключевых слов
    • Сбор списка обратных ссылок
    • И многое другое
  • Web-безопасность
    • Сбор и фильтрация баз ссылок по признакам
    • Определение CMS сайтов
    • Формирование произвольных GET, POST запросов с одновременной фильтрацией ответа
  • Сетевое администрирование
    • Работа с DNS службой - резолвинг доменов в IP адреса
    • Работа с Whois - дата регистрации и окончания регистрации доменов, name-cервера
A-Parser обладает следующими преимуществами:
  • Колоссальная производительность
    • Многопоточность - парсер способен распараллеливать сетевые операции до 5000-10000 потоков в зависимости от конфигурации компьютера и решаемой задачи
    • Продуманная внутренняя архитектура, в которую заложена производительность и расширяемость
    • Множественные оптимизации сложных операций
    • Парсер не требователен к ресурсам, может работать как на компьютере, так и на VDS или сервере, на операционных системах Windows, Linux или FreeBSD
  • Промышленные масштабы
    • Парсер разрабатывался с учетом работы с неограниченным размером данных
    • Способен обрабатывать сотни миллионов и миллиардов запросов
    • Размеры файлов запросов и результатов ничем не ограничены и могут достигать терабайтных значений
  • Автономность
    • A-Parser рассчитан на бесперебойную и беспрерывную работу без участия пользователя
    • Очередь заданий позволяет нагрузить парсер работой на недели и месяцы вперед
    • Одновременное выполнение нескольких разных задач для скорейшего получения результатов
  • Поддержка более 70 парсеров
  • Создание собственных пресетов
    • Использование регулярных выражений
    • Поддержка XPath
    • Поддержка многостраничного парсинга
    • Проверка контента и наличия следующей страницы
  • Создание собственных парсеров
    • Быстрая разработка на JavaScript
    • Многопоточность и работу с прокси обеспечивает A-Parser
  • Распознавание каптчи
    • Поддержка множества сервисов: антигейт, cheap-captcha.com, rucaptcha.com и любых других на основе AntiGate API
    • Поддержка CapMonster и XEvil
  • Мощные инструменты для формирования запросов и результатов
    • Конструктор запросов и результатов - позволяет видоизменять данные(поиск и замена, выделение домена из ссылки, преобразования по регулярным выражениям...)
    • Подстановки для запросов: из файла; перебор слов, символов и цифр
    • Фильтрация результатов - по вхождению подстроки, равенству, больше\меньше
    • Уникализация результатов - по строке, по домену, по главному домену(A-Parser знает все домены верхнего уровня, в т.ч. такие как co.uk, msk.ru)
    • Мощный шаблонизатор результатов на основе Template Toolkit - позволяет выводить результаты в любом удобном виде(текстом, csv, html, xml, json, sql, произвольный формат)
  • Гибкость настроек
    • В парсере используется система пресетов - для каждого парсера можно создать множество предустановленных настроек для различных ситуаций
    • Настроить можно все - никаких рамок и ограничений
    • Экспорт и импорт настроек позволяет легко обмениваться опытом с другими пользователями
  • Сетевые возможности
    • Поддержка HTTP/1.1, HTTP/2 и HTTPS(TLS)
    • Поддержка HTTP и SOCKS5 прокси, в т.ч. с авторизацией
    • Полностью асинхронная работа с сетью, включая работу с DNS
  • API
    • Возможность интегрировать и управлять парсером из своих программ и скриптов
    • Полная автоматизация бизнес-процессов
    • Клиенты для PHP, Perl, Python и NodeJS
  • Постоянные улучшения и исправления
    • Разработка парсера началась в 2011 году, а первый релиз вышел зимой 2012 года
    • С тех пор было выпущено более 100 новых версий, включающих множество улучшений и исправлений
    • A-Parser не останавливается в развитии, идет активная разработка, будет реализовано множество новых функций, в т.ч. по запросам от пользователей
  • Техническая поддержка
    • Мы прилагаем все усилия по поддержке пользователей и ответам на все возникающие вопросы
    • Создана подробная документация по A-Parser'у, открыт форум для пользователей
    • Специалист технической поддержки готов ответить любым удобным способом: ICQ, Skype, Jabber, GoogleTalk, e-mail и через форму онлайн связи на сайте
    • Разработчики A-Parser'а готовы ответить на любые сложные и технические вопросы, также открыт к обсуждению улучшений и дополнений для парсера
Более подробно ознакомится с возможностями парсера можно в полноценной документации

A-Parser предоставляется в трех версиях, сравнительная таблица и стоимость лицензий:



Мы принимаем к оплате в автоматическом режиме все популярные платежные системы, такие как Bitcoin, WebMoney, PayPal, Visa, MasterCard, Paxum, Яндекс.Деньги, QIWI, PerfectMoney, банковские переводы, терминалы оплаты и многое другое.
Для приобретения лицензии необходимо зарегистрироваться на сайте https://a-parser.com и перейти на страницу оплаты.
Если у вас возникли вопросы - обращайтесь по любым контактам в техническую поддержку


24 Август, 2017, 11:27:35
Ответ #1

Оффлайн A-Parser Support

  • Школьник
  • *
  • Сообщений: 9
  • Репутация: 0
  • OS: Windows 7/Server 2008 R2 Windows 7/Server 2008 R2
  • Browser: Chrome 60.0.3112.90 Chrome 60.0.3112.90
    • Просмотр профиля
1.1.918 - улучшена работа с override и отдельные append/preppend text для каждого файла



Улучшения:
  • Изменена работа с override: устранена возможность их дублирования, а также улучшен выбор и добавление настроек в пресет в один клик

  • Добавлена возможность для каждого файла результатов задавать индивидуальные Начальный/Конечный текст
Исправления в связи с изменениями в выдаче:
  • SE::Dogpile, Rank::MajesticSEO, SE::Google::Images, SE::Yandex
Исправления:
  • Исправлены падения при работе JS парсеров на Windows 10
  • Исправлен баг с ""белым экраном"", который появился в предыдущей версии
  • Парсер Rank::SimilarWeb удален в связи с требованием правообладателей
  • Исправлен баг, при котором не срабатывал шаблон в Общем формате результата при пустом имени файла результата, появился в версии 1.1.896
  • Исправлена работа с каптчей в SE::Google при работе через IPv6 прокси

06 Сентябрь, 2017, 11:26:39
Ответ #2

Оффлайн A-Parser Support

  • Школьник
  • *
  • Сообщений: 9
  • Репутация: 0
  • OS: Windows 7/Server 2008 R2 Windows 7/Server 2008 R2
  • Browser: Chrome 60.0.3112.113 Chrome 60.0.3112.113
    • Просмотр профиля
Видео урок: Парсинг пользователей ВК, которые лайкнули определенный пост

В этом уроке будет рассмотрен пример получения с помощью А-Парсер списка пользователей социальной сети Вконтакте, которые лайкнули выбранный пост. Такую информацию можно использовать для дальнейшего маркетинга, например, для рассылки сообщений только заинтересованным пользователям или проведения различных акций.

https://youtu.be/HFAbEDBEMj8

Урок включает в себя:
  • Парсинг социальной сети Вконтакте после авторизации
  • Отправка POST-запросов парсером и разбор результата
  • Использование Cookies в парсинге


Готовый парсер можно взять в нашем каталоге пресетов: Получение списка пользователей, которые лайкнули пост в VK

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

18 Сентябрь, 2017, 12:37:45
Ответ #3

Оффлайн A-Parser Support

  • Школьник
  • *
  • Сообщений: 9
  • Репутация: 0
  • OS: Windows 7/Server 2008 R2 Windows 7/Server 2008 R2
  • Browser: Chrome 61.0.3163.79 Chrome 61.0.3163.79
    • Просмотр профиля
1.1.937 - 2 новых парсера, поддержка reCAPTCHA, возможность перевода интерфейса парсера



Улучшения
  • Добавлено 2 новых парсера:
    • GooglePlay::Apps - парсинг информации о приложениях из Google Play
    • SE::Yandex::Speller - проверка страниц на ошибки в тексте через Яндекс.Спеллер
  • Добавлен функционал перевода интерфейса парсера на другие языки
  • В тестовом режиме добавлена поддержка reCAPTCHA в SE::Google::Mobile, пока поддерживается только сервис anti-captcha.com
  • Улучшен парсинг Google на паблик прокси
  • Уменьшена частота появления каптч, убран лимит страниц и добавлена поддержка антигейта в Shop::Yandex::Market
  • Добавлен выбор базы данных в Rank::SEMrush::Keyword
  • В SE::Yandex::Direct::Frequency улучшена обработка ошибок
  • Обновлен список языков в SE::Bing::Translator

Исправления в связи с изменениями в выдачи
  • В связи с прекращением поддержки со стороны Google, удален SE::Google::Fast
  • SE::Dogpile, Rank::MajesticSEO, SE::DuckDuckGo, Shop::Amazon

Исправления
  • Исправлен сбор картинок в HTML::EmailExtractor
  • Исправлена работа Shop::Yandex::Market в некоторых случаях
  • Исправлена работа с каптчей в SE::Yandex::Direct::Frequency в редких случаях
  • Исправлен парсинг данных о доменах .biz в Net::Whois
  • Исправлена работа с экзотическими кодировками в Net::HTTP
  • Исправлена работа с прокси в SE::Yandex
  • Исправлена работа с кодировками в JS-парсерах

28 Сентябрь, 2017, 13:07:58
Ответ #4

Оффлайн A-Parser Support

  • Школьник
  • *
  • Сообщений: 9
  • Репутация: 0
  • OS: Windows 7/Server 2008 R2 Windows 7/Server 2008 R2
  • Browser: Chrome 61.0.3163.100 Chrome 61.0.3163.100
    • Просмотр профиля
Сборник рецептов #18: скриншоты сайтов, lite выдача Яндекса и проверка сайтов

18-й сборник рецептов. В нем мы будем смотреть как выглядят сайты сразу в нескольких браузерах, протестируем облегченную выдачу Яндекса и проверим сайты в Яндексы. Кроме этого в сборнике предоставлены парсер для проверки существования e-mail'ов и пресет для получения позиций сразу по нескольким регионам. Итак, поехали!

Автоматизация тестирования сайтов в разных браузерах
Наверное каждый разработчик сайтов сталкивается с вопросом тестирования своих наработок в различных браузерах. Можно конечно держать для этого несколько виртуальных машин, что далеко не совсем рационально. Можно собирать отзывы от пользователей, что негативно влияет на общее впечатление от сайта тех же пользователей. А можно воспользоваться специализированными сервисами. Например BrowserStack. А с помощью А-Парсера этот процесс можно еще и автоматизировать, если к примеру нужно сразу протестировать множество сайтов. Как это сделать - читайте по ссылке выше.



Парсинг lite выдачи Яндекса
Недавно на Хабре была опубликована статья о lite выдаче поиска Яндекса. Нам стало интересно, насколько такая выдача может быть полезной в сравнении с обычной с точки зрения парсинга. Мы с помощью функционала JS парсеров сделали новый парсер и сравнили его со стандартным. Как это было, что из этого вышло и какие получились выводы, а также готовый парсер lite выдачи Яндекса - по ссылке выше.



Проверка сайта в Яндекс
Поисковую выдачу Яндекса можно использовать для решения самых разных задач. Одна из них - проверка сайтов на различные типы угроз. Яндекс отмечает такие сайты в выдаче специальными метками. С помощью A-Parser можно быстро проверить большие списки сайтов на наличие таких меток. Как это сделать - описано по ссылке выше.



Кроме этого:
Еще больше различных рецептов в нашем обновленном Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Сборник рецептов #1: Определяем CMS, оцениваем частотность ключевых слов и парсим Вконтакте
Сборник рецептов #2: собираем форумы для XRumer, парсим email со страниц контактов
Сборник рецептов #3: мобильные сайты, несколько парсеров, позиции ключевых слов
Сборник рецептов #4: поиск в выдаче, парсинг интернет-магазина и скачиваем файлы
Сборник рецептов #5: ссылки из JS, паблик прокси и карта сайта
Сборник рецептов #6: парсим базу номеров телефонов и сохраняем результаты красиво
Сборник рецептов #7: парсим RSS, качаем картинки и фильтруем результат по заголовкам
Сборник рецептов #8: парсим 2GIS, Google translate и подсказки Youtube
Сборник рецептов #9: проверяем сезонность ключевых слов и их полезность
Сборник рецептов #10: пишем кастомный парсер поисковика и парсим дерево категорий
Сборник рецептов #11: парсим Авито, работаем с JavaScript, анализируем тексты и участвуем в акции!
Сборник рецептов #12: парсим Instagram, собираем статистику и делаем свои парсеры подсказок
Сборник рецептов #13: сохраняем результат в файл дампа SQL и знакомимся с $tools.query
Сборник рецептов #14: используем XPath, анализируем сайты и создаем комбинированные пресеты
Сборник рецептов #15: анализируем скорость и юзабилити сайтов, парсим Яндекс.Картинки и Baidu
Сборник рецептов #16: парсинг OpenSiteExplorer с авторизацией, Яндекс.Каталога и Яндекс.Новостей
Сборник рецептов #17: картинки из Flickr, язык ключевых слов, список лайков в ВК

09 Октябрь, 2017, 12:14:34
Ответ #5

Оффлайн A-Parser Support

  • Школьник
  • *
  • Сообщений: 9
  • Репутация: 0
  • OS: Windows 7/Server 2008 R2 Windows 7/Server 2008 R2
  • Browser: Chrome 61.0.3163.100 Chrome 61.0.3163.100
    • Просмотр профиля
Получение позиций сайта одновременно для нескольких регионов



Обычно для получения позиций сайта в Яндексе используется SE::Yandex:: position. Но если возникает задача получить позиции для нескольких регионов, при этом для каждого региона нужно проверять позицию отдельного поддомена, то нужно делать много однотипных заданий с разными регионами, что несколько неудобно. Решение можно значительно упростить, использовав функционал JavaScript парсеров и написав небольшую обертку вокруг SE::Yandex:: position

Урок включает в себя:
  • Написание JS парсера
  • Использование стандартных встроенных парсеров в JS парсере
  • Переопределение настроек стандартного парсера при обращении к нему

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

09 Ноябрь, 2017, 11:29:15
Ответ #6

Оффлайн A-Parser Support

  • Школьник
  • *
  • Сообщений: 9
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 61.0.3163.100 Chrome 61.0.3163.100
    • Просмотр профиля
1.2.0 - обновленный интерфейс и множество улучшений

Мы рады представить релиз A-Parser 1.2.0 - результат почти двухмесячной разработки на бета-канале!
Полностью обновленный интерфейс, переработан ряд парсеров, реализовано множество различных улучшений.



Новые парсеры
  • SE::Google::Modern - теперь старая, новая и мобильная выдачи в одном парсере, а также поддержка работы с каптчами и рекаптчами

  • Util::ReCaptcha2 - распознавание Google ReCaptcha2 через популярные сервисы (anti-captcha, rucaptcha, CapMonster, а в скором будущем и xevil)

Улучшения

  • Полностью обновлен интерфейс
  • Добавлен статусбар, в котором выводится
    • статус парсера
    • количество работающих и всего заданий
    • количество живых и загруженных прокси
    • количество задействованных потоков
  • Полностью изменен выбор файлов запросов. Теперь легко можно выбирать несколько файлов, а также папки целиком
  • Реализована возможность получать JSON для API прямо в Редакторе заданий
  • Добавлен поиск во всех списках
  • Добавлена возможность сворачивания меню для увеличения рабочей области
  • В Тестовом парсинге добавлена новая область быстрых настроек: отключение автоскрола и включение debug режима
  • Добавлено предупреждение о риске затереть конфиг при обновлении через интерфейс
  • Добавлена возможность включения форматирования больших чисел
  • JS парсеры: добавлена опция use_proxy для this.request, которая позволяет переопределить использование прокси для отдельного запроса внутри JS парсера поверх глобального параметра Use proxy
  • JS парсеры: this.util переименован в this.utils и добавлены новые функции
  • JS парсеры: добавлена группировка в списке парсеров
  • Изменена иконка приложения, а также иконки некоторых парсеров
Исправления
  • Исправлена ситуация, когда оставались форматы запросов с предыдущего открытого задания
  • Исправлен перевод запросов с кавычками в SE::Yandex::Translate
  • Исправлен баг с сохранением переменных уникализации в некоторых случаях
  • Исправлена ошибка в SE::Google при работе со старой каптчей

  • Исправлена ошибка при открытии лога (возникла в одной из предыдущих версий)
  • Исправлена ошибка при удалении заданий (возникла в одной из предыдущих версий)
Исправления в связи с изменениями в выдачи
Впереди у нас еще очень много планов, поэтому оставайтесь с нами и следите за новостями!

26 Декабрь, 2017, 13:02:51
Ответ #7

Оффлайн A-Parser Support

  • Школьник
  • *
  • Сообщений: 9
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 63.0.3239.84 Chrome 63.0.3239.84
    • Просмотр профиля
1.2.50 - улучшение стабильности, поддержка Xevil и множество исправлений в стандартных парсерах

Улучшения

  • Уменьшение потребления памяти и улучшение стабильности работы x64 версий
  • Добавлена поддержка 2captcha и Xevil в Util::ReCaptcha2
  • Добавлен Parse all results и Parse related to level для SE::Bing
  • В SE::Bing добавлена возможность задавать Safe Search, а также добавлен повтор запроса при получении кешированной "короткой" выдачи
  • В SE::Yandex::Translate, добавлен обход ограничения на кол-во символов в запросе, что позволяет переводить очень большие запросы (>10k символов)
  • В SE::Google::Modern добавлена возможность задать автоматическое определение языка интерфейса в зависимости от IP
  • Движок V8 обновлен до версии 6.4

Исправления в связи с изменениями в выдаче
Исправления
  • Исправлена работа SE::Bing:
    • устранена ситуация, когда выдавалась одинаковая выдача для всех страниц
    • исправлена работа параметра Links per page
    • исправлен парсинг количества результатов в некоторых ситуациях
    • исправлена ошибка, при которой не было результатов, если в выдаче одна ссылка
  • Исправлена работа с каптчей в SE::Yandex::Wordstat
  • Исправлена ошибка, когда при запросе с опечаткой SE::Google::Modern не забирал результаты с первой страницы
  • Исправлена ошибка в Rank::MajesticSeo, при которой неправильно определялся бан IP
  • В SE::Google::Trends исправлена работа при изменении формата результата по-умолчанию
  • В SE::Google::Modern для Search from country изменен параметр: вместо cr теперь используется gl - это на данный момент позволяет более точно задавать регион
  • Исправлена проблема с чрезмерным потреблением памяти в JavaScript парсерах
  • Исправлена ошибка влияющая на стабильность работы на Linux и Windows
  • Исправлена ошибка в SE::Yandex, при которой не было результатов, если в выдаче одна ссылка
Команда A-Parser поздравляет всех с Новым годом и Рождеством! Спасибо что вы с нами!

10 Январь, 2018, 09:31:36
Ответ #8

Оффлайн A-Parser Support

  • Школьник
  • *
  • Сообщений: 9
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Chrome 63.0.3239.132 Chrome 63.0.3239.132
    • Просмотр профиля
Сборник статей #2: цикл статей-уроков по созданию JS парсеров

Как известно, в A-Parser есть возможность создавать свои собственные парсеры, которые могут иметь практически любую логику и в то же время позволяют пользоваться всеми преимуществами А-Парсера. Для написания таких парсеров используется язык JavaScript. В нашей документации подробно описаны все функции и методы, которые можно использовать при написании парсеров. А в сегодняшнем сборнике мы на практических примерах покажем наиболее часто применяемые функции. Поехали!



  • Получение результатов от стандартного парсера.
    В этой статье описано использование функции yield this.parser.request, которая позволяет работать с уже существующими парсерами, получать от них данные и дополнительно обрабатывать их.
  • Парсинг сайта с проходом по страницах.
    Здесь показан общий подход к созданию парсера, который будет "ходить" по страницам на сайте и забирать с них некоторую информацию.
  • Парсинг title и description для топ10 сайтов по запросу.
    В данном примере показано как написать собственный парсер, который объединит в себе две разных задачи: парсинг топ10 сайтов и парсинг данных из каждого полученного сайта. При этом также будет показана возможность реализации выбора между несколькими поисковиками, что делает такой парсер еще более универсальным.
  • Реализация подстановки запросов и их многопоточной обработки.
    Этот пример продемонстрирует, как "на лету" добавлять запросы с помощью tools.query.add, а также, как обрабатывать их в многопоточном режиме.
  • Работа с CAPTCHA.
    В этой статье на простом примере будет показан общий подход к работе с сайтами, на которых появляется каптча. Будет пошагово разобран алгоритм и продемонстрирован результат работы.
  • Работа с ReCaptcha2.
    А в этом примере по аналогии с обычной каптчей демонстрируется алгоритм работы с рекаптчей, а также вкратце поясняется принцип ее действия.
Для каждой статьи в конце будет продемонстрирован результат работы и дана ссылка на готовый парсер.
Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь здесь.
Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Предыдущие сборники статей