Автор Тема: Проблема с парсингом сайта  (Прочитано 445 раз)

15 Ноябрь, 2018, 09:55:45

Оффлайн Volus

  • Школьник
  • *
  • Сообщений: 1
  • Репутация: 0
  • OS: Windows NT 10.0 Windows NT 10.0
  • Browser: Firefox 64.0 Firefox 64.0
    • Просмотр профиля
Есть страница системы Скопус, например, https://www.scopus.com/authid/detail.uri?authorId=56448936500
Стоит задача на PHP пропарсить некий текст.
Проблема в том, что страница не затягивается через file_get_contents($url) - выдает совсем не то, что на браузере (любом).
Пробовал вставить этот УРЛ в простой iframe - никакого результата. Пустой фрэйм.
В общем, стоит задача как-то перехватить конечный HTML, который сервер отдает браузеру.
-
Интересно, что для УРЛ https://scholar.google.com.ua/citations?user=cYjejPIAAAAJ&hl=en
file_get_contents($url) - работает нормально, и результат парсится нормально.
А в iframe - тоже не лезет, сообщает :
 Сайт scholar.google.com.ua не позволяет установить соединение

Подскажите, пожалуйста, как пропарсить страницу Скопуса?
« Последнее редактирование: 15 Ноябрь, 2018, 09:57:35 от Volus »

Форум вебмастеров - Webmasters.BY

Проблема с парсингом сайта
« : 15 Ноябрь, 2018, 09:55:45 »