На 15-й международной научно-практической конференции "ЛЕОТЕСТ-2010" был проведен доклад, посвященный системе PDF Science Search "Возможности системы мультипоиска доступных научно-технических документов в Интернет на примере тематики неразрушающего контроля и технической диагностики".
Несмотря на то, что большое число аналитических материалов публикуется в Интернете на «закрытых» информационных ресурсах (тех, которые требуют оплаты, регистрации, корпоративной принадлежности и т.п.), большая часть из них публикуется в веб-среде: на домашних страницах авторов, серверах пресс-релизов.
В настоящее время в Интернет-пространстве содержится большое количество документальных ресурсов, представленных в формате PDF. Вместе с тем, при поиске необходимой документации в формате PDF с помощью традиционных сетевых информационно-поисковых систем пользователь постоянно сталкивается с проблемами, связанными с плохой доступностью целевой информации (условиями платного доступа, отсутствием необходимых файлов по указанным адресам, или неверными гиперссылками). Хотя большинство поисковых систем, таких как Google, Yandex, Rambler, Yahoo и пр. выводят в список результатов информацию о найденных PDF-файлах, вместе с тем они часто дают ссылки на несуществующие PDF-файлы, или ссылки на сайты где PDF-файлы находятся в закрытом доступе.
В Информационном центре ElVisti была построена модель технологии агрегирования документальных информационных потоков, реализованная в виде метапоисковой системы PDF Science Search (PDFSS), доступной в настоящее время на сайте «Хаос. Нелинейная динамика» (http://chaos.in.ua).
Основная идея данной метапоисковой системы состоит в том, чтобы находить в Сети PDF-файлы без сопровождающего их информационного шума или рекламы. Особенностью PDFSS является то, что она полностью направлена на поиск доступных пользователю PDF-файлов, с возможностью фильтрации платных ресурсов, текстовых описаний, любой информации, кроме самих файлов.
С помощью поисковой системы PDFSS можно искать PDF- файлы в таких поисковых системах как Google, Yandex, Rambler, а также в ее собственной базе данных (кэше PDFSS). Поиск в кэше производится при любом запросе по умолчанию и выводится списком после результатов полученных от других ИПС.
Ист.: ИЦ "ЭЛВИСТИ".